不可以澀澀!AI續寫軟體初體驗;遷移學習路線圖;谷歌新聞非官方搜尋API;CS295『因果推理』2021課程資料;前沿論文 | ShowMeAI資訊日報

語言: CN / TW / HK

我報名參加金石計劃1期挑戰——瓜分10萬獎池,這是我的第13篇文章,點選檢視活動詳情

👀日報合輯 | 📆電子月刊 | 🔔公眾號下載資料 | 🍩@韓信子

📢 AI 續寫軟體初體驗:不可以澀澀!CP被🔪!我人麻了...

B 站 Up 主『摸魚事務所』昨天釋出了 AI 續寫軟體『彩雲小夢』的體驗影片,與帶有角色設定的 AI 機器人打字聊天,眼看著對話走到了奇怪的方向(⊙o⊙)

一如既往,笑死在彈幕和評論!有人拿這款軟體續寫同人文,結果劇情變幻莫測急轉直下。還有人給了一個美麗的言情小說開頭,卻陷入恐怖故事裡 (°ー°〃) Up主別出心裁,他用來討論廣告創意!把一款『定製夢境』的軟體用成了生產率工具 ㄟ( ▔, ▔ )ㄏ

談到 AI 就免不了隱私和邊界話題的討論。當前的『彩雲小夢』不可以澀澀啦,更早期的使用者見過不太一樣的版本。當然,更棘手的挑戰來自於真實世界難以消弭的偏見、歧視、隱私和敏感話題,微軟小冰、Google LaMDA、Facebook Blender 等應用都曾折戟。畢竟,AI 只是人類的一面鏡子。(來源:BV1FG411G77q)

工具&框架

🚧 『DeepPavlov』開源對話 AI 庫

https://github.com/deeppavlovteam/DeepPavlov

https://demo.deeppavlov.ai/

DeepPavlov 是一個基於 TensorFlow、Keras 和 PyTorch 的開源對話式人工智慧庫。DeepPavlov 可以用於:開發可用於生產的聊天機器人和複雜的對話系統、NLP領域對話系統的研究。

🚧 『Flutter Chat UI』基於 Flutter 的聊天介面 UI

https://github.com/flyerhq/flutter_chat_ui

https://flyer.chat/

Flyer Chat 是一個使用 Flutter 或 React Native 建立應用內聊天體驗的平臺。這個資源庫包含 Flutter 的聊天 UI 實現。它具備以下特點:

  • 免費、開源、社群驅動
  • 多後臺支援,可選擇自己喜歡的後端
  • 可定製,支援自定義主題、地域和更多
  • 極小的依賴性

🚧 『TuGraph』高效的圖資料庫

https://github.com/TuGraph-db/tugraph-db

TuGraph 是一個高效的圖形資料庫,支援高資料量、低延遲查詢和快速圖形分析。

🚧 『VDP』將視覺AI與現代資料棧無縫整合的開源工具

https://github.com/instill-ai/vdp

https://www.instill.tech/

視覺資料準備(VDP)是一個開源的視覺資料ETL工具,用於簡化端到端的視覺資料處理管道。核心步驟功能包括:

  • 從預先建立的資料來源(如雲/企業內部儲存或物聯網裝置)中提取非結構化的視覺資料
  • 通過Vision AI模型將其轉化為可分析的結構化資料
  • 將轉換後的資料載入到倉庫、應用程式或其他場景。

🚧 『GNews』Google新聞的非官方搜尋API

https://github.com/ranahaani/GNews

https://pypi.org/project/gnews/

一個輕量級的 Python 包,它提供了一個 API 來搜尋谷歌新聞上的文章,並返回一個 JSON 格式的結果。

博文&分享

👍 『CS 295 - Causal Reasoning』UCI·因果推理(2021課程)

https://www.ics.uci.edu/~dechter/courses/ics-295cr/spring-2021/

https://www.youtube.com/playlist?list=PLBxVZ0owetvpxLEXmVEaZWaAHJAd-lXmq

課程涵蓋因果推理的相關主題,以研討會的形式進行,課程的前半部分有課程講授,後半部分是學生閱讀並向全班展示基於書本章節的論文。本課程是為人工智慧和機器學習領域的博士生準備的,需要有一定的機器學習基礎。

課程包含以下主題:

  • Introduction: Causal Hierarchy / 簡介:因果層次結構
  • The Simpson Paradox / 辛普森悖論
  • Structural Causal Models / 結構因果模型
  • Identification of Causal Effects / 因果效應識別
  • The Problem of Confounding and the Back-Door Criterion / 混雜問題和後門標準
  • Causal Calculus / 因果演算
  • Linear Structural Causal Models / 線性結構的因果模型
  • Counterfactuals / 反事實
  • Structural Learning / 結構學習

👍 『Grokking Stable Diffusion.ipynb』Stable Diffusion實戰 (Colab)

https://colab.research.google.com/drive/1dlgggNa5Mz8sEAGU0wFCHhGLFooW_pf1

資料&資源

🔥 『A Roadmap for Transfer Learning』遷移學習路線圖

https://github.com/thuml/A-Roadmap-for-Transfer-Learning

https://zhuanlan.zhihu.com/p/463332254

當下大部分的深度學習應用(尤其是CV和NLP)或多或少都會用到預訓練模型,因此綜述按照這些應用的生命週期,也就是 Pre-training - Adaptation - Evaluation,進行展開。

  • 預訓練(Pre-training)階段的目標是獲得可遷移的知識。深度模型在具有大規模資料的上游任務上進行預訓練,以學習可遷移到各種下游任務的特徵表示或引數。
  • 適應階段(Adaptation)的目標是重用可遷移的知識。通過將預訓練的模型適應到下游任務,能夠以更少的標註樣本實現更好的泛化。而當下遊任務不存在標註樣本時,通常還會使用來自相同學習任務但不同資料分佈的另一個數據域。上述兩個過程分別涉及到了跨任務或者跨分佈的遷移性。
  • 評估階段(Evaluation)的目標是評估模型的遷移性。通過評估某個模型或者某個方法在跨任務或者跨分佈情況下的遷移性,可以幫助我們更好地挑選預訓練模型、改進預訓練方法、設計適應方法等。

🔥 『personal emotional dialogue system』對話系統相關文獻列表

https://github.com/neuChatbotDS/personal-emotional-dialogue-system

研究&論文

公眾號後臺回覆關鍵字 日報,免費獲取整理好的論文合輯。

科研進展

  • 2022.08.31 『影象質量評估』 PyTorch Image Quality: Metrics for Image Quality Assessment
  • 2022.07.15 『病變檢測』 ESFPNet: efficient deep learning architecture for real-time lesion segmentation in autofluorescence bronchoscopic video
  • 2022.08.31 『貝葉斯推斷』 Stationary Kernels and Gaussian Processes on Lie Groups and their Homogeneous Spaces I: the Compact Case

⚡ 論文:PyTorch Image Quality: Metrics for Image Quality Assessment

論文時間:31 Aug 2022

領域任務:Image Quality Assessment,影象質量評估

論文地址:https://arxiv.org/abs/2208.14818

程式碼實現:https://github.com/photosynthesis-team/piq

論文作者:Sergey Kastryulin, Jamil Zakirov, Denis Prokopenko, Dmitry V. Dylov

論文簡介:Image Quality Assessment (IQA) metrics are widely used to quantitatively estimate the extent of image degradation following some forming, restoring, transforming, or enhancing algorithms./影象質量評估(IQA)指標被廣泛用於定量估計某些成形、恢復、轉換或增強演算法後的影象退化程度。

論文摘要:影象質量評估(IQA)指標被廣泛用於定量估計一些成形、恢復、轉換或增強演算法後的影象退化程度。我們提出了PyTorch影象質量(PIQ),這是一個以可用性為中心的庫,包含了最流行的現代IQA演算法,保證根據其原始命題正確實施,並經過徹底驗證。在本文中,我們詳細介紹了該庫的基礎原理,描述了使其可靠的評估策略,提供了展示效能-時間權衡的基準,並強調了在PyTorch後端使用該庫時GPU加速的好處。PyTorch影象質量是一個開源軟體,獲取地址:https://github.com/photosynthesis-team/piq/ 。

⚡ 論文:ESFPNet: efficient deep learning architecture for real-time lesion segmentation in autofluorescence bronchoscopic video

論文時間:15 Jul 2022

領域任務:Lesion Detection, Lesion Segmentation,病變檢測病變分割

論文地址:https://arxiv.org/abs/2207.07759

程式碼實現:https://github.com/dumyCq/ESFPNet

論文作者:Qi Chang, Danish Ahmad, Jennifer Toth, Rebecca Bascom, William E. Higgins

論文簡介:These values are superior to results achieved by other competing architectures that use Mix transformers or CNN-based encoders./這些數值優於其他使用混合變換器或基於CNN的編碼器的競爭架構所取得的結果。

論文摘要:肺癌往往在晚期才被發現,導致病人的死亡率很高。因此,最近的研究集中在早期疾病檢測方面。肺癌一般首先表現為在氣道壁的支氣管上皮內發生病變。支氣管鏡檢查是有效的無創性支氣管病變檢測的首選程式。特別是,自體熒光支氣管鏡(AFB)可以區分正常和病變組織的自體熒光特性,即病變在AFB影片幀中顯示為紅褐色,而正常組織顯示為綠色。由於最近的研究顯示AFB對病變有很高的敏感性,它已成為標準支氣管鏡氣道檢查中檢測早期肺癌的一個潛在的關鍵方法。不幸的是,手動檢查AFB影片是非常繁瑣和容易出錯的,而在潛在的更強大的自動AFB病變檢測和分割方面所做的努力有限。我們提出了一個實時的深度學習架構ESFPNet,用於從AFB影片流中對支氣管病變進行穩健檢測和分割。該架構的特點是利用預訓練的混合Transformer(MiT)編碼器結構和分階段的特徵金字塔(ESFP)解碼器結構。來自肺癌患者氣道檢查的AFB影片的結果表明,我們的方法給出的平均Dice指數和IOU值分別為0.782和0.658,而處理量為27幀/秒。這些數值優於其他使用混合Transformer或基於CNN的編碼器的競爭架構所取得的結果。此外,在ETIS-LaribPolypDB資料集上的優異表現表明了它在其他領域的潛在適用性。

⚡ 論文:Stationary Kernels and Gaussian Processes on Lie Groups and their Homogeneous Spaces I: the Compact Case

論文時間:31 Aug 2022

領域任務:Bayesian Inference, Gaussian Processes,貝葉斯推斷高斯過程

論文地址:https://arxiv.org/abs/2208.14960

程式碼實現:https://github.com/imbirik/liestationarykernels

論文作者:Iskander Azangulov, Andrei Smolensky, Alexander Terenin, Viacheslav Borovitskiy

論文簡介:The invariance of a Gaussian process' covariance to such symmetries gives rise to the most natural generalization of the concept of stationarity to such spaces./高斯過程的協方差對這種對稱性的不變性引起了靜止性概念對這種空間的最自然的概括。

論文摘要:高斯過程可以說是空間統計中最重要的模型類別。它們編碼了關於建模函式的先驗資訊,可用於精確或近似的貝葉斯推斷。在許多應用中,特別是在物理科學和工程領域,也包括地理統計學和神經科學等領域,對稱性不變性是人們可以考慮的最基本的先驗資訊形式之一。高斯過程的協方差對這種對稱性的不變性引起了靜止性概念對這種空間的最自然的概括。在這項工作中,我們開發了建設性的實用技術,用於在對稱性背景下產生的一大類非歐幾里得空間上建立靜止的高斯過程。我們的技術使得(i)計算協方差核和(ii)從定義在這類空間上的先驗和後驗高斯過程中取樣成為可能,而且都是以一種實用的方式。這項工作分為兩部分,分別涉及不同的技術考慮:第一部分研究緊湊空間,第二部分研究具有一定結構的非緊湊空間。我們的貢獻使我們研究的非歐幾里得高斯過程模型與標準高斯過程軟體包中的公認的計算技術相容,從而使它們為實踐者所接受。

我們是 ShowMeAI,致力於傳播AI優質內容,分享行業解決方案,用知識加速每一次技術成長!

◉ 點選 日報合輯,在公眾號內訂閱話題 #ShowMeAI資訊日報,可接收每日最新推送。

◉ 點選 電子月刊,快速瀏覽月度合輯。

「其他文章」