2022年AI專家成長路線圖 21K★;前端工程師演算法紅寶書;經典推薦演算法的程式碼全實現;觸覺機器人的強化學習套件;前沿論文 | ShowMeAI資訊日報

語言: CN / TW / HK

攜手創作,共同成長!這是我參與「掘金日新計劃 · 8 月更文挑戰」的第19天,點選檢視活動詳情

ShowMeAI日報系列全新升級!覆蓋AI人工智慧 工具&框架 | 專案&程式碼 | 博文&分享 | 資料&資源 | 研究&論文 等方向。點選檢視 歷史文章列表,在公眾號內訂閱話題 #ShowMeAI資訊日報,可接收每日最新推送。點選 專題合輯&電子月刊 快速瀏覽各專題全集

工具&框架

🚧 『ONNX HAWP Line Detection』基於 ONNX 的線條檢測 HAWP 模型

https://github.com/ibaiGorordo/ONNX-HAWP-Line-Detection

用於在 ONNX 中使用 HAWP 模型執行線檢測的 Python 指令碼。

🚧 『Tiny.Sim』用於 Free Pascal 的跨平臺實時2D/3D圖形、2D物理模擬庫

https://github.com/sysrpl/Tiny.Sim

Tiny.Sim 是一個微型跨平臺庫,用於渲染實時動畫 2D/3D 圖形和 2D 物理模擬,有一個幾乎完整的 2D 物理模擬引擎,具備許多實體型別和物理碰撞反饋控制。Tiny.Sim 具有完整的向量繪圖畫布和支援物件,已經過測試並且在 Linux、macOS、Windows 和 Raspberry Pi 計算機上執行良好。

🚧 『Tactile-Gym 2.0』用於觸覺機器人技術的強化學習套件(多觸覺感測器)

https://github.com/ac-93/tactile_gym

Repo 作為 Tactile Gym 2.0 開源,建立在 Tactile Gym 之上,擴充套件為 DigiTac、DIGIT、TacTip 三個觸覺感測器,並集成了一個低成本的工業級精度桌面機器人 DOBOT MG400,用於將學習到的策略成功轉移到無需任何進一步微調的真實世界。專案論文『Sim-to-real Deep Reinforcement Learning for Comparing Low-cost High-Resolution Robot Touch』提到的框架如下。

🚧 『wfrest』快速、高效、簡單易用的C++非同步web框架

https://github.com/wfrest/wfrest

wfrest 是一個 C++ 非同步 web 框架,基於 C++ Workflow 企業級程式引擎進行開發,能夠快速搭建 http 伺服器。

博文&分享

👍 『前端啃演算法』一次性解決前端工程師的演算法學習問題

https://github.com/course-dasheng/fe-algorithm

👍 『Blockchain in a nutshell』深入淺出區塊鏈教程

https://arxiv.org/abs/2205.01091

區塊鏈實現了一個數字社會,在這個社會中,人們可以貢獻、合作和交易,而不必再去猜測信任和透明度。它是比特幣、以太坊以及許多顛覆性應用和平臺成功背後的技術,對許多行業產生了積極影響,包括金融、教育、醫療保健、環境、交通和慈善事業等等。本章對奠定區塊鏈技術基礎的基本概念、數學和演算法進行了j講述。

資料&資源

🔥『AI Expert Roadmap』2022年人工智慧專家成長路線圖 21.1k✨

https://github.com/liuchong/awesome-roadmaps

https://i.am.ai/roadmap/

這是一組圖表,展示了成為資料科學、機器學習工程師或人工智慧專家的成長路徑,包含資料科學路線圖、機器學習路線圖、深度學習路線圖、資料工程師路線圖、大資料工程師路線圖等。可以前往 https://i.am.ai/roadmap/ 檢視互動式版本(列表中每個專案符號對應的資料頁面)。

🔥『Recommend System TF2.0』推薦演算法實現

https://github.com/jc-LeeHub/Recommend-System-tf2.0

Repo 用於記錄在學習推薦系統過程中的知識產出,主要是對經典推薦演算法的原理解析及程式碼實現。演算法包含但不僅限於下圖中的演算法,持續更新中...

研究&論文

公眾號回覆關鍵字日報,免費獲取整理好的論文合輯。

科研進展

  • 2022.07.28 『自然語言處理』 Efficient Training of Language Models to Fill in the Middle
  • 2022.07.27 『機器學習』 Learning with Combinatorial Optimization Layers: a Probabilistic Approach
  • 2022.07.27 『計算機視覺』 Generator Knows What Discriminator Should Learn in Unconditional GANs
  • 2022.07.27 『計算機視覺』 Real-World Image Super-Resolution by Exclusionary Dual-Learning

⚡ 論文:Efficient Training of Language Models to Fill in the Middle

論文標題:Efficient Training of Language Models to Fill in the Middle

論文時間:28 Jul 2022

所屬領域自然語言處理

對應任務:Data Augmentation,資料擴增

論文地址:https://arxiv.org/abs/2207.14255

程式碼實現:https://github.com/openai/human-eval-infilling

論文作者:Mohammad Bavarian, Heewoo Jun, Nikolas Tezak, John Schulman, Christine McLeavey, Jerry Tworek, Mark Chen

論文簡介:To this end, we run a series of ablations on key hyperparameters, such as the data transformation frequency, the structure of the transformation, and the method of selecting the infill span./為此,我們對關鍵的超引數進行了一系列的消融,如資料轉換頻率、轉換的結構和選擇填充跨度的方法。

論文摘要:我們表明,在我們對資料集進行簡單的轉換後,自迴歸語言模型可以學會填充文字,這種轉換隻是將文字的跨度從文件的中間移到其末端。雖然這種資料擴充近年來引起了很多人的興趣,但我們提供了大量的證據,證明以這種方式轉換的大量資料訓練模型並不損害原始的從左到右的生成能力,這一點可以通過在各種規模上的困惑和抽樣評估來衡量。鑑於訓練模型的有用性、簡單性和效率,我們建議未來的自迴歸語言模型預設使用FIM訓練。為此,我們對關鍵的超引數進行了一系列的消融,如資料轉換頻率、轉換的結構和選擇填充跨度的方法。我們使用這些消融來規定強大的預設設定和最佳做法來訓練FIM模型。我們在API中釋出了用最佳實踐訓練的最佳填充模型,併發布了我們的填充基準以幫助未來的研究。

⚡ 論文:Learning with Combinatorial Optimization Layers: a Probabilistic Approach

論文標題:Learning with Combinatorial Optimization Layers: a Probabilistic Approach

論文時間:27 Jul 2022

所屬領域機器學習

對應任務:Combinatorial Optimization,組合優化

論文地址:https://arxiv.org/abs/2207.13513

程式碼實現:https://github.com/axelparmentier/inferopt.jl

論文作者:Guillaume Dalle, Léo Baty, Louis Bouvier, Axel Parmentier

論文簡介:Combinatorial optimization (CO) layers in machine learning (ML) pipelines are a powerful tool to tackle data-driven decision tasks, but they come with two main challenges./機器學習(ML)管道中的組合優化(CO)層是處理資料驅動的決策任務的有力工具,但它們有兩個主要挑戰。

論文摘要:機器學習(ML)管道中的組合優化(CO)層是處理資料驅動的決策任務的有力工具,但它們也有兩個主要挑戰。首先,組合優化問題的解決方案通常表現為其目標引數的分片常數函式。鑑於ML管道通常使用隨機梯度下降法進行訓練,沒有斜率資訊是非常不利的。其次,標準的ML損失在組合環境中不能很好地工作。越來越多的研究通過不同的方法解決這些挑戰。不幸的是,缺乏維護良好的實施方案,減緩了對CO層的採用。在本文中,在以前的工作基礎上,我們引入了關於CO層的概率觀點,它自然而然地適用於近似區分和結構化損失的構建。我們從文獻中恢復了許多作為特例的方法,同時我們也得出了新的方法。基於這種統一的觀點,我們提出了InferOpt.jl,這是一個開源的Julia包,1)允許將任何具有線性目標的CO oracle變成可微分層,2)定義足夠的損失來訓練包含這種層的管道。我們的庫可以與任意的優化演算法一起工作,並且與Julia的ML生態系統完全相容。我們使用影片遊戲地圖上的尋路問題來證明其能力。

⚡ 論文:Generator Knows What Discriminator Should Learn in Unconditional GANs

論文標題:Generator Knows What Discriminator Should Learn in Unconditional GANs

論文時間:27 Jul 2022

所屬領域計算機視覺

對應任務:Conditional Image Generation,Image Generation,Unconditional Image Generation,約束影象生成,影象生成,無約束影象生成

論文地址:https://arxiv.org/abs/2207.13320

程式碼實現:https://github.com/naver-ai/ggdr

論文作者:Gayoung Lee, Hyunsu Kim, Junho Kim, Seonghyeon Kim, Jung-Woo Ha, Yunjey Choi

論文簡介:Here we explore the efficacy of dense supervision in unconditional generation and find generator feature maps can be an alternative of cost-expensive semantic label maps./這裡我們探討了密集監督在無條件生成中的功效,並發現生成器特徵圖可以作為成本低廉的語義標籤圖的替代品。

論文摘要:最近的條件性影象生成方法得益於密集監督,如分割標籤圖以實現高保真。然而,在無條件的影象生成中採用密集監督的方法卻很少被探索。在這裡,我們探討了密集監督在無條件生成中的功效,並發現生成器特徵圖可以作為成本低廉的語義標籤圖的替代品。根據我們的經驗證據,我們提出了一種新的生成器引導的判別器正則化(GGDR),其中生成器特徵圖監督判別器在無條件生成中具有豐富的語義表示。具體來說,我們採用了U-Net結構的判別器,它被訓練來預測給定的假影象作為輸入的發生器特徵圖。在多個數據集上進行的廣泛實驗表明,我們的GGDR在定量和定性方面一直在提高基線方法的效能。程式碼可在https://github.com/naver-ai/GGDR獲取

⚡ 論文:Real-World Image Super-Resolution by Exclusionary Dual-Learning

論文標題:Real-World Image Super-Resolution by Exclusionary Dual-Learning

論文時間:6 Jun 2022

所屬領域計算機視覺

對應任務:Image Restoration,Image Super-Resolution,Super-Resolution,影象修復,影象超解析度,超解析度

論文地址:https://arxiv.org/abs/2206.02609

程式碼實現:https://github.com/house-leo/rwsr-edl

論文作者:Hao Li, Jinghui Qin, Zhijing Yang, Pengxu Wei, Jinshan Pan, Liang Lin, Yukai Shi

論文簡介:Real-world image super-resolution is a practical image restoration problem that aims to obtain high-quality images from in-the-wild input, has recently received considerable attention with regard to its tremendous application potentials./現實世界的影象超級解析度是一個實際的影象修復問題,旨在從原始輸入中獲得高質量的影象,最近因其巨大的應用潛力而受到相當的關注。

論文摘要:真實世界的影象超解析度是一個實際的影象修復問題,旨在從原始輸入中獲得高質量的影象,最近因其巨大的應用潛力而受到廣泛關注。儘管基於深度學習的方法在真實世界的影象超解析度資料集上取得了可喜的修復質量,但它們忽略了L1-和感知最小化之間的關係,並粗略地採用輔助的大規模資料集進行預訓練。在本文中,我們討論了損壞影象中的影象型別以及基於感知和歐幾里得的評估協議的特性。然後,我們提出了一種方法,即排他性雙學習(RWSR-EDL)的真實世界影象超解析度,以解決基於感知和L1的合作學習中的特徵多樣性。此外,還開發了一個噪音引導的資料收集策略,以解決多資料集優化中的訓練時間消耗問題。當一個輔助資料集被納入時,RWSR-EDL取得了可喜的成果,並通過採用噪聲引導資料收集策略,擊退了任何訓練時間的增加。廣泛的實驗表明,RWSR-EDL在四個野外影象超解析度資料集上取得了比最先進方法更有競爭力的效能。

我們是 ShowMeAI,致力於傳播AI優質內容,分享行業解決方案,用知識加速每一次技術成長!點選檢視 歷史文章列表,在公眾號內訂閱話題 #ShowMeAI資訊日報,可接收每日最新推送。點選 專題合輯&電子月刊 快速瀏覽各專題全集。

「其他文章」