臨陣磨槍!LeetCode技術面試要點清單;【前沿】機器人描述資源集錦;【熱門】生成式Diffusion模型綜述;前沿論文 | ShowMeAI資訊日報

語言: CN / TW / HK

我報名參加金石計劃1期挑戰——瓜分10萬獎池,這是我的第22篇文章,點選檢視活動詳情

👀日報合輯 | 📆電子月刊 | 🔔公眾號下載資料 | 🍩@韓信子

工具&框架

🚧 『agg』asciinema gif 生成器

https://github.com/asciinema/agg

agg 是一個命令列工具,用於從 asciinema 終端記錄器產生的 asciicast v2 檔案生成 GIF 動畫檔案。它使用 gifski 庫來產生優化的、高質量的GIF輸出,並具有精確的幀計時。

🚧 『YOLOX M1 Mac』YOLO 的無錨版本,支援 M1 晶片的 Mac

https://github.com/j-ohashi/YOLOX-M1-Mac

YOLOX 是 YOLO 的無錨版本,設計更簡單,但效能更好——超過 yolov3~v5,支援 MegEngine、ONNX、TensorRT、ncnn 和 OpenVINO!它的目標是在研究和工業界之間架起一座橋樑,彌合研究界和工業界之間的差距。YOLOX M1 Mac 是 PyTorch 版本 YOLOX 的實現,支援 M1 晶片的 Mac。

🚧 『MLIR Playground』在瀏覽器中玩 MLIR 的實現

https://github.com/MLIR-China/mlir-playground

https://playground.mlir-china.org/

MLIR Playground 是一個可以在瀏覽器中玩 MLIR 的實現,它不需要安裝任何依賴性或設定一個構建系統;私密和安全,一切都在你的瀏覽器的沙盒環境中本地執行。

🚧 『async_simple』阿里巴巴開源的輕量級 C++ 非同步框架

https://github.com/alibaba/async_simple

async_simple 是阿里巴巴開源的輕量級 C++ 非同步框架,提供了基於 C++20 無棧協程(Lazy)、有棧協程(Uthread)以及 Future/Promise 等非同步元件。

async_simple 誕生於阿里巴巴智慧引擎事業部,目前廣泛應用於圖計算引擎、時序資料庫、搜尋引擎等線上系統。連續兩年經歷天貓雙十一磨礪,承擔了億級別流量洪峰,具備非常強勁的效能和可靠的穩定性。

🚧 『SREWorks』雲原生運維平臺

https://github.com/alibaba/SREWorks

SREWorks是阿里巴巴大資料SRE團隊雲原生運維平臺,沉澱了團隊近10年經過內部業務錘鍊的 SRE 工程實踐,秉承“資料化、智慧化”運維思想,幫助運維行業更多的從業者採用“數智”思想做好高效運維。它是一站式資料化、智慧化運維SaaS應用套件(交付、監測、管理、控制、運營、服務)。

博文&分享

👍 『leetcode-curation-topica』技術面試準備清單

https://github.com/fterh/leetcode-curation-topical

針對面試過程中容易被問到的資料結構 LeetCode 題,作者按照主題/概念進行歸類整理。嘗試了一題多解:通過多種方式以不同的時間/空間效率(通過使用各種資料結構)來解決。

清單包含以下主題,並標示了 easy、medium、hard 三個難度等級:

  • Arrays/Strings(陣列 / 字串
  • Sliding Window / Two Pointer(滑動視窗 / 兩個指標)
  • Intervals(區間合併/插入/排序)
  • Heaps/Priority Queues(堆/優先佇列)
  • Linked Lists / Deques(連結串列 / 雙端佇列
  • Trees(
  • Graphs(
  • Recursion/Backtracking(遞迴/回溯
  • Dynamic Programming(動態規劃
  • Design & Implementation(設計模式與實現
  • Greedy(貪心

👍 『A Survey on Generative Diffusion Model』生成式Diffusion模型綜述

https://github.com/chq1155/A-Survey-on-Generative-Diffusion-Model

論文:https://arxiv.org/pdf/2209.02646.pdf

論文『A Survey on Generative Diffusion Model』對Diffusion模型領域的里程碑模型進行了總結,如 DDPM、DSM、core SDE 等。並針對基於擴散的模型領域中的現有問題提出了分類改進技術,並介紹了擴散模型的應用。

Repo 是論文總結,清單包含以下主題:

  • Methodology Improvement / 方法改進
  • Speed-up / 提速
  • Distribution Diversification / 分佈多樣化
  • Application / 應用
  • Computer Vision / 計算機視覺
  • Sequential Modeling / 序列模型(文字)
  • Audio / 音訊

資料&資源

🔥 『Awesome Robot Descriptions』機器人描述相關文獻列表

https://github.com/robot-descriptions/awesome-robot-descriptions

清單包含以下主題:

  • Arms / 機械臂
  • Bipeds / 雙足機器人
  • Dual Arms / 雙臂機器人
  • Drones / 無人機
  • Educational / 教學機器人
  • End Effectors / 末端輔助機器人
  • Mobile Manipulators / 輪動機械手
  • Humanoids / 人形機器人
  • Quadrupeds / 四足機器人

🔥 『3DMM and 3D Face Reconstruction and Manipulation』3D人臉重建與操作相關文獻列表

https://github.com/AndrewChiyz/3DMM-and-3D-Face-reconstruction-and-manipulation

清單包含以下主題:

  • Deep learning (VAE & Encoder-decoder models)
  • Deep learning (GAN models)
  • Deep learning (Hybrid structures & Nonlinear 3DMM)
  • Self-supervised
  • High Fidelity, Face Texture, GAN Hallucination
  • Face reconstruction from videos
  • CVPR2019、CVPR2018、CVPR2017
  • ICCV2019、ICCV2017、ECCV2018、CoRR
  • TPAMI
  • Dataset
  • Models

研究&論文

公眾號後臺回覆關鍵字 日報,免費獲取整理好的論文合輯。

科研進展

  • 2022.09.07 『目標檢測』 YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
  • 2022.08.03 『語義分割』 MinVIS: A Minimal Video Instance Segmentation Framework without Video-based Training
  • 2022.09.12 『文字分類』 CSL: A Large-scale Chinese Scientific Literature Dataset

⚡ 論文:YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications

論文時間:7 Sep 2022

領域任務:object-detection, Object Detection, 目標檢測

論文地址:https://arxiv.org/abs/2209.02976

程式碼實現:https://github.com/meituan/yolov6

論文作者:Chuyi Li, Lulu Li, Hongliang Jiang, Kaiheng Weng, Yifei Geng, Liang Li, Zaidan Ke, Qingyuan Li, Meng Cheng, Weiqiang Nie, Yiduo Li, Bo Zhang, Yufei Liang, Linyuan Zhou, Xiaoming Xu, Xiangxiang Chu, Xiaoming Wei, Xiaolin Wei

論文簡介:The YOLO community has prospered overwhelmingly to enrich its use in a multitude of hardware platforms and abundant scenarios./YOLO社群以壓倒性的優勢豐富了其在眾多硬體平臺和豐富場景中的應用。

論文摘要:多年來,YOLO系列一直是高效物體檢測的事實上的工業級標準。YOLO社群已經取得了壓倒性的發展,以豐富其在眾多硬體平臺和豐富場景中的應用。在這份技術報告中,我們努力把它的極限推到一個新的水平,以堅定不移的心態向行業應用邁進。考慮到現實環境中對速度和準確性的不同要求,我們廣泛地研究了工業界或學術界最新的物體檢測進展。具體來說,我們大量吸收了最近的網路設計、訓練策略、測試技術、量化和優化方法的思想。在此基礎上,我們整合了我們的想法和實踐,建立了一套不同規模的可部署的網路,以適應多樣化的用例。在YOLO作者的慷慨許可下,我們將其命名為YOLOv6。我們也表示熱烈歡迎使用者和貢獻者的進一步改進。對於效能的一瞥,我們的YOLOv6-N在COCO資料集上達到了35.9%的AP,在NVIDIA Tesla T4 GPU上的吞吐量為1234 FPS。YOLOv6-S在495FPS的情況下達到了43.5%的AP,超過了其他相同規模的主流檢測器~(YOLOv5-S、YOLOX-S和PPYOLOE-S)。我們的量化版本YOLOv6-S甚至在869 FPS時帶來了新的最先進的43.3%的AP。此外,YOLOv6-M/L也比其他具有類似推理速度的檢測器取得了更好的準確性表現(即49.5%/52.3%)。我們仔細進行了實驗,以驗證每個元件的有效性。我們的程式碼可在 https://github.com/meituan/YOLOv6 獲取。

⚡ 論文:MinVIS: A Minimal Video Instance Segmentation Framework without Video-based Training

論文時間:3 Aug 2022

領域任務:Instance Segmentation, Semantic Segmentation, 語義分割例項分割

論文地址:https://arxiv.org/abs/2208.02245

程式碼實現:https://github.com/nvlabs/minvis

論文作者:De-An Huang, Zhiding Yu, Anima Anandkumar

論文簡介:By only training a query-based image instance segmentation model, MinVIS outperforms the previous best result on the challenging Occluded VIS dataset by over 10% AP./通過只訓練一個基於查詢的影象例項分割模型,MinVIS在具有挑戰性的Occluded VIS資料集上的表現超過了之前的最佳結果,AP超過了10%。

論文摘要:我們提出了MinVIS,一個最小化的影片例項分割(VIS)框架,它既沒有基於影片的架構,也沒有訓練程式,就能達到最先進的VIS效能。通過只訓練一個基於查詢的影象例項分割模型,MinVIS在具有挑戰性的Occluded VIS資料集上的表現比之前的最佳結果高出10%以上。由於MinVIS將訓練影片中的幀視為獨立的影象,我們可以在不做任何修改的情況下對訓練影片中的標註幀進行大幅度的子取樣。在YouTube-VIS 2019/2021上,MinVIS只用了1%的標註幀,就超過了完全監督的最先進的方法,或者與之相當。我們的主要觀察結果是,經過訓練的查詢在幀內物體例項之間具有判別能力,在時間上是一致的,可以用來追蹤例項,而不需要任何人工設計的啟發式方法。因此,MinVIS有以下推理管道:我們首先將訓練好的基於查詢的影象例項分割獨立應用於影片幀。然後,通過對相應的查詢進行雙邊匹配來追蹤被分割的例項。這種推理是以線上方式進行的,不需要一次性處理整個影片。因此,MinVIS具有降低標籤成本和記憶體需求的實際優勢,同時不犧牲VIS的效能。程式碼見:https://github.com/NVlabs/MinVIS

⚡ 論文:CSL: A Large-scale Chinese Scientific Literature Dataset

論文時間:12 Sep 2022

領域任務:Text Classification,文字分類

論文地址:https://arxiv.org/abs/2209.05034

程式碼實現:https://github.com/ydli-ai/csl,https://github.com/p01son6415/csl

論文作者:Yudong Li, Yuqing Zhang, Zhe Zhao, Linlin Shen, Weijie Liu, Weiquan Mao, HUI ZHANG

論文簡介:The CSL can serve as a Chinese corpus./CSL可以作為一箇中文語料庫。

論文摘要:科學文獻作為一個高質量的語料庫,支援了大量的自然語言處理(NLP)研究。然而,現有的資料集是以英語為中心的,這限制了中文科學NLP的發展。在這項工作中,我們提出了CSL,一個大規模的中文科學文獻資料集,它包含了396k篇論文的標題、摘要、關鍵詞和學術領域。就我們所知,CSL是第一個中文科學文獻資料集。CSL可以作為一箇中文語料庫。同時,這種半結構化的資料是一種自然的註釋,可以構成許多有監督的NLP任務。基於CSL,我們提出了一個基準來評估模型在科學領域任務中的表現,即總結、關鍵詞生成和文字分類。我們分析了現有文字到文字模型在評估任務上的行為,並揭示了中文科學NLP任務所面臨的挑戰,這為未來的研究提供了寶貴的參考。資料和程式碼可在 https://github.com/ydli-ai/CSL 獲取

我們是 ShowMeAI,致力於傳播AI優質內容,分享行業解決方案,用知識加速每一次技術成長!

◉ 點選 日報合輯,在公眾號內訂閱話題 #ShowMeAI資訊日報,可接收每日最新推送。

◉ 點選 電子月刊,快速瀏覽月度合輯。

「其他文章」