簡單好用的個人圖書管理系統;開源啦!北大NLP新手教程;『Rust命令列程式設計指南』隨書程式碼;原始碼結構視覺化工具 | ShowMeAI資訊日報

語言: CN / TW / HK

👀日報合輯 | 📆電子月刊 | 🔔公眾號下載資料 | 🍩@韓信子

工具&框架

🚧 『Emerge』原始碼分析和依賴視覺化工具

https://github.com/glato/emerge

Emerge(或emerge-viz)是一個程式碼分析工具,它可以分析原始碼結構、度量、依賴關係和軟體專案複雜性。你可以用它來掃描一個專案的原始碼,計算度量結果和統計資料,將原始碼對映到圖形結構(如依賴關係圖或檔案系統圖),以其他檔案格式匯出結果,甚至建立一個互動式網路應用程式來進一步探索。

Emerge主要用 Python 3 編寫,並在 MacOS、Linux和各種瀏覽器(Safari、Chrome、Firefox、Edge)上測試通過。目前支援以下語言:C、C++、Groovy、Java、JavaScript、TypeScript、Kotlin、ObjC、Ruby、Swift、Python。

🚧 『Tale Book: My Calibre WebServer』簡單好用的個人圖書管理系統

https://github.com/talebook/talebook

https://www.talebook.org/

Tale Book 是一個基於Calibre的簡單的個人圖書管理系統,具備書籍管理、線上閱讀與推送、使用者管理、SSO登入、從百度/豆瓣拉取書籍資訊等功能。

Tale Book 開源專案具備諸多優勢:介面美觀、支援多使用者、支援線上閱讀、支援批量掃描匯入書籍、支援郵件推送、支援OPDS、支援一鍵安裝、支援快捷更新書籍資訊、支援私人模式等。

🚧 『PyTorch Metric Learning』PyTorch 深度度量學習庫

https://github.com/KevinMusgrave/pytorch-metric-learning

https://kevinmusgrave.github.io/pytorch-metric-learning/

PyTorch Metric Learning 是一個幫助大家方便使用深度計量學習的工具庫。具備模組化、靈活、可擴充套件的特點,由 PyTorch 編寫完成。它包含9個模組,每個模組都可以在你現有的程式碼庫中獨立使用,或者結合在一起,形成一個完整的訓練/測試工作流程。

🚧 『VITS + BigVGAN + SpanPSP 中文TTS』基於 PyTorch 的 VITS-BigVGAN 的 TTS 中文模型

https://github.com/Zz-ww/VITS-BigVGAN-SpanPSP-Chinese

該專案實現 VITS + BigVGAN 端到端的中文 TTS 模型,推理階段加入中文韻律預測模型,實現的帶韻律預測的中文 TTS 模型。

🚧 『JSON structural diff』JSON檔案結構化diff工具

https://github.com/andreyvit/json-diff

JSON structural diff 是一個對 json 資料進行比對差異化的工具,簡單易用。

博文&分享

👍 『Command-Line Rust』Rust 命令列程式設計指南·隨書程式碼

https://github.com/kyclark/command-line-rust

這是 Ken Youens-Clark 撰寫的 O'Reilly 的『Command-Line Rust』書對應的程式碼集。

連續幾年來,Rust在Stack Overflow的年度開發者調查中被評為『最受喜愛的程式語言』。這種開源的系統程式語言現在被用於從遊戲引擎和作業系統到瀏覽器元件和虛擬現實模擬引擎的所有方面。但是,Rust也是一種極其複雜的語言,其學習難度是眾所周知的。

本指南沒有把重點放在整個語言上,而是在每一章用一個小的、完整的、有重點的程式示例來教Rust。作者Ken Youens-Clark向你展示瞭如何開始、編寫和測試每一個程式以建立一個成品。你將學習如何處理Rust中的錯誤,讀寫檔案,以及使用正則表示式、Rust型別、結構等等。

👍 『PKU TANGENT NLP Tutorial』北大 NLP 新手入門教程

https://github.com/PKU-TANGENT/nlp-tutorial

這是北京大學 TANGENT 實驗室(Text ANalysis and GENeration Technology Group at Peking University)的一份 NLP 教程,提供了一條學習&實踐路徑,並有對應的資料連結。教程包含三大部分:

  • 1)基礎知識
    • 機器學習
    • 深度學習
    • 自然語言處理
  • 2)文獻閱讀
    • Google Scholar
    • 會議論文
    • 前沿進展
    • 工具
  • 3)動手實踐
    • 任務一:基於深度學習的文字分類
    • 任務二:基於 LSTM-CRF 的命名實體識別
    • 任務三:Neural Machine Translation (NMT)
    • 任務四:Transformer & PLM

資料&資源

🔥 『Awesome Fluid Dynamics』流體動力學相關資源列表

https://github.com/lento234/awesome-fluid-dynamics

https://manickathan.ch/awesome-fluid-dynamics/

列表包含以下主題:

  • Meshing / 網格劃分
  • Computational Fluid Dynamics / 計算流體力學
  • Experimental Fluid Dynamics / 實驗性流體動力學
  • Post-processing and Data Analysis / 後處理和資料分析
  • Visualization / 視覺化
  • Benchmarks and Datasets / 基準和資料集
  • Reproducibility / 可重複性

🔥 『Awesome Inpainting Tech』影象補全相關文獻資源列表

https://github.com/zengyh1900/Awesome-Image-Inpainting

列表包含以下主題:

  • Image Inpainting / 影象補全
    • Classical methods (Non-learning based) / 經典方法
    • Deep Architectures (Learning Based) / 深度架構
  • Video Inpainting / 影片補全
    • Classical methods (Non-learning based) / 經典方法
    • Deep Architectures (Learning Based) / 深度架構
  • Challenge / 挑戰

研究&論文

公眾號後臺回覆關鍵字 日報,免費獲取整理好的論文合輯。

科研進展

  • 2022.09.01 『模板匹配』 AccoMontage2: A Complete Harmonization and Accompaniment Arrangement System
  • 2022.09.02 『基因組學』 genomepy: genes and genomes at your fingertips
  • 2022.08.16 『自然語言處理』 Mask and Reason: Pre-Training Knowledge Graph Transformers for Complex Logical Queries

⚡ 論文:AccoMontage2: A Complete Harmonization and Accompaniment Arrangement System

論文時間:1 Sep 2022

領域任務:Template Matching,模板匹配

論文地址:https://arxiv.org/abs/2209.00353

程式碼實現:https://github.com/billyblu2000/accomontage2

論文作者:Li Yi, Haochen Hu, Jingwei Zhao, Gus Xia

論文簡介:We propose AccoMontage2, a system capable of doing full-length song harmonization and accompaniment arrangement based on a lead melody./我們提出了AccoMontage2,一個能夠在主旋律的基礎上進行全曲和聲和伴奏編排的系統。

論文摘要:我們提出了AccoMontage2,一個能夠根據主旋律進行全曲和聲和伴奏編曲的系統。繼AccoMontage之後,本研究的重點是生成流行/民謠歌曲的鋼琴編曲,並採用了基於模板的通用檢索方法。本研究的創新之處在於兩個方面。首先,我們發明了一個和聲模組(AccoMontage沒有這個模組)。這個模組通過優化和平衡三個損失項來生成結構化和連貫的全長和絃進展:微觀層面的音符不和諧損失,中觀層面的樂句模板匹配損失,以及巨集觀層面的全曲連貫性損失。第二,我們開發了一個圖形使用者介面,允許使用者選擇不同風格的和絃進展和鋼琴紋理。目前,和絃進展風格包括流行、R&B和黑暗,而鋼琴紋理風格包括幾個級別的聲音密度和節奏的複雜性。實驗結果表明,我們的和聲和編曲結果都大大超過了基線的表現。最後,我們將AccoMontage2作為一個線上應用程式釋出,並將有組織的和絃行進模板作為一個公共資料集。

⚡ 論文:genomepy: genes and genomes at your fingertips

論文時間:2 Sep 2022

領域任務:Genomics, 基因組學

論文地址:https://arxiv.org/abs/2209.00842

程式碼實現:https://github.com/vanheeringen-lab/genomepy

論文作者:Siebren Frölich, Maarten van der Sande, Tilman Schäfers, Simon J. van Heeringen

論文簡介:Analyzing a functional genomics experiment, such as ATAC-, ChIP- or RNA-sequencing, requires reference data including a genome assembly and gene annotation./分析功能基因組學實驗,如ATAC-、ChIP-或RNA測序,需要包括基因組組裝和基因註釋的參考資料。

論文摘要:分析功能基因組學實驗,如ATAC-、ChIP-或RNA測序,需要包括基因組組裝和基因註釋的參考資料。這些資源通常可以從不同的組織和不同的版本中檢索到。大多數生物資訊學工作流程要求使用者手動提供這些基因組資料,這可能是一個繁瑣和容易出錯的過程。這裡我們介紹genomepy,它可以為你的分析搜尋、下載和預處理正確的基因組資料。Genomepy可以搜尋NCBI、Ensembl、UCSC和GENCODE上的基因組資料,並比較可用的基因註釋,以便做出明智的決定。選定的基因組和基因註釋可以被下載,並以合理但可控的預設值進行預處理。額外的支援資料可以自動生成或下載,如對齊器索引、基因組元資料和黑名單。Genomepy開源在 https://github.com/vanheeringen-lab/genomepy 可通過pip或bioconda安裝。

⚡ 論文:Mask and Reason: Pre-Training Knowledge Graph Transformers for Complex Logical Queries

論文時間:16 Aug 2022

領域任務自然語言處理

論文地址:https://arxiv.org/abs/2208.07638

程式碼實現:https://github.com/thudm/kgtransformer

論文作者:Xiao Liu, Shiyu Zhao, Kai Su, Yukuo Cen, Jiezhong Qiu, Mengdi Zhang, Wei Wu, Yuxiao Dong, Jie Tang

論文簡介:In this work, we present the Knowledge Graph Transformer (kgTransformer) with masked pre-training and fine-tuning strategies./在這項工作中,我們提出了知識圖譜轉化器(kgTransformer),該轉化器具有遮蔽式預訓練和微調策略。

論文摘要:知識圖(KG)嵌入一直是對不完整KG進行推理的主流方法。然而,受限於其固有的淺層和靜態架構,它們很難處理日益受到關注的複雜邏輯查詢,其中包括邏輯運算子、歸屬邊、多個源實體和未知中間實體。在這項工作中,我們提出了知識圖譜轉化器(kgTransformer),該轉化器具有遮蔽式預訓練和微調策略。我們設計了一個KG三重轉換方法,使Transformer能夠處理KG,並通過Mixture-of-Experts(MoE)稀疏啟用進一步加強。然後,我們將複雜的邏輯查詢制定為掩碼預測,並引入兩階段的掩碼預訓練策略,以提高可轉移性和可推廣性。在兩個基準上的廣泛實驗表明,kgTransformer在九個領域內和領域外的推理任務上可以持續地超過基於KG嵌入的基線和高階編碼器。此外,kgTransformer可以通過提供完整的推理路徑來解釋給定的答案,從而實現可解釋性推理。

我們是 ShowMeAI,致力於傳播AI優質內容,分享行業解決方案,用知識加速每一次技術成長!

◉ 點選 日報合輯,在公眾號內訂閱話題 #ShowMeAI資訊日報,可接收每日最新推送。

◉ 點選 電子月刊,快速瀏覽月度合輯。

「其他文章」