如何讓程序更健壯「GitHub 熱點速覽」
對於 ML 模型訓練而言,好的數據集能讓結果更健壯,cleanlab 是一個降低數據噪音,及時幫你修正數據集錯誤的工具。好的工具能讓你的結果更完美。同樣的,RedTeam-Tools 提高了滲透測試的能力,也間接地讓你的安全系統更牢固。DocsGPT 一看便知它是個 Docs + GPT 的結合體,可以提高文檔解決用户問題的能力。meilisearch 輕量、速度的檢索能力,則提高了 HG 社區的搜索能力。
以下內容摘錄自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 熱帖(簡稱 HN 熱帖),選項標準:新發布
| 實用
| 有趣
,根據項目 release 時間分類,發佈時間不超過 14 day 的項目會標註 New
,無該標誌則説明項目 release 超過半月。由於本文篇幅有限,還有部分項目未能在本文展示,望周知 🌝
- 本文目錄
- 1. 本週特推
- 1.1 數據集質保:cleanlab
- 1.2 動畫生成器:motion-canvas
- 2. GitHub Trending 周榜
- 2.1 文檔助手:DocsGPT
- 2.2 再現塞爾達 3:zelda3
- 2.3 滲透工具:RedTeam-Tools
- 2.4 低代碼框架:ToolJet
- 2.5 輕量級搜索引擎:meilisearch
- 3. 往期回顧
- 1. 本週特推
1. 本週特推
1.1 數據集質保:cleanlab
主語言:Python
數據集是每個數據工程師都會經手的東西,那麼如果這個數據集本身有問題,很多噪音,後續的模型訓練結果就不會多好。而 cleanlab 就能幫你檢測 ML 數據集是否有問題,修正裏面有問題的 label 以及標記錯誤的數據。它適用於 Sklearn / PyTorch / TensorFlow / XGBoost 等等框架,一行代碼就能找到任意數據集中的數據和標籤錯誤,像這樣:
label_issues = cl.find_label_issues(data, labels)
而這行代碼能幫你降低數據的噪音,讓訓練出來的模型更健壯:
cl.fit(data, labels)
GitHub 地址→http://github.com/cleanlab/cleanlab
1.2 動畫生成器:motion-canvas
主語言:TypeScript
Motion Canvas 提供了兩樣東西:
- 一個用於生成編程動畫的 TS 庫;
- 該編程動畫的實時預覽;
簡單來説,它能創建矢量動畫,並與旁白同步。在線體驗:http://motion-canvas.github.io/editor/quickstart/
2. GitHub Trending 周榜
2.1 文檔助手:DocsGPT
本週 star 增長數:1,450+,主語言:Python、HTML
New
這周 ChatGPT 又燒起來了,這把搞點實際的,這是一個藉助 GPT 模型幫助那些向文檔提問、檢索的人快速得到準確、全面的答案。
GitHub 地址→http://github.com/arc53/DocsGPT
2.2 再現塞爾達 3:zelda3
本週 star 增長數:750+,主語言:C
塞爾達·眾神的三角力量的逆向工程,它用了 7-8 萬行 C 代碼來重現經典遊戲,你可以從頭玩到通關。
GitHub 地址→http://github.com/snesrev/zelda3
2.3 滲透工具:RedTeam-Tools
本週 star 增長數:450+
New
RedTeam-Tools 供 Red Team 使用的 120+ 技巧和工具,來提高滲透團隊的技術實力。下圖為其中一個工具的截圖:
GitHub 地址→http://github.com/A-poc/RedTeam-Tools
2.4 低代碼框架:ToolJet
本週 star 增長數:1,800+,主語言:JavaScript、TypeScript
一個低代碼框架,可在幾分鐘內快速構建、部署內部工具。你可以連接到數據庫,比如:PostgreSQL、MongoDB、ES 等等;也支持 API 端點(支持導入 OpenAPI spec 和 OAuth2 authorization),也支持對接 SaaS 工具,像 Slack、Notion、Google Sheets 之類的都可以接上,還支持對象存儲服務。
GitHub 地址→http://github.com/ToolJet/ToolJet
2.5 輕量級搜索引擎:meilisearch
本週 star 增長數:850+,主語言:Rust
一個輕量、快捷的搜索引擎,非常適合在應用程序、網站、workflow 中使用。開箱即用,能在非常短時間內給你檢索結果。大家也可以再重温 1 年半前滷蛋寫的 「相見恨晚!開源的傻瓜搜索引擎,幫你快速實現搜索功能」。
3. 往期回顧
往期回顧:
以上為 2023 年第 6 個工作周的 GitHub Trending 🎉如果你 Pick 其他好玩、實用的 GitHub 項目,來 HelloGitHub 和大家一起分享下喲 🌝
- 開源月刊《HelloGitHub》第 84 期
- 10 款開源的在線遊戲,點開就能玩的那種
- 窮人版生產力工具,好用得飛起 「GitHub 熱點速覽」
- GPT-4 來了!這些開源的 GPT 應用又要變強了
- 誰會拒絕一款開源的 3D 博客呢?
- 你的夢想家居「GitHub 熱點速覽」
- 開箱即用,你不可錯過的好東西「GitHub 熱點速覽」
- AI 能多強「GitHub 熱點速覽」
- 開源月刊《HelloGitHub》第 83 期
- 真·生產力「GitHub 熱點速覽」
- 如何讓程序更健壯「GitHub 熱點速覽」
- 朋友圈那串神祕字符背後的開源項目「GitHub 熱點速覽」
- 讓人眼前一亮的應用「GitHub 熱點速覽」
- 2023 年該學點什麼技術?「GitHub 熱點速覽 v.23.03」
- 開源月刊《HelloGitHub》第 82 期
- 忙活了一年的開源社區,終於趕上了春節前的末班車!
- 過年必備!親戚計算器「GitHub 熱點速覽 v.23.02」
- Windows 11 內核新調試器「GitHub 熱點速覽 v.23.01」
- HelloGitHub 最受歡迎的開源項目 Top10(2022年)
- 你的 GitHub 年度報告「GitHub 熱點速覽 v.22.52」