如何让程序更健壮「GitHub 热点速览」
对于 ML 模型训练而言,好的数据集能让结果更健壮,cleanlab 是一个降低数据噪音,及时帮你修正数据集错误的工具。好的工具能让你的结果更完美。同样的,RedTeam-Tools 提高了渗透测试的能力,也间接地让你的安全系统更牢固。DocsGPT 一看便知它是个 Docs + GPT 的结合体,可以提高文档解决用户问题的能力。meilisearch 轻量、速度的检索能力,则提高了 HG 社区的搜索能力。
以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布
| 实用
| 有趣
,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New
,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知 🌝
- 本文目录
- 1. 本周特推
- 1.1 数据集质保:cleanlab
- 1.2 动画生成器:motion-canvas
- 2. GitHub Trending 周榜
- 2.1 文档助手:DocsGPT
- 2.2 再现塞尔达 3:zelda3
- 2.3 渗透工具:RedTeam-Tools
- 2.4 低代码框架:ToolJet
- 2.5 轻量级搜索引擎:meilisearch
- 3. 往期回顾
- 1. 本周特推
1. 本周特推
1.1 数据集质保:cleanlab
主语言:Python
数据集是每个数据工程师都会经手的东西,那么如果这个数据集本身有问题,很多噪音,后续的模型训练结果就不会多好。而 cleanlab 就能帮你检测 ML 数据集是否有问题,修正里面有问题的 label 以及标记错误的数据。它适用于 Sklearn / PyTorch / TensorFlow / XGBoost 等等框架,一行代码就能找到任意数据集中的数据和标签错误,像这样:
label_issues = cl.find_label_issues(data, labels)
而这行代码能帮你降低数据的噪音,让训练出来的模型更健壮:
cl.fit(data, labels)
GitHub 地址→http://github.com/cleanlab/cleanlab
1.2 动画生成器:motion-canvas
主语言:TypeScript
Motion Canvas 提供了两样东西:
- 一个用于生成编程动画的 TS 库;
- 该编程动画的实时预览;
简单来说,它能创建矢量动画,并与旁白同步。在线体验:http://motion-canvas.github.io/editor/quickstart/
2. GitHub Trending 周榜
2.1 文档助手:DocsGPT
本周 star 增长数:1,450+,主语言:Python、HTML
New
这周 ChatGPT 又烧起来了,这把搞点实际的,这是一个借助 GPT 模型帮助那些向文档提问、检索的人快速得到准确、全面的答案。
GitHub 地址→http://github.com/arc53/DocsGPT
2.2 再现塞尔达 3:zelda3
本周 star 增长数:750+,主语言:C
塞尔达·众神的三角力量的逆向工程,它用了 7-8 万行 C 代码来重现经典游戏,你可以从头玩到通关。
GitHub 地址→http://github.com/snesrev/zelda3
2.3 渗透工具:RedTeam-Tools
本周 star 增长数:450+
New
RedTeam-Tools 供 Red Team 使用的 120+ 技巧和工具,来提高渗透团队的技术实力。下图为其中一个工具的截图:
GitHub 地址→http://github.com/A-poc/RedTeam-Tools
2.4 低代码框架:ToolJet
本周 star 增长数:1,800+,主语言:JavaScript、TypeScript
一个低代码框架,可在几分钟内快速构建、部署内部工具。你可以连接到数据库,比如:PostgreSQL、MongoDB、ES 等等;也支持 API 端点(支持导入 OpenAPI spec 和 OAuth2 authorization),也支持对接 SaaS 工具,像 Slack、Notion、Google Sheets 之类的都可以接上,还支持对象存储服务。
GitHub 地址→http://github.com/ToolJet/ToolJet
2.5 轻量级搜索引擎:meilisearch
本周 star 增长数:850+,主语言:Rust
一个轻量、快捷的搜索引擎,非常适合在应用程序、网站、workflow 中使用。开箱即用,能在非常短时间内给你检索结果。大家也可以再重温 1 年半前卤蛋写的 「相见恨晚!开源的傻瓜搜索引擎,帮你快速实现搜索功能」。
3. 往期回顾
往期回顾:
以上为 2023 年第 6 个工作周的 GitHub Trending 🎉如果你 Pick 其他好玩、实用的 GitHub 项目,来 HelloGitHub 和大家一起分享下哟 🌝
- 开源月刊《HelloGitHub》第 84 期
- 10 款开源的在线游戏,点开就能玩的那种
- 穷人版生产力工具,好用得飞起 「GitHub 热点速览」
- GPT-4 来了!这些开源的 GPT 应用又要变强了
- 谁会拒绝一款开源的 3D 博客呢?
- 你的梦想家居「GitHub 热点速览」
- 开箱即用,你不可错过的好东西「GitHub 热点速览」
- AI 能多强「GitHub 热点速览」
- 开源月刊《HelloGitHub》第 83 期
- 真·生产力「GitHub 热点速览」
- 如何让程序更健壮「GitHub 热点速览」
- 朋友圈那串神秘字符背后的开源项目「GitHub 热点速览」
- 让人眼前一亮的应用「GitHub 热点速览」
- 2023 年该学点什么技术?「GitHub 热点速览 v.23.03」
- 开源月刊《HelloGitHub》第 82 期
- 忙活了一年的开源社区,终于赶上了春节前的末班车!
- 过年必备!亲戚计算器「GitHub 热点速览 v.23.02」
- Windows 11 内核新调试器「GitHub 热点速览 v.23.01」
- HelloGitHub 最受欢迎的开源项目 Top10(2022年)
- 你的 GitHub 年度报告「GitHub 热点速览 v.22.52」