临阵磨枪!LeetCode技术面试要点清单;【前沿】机器人描述资源集锦;【热门】生成式Diffusion模型综述;前沿论文 | ShowMeAI资讯日报

语言: CN / TW / HK

我报名参加金石计划1期挑战——瓜分10万奖池,这是我的第22篇文章,点击查看活动详情

👀日报合辑 | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子

工具&框架

🚧 『agg』asciinema gif 生成器

http://github.com/asciinema/agg

agg 是一个命令行工具,用于从 asciinema 终端记录器产生的 asciicast v2 文件生成 GIF 动画文件。它使用 gifski 库来产生优化的、高质量的GIF输出,并具有精确的帧计时。

🚧 『YOLOX M1 Mac』YOLO 的无锚版本,支持 M1 芯片的 Mac

http://github.com/j-ohashi/YOLOX-M1-Mac

YOLOX 是 YOLO 的无锚版本,设计更简单,但性能更好——超过 yolov3~v5,支持 MegEngine、ONNX、TensorRT、ncnn 和 OpenVINO!它的目标是在研究和工业界之间架起一座桥梁,弥合研究界和工业界之间的差距。YOLOX M1 Mac 是 PyTorch 版本 YOLOX 的实现,支持 M1 芯片的 Mac。

🚧 『MLIR Playground』在浏览器中玩 MLIR 的实现

http://github.com/MLIR-China/mlir-playground

http://playground.mlir-china.org/

MLIR Playground 是一个可以在浏览器中玩 MLIR 的实现,它不需要安装任何依赖性或设置一个构建系统;私密和安全,一切都在你的浏览器的沙盒环境中本地运行。

🚧 『async_simple』阿里巴巴开源的轻量级 C++ 异步框架

http://github.com/alibaba/async_simple

async_simple 是阿里巴巴开源的轻量级 C++ 异步框架,提供了基于 C++20 无栈协程(Lazy)、有栈协程(Uthread)以及 Future/Promise 等异步组件。

async_simple 诞生于阿里巴巴智能引擎事业部,目前广泛应用于图计算引擎、时序数据库、搜索引擎等在线系统。连续两年经历天猫双十一磨砺,承担了亿级别流量洪峰,具备非常强劲的性能和可靠的稳定性。

🚧 『SREWorks』云原生运维平台

http://github.com/alibaba/SREWorks

SREWorks是阿里巴巴大数据SRE团队云原生运维平台,沉淀了团队近10年经过内部业务锤炼的 SRE 工程实践,秉承“数据化、智能化”运维思想,帮助运维行业更多的从业者采用“数智”思想做好高效运维。它是一站式数据化、智能化运维SaaS应用套件(交付、监测、管理、控制、运营、服务)。

博文&分享

👍 『leetcode-curation-topica』技术面试准备清单

http://github.com/fterh/leetcode-curation-topical

针对面试过程中容易被问到的数据结构 LeetCode 题,作者按照主题/概念进行归类整理。尝试了一题多解:通过多种方式以不同的时间/空间效率(通过使用各种数据结构)来解决。

清单包含以下主题,并标示了 easy、medium、hard 三个难度等级:

  • Arrays/Strings(数组 / 字符串
  • Sliding Window / Two Pointer(滑动窗口 / 两个指针)
  • Intervals(区间合并/插入/排序)
  • Heaps/Priority Queues(堆/优先队列)
  • Linked Lists / Deques(链表 / 双端队列
  • Trees(
  • Graphs(
  • Recursion/Backtracking(递归/回溯
  • Dynamic Programming(动态规划
  • Design & Implementation(设计模式与实现
  • Greedy(贪心

👍 『A Survey on Generative Diffusion Model』生成式Diffusion模型综述

http://github.com/chq1155/A-Survey-on-Generative-Diffusion-Model

论文:http://arxiv.org/pdf/2209.02646.pdf

论文『A Survey on Generative Diffusion Model』对Diffusion模型领域的里程碑模型进行了总结,如 DDPM、DSM、core SDE 等。并针对基于扩散的模型领域中的现有问题提出了分类改进技术,并介绍了扩散模型的应用。

Repo 是论文总结,清单包含以下主题:

  • Methodology Improvement / 方法改进
  • Speed-up / 提速
  • Distribution Diversification / 分布多样化
  • Application / 应用
  • Computer Vision / 计算机视觉
  • Sequential Modeling / 序列模型(文本)
  • Audio / 音频

数据&资源

🔥 『Awesome Robot Descriptions』机器人描述相关文献列表

http://github.com/robot-descriptions/awesome-robot-descriptions

清单包含以下主题:

  • Arms / 机械臂
  • Bipeds / 双足机器人
  • Dual Arms / 双臂机器人
  • Drones / 无人机
  • Educational / 教学机器人
  • End Effectors / 末端辅助机器人
  • Mobile Manipulators / 轮动机械手
  • Humanoids / 人形机器人
  • Quadrupeds / 四足机器人

🔥 『3DMM and 3D Face Reconstruction and Manipulation』3D人脸重建与操作相关文献列表

http://github.com/AndrewChiyz/3DMM-and-3D-Face-reconstruction-and-manipulation

清单包含以下主题:

  • Deep learning (VAE & Encoder-decoder models)
  • Deep learning (GAN models)
  • Deep learning (Hybrid structures & Nonlinear 3DMM)
  • Self-supervised
  • High Fidelity, Face Texture, GAN Hallucination
  • Face reconstruction from videos
  • CVPR2019、CVPR2018、CVPR2017
  • ICCV2019、ICCV2017、ECCV2018、CoRR
  • TPAMI
  • Dataset
  • Models

研究&论文

公众号后台回复关键字 日报,免费获取整理好的论文合辑。

科研进展

  • 2022.09.07 『目标检测』 YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
  • 2022.08.03 『语义分割』 MinVIS: A Minimal Video Instance Segmentation Framework without Video-based Training
  • 2022.09.12 『文本分类』 CSL: A Large-scale Chinese Scientific Literature Dataset

⚡ 论文:YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications

论文时间:7 Sep 2022

领域任务:object-detection, Object Detection, 目标检测

论文地址:http://arxiv.org/abs/2209.02976

代码实现:http://github.com/meituan/yolov6

论文作者:Chuyi Li, Lulu Li, Hongliang Jiang, Kaiheng Weng, Yifei Geng, Liang Li, Zaidan Ke, Qingyuan Li, Meng Cheng, Weiqiang Nie, Yiduo Li, Bo Zhang, Yufei Liang, Linyuan Zhou, Xiaoming Xu, Xiangxiang Chu, Xiaoming Wei, Xiaolin Wei

论文简介:The YOLO community has prospered overwhelmingly to enrich its use in a multitude of hardware platforms and abundant scenarios./YOLO社区以压倒性的优势丰富了其在众多硬件平台和丰富场景中的应用。

论文摘要:多年来,YOLO系列一直是高效物体检测的事实上的工业级标准。YOLO社区已经取得了压倒性的发展,以丰富其在众多硬件平台和丰富场景中的应用。在这份技术报告中,我们努力把它的极限推到一个新的水平,以坚定不移的心态向行业应用迈进。考虑到现实环境中对速度和准确性的不同要求,我们广泛地研究了工业界或学术界最新的物体检测进展。具体来说,我们大量吸收了最近的网络设计、训练策略、测试技术、量化和优化方法的思想。在此基础上,我们整合了我们的想法和实践,建立了一套不同规模的可部署的网络,以适应多样化的用例。在YOLO作者的慷慨许可下,我们将其命名为YOLOv6。我们也表示热烈欢迎用户和贡献者的进一步改进。对于性能的一瞥,我们的YOLOv6-N在COCO数据集上达到了35.9%的AP,在NVIDIA Tesla T4 GPU上的吞吐量为1234 FPS。YOLOv6-S在495FPS的情况下达到了43.5%的AP,超过了其他相同规模的主流检测器~(YOLOv5-S、YOLOX-S和PPYOLOE-S)。我们的量化版本YOLOv6-S甚至在869 FPS时带来了新的最先进的43.3%的AP。此外,YOLOv6-M/L也比其他具有类似推理速度的检测器取得了更好的准确性表现(即49.5%/52.3%)。我们仔细进行了实验,以验证每个组件的有效性。我们的代码可在 http://github.com/meituan/YOLOv6 获取。

⚡ 论文:MinVIS: A Minimal Video Instance Segmentation Framework without Video-based Training

论文时间:3 Aug 2022

领域任务:Instance Segmentation, Semantic Segmentation, 语义分割实例分割

论文地址:http://arxiv.org/abs/2208.02245

代码实现:http://github.com/nvlabs/minvis

论文作者:De-An Huang, Zhiding Yu, Anima Anandkumar

论文简介:By only training a query-based image instance segmentation model, MinVIS outperforms the previous best result on the challenging Occluded VIS dataset by over 10% AP./通过只训练一个基于查询的图像实例分割模型,MinVIS在具有挑战性的Occluded VIS数据集上的表现超过了之前的最佳结果,AP超过了10%。

论文摘要:我们提出了MinVIS,一个最小化的视频实例分割(VIS)框架,它既没有基于视频的架构,也没有训练程序,就能达到最先进的VIS性能。通过只训练一个基于查询的图像实例分割模型,MinVIS在具有挑战性的Occluded VIS数据集上的表现比之前的最佳结果高出10%以上。由于MinVIS将训练视频中的帧视为独立的图像,我们可以在不做任何修改的情况下对训练视频中的标注帧进行大幅度的子采样。在YouTube-VIS 2019/2021上,MinVIS只用了1%的标注帧,就超过了完全监督的最先进的方法,或者与之相当。我们的主要观察结果是,经过训练的查询在帧内物体实例之间具有判别能力,在时间上是一致的,可以用来追踪实例,而不需要任何人工设计的启发式方法。因此,MinVIS有以下推理管道:我们首先将训练好的基于查询的图像实例分割独立应用于视频帧。然后,通过对相应的查询进行双边匹配来追踪被分割的实例。这种推理是以在线方式进行的,不需要一次性处理整个视频。因此,MinVIS具有降低标签成本和内存需求的实际优势,同时不牺牲VIS的性能。代码见:http://github.com/NVlabs/MinVIS

⚡ 论文:CSL: A Large-scale Chinese Scientific Literature Dataset

论文时间:12 Sep 2022

领域任务:Text Classification,文本分类

论文地址:http://arxiv.org/abs/2209.05034

代码实现:http://github.com/ydli-ai/csl,http://github.com/p01son6415/csl

论文作者:Yudong Li, Yuqing Zhang, Zhe Zhao, Linlin Shen, Weijie Liu, Weiquan Mao, HUI ZHANG

论文简介:The CSL can serve as a Chinese corpus./CSL可以作为一个中文语料库。

论文摘要:科学文献作为一个高质量的语料库,支持了大量的自然语言处理(NLP)研究。然而,现有的数据集是以英语为中心的,这限制了中文科学NLP的发展。在这项工作中,我们提出了CSL,一个大规模的中文科学文献数据集,它包含了396k篇论文的标题、摘要、关键词和学术领域。就我们所知,CSL是第一个中文科学文献数据集。CSL可以作为一个中文语料库。同时,这种半结构化的数据是一种自然的注释,可以构成许多有监督的NLP任务。基于CSL,我们提出了一个基准来评估模型在科学领域任务中的表现,即总结、关键词生成和文本分类。我们分析了现有文本到文本模型在评估任务上的行为,并揭示了中文科学NLP任务所面临的挑战,这为未来的研究提供了宝贵的参考。数据和代码可在 http://github.com/ydli-ai/CSL 获取

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!

◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。

◉ 点击 电子月刊,快速浏览月度合辑。

「其他文章」