好耶!谷歌推出AI医学成像套件;『深度学习数学工程』电子书;适用MacOS的Linux子系统;根据文本提示补全图像;前沿论文 | ShowMeAI资讯日报

语言: CN / TW / HK

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第4天,点击查看活动详情

👀日报合辑 | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子

📢 Google Cloud 推出医学成像套件,使基于人工智能的诊断更容易实现

https://cloud.google.com/medical-imaging

Google Cloud 近日推出了新的人工智能医学成像套件(Medical Imaging Suite),使用人工智能算法扫描医学图像,提供更快、更准确的诊断结果。这能缓解许多医院放射科医生和其他医护的巨大工作量,提高运转效率吧,同时也能改善医疗服务水平和患者的护理结果。

Medical Imaging Suite 的组件包括:Imaging Storage、Imaging Lab、Imaging Datasets & Dashboards、Imaging AI Pipelines。Google表示,医学成像套件旨在解决人工智能和机器学习模型开发时面临的常见痛点。

医学影像是医院用于诊断病人的最关键工具之一,每年有数十亿张图像被临床医生用来辅助诊断病因,占所有医疗数据的90%左右。视觉人工智能有望在医疗保健领域产生巨大的影响,而 Google 的医学影像套件展示了科技公司与医疗保健公司携手前进的可能性。

工具&框架

🚧 『macOS Subsystem for Linux』适用 macOS 的 Linux 子系统

https://github.com/macbian-linux/macos-subsystem-for-linux

macOS Subsystem for Linux 是一个用 Qemu 创建的适用 macOS 的 Linux 子系统,用于学习。

🚧 『stable-diffusion-prompt-inpainting』基于 Stable Diffusion 的提示图像补全

https://github.com/amrrs/stable-diffusion-prompt-inpainting

stable diffusion prompt inpainting 实现了基于 Stable Diffusion 的提示图像补全,你无需在图像上涂抹和遮蔽,只需要通过文本提示,就可以让AI帮你完成图像编辑和涂抹补全,它基于 Stable Diffusion 和 Clipseg 实现。

🚧 『Testing ML』通过代码、数据、模型的测试创建可靠的机器学习模型

https://github.com/GokuMohandas/testing-ml

https://madewithml.com/courses/mlops/testing/

Repo 是 MLOps课程 Testing(测试板块)的一部分,包含了交互式 notebook。课程覆盖了大部分概念,并关联了构建ML系统的软件工程最佳实践知识。

🚧 『gitui』Rust 写的 git 命令行图形界面

https://github.com/extrawurst/gitui

GitUI 是一个 Rust 写的 git 命令行图形界面,提供了舒适的终端 git GUI,它具备以下特性:

  • 快速而直观的键盘控制
  • 基于上下文的帮助
  • 检查、提交和修改
  • stage、取消stage、恢复和重置文件、块和行
  • 向/从远程推送/fetch
  • 分支列表
  • 浏览提交日志,对已提交的修改进行比较

🚧 『JSeg』基于 MMSegmentation 和 Jittor 的语义分割工具包

https://github.com/Jittor/JSeg

JSeg 是一个基于 MMSegmentation、Jittor 和 JDet 的语义分割工具箱。

博文&分享

👍 『The Mathematical Engineering of Deep Learning』深度学习数学工程 · 电子书

https://deeplearningmath.org/

本书对深度学习的数学工程进行了完整而简洁的概述,并覆盖了卷积神经网络、循环神经网络、transformers、生成对抗网络、强化学习等要点,当然书籍的重点是深度学习模型、算法和基本数学描述。

深度学习很容易通过数学语言在许多专业人士都能理解的水平上进行描述,因此文稿也很少涉及代码,而专注于通过数学讲解现代深度学习算法、模型和技术的精髓。所以,信号处理、统计学、物理学、纯数学、计量经济学、运筹学、量化管理、应用机器学习或应用深度学习领域的读者,具备扎实的数学基础,可以迅速深入了解关键数学工程组成部分。

  • Introduction(简介
  • Principles of Machine Learning(机器学习原理
  • Simple Neural Networks(简单神经网络
  • Optimization Algorithms(优化算法
  • Feed-Forward Deep Networks(前馈深度网络
  • Convolutional Neural Networks(卷积神经网络
  • Sequence Models(序列模型
  • Tricks of the Trade(交易技巧
  • Generative Adversarial Networks(生成对抗网络
  • Deep Reinforcement Learning(深度强化学习

数据&资源

🔥 『Contrastive Learning for Natural Language Processing』对比学习自然语言处理 · 资源大列表

https://github.com/ryanzhumich/Contrastive-Learning-NLP-Papers

对比学习是一种学习嵌入空间的技术,这样相似的数据样本具有接近的表示,而不同的样本彼此远离。可用于使用不同损失函数的有监督或无监督设置,以生成特定于任务或通用目的的表示。

虽然对比学习最初在视觉任务上取得了成功,但近年来在对比 NLP 方面的出版物越来越多。当前的 NLP 模型严重依赖于有效的表示学习算法。清单包含以下主题:

  • Tutorial and Survey(教程和调查)
  • Talk, Presentation, and Blog(演讲、演示和博客)
  • Foundation of Contrastive Learning(对比学习基础)
  • Contrastive Learning Objective(对比学习目标)
  • Sampling Strategy for Contrastive Learning(对比学习的抽样策略)
  • Most Notable Applications of Contrastive Learning(对比学习最显着的应用)
  • Analysis of Contrastive Learning(对比学习分析)
  • Graph Contrastive Learning(图对比学习)
  • Contrastive Learning for NLP(NLP对比学习)
  • Contrastive Data Augmentation for NLP(NLP的对比数据增强)
  • Text Classification(文本分类)
  • Sentence Embeddings and Phrase Embeddings(句子嵌入和短语嵌入)
  • Information Extraction(信息提取)
  • Sequence Labeling(序列标注)
  • Machine Translation(机器翻译)
  • Question Answering(问答)
  • Summarization(总结)
  • Text Generation(文本生成)
  • Data-Efficient Learning(数据高效学习)
  • Contrastive Pretraining(对比预训练)
  • Interpretability and Explainability(可解释性和可解释性)
  • Commonsense Knowledge and Reasoning(常识知识与推理)
  • Vision-and-Language(视觉与语言)
  • Others(其他)

研究&论文

公众号后台回复关键字 日报,免费获取整理好的论文合辑。

科研进展

  • 2022.09.22 『风格迁移』 VToonify: Controllable High-Resolution Portrait Video Style Transfer
  • 2022.09.22 『图像生成』 Poisson Flow Generative Models
  • 2022.07.19 『异常检测』 ADBench: Anomaly Detection Benchmark

⚡ 论文:VToonify: Controllable High-Resolution Portrait Video Style Transfer

论文时间:22 Sep 2022

领域任务:Face Alignment, Style Transfer, 风格迁移

论文地址:https://arxiv.org/abs/2209.11224

代码实现:https://github.com/williamyang1991/vtoonify

论文作者:Shuai Yang, Liming Jiang, Ziwei Liu, Chen Change Loy

论文简介:Although a series of successful portrait image toonification models built upon the powerful StyleGAN have been proposed, these image-oriented methods have obvious limitations when applied to videos, such as the fixed frame size, the requirement of face alignment, missing non-facial details and temporal inconsistency./尽管已经提出了一系列建立在强大的StyleGAN基础上的成功的人像图像去声模型,但这些面向图像的方法在应用于视频时有明显的局限性,例如固定的帧大小、脸部对齐的要求、非脸部细节的缺失和时间上的不一致。

论文摘要:生成高质量的艺术人像视频是计算机图形学和视觉领域的一项重要而理想的任务。尽管已经提出了一系列建立在强大的StyleGAN基础上的成功的肖像图像化模型,但这些面向图像的方法在应用于视频时有明显的局限性,如固定的帧大小、脸部对齐的要求、非脸部细节的缺失和时间上的不一致。在这项工作中,我们通过引入一个新颖的VToonify框架来研究具有挑战性的可控高分辨率人像视频风格转移。具体来说,VToonify利用StyleGAN的中分辨率和高分辨率层,根据编码器提取的多尺度内容特征渲染高质量的艺术肖像,以更好地保留帧的细节。由此产生的全卷积架构接受可变大小的视频中的非对齐人脸作为输入,有助于在输出中形成具有自然运动的完整人脸区域。我们的框架与现有的基于StyleGAN的图像卡通化模型兼容,将其扩展到视频卡通化,并继承了这些模型的吸引人的特点,对颜色和强度进行灵活的风格控制。这项工作提出了建立在Toonify和DualStyleGAN基础上的VToonify的两个实例,分别用于基于集合和基于示范的肖像视频风格转移。广泛的实验结果表明,我们提出的VToonify框架在生成具有灵活风格控制的高质量和时间连贯的艺术肖像视频方面比现有的方法更有效。

⚡ 论文:Poisson Flow Generative Models

论文时间:22 Sep 2022

领域任务:Image Generation,图像生成

论文地址:https://arxiv.org/abs/2209.11178

代码实现:https://github.com/newbeeer/poisson_flow

论文作者:Yilun Xu, Ziming Liu, Max Tegmark, Tommi Jaakkola

论文简介:We interpret the data points as electrical charges on the z=0 hyperplane in a space augmented with an additional dimension z, generating a high-dimensional electric field (the gradient of the solution to Poisson equation)./我们将数据点解释为空间中z=0超平面上的电荷,用一个额外的维度z增强,产生一个高维电场(泊松方程的解的梯度)。

论文摘要:我们提出了一个新的 "泊松流 "生成模型(PFGM),将高维半球上的均匀分布映射为任何数据分布。我们将数据点解释为空间中z=0超平面上的电荷,用一个额外的维度z增强,产生一个高维电场(泊松方程的解的梯度)。我们证明,如果这些电荷沿着电场线向上流动,它们在z=0平面上的初始分布会转化为半径为r的半球上的分布,在r→∞的极限中变得均匀。为了学习双射转换,我们估计了扩增空间中的归一化场。对于取样,我们设计了一个由有物理意义的额外维度固定的后向ODE:当Z达到零时,样本会击中未增强的数据流形。通过实验,PFGM在CIFAR-10的归一化流模型中达到了目前最先进的性能,Inception评分为9.68,FID评分为2.48。它的表现也与最先进的SDE方法相当,同时在图像生成任务上提供10倍到20倍的加速。此外,PFGM在较弱的网络结构上对估计错误的容忍度更高,对欧拉方法中的步长也更强。代码可在 https://github.com/Newbeeer/poisson_flow 获取。

⚡ 论文:ADBench: Anomaly Detection Benchmark

论文时间:19 Jun 2022

领域任务:Anomaly Detection, Outlier Detection,异常检测

论文地址:https://arxiv.org/abs/2206.09426

代码实现:https://github.com/minqi824/adbench

论文作者:Songqiao Han, Xiyang Hu, Hailiang Huang, Mingqi Jiang, Yue Zhao

论文简介:Given a long list of anomaly detection algorithms developed in the last few decades, how do they perform with regard to (i) varying levels of supervision, (ii) different types of anomalies, and (iii) noisy and corrupted data?/鉴于过去几十年来开发的一长串异常检测算法,它们在(i)不同的监督水平,(ii)不同类型的异常,以及(iii)噪声和损坏的数据方面表现如何?

论文摘要:鉴于过去几十年来开发的一长串异常检测算法,它们在(i)不同的监督水平,(ii)不同类型的异常,以及(iii)噪声和损坏的数据方面表现如何?在这项工作中,我们通过在57个基准数据集上用30种算法进行(据我们所知)最全面的异常检测基准,即ADBench来回答这些关键问题。我们广泛的实验(共98,436次)确定了对监督和异常类型的作用的有意义的见解,并为研究人员在算法选择和设计方面解锁了未来的方向。通过ADBench,研究人员可以轻松地在数据集上对新提出的方法(包括我们从自然语言和计算机视觉领域贡献的方法)与现有的基线进行全面和公平的评估。为了促进可及性和可重复性,我们将ADBench和相应的结果完全开源。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!

◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。

◉ 点击 电子月刊,快速浏览月度合辑。

「其他文章」