不可以涩涩!AI续写软件初体验;迁移学习路线图;谷歌新闻非官方搜索API;CS295『因果推理』2021课程资料;前沿论文 | ShowMeAI资讯日报

语言: CN / TW / HK

我报名参加金石计划1期挑战——瓜分10万奖池,这是我的第13篇文章,点击查看活动详情

👀日报合辑 | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子

📢 AI 续写软件初体验:不可以涩涩!CP被🔪!我人麻了...

B 站 Up 主『摸鱼事务所』昨天发布了 AI 续写软件『彩云小梦』的体验视频,与带有角色设定的 AI 机器人打字聊天,眼看着对话走到了奇怪的方向(⊙o⊙)

一如既往,笑死在弹幕和评论!有人拿这款软件续写同人文,结果剧情变幻莫测急转直下。还有人给了一个美丽的言情小说开头,却陷入恐怖故事里 (°ー°〃) Up主别出心裁,他用来讨论广告创意!把一款『定制梦境』的软件用成了生产率工具 ㄟ( ▔, ▔ )ㄏ

谈到 AI 就免不了隐私和边界话题的讨论。当前的『彩云小梦』不可以涩涩啦,更早期的使用者见过不太一样的版本。当然,更棘手的挑战来自于真实世界难以消弭的偏见、歧视、隐私和敏感话题,微软小冰、Google LaMDA、Facebook Blender 等应用都曾折戟。毕竟,AI 只是人类的一面镜子。(来源:BV1FG411G77q)

工具&框架

🚧 『DeepPavlov』开源对话 AI 库

https://github.com/deeppavlovteam/DeepPavlov

https://demo.deeppavlov.ai/

DeepPavlov 是一个基于 TensorFlow、Keras 和 PyTorch 的开源对话式人工智能库。DeepPavlov 可以用于:开发可用于生产的聊天机器人和复杂的对话系统、NLP领域对话系统的研究。

🚧 『Flutter Chat UI』基于 Flutter 的聊天界面 UI

https://github.com/flyerhq/flutter_chat_ui

https://flyer.chat/

Flyer Chat 是一个使用 Flutter 或 React Native 创建应用内聊天体验的平台。这个资源库包含 Flutter 的聊天 UI 实现。它具备以下特点:

  • 免费、开源、社区驱动
  • 多后台支持,可选择自己喜欢的后端
  • 可定制,支持自定义主题、地域和更多
  • 极小的依赖性

🚧 『TuGraph』高效的图数据库

https://github.com/TuGraph-db/tugraph-db

TuGraph 是一个高效的图形数据库,支持高数据量、低延迟查询和快速图形分析。

🚧 『VDP』将视觉AI与现代数据栈无缝集成的开源工具

https://github.com/instill-ai/vdp

https://www.instill.tech/

视觉数据准备(VDP)是一个开源的视觉数据ETL工具,用于简化端到端的视觉数据处理管道。核心步骤功能包括:

  • 从预先建立的数据源(如云/企业内部存储或物联网设备)中提取非结构化的视觉数据
  • 通过Vision AI模型将其转化为可分析的结构化数据
  • 将转换后的数据加载到仓库、应用程序或其他场景。

🚧 『GNews』Google新闻的非官方搜索API

https://github.com/ranahaani/GNews

https://pypi.org/project/gnews/

一个轻量级的 Python 包,它提供了一个 API 来搜索谷歌新闻上的文章,并返回一个 JSON 格式的结果。

博文&分享

👍 『CS 295 - Causal Reasoning』UCI·因果推理(2021课程)

https://www.ics.uci.edu/~dechter/courses/ics-295cr/spring-2021/

https://www.youtube.com/playlist?list=PLBxVZ0owetvpxLEXmVEaZWaAHJAd-lXmq

课程涵盖因果推理的相关主题,以研讨会的形式进行,课程的前半部分有课程讲授,后半部分是学生阅读并向全班展示基于书本章节的论文。本课程是为人工智能和机器学习领域的博士生准备的,需要有一定的机器学习基础。

课程包含以下主题:

  • Introduction: Causal Hierarchy / 简介:因果层次结构
  • The Simpson Paradox / 辛普森悖论
  • Structural Causal Models / 结构因果模型
  • Identification of Causal Effects / 因果效应识别
  • The Problem of Confounding and the Back-Door Criterion / 混杂问题和后门标准
  • Causal Calculus / 因果演算
  • Linear Structural Causal Models / 线性结构的因果模型
  • Counterfactuals / 反事实
  • Structural Learning / 结构学习

👍 『Grokking Stable Diffusion.ipynb』Stable Diffusion实战 (Colab)

https://colab.research.google.com/drive/1dlgggNa5Mz8sEAGU0wFCHhGLFooW_pf1

数据&资源

🔥 『A Roadmap for Transfer Learning』迁移学习路线图

https://github.com/thuml/A-Roadmap-for-Transfer-Learning

https://zhuanlan.zhihu.com/p/463332254

当下大部分的深度学习应用(尤其是CV和NLP)或多或少都会用到预训练模型,因此综述按照这些应用的生命周期,也就是 Pre-training - Adaptation - Evaluation,进行展开。

  • 预训练(Pre-training)阶段的目标是获得可迁移的知识。深度模型在具有大规模数据的上游任务上进行预训练,以学习可迁移到各种下游任务的特征表示或参数。
  • 适应阶段(Adaptation)的目标是重用可迁移的知识。通过将预训练的模型适应到下游任务,能够以更少的标注样本实现更好的泛化。而当下游任务不存在标注样本时,通常还会使用来自相同学习任务但不同数据分布的另一个数据域。上述两个过程分别涉及到了跨任务或者跨分布的迁移性。
  • 评估阶段(Evaluation)的目标是评估模型的迁移性。通过评估某个模型或者某个方法在跨任务或者跨分布情况下的迁移性,可以帮助我们更好地挑选预训练模型、改进预训练方法、设计适应方法等。

🔥 『personal emotional dialogue system』对话系统相关文献列表

https://github.com/neuChatbotDS/personal-emotional-dialogue-system

研究&论文

公众号后台回复关键字 日报,免费获取整理好的论文合辑。

科研进展

  • 2022.08.31 『图像质量评估』 PyTorch Image Quality: Metrics for Image Quality Assessment
  • 2022.07.15 『病变检测』 ESFPNet: efficient deep learning architecture for real-time lesion segmentation in autofluorescence bronchoscopic video
  • 2022.08.31 『贝叶斯推断』 Stationary Kernels and Gaussian Processes on Lie Groups and their Homogeneous Spaces I: the Compact Case

⚡ 论文:PyTorch Image Quality: Metrics for Image Quality Assessment

论文时间:31 Aug 2022

领域任务:Image Quality Assessment,图像质量评估

论文地址:https://arxiv.org/abs/2208.14818

代码实现:https://github.com/photosynthesis-team/piq

论文作者:Sergey Kastryulin, Jamil Zakirov, Denis Prokopenko, Dmitry V. Dylov

论文简介:Image Quality Assessment (IQA) metrics are widely used to quantitatively estimate the extent of image degradation following some forming, restoring, transforming, or enhancing algorithms./图像质量评估(IQA)指标被广泛用于定量估计某些成形、恢复、转换或增强算法后的图像退化程度。

论文摘要:图像质量评估(IQA)指标被广泛用于定量估计一些成形、恢复、转换或增强算法后的图像退化程度。我们提出了PyTorch图像质量(PIQ),这是一个以可用性为中心的库,包含了最流行的现代IQA算法,保证根据其原始命题正确实施,并经过彻底验证。在本文中,我们详细介绍了该库的基础原理,描述了使其可靠的评估策略,提供了展示性能-时间权衡的基准,并强调了在PyTorch后端使用该库时GPU加速的好处。PyTorch图像质量是一个开源软件,获取地址:https://github.com/photosynthesis-team/piq/ 。

⚡ 论文:ESFPNet: efficient deep learning architecture for real-time lesion segmentation in autofluorescence bronchoscopic video

论文时间:15 Jul 2022

领域任务:Lesion Detection, Lesion Segmentation,病变检测病变分割

论文地址:https://arxiv.org/abs/2207.07759

代码实现:https://github.com/dumyCq/ESFPNet

论文作者:Qi Chang, Danish Ahmad, Jennifer Toth, Rebecca Bascom, William E. Higgins

论文简介:These values are superior to results achieved by other competing architectures that use Mix transformers or CNN-based encoders./这些数值优于其他使用混合变换器或基于CNN的编码器的竞争架构所取得的结果。

论文摘要:肺癌往往在晚期才被发现,导致病人的死亡率很高。因此,最近的研究集中在早期疾病检测方面。肺癌一般首先表现为在气道壁的支气管上皮内发生病变。支气管镜检查是有效的无创性支气管病变检测的首选程序。特别是,自体荧光支气管镜(AFB)可以区分正常和病变组织的自体荧光特性,即病变在AFB视频帧中显示为红褐色,而正常组织显示为绿色。由于最近的研究显示AFB对病变有很高的敏感性,它已成为标准支气管镜气道检查中检测早期肺癌的一个潜在的关键方法。不幸的是,手动检查AFB视频是非常繁琐和容易出错的,而在潜在的更强大的自动AFB病变检测和分割方面所做的努力有限。我们提出了一个实时的深度学习架构ESFPNet,用于从AFB视频流中对支气管病变进行稳健检测和分割。该架构的特点是利用预训练的混合Transformer(MiT)编码器结构和分阶段的特征金字塔(ESFP)解码器结构。来自肺癌患者气道检查的AFB视频的结果表明,我们的方法给出的平均Dice指数和IOU值分别为0.782和0.658,而处理量为27帧/秒。这些数值优于其他使用混合Transformer或基于CNN的编码器的竞争架构所取得的结果。此外,在ETIS-LaribPolypDB数据集上的优异表现表明了它在其他领域的潜在适用性。

⚡ 论文:Stationary Kernels and Gaussian Processes on Lie Groups and their Homogeneous Spaces I: the Compact Case

论文时间:31 Aug 2022

领域任务:Bayesian Inference, Gaussian Processes,贝叶斯推断高斯过程

论文地址:https://arxiv.org/abs/2208.14960

代码实现:https://github.com/imbirik/liestationarykernels

论文作者:Iskander Azangulov, Andrei Smolensky, Alexander Terenin, Viacheslav Borovitskiy

论文简介:The invariance of a Gaussian process' covariance to such symmetries gives rise to the most natural generalization of the concept of stationarity to such spaces./高斯过程的协方差对这种对称性的不变性引起了静止性概念对这种空间的最自然的概括。

论文摘要:高斯过程可以说是空间统计中最重要的模型类别。它们编码了关于建模函数的先验信息,可用于精确或近似的贝叶斯推断。在许多应用中,特别是在物理科学和工程领域,也包括地理统计学和神经科学等领域,对称性不变性是人们可以考虑的最基本的先验信息形式之一。高斯过程的协方差对这种对称性的不变性引起了静止性概念对这种空间的最自然的概括。在这项工作中,我们开发了建设性的实用技术,用于在对称性背景下产生的一大类非欧几里得空间上建立静止的高斯过程。我们的技术使得(i)计算协方差核和(ii)从定义在这类空间上的先验和后验高斯过程中取样成为可能,而且都是以一种实用的方式。这项工作分为两部分,分别涉及不同的技术考虑:第一部分研究紧凑空间,第二部分研究具有一定结构的非紧凑空间。我们的贡献使我们研究的非欧几里得高斯过程模型与标准高斯过程软件包中的公认的计算技术兼容,从而使它们为实践者所接受。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!

◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。

◉ 点击 电子月刊,快速浏览月度合辑。

「其他文章」