东方甄选推独立App自立门户;西湖大学『强化学习数学基础』教材书稿;经典书籍『深入浅出设计模式』Python版代码;前沿论文 | ShowMeAI资讯日报

语言: CN / TW / HK

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第32天,点击查看活动详情

👀日报合辑 | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子

📢 东方甄选推独立App,新晋『抖音一哥』这就要自立门户了?

东方甄选在各大应用平台上线了同名独立App,据第三方数据显示,目前累计下载量已接近20万。

APP底部有甄选、分类、购物车和我的订单4个入口。『分类』页面,除了东方甄选自营商品以外,共有11个类目的近千款商品,大多是零食、生鲜、农副产品和图书等,品类与抖音商城基本一致,商品价格也无明显变化,仅部分产品参与限时折扣。App当前还仅限于购物,直播等功能尚未开通。

俞敏洪6月底直播时表示,未来东方甄选会非常认真地布局,建立一个立体化的销售平台,为更多的中国商家服务,除了抖音以外,也会考虑到其他地方;还会以较快速度自建产品体系,类似于网易严选。东方甄选独立App上线,说明正在沿着俞敏洪预设的轨道前进。

工具&框架

🚧 『bqplot』IPython/Jupyter notebooks绘图库

https://github.com/bqplot/bqplot

bqplot 是一个 IPython/Jupyter notebooks 绘图库,在 bqplot中,一个绘图的每个组件都是一个交互式部件。这使得用户可以将可视化与其他Jupyter交互式部件集成起来,只需几行Python代码就可以创建集成的图形用户界面。

🚧 『flink-ml』Apache Flink机器学习库

https://github.com/apache/flink-ml

https://flink.apache.org/zh/

Flink ML是一个提供机器学习(ML)API和基础设施的工具库,它简化了ML管道的构建。用户可以用标准的ML APIs实现ML算法,并进一步使用这些基础设施来建立ML管道,用于训练和推理工作。Flink ML是在Apache Flink的基础上开发的。

🚧 『Azimuth』面向文本分类的开源数据集和错误分析工具

https://github.com/ServiceNow/azimuth

https://servicenow.github.io/azimuth/main/

Azimuth 是一个开源的应用程序,通过数据集和错误分析,帮助人工智能从业者和数据科学家更好地理解他们的数据集和模型预测。它利用不同的工具,包括鲁棒性测试、语义相似性分析和突出性地图,由智能标签和拟议行动等概念统一起来。目前只支持文本分类用例。

🚧 『gym-wordle』Wordle的Gym强化学习研究环境

https://github.com/zach-lawless/gym-wordle

Wordle是一个猜词游戏,玩家有六次猜词机会,以猜出当天的五个字母的隐藏单词。根据玩家的猜测,游戏会对所猜单词中的每个字母提供反馈。如果玩家在用完所有的六个猜测之前猜对了这个词,游戏就赢了。这个猜词游戏被构建为强化学习环境,可以被使用。

🚧 『Opni』Opni = Kubernetes的AIOps + 日志 + 监控

https://github.com/rancher/opni

https://opni.io/v0.4/

Opni 具有日志异常检测功能:只需将你的日志提交给Opni,其人工智能模型将自动学习并识别你的控制平台、etcd和应用程序日志中的异常行为。

博文&分享

👍 『Mathmatical Foundation of Reinforcement Learning』强化学习的数学基础·免费书稿

https://github.com/MathFoundationRL/Book-Mathmatical-Foundation-of-Reinforcement-Learning

这是新书『强化学习的数学基础』的书稿,作者赵世钰,现任西湖大学工学院智能无人系统实验室主任。2022年秋季是作者第四次教授强化学习的研究生课程,撰写这份资料是为了弥补已有教材的不足,具有以下特点:

  • 从数学角度介绍强化学习各主题,帮助读者更好地理解算法的数学根源、设计初衷与作用机制。
  • 数学的呈现方式也经过精心设计,深度也被仔细地控制在适当的水平。
  • 书中大量示例均基于网格世界任务,非常易于理解,且有助于说明新概念和算法。
  • 将算法核心思想与可能分散读者注意力的复杂问题进行了区分,帮助读者更好地掌握算法心思想。
  • 章末有问答部分,汇总整理自网络上的常见问题,并给出了明确的参考答案。

本书的每一章都在前一章的基础上构建,并为后续章节奠定了必要的基础。不同章节内容主题与彼此之间的关系如图所示。

  • 第2章:贝尔曼方程,是分析状态值的基本工具
  • 第3章:贝尔曼最优方程,是一个特殊的贝尔曼方程
  • 第4章:值迭代算法,是一种求解贝尔曼最优方程的算法
  • 第5章:蒙特卡罗学习,是第4章策略迭代算法的扩展
  • 第6章:随机逼近的基础知识
  • 第7章:时差学习,第6章是本章的基础
  • 第8章:扩展了表格时间对价值函数逼近情况的差分学习方法
  • 第9章:策略迭代
  • 第10章:actor-critic 方法

👍 『Python Head First Design Patterns』深入浅出设计模式(第二版)·Python版代码

https://github.com/rebuild-123/Python-Head-First-Design-Patterns

https://github.com/bethrobson/Head-First-Design-Patterns

这是GitHub上 2.7K Star的项目『Head First Design Patterns』的Python版实现。原项目的代码为 java。

数据&资源

🔥 『Adversarial Explainable AI』对抗可解释AI相关资源列表

https://github.com/hbaniecki/adversarial-explainable-ai

https://hbaniecki.com/adversarial-explainable-ai/

🔥 『Awesome NeuroAI Papers』神经科学与深度学习交叉论文列表

https://github.com/CYHSM/awesome-neuro-ai-papers

研究&论文

公众号回复关键字日报,免费获取整理好的论文合辑。

科研进展

  • 2022.08.11 『语音降噪』 Speech Enhancement and Dereverberation with Diffusion-based Generative Models
  • 2022.08.18 『目标检测』Unifying Visual Perception by Dispersible Points Learning
  • 2022.08.18 『目标检测』RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object Detection
  • 2022.08.08 『看图说话』Analog Bits: Generating Discrete Data using Diffusion Models with Self-Conditioning

⚡ 论文:Speech Enhancement and Dereverberation with Diffusion-based Generative Models

论文时间:11 Aug 2022

领域任务:Speech Dereverberation,语音降噪

论文地址:https://arxiv.org/abs/2208.05830

代码实现:https://github.com/sp-uhh/sgmse

论文作者:Julius Richter, Simon Welker, Jean-Marie Lemercier, Bunlong Lay, Timo Gerkmann

论文简介:Furthermore, we show that the proposed method achieves remarkable state-of-the-art performance in single-channel speech dereverberation./此外,我们还表明,所提出的方法在单通道语音去混响方面取得了显著的先进性能。

论文摘要:最近,基于扩散的生成模型已被引入到语音增强的任务中。清洁语音的损坏被建模为一个固定的前向过程,在这个过程中,越来越多的噪声被逐渐加入。通过学习以迭代的方式逆转这一过程,并以噪声输入为条件,生成干净的语音。我们在以前工作的基础上,在随机微分方程的形式中推导出训练任务。我们对基本的分数匹配目标进行了详细的理论回顾,并探讨了在测试时解决反向过程的不同采样器配置。通过使用自然图像生成文献中的一个复杂的网络结构,与我们以前的方法相比,我们明显提高了性能。我们还表明,在对不同于训练用的语料库进行评估时,我们可以与最近的判别性模型竞争,并实现更好的泛化。我们用主观听觉测试来补充评价结果,其中我们提出的方法被评为最佳。此外,我们表明,所提出的方法在单通道语音去混响方面取得了显著的最先进的性能。我们的代码和音频实例可在线获取,地址为 https://uhh.de/inf-sp-sgmse

⚡ 论文:Unifying Visual Perception by Dispersible Points Learning

论文时间:18 Aug 2022

领域任务:Instance Segmentation, object-detection, 实例分割目标检测

论文地址:https://arxiv.org/abs/2208.08630

代码实现:https://github.com/sense-x/unihead

论文作者:Jianming Liang, Guanglu Song, Biao Leng, Yu Liu

论文简介:The method, called UniHead, views different visual perception tasks as the dispersible points learning via the transformer encoder architecture./该方法被称为UniHead,它将不同的视觉感知任务视为通过transformer编码器架构进行的可分散点学习。

论文摘要:我们提出了一个概念上简单、灵活和通用的视觉感知头,用于不同的视觉任务,如分类、物体检测、实例分割和姿势估计,以及不同的框架,如单阶段或双阶段管道。我们的方法可以有效地识别图像中的物体,同时生成高质量的目标检测框或基于轮廓的分割掩码或关键点集。该方法被称为UniHead,它将不同的视觉感知任务视为通过transformer编码器架构进行的可分散点学习。给定一个固定的空间坐标,UniHead自适应地将其分散到不同的空间点,并通过transformer编码器推理它们之间的关系。它直接以多个点的形式输出最终的预测集,使我们能够在不同的框架中用相同的头设计来执行不同的视觉任务。我们展示了对ImageNet分类和COCO系列挑战的所有三个轨道的广泛评估,包括物体检测、实例分割和姿态估计。没有任何花哨的东西,UniHead可以通过单一的视觉头设计来统一这些视觉任务,并且与为每个任务开发的专家模型相比取得了相当的性能。我们希望我们简单而通用的UniHead可以作为一个坚实的基线,帮助促进通用的视觉感知研究。代码和模型可在https://github.com/Sense-X/UniHead获取。

⚡ 论文:RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object Detection

论文时间:18 Aug 2022

领域任务:object-detection, Object Detection,目标检测

论文地址:https://arxiv.org/abs/2208.08738

代码实现:https://github.com/chasel-tsui/mmdet-rfla

论文作者:Chang Xu, Jinwang Wang, Wen Yang, Huai Yu, Lei Yu, Gui-Song Xia

论文简介:Then, instead of assigning samples with IoU or center sampling strategy, a new Receptive Field Distance (RFD) is proposed to directly measure the similarity between the Gaussian receptive field and ground truth./然后,我们提出了一种新的感受场距离(RFD),以直接测量高斯感受场和地面真实之间的相似性,而不是用IoU或中心采样策略来分配样本。

论文摘要:检测微小物体是阻碍物体检测发展的主要障碍之一。一般物体检测器的性能在微小物体检测任务中往往会急剧恶化。在本文中,我们指出,无论是基于锚的检测器中的盒式先验还是无锚检测器中的点式先验,对于微小物体来说都是次优的。我们的主要观察结果是,目前基于锚点或无锚点的标签分配范式会产生许多离群的微小尺寸的地面真实样本,导致检测器对微小物体的关注度降低。为此,我们提出了一种基于高斯感受场的标签分配(RFLA)策略,用于微小物体检测。具体来说,RFLA首先利用了特征感受野遵循高斯分布的先验信息。然后,不使用IoU或中心采样策略来分配样本,而是提出一个新的感受野距离(RFD)来直接测量高斯感受野和地面真相之间的相似度。考虑到基于IoU阈值和中心采样策略对大型物体的倾斜,我们进一步设计了基于RFD的层次化标签分配(HLA)模块,以实现对微小物体的平衡学习。在四个数据集上进行的大量实验证明了所提出的方法的有效性。特别是,我们的方法在AI-TOD数据集上以4.0个AP点超越了最先进的竞争对手。代码可在https://github.com/Chasel-Tsui/mmdet-rfla获取。

⚡ 论文:Analog Bits: Generating Discrete Data using Diffusion Models with Self-Conditioning

论文时间:8 Aug 2022

领域任务:Image Captioning, Image Generation,图像字幕看图说话图像生成

论文地址:https://arxiv.org/abs/2208.04202

代码实现:https://github.com/lucidrains/imagen-pytorch

论文作者:Ting Chen, Ruixiang Zhang, Geoffrey Hinton

论文简介:The main idea behind our approach is to first represent the discrete data as binary bits, and then train a continuous diffusion model to model these bits as real numbers which we call analog bits./我们的方法的主要思想是首先将离散数据表示为二进制比特,然后训练一个连续扩散模型,将这些比特模拟为实数,我们称之为模拟比特。

论文摘要:我们提出了比特扩散:一种简单而通用的方法,用连续扩散模型生成离散数据。我们的方法的主要思想是首先将离散数据表示为二进制比特,然后训练一个连续扩散模型,将这些比特建模为实数,我们称之为模拟比特。为了生成样本,该模型首先生成模拟比特,然后对其进行阈值处理,得到代表离散变量的比特。我们进一步提出了两个简单的技术,即自我调节和不对称时间间隔,这导致了样本质量的显著改善。尽管它很简单,但所提出的方法在离散图像生成和图像字幕任务中都能取得强大的性能。对于离散图像生成,我们在CIFAR-10(有3K个离散的8位标记)和ImageNet-64x64(有12K个离散的8位标记)上都大大改进了以前的先进技术,在样本质量(用FID衡量)和效率上都超过了最佳自回归模型。对于MS-COCO数据集上的图像标题,与自回归模型相比,我们的方法取得了有竞争力的结果。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!

◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。

◉ 点击 电子月刊,快速浏览月度合辑。

「其他文章」