亚马逊17亿美元收购iRobot;谷歌·Web性能权威指南电子书;宾大·现代统计学习课程资料;轻量化爬虫实现方案;前沿论文 | ShowMeAI资讯日报

语言: CN / TW / HK

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第26天,点击查看活动详情

ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向。点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。

📢 亚马逊17亿美元收购iRobot,是吸尘器也是家庭数据收集器

http://www.irobot.com/

近日,亚马逊宣布,以约17亿美元的价格收购机器人吸尘器制造商iRobot。iRobot 在2002年推出第一款产品 Roomba 扫地机器人,凭一己之力打开了扫地机器人赛道。2018年起 iRobot Roombas 能够利用传感器和相机绘制房屋结构地图,以便了解家具位置后躲避障碍。iRobot 将加入亚马逊智能家居列表,与语音助手Alexa、机器人Astro 和安全摄像头Ring 等智共同补齐亚马逊的智能家居拼图,了解用户家庭空间并加速亚马逊在零售之外的增长。

工具&框架

🚧 『OFPS』通用光流处理库

http://github.com/h33p/ofps

光流,顾名思义,光的流动,比如人眼感受到的夜空中划过的流星。在计算机视觉中,光流指视频图像中代表同一对象的像素点,从一帧到下一帧的移动量。这个移动可以是相机或者物体移动引起的。光流处理是计算机视觉的重要任务,OFPS是对应该任务的一个通用光流处理库,OFPS Suite 可用于演示这一功能。

🚧 『EvoTorch』 直接构建在 PyTorch 之上的高级进化计算库

http://github.com/nnaisense/evotorch

http://evotorch.ai/

EvoTorch 是 NNAISENSE 基于PyTorch构建的开源进化计算库,可以解决各种优化问题,而不必担心手头的这些问题是否可微。可以用 EvoTorch 解决的问题类型包括:黑箱优化问题(连续或离散)、强化学习任务、监督学习任务。

🚧 『NERpy』命名实体识别工具,支持BertSoftmax、BertCrf、BertSpan等模型,开箱即用

http://github.com/shibing624/nerpy

NERpy 实现了BertSoftmax、BertCrf、BertSpan等多种命名实体识别模型,并在标准数据集上比较了各模型的效果。

🚧 『magical_spider』神奇的蜘蛛,几乎适用于所有Web端站点的采集方案

http://github.com/lixi5338619/magical_spider

一个轻量化的爬虫实现方案,带web端可视化管理界面。

博文&分享

👍 『High Performance Browser Networking』Web性能权威指南 · 免费书籍

http://hpbn.co/

谷歌公司高性能团队核心成员的权威之作,涵盖 Web 开发者技术体系中应该掌握的所有网络及性能优化知识。全书以性能优化为主线,从TCP、UDP 和TLS 协议讲起,解释了如何针对这几种协议和基础设施来优化应用。然后深入探讨了无线和移动网络的工作机制。最后,揭示了 HTTP 协议的底层细节,同时详细介绍了HTTP 2.0、 XHR、SSE、WebSocket、WebRTC 和DataChannel 等现代浏览器新增的具有革命性的新能力。

👍 『机器学习方案手册』内容覆盖自然语言处理、图像与文字、计算机视觉

http://github.com/bipinKrishnan/ml-recipe-book

http://bipinkrishnan.github.io/ml-recipe-book/about.html

本书包含自然语言处理、图像与文字、计算机视觉三个部分,具有相当的专业深度,对于学习者和有一定经验的从业者都是适用的,对于建立深度学习模型并解决实际任务来说,都是有帮助的。全书包含以下章节:

  • Natural language processing / 自然语言处理
  • Named entity recognition / 命名实体识别
  • Masked language modeling / 掩码语言建模
  • Machine translation / 机器翻译
  • Causal language modeling / 概率语言建模
  • Image & Text / 图像与文字
  • Image captioning / 看图说话
  • Computer vision / 计算机视觉
  • Image classification / 图像分类
  • Image segmentation / 图像分割
  • Object detection / 目标检测

数据&资源

🔥 『STAT 991 · Topics In Modern Statistical Learning』 宾夕法尼亚大学·现代统计学习专题·课程资料(2022 Spring)

http://github.com/dobriban/Topics-In-Modern-Statistical-Learning

虽然现代机器学习方法在各类问题中具有很高的预测精度,但正确量化其不确定性仍具有挑战性。这个领域集中了大量的研究和快速的发展,也是本课程的核心主题。

本课程将调查各类问题及解决方法,例如校准、预测区间(和集合)、保形预测、OOD检测等,并简要讨论最近有影响力的突破性论文、近期重要的统计学理论论文等。

🔥 『Awesome SQLite』SQLite 相关资源大列表

http://github.com/sqlsite/awesome-sqlite

研究&论文

公众号回复关键字日报,免费获取整理好的论文合辑。

科研进展

  • 2022.08.05 『运动规划』Learning from Sparse Demonstrations
  • 2022.08.05 『无人驾驶』LCCDE: A Decision-Based Ensemble Framework for Intrusion Detection in The Internet of Vehicles
  • 2022.07.09 『图挖掘』TwiBot-22: Towards Graph-Based Twitter Bot Detection
  • 2022.07.13 『时间序列预测』DeepTIMe: Deep Time-Index Meta-Learning for Non-Stationary Time-Series Forecasting

⚡ 论文:Learning from Sparse Demonstrations

论文标题:Learning from Sparse Demonstrations

论文时间:5 Aug 2020

领域任务:Motion Planning,运动规划

论文地址:http://arxiv.org/abs/2008.02159

代码实现:http://github.com/wanxinjin/Learning-from-Sparse-Demonstrations , http://github.com/wanxinjin/Pontryagin-Differentiable-Programming

论文作者:Wanxin Jin, Todd D. Murphey, Dana Kulić, Neta Ezer, Shaoshuai Mou

论文简介:The time stamps of the keyframes can be different from the time of the robot's actual execution./关键帧的时间戳可能与机器人的实际执行时间不同。

论文摘要:本文开发了Continuous Pontryagin Differentiable Programming(Continuous PDP)方法,该方法使机器人能够从一些稀少的关键帧中学习目标函数。标有一些时间戳的关键帧是期望的任务空间输出,机器人应按顺序进行。关键帧的时间戳可能与机器人的实际执行时间不同。该方法联合寻找一个目标函数和一个时间扭曲函数,使机器人产生的轨迹以最小的差异损失顺序跟随关键帧。连续PDP使用投影梯度下降法使差异损失最小化,有效地解决了机器人轨迹相对于未知参数的梯度问题。该方法首先在一个模拟的机器人手臂上进行评估,然后应用于一个6DoF的四旋翼机器人,以学习未建模环境中运动规划的目标函数。结果显示了该方法的效率,其处理关键帧和机器人执行之间的时间错位的能力,以及将目标学习推广到未见过的运动条件。

⚡ 论文:LCCDE: A Decision-Based Ensemble Framework for Intrusion Detection in The Internet of Vehicles

论文时间:5 Aug 2022

领域任务:Autonomous Vehicles, Intrusion Detection,无人驾驶

论文地址:http://arxiv.org/abs/2208.03399

代码实现:http://github.com/Western-OC2-Lab/Intrusion-Detection-System-Using-Machine-Learning

论文作者:Li Yang, Abdallah Shami, Gary Stevens, Stephen De Rusett

论文简介:Modern vehicles, including autonomous vehicles and connected vehicles, have adopted an increasing variety of functionalities through connections and communications with other vehicles, smart devices, and infrastructures./现代车辆,包括自动驾驶车辆和互联车辆,通过与其他车辆、智能设备和基础设施的连接和通信,已经集成了越来越多的功能。

论文摘要:现代车辆,包括自动驾驶车辆和互联车辆,已经通过与其他车辆、智能设备和基础设施的连接和通信,集成了越来越多的功能。然而,车辆互联网(IoV)日益增长的连接性也增加了对网络攻击的脆弱性。为了保护物联网系统免受网络威胁,已经使用机器学习(ML)方法开发了能够识别恶意网络攻击的入侵检测系统(IDS)。为了准确地检测物联网网络中的各种类型的攻击,我们提出了一个新颖的集合IDS框架,命名为领导者类和信心决策集合(LCCDE)。它是通过在三种先进的ML算法(XGBoost、LightGBM和CatBoost)中为每一类或每一种攻击类型确定表现最好的ML模型。然后利用班级领导者模型及其预测置信值,对各种类型的网络攻击的检测做出准确的决定。在两个公共物联网安全数据集(Car-Hacking和CICIDS2017数据集)上的实验证明了所提出的LCCDE对车辆内部和外部网络的入侵检测的有效性。

⚡ 论文:TwiBot-22: Towards Graph-Based Twitter Bot Detection

论文时间:9 Jun 2022

领域任务:Misinformation, Twitter Bot Detection,图挖掘

论文地址:http://arxiv.org/abs/2206.04564

代码实现:http://github.com/luoundergradxjtu/twibot-22

论文作者:Shangbin Feng, Zhaoxuan Tan, Herun Wan, Ningnan Wang, Zilong Chen, Binchi Zhang, Qinghua Zheng, Wenqian Zhang, Zhenyu Lei, Shujie Yang, Xinshun Feng, Qingyue Zhang, Hongrui Wang, YuHan Liu, Yuyang Bai, Heng Wang, Zijian Cai, Yanbo Wang, Lijing Zheng, Zihan Ma, Jundong Li, Minnan Luo

论文简介:Twitter bot detection has become an increasingly important task to combat misinformation, facilitate social media moderation, and preserve the integrity of the online discourse./Twitter机器人检测已经成为一项日益重要的任务,以打击错误信息,促进社会媒体的调节,并保持在线话语的完整性。

论文摘要:Twitter机器人检测已经成为一项日益重要的任务,以打击错误信息,促进社会媒体的调节,并保持在线话语的完整性。目前最先进的机器人检测方法通常利用Twitter网络的图结构,在面对传统方法无法检测到的新型Twitter机器人时,这些方法表现出良好的性能。然而,现有的Twitter机器人检测数据集很少是基于图的,即使这些少数基于图的数据集也存在数据集规模有限、图结构不完整以及注释质量低等问题。事实上,缺乏一个大规模的基于图的Twitter-bot检测基准来解决这些问题,严重阻碍了基于图的新型bot检测方法的发展和评估。在本文中,我们提出了TwiBot-22,一个全面的基于图的Twitter机器人检测基准,它提出了迄今为止最大的数据集,提供了Twitter网络上多样化的实体和关系,并且具有比现有数据集更好的注释质量。此外,我们重新实现了35个有代表性的Twitter机器人检测基准,并在包括TwiBot-22在内的9个数据集上对其进行了评估,以促进对模型性能的公平比较和对研究进展的整体理解。为了促进进一步的研究,我们将所有实现的代码和数据集整合到TwiBot-22评估框架中,研究人员可以一致地评估新模型和数据集。TwiBot-22推特机器人检测基准和评估框架可在 http://twibot22.github.io/ 上公开获取。

⚡ 论文:DeepTIMe: Deep Time-Index Meta-Learning for Non-Stationary Time-Series Forecasting

论文时间:13 Jul 2022

领域任务:Meta-Learning, Time Series Forecasting,元学习时间序列预测

论文地址:http://arxiv.org/abs/2207.06046

代码实现:http://github.com/salesforce/deeptime

论文作者:Gerald Woo, Chenghao Liu, Doyen Sahoo, Akshat Kumar, Steven Hoi

论文简介:Yet, despite the attractive properties of time-index based models, such as being a continuous signal function over time leading to smooth representations, little attention has been given to them./然而,尽管基于时间指数的模型具有吸引人的特性,比如在时间上是一个连续的信号函数,导致平滑的表示,但很少有人对它们给予关注。

论文摘要:深度学习已经被积极地应用于时间序列预测,导致了大量新的自回归模型架构的出现。然而,尽管基于时间指数的模型具有吸引人的特性,比如作为一个连续的信号函数随时间变化导致平滑的表示,但人们对它们的关注却很少。事实上,虽然原始的基于时间指数的深度模型比经典的基于时间指数的模型的手动预定义函数表示法更有表现力,但由于缺乏归纳偏差和时间序列的非平稳性,它们在预测方面是不够的。在本文中,我们提出了DeepTIMe,一个通过元学习公式训练的基于时间指数的深度模型,它克服了这些限制,产生了一个高效和准确的预测模型。在真实世界的数据集上进行的广泛实验表明,我们的方法取得了与最先进的方法有竞争力的结果,并且非常有效。代码可在 http://github.com/salesforce/DeepTIMe 获取。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。

「其他文章」