亞馬遜17億美元收購iRobot;谷歌·Web效能權威指南電子書;賓大·現代統計學習課程資料;輕量化爬蟲實現方案;前沿論文 | ShowMeAI資訊日報

語言: CN / TW / HK

攜手創作,共同成長!這是我參與「掘金日新計劃 · 8 月更文挑戰」的第26天,點選檢視活動詳情

ShowMeAI日報系列全新升級!覆蓋AI人工智慧 工具&框架 | 專案&程式碼 | 博文&分享 | 資料&資源 | 研究&論文 等方向。點選檢視 歷史文章列表,在公眾號內訂閱話題 #ShowMeAI資訊日報,可接收每日最新推送。點選 專題合輯&電子月刊 快速瀏覽各專題全集。

📢 亞馬遜17億美元收購iRobot,是吸塵器也是家庭資料收集器

https://www.irobot.com/

近日,亞馬遜宣佈,以約17億美元的價格收購機器人吸塵器製造商iRobot。iRobot 在2002年推出第一款產品 Roomba 掃地機器人,憑一己之力打開了掃地機器人賽道。2018年起 iRobot Roombas 能夠利用感測器和相機繪製房屋結構地圖,以便了解傢俱位置後躲避障礙。iRobot 將加入亞馬遜智慧家居列表,與語音助手Alexa、機器人Astro 和安全攝像頭Ring 等智共同補齊亞馬遜的智慧家居拼圖,瞭解使用者家庭空間並加速亞馬遜在零售之外的增長。

工具&框架

🚧 『OFPS』通用光流處理庫

https://github.com/h33p/ofps

光流,顧名思義,光的流動,比如人眼感受到的夜空中劃過的流星。在計算機視覺中,光流指影片影象中代表同一物件的畫素點,從一幀到下一幀的移動量。這個移動可以是相機或者物體移動引起的。光流處理是計算機視覺的重要任務,OFPS是對應該任務的一個通用光流處理庫,OFPS Suite 可用於演示這一功能。

🚧 『EvoTorch』 直接構建在 PyTorch 之上的高階進化計算庫

https://github.com/nnaisense/evotorch

https://evotorch.ai/

EvoTorch 是 NNAISENSE 基於PyTorch構建的開源進化計算庫,可以解決各種優化問題,而不必擔心手頭的這些問題是否可微。可以用 EvoTorch 解決的問題型別包括:黑箱優化問題(連續或離散)、強化學習任務、監督學習任務。

🚧 『NERpy』命名實體識別工具,支援BertSoftmax、BertCrf、BertSpan等模型,開箱即用

https://github.com/shibing624/nerpy

NERpy 實現了BertSoftmax、BertCrf、BertSpan等多種命名實體識別模型,並在標準資料集上比較了各模型的效果。

🚧 『magical_spider』神奇的蜘蛛,幾乎適用於所有Web端站點的採集方案

https://github.com/lixi5338619/magical_spider

一個輕量化的爬蟲實現方案,帶web端視覺化管理介面。

博文&分享

👍 『High Performance Browser Networking』Web效能權威指南 · 免費書籍

https://hpbn.co/

谷歌公司高效能團隊核心成員的權威之作,涵蓋 Web 開發者技術體系中應該掌握的所有網路及效能優化知識。全書以效能優化為主線,從TCP、UDP 和TLS 協議講起,解釋瞭如何針對這幾種協議和基礎設施來優化應用。然後深入探討了無線和行動網路的工作機制。最後,揭示了 HTTP 協議的底層細節,同時詳細介紹了HTTP 2.0、 XHR、SSE、WebSocket、WebRTC 和DataChannel 等現代瀏覽器新增的具有革命性的新能力。

👍 『機器學習方案手冊』內容覆蓋自然語言處理、影象與文字、計算機視覺

https://github.com/bipinKrishnan/ml-recipe-book

https://bipinkrishnan.github.io/ml-recipe-book/about.html

本書包含自然語言處理、影象與文字、計算機視覺三個部分,具有相當的專業深度,對於學習者和有一定經驗的從業者都是適用的,對於建立深度學習模型並解決實際任務來說,都是有幫助的。全書包含以下章節:

  • Natural language processing / 自然語言處理
  • Named entity recognition / 命名實體識別
  • Masked language modeling / 掩碼語言建模
  • Machine translation / 機器翻譯
  • Causal language modeling / 概率語言建模
  • Image & Text / 影象與文字
  • Image captioning / 看圖說話
  • Computer vision / 計算機視覺
  • Image classification / 影象分類
  • Image segmentation / 影象分割
  • Object detection / 目標檢測

資料&資源

🔥 『STAT 991 · Topics In Modern Statistical Learning』 賓夕法尼亞大學·現代統計學習專題·課程資料(2022 Spring)

https://github.com/dobriban/Topics-In-Modern-Statistical-Learning

雖然現代機器學習方法在各類問題中具有很高的預測精度,但正確量化其不確定性仍具有挑戰性。這個領域集中了大量的研究和快速的發展,也是本課程的核心主題。

本課程將調查各類問題及解決方法,例如校準、預測區間(和集合)、保形預測、OOD檢測等,並簡要討論最近有影響力的突破性論文、近期重要的統計學理論論文等。

🔥 『Awesome SQLite』SQLite 相關資源大列表

https://github.com/sqlsite/awesome-sqlite

研究&論文

公眾號回覆關鍵字日報,免費獲取整理好的論文合輯。

科研進展

  • 2022.08.05 『運動規劃』Learning from Sparse Demonstrations
  • 2022.08.05 『無人駕駛』LCCDE: A Decision-Based Ensemble Framework for Intrusion Detection in The Internet of Vehicles
  • 2022.07.09 『圖挖掘』TwiBot-22: Towards Graph-Based Twitter Bot Detection
  • 2022.07.13 『時間序列預測』DeepTIMe: Deep Time-Index Meta-Learning for Non-Stationary Time-Series Forecasting

⚡ 論文:Learning from Sparse Demonstrations

論文標題:Learning from Sparse Demonstrations

論文時間:5 Aug 2020

領域任務:Motion Planning,運動規劃

論文地址:https://arxiv.org/abs/2008.02159

程式碼實現:https://github.com/wanxinjin/Learning-from-Sparse-Demonstrations , https://github.com/wanxinjin/Pontryagin-Differentiable-Programming

論文作者:Wanxin Jin, Todd D. Murphey, Dana Kulić, Neta Ezer, Shaoshuai Mou

論文簡介:The time stamps of the keyframes can be different from the time of the robot's actual execution./關鍵幀的時間戳可能與機器人的實際執行時間不同。

論文摘要:本文開發了Continuous Pontryagin Differentiable Programming(Continuous PDP)方法,該方法使機器人能夠從一些稀少的關鍵幀中學習目標函式。標有一些時間戳的關鍵幀是期望的任務空間輸出,機器人應按順序進行。關鍵幀的時間戳可能與機器人的實際執行時間不同。該方法聯合尋找一個目標函式和一個時間扭曲函式,使機器人產生的軌跡以最小的差異損失順序跟隨關鍵幀。連續PDP使用投影梯度下降法使差異損失最小化,有效地解決了機器人軌跡相對於未知引數的梯度問題。該方法首先在一個模擬的機器人手臂上進行評估,然後應用於一個6DoF的四旋翼機器人,以學習未建模環境中運動規劃的目標函式。結果顯示了該方法的效率,其處理關鍵幀和機器人執行之間的時間錯位的能力,以及將目標學習推廣到未見過的運動條件。

⚡ 論文:LCCDE: A Decision-Based Ensemble Framework for Intrusion Detection in The Internet of Vehicles

論文時間:5 Aug 2022

領域任務:Autonomous Vehicles, Intrusion Detection,無人駕駛

論文地址:https://arxiv.org/abs/2208.03399

程式碼實現:https://github.com/Western-OC2-Lab/Intrusion-Detection-System-Using-Machine-Learning

論文作者:Li Yang, Abdallah Shami, Gary Stevens, Stephen De Rusett

論文簡介:Modern vehicles, including autonomous vehicles and connected vehicles, have adopted an increasing variety of functionalities through connections and communications with other vehicles, smart devices, and infrastructures./現代車輛,包括自動駕駛車輛和互聯車輛,通過與其他車輛、智慧裝置和基礎設施的連線和通訊,已經集成了越來越多的功能。

論文摘要:現代車輛,包括自動駕駛車輛和互聯車輛,已經通過與其他車輛、智慧裝置和基礎設施的連線和通訊,集成了越來越多的功能。然而,車輛網際網路(IoV)日益增長的連線性也增加了對網路攻擊的脆弱性。為了保護物聯網系統免受網路威脅,已經使用機器學習(ML)方法開發了能夠識別惡意網路攻擊的入侵檢測系統(IDS)。為了準確地檢測物聯網網路中的各種型別的攻擊,我們提出了一個新穎的集合IDS框架,命名為領導者類和信心決策集合(LCCDE)。它是通過在三種先進的ML演算法(XGBoost、LightGBM和CatBoost)中為每一類或每一種攻擊型別確定表現最好的ML模型。然後利用班級領導者模型及其預測置信值,對各種型別的網路攻擊的檢測做出準確的決定。在兩個公共物聯網安全資料集(Car-Hacking和CICIDS2017資料集)上的實驗證明了所提出的LCCDE對車輛內部和外部網路的入侵檢測的有效性。

⚡ 論文:TwiBot-22: Towards Graph-Based Twitter Bot Detection

論文時間:9 Jun 2022

領域任務:Misinformation, Twitter Bot Detection,圖挖掘

論文地址:https://arxiv.org/abs/2206.04564

程式碼實現:https://github.com/luoundergradxjtu/twibot-22

論文作者:Shangbin Feng, Zhaoxuan Tan, Herun Wan, Ningnan Wang, Zilong Chen, Binchi Zhang, Qinghua Zheng, Wenqian Zhang, Zhenyu Lei, Shujie Yang, Xinshun Feng, Qingyue Zhang, Hongrui Wang, YuHan Liu, Yuyang Bai, Heng Wang, Zijian Cai, Yanbo Wang, Lijing Zheng, Zihan Ma, Jundong Li, Minnan Luo

論文簡介:Twitter bot detection has become an increasingly important task to combat misinformation, facilitate social media moderation, and preserve the integrity of the online discourse./Twitter機器人檢測已經成為一項日益重要的任務,以打擊錯誤資訊,促進社會媒體的調節,並保持線上話語的完整性。

論文摘要:Twitter機器人檢測已經成為一項日益重要的任務,以打擊錯誤資訊,促進社會媒體的調節,並保持線上話語的完整性。目前最先進的機器人檢測方法通常利用Twitter網路的圖結構,在面對傳統方法無法檢測到的新型Twitter機器人時,這些方法表現出良好的效能。然而,現有的Twitter機器人檢測資料集很少是基於圖的,即使這些少數基於圖的資料集也存在資料集規模有限、圖結構不完整以及註釋質量低等問題。事實上,缺乏一個大規模的基於圖的Twitter-bot檢測基準來解決這些問題,嚴重阻礙了基於圖的新型bot檢測方法的發展和評估。在本文中,我們提出了TwiBot-22,一個全面的基於圖的Twitter機器人檢測基準,它提出了迄今為止最大的資料集,提供了Twitter網路上多樣化的實體和關係,並且具有比現有資料集更好的註釋質量。此外,我們重新實現了35個有代表性的Twitter機器人檢測基準,並在包括TwiBot-22在內的9個數據集上對其進行了評估,以促進對模型效能的公平比較和對研究進展的整體理解。為了促進進一步的研究,我們將所有實現的程式碼和資料集整合到TwiBot-22評估框架中,研究人員可以一致地評估新模型和資料集。TwiBot-22推特機器人檢測基準和評估框架可在 https://twibot22.github.io/ 上公開獲取。

⚡ 論文:DeepTIMe: Deep Time-Index Meta-Learning for Non-Stationary Time-Series Forecasting

論文時間:13 Jul 2022

領域任務:Meta-Learning, Time Series Forecasting,元學習時間序列預測

論文地址:https://arxiv.org/abs/2207.06046

程式碼實現:https://github.com/salesforce/deeptime

論文作者:Gerald Woo, Chenghao Liu, Doyen Sahoo, Akshat Kumar, Steven Hoi

論文簡介:Yet, despite the attractive properties of time-index based models, such as being a continuous signal function over time leading to smooth representations, little attention has been given to them./然而,儘管基於時間指數的模型具有吸引人的特性,比如在時間上是一個連續的訊號函式,導致平滑的表示,但很少有人對它們給予關注。

論文摘要:深度學習已經被積極地應用於時間序列預測,導致了大量新的自迴歸模型架構的出現。然而,儘管基於時間指數的模型具有吸引人的特性,比如作為一個連續的訊號函式隨時間變化導致平滑的表示,但人們對它們的關注卻很少。事實上,雖然原始的基於時間指數的深度模型比經典的基於時間指數的模型的手動預定義函式表示法更有表現力,但由於缺乏歸納偏差和時間序列的非平穩性,它們在預測方面是不夠的。在本文中,我們提出了DeepTIMe,一個通過元學習公式訓練的基於時間指數的深度模型,它克服了這些限制,產生了一個高效和準確的預測模型。在真實世界的資料集上進行的廣泛實驗表明,我們的方法取得了與最先進的方法有競爭力的結果,並且非常有效。程式碼可在 https://github.com/salesforce/DeepTIMe 獲取。

我們是 ShowMeAI,致力於傳播AI優質內容,分享行業解決方案,用知識加速每一次技術成長!點選檢視 歷史文章列表,在公眾號內訂閱話題 #ShowMeAI資訊日報,可接收每日最新推送。點選 專題合輯&電子月刊 快速瀏覽各專題全集。

「其他文章」