ECCV 2022 | 創新奇智提出通過單品示例進行基於原型的分類器學習方法

語言: CN / TW / HK

日前,全球計算機視覺頂級會議ECCV(European Conference on Computer Vision)公佈了2022年論文接收結果。創新奇智投稿論文 《Automatic Check-Out via Prototype-based Classifier Learning from Single-Product Exemplars》成功被ECCV 2022接收。

ECCV 是計算機視覺領域世界三大頂級會議(CVPR,ICCV,ECCV)之一,每兩年舉辦一次。ECCV 的論文投稿量近五年來持續增長,根據ECCV 官方網站資料,2022年ECCV 收到有效投稿論文8170篇,評審通過接收1629篇,評審不通過拒稿6541篇,接收率不到20%,反映出AI視覺技術在工業界和學術界的創新熱情繼續高漲,但創新難度也在不斷加大。作為對比,2020年ECCV共收到有效投稿5025篇,接收論文1361篇,接收率為27%。2018年共有2439篇投稿,接收776篇,錄用率為31.8%。通過對比發現,ECCV 2022論文接收投稿數直接拉滿,比2020年還要多大約3000多篇。而錄用的論文這次比ECCV 2020僅多出200多篇,很顯然,中稿率下降也是情理之中。除了我們熟知的CVPR、ICCV,ECCV(歐洲計算機視覺國際會議)也是計算機視覺三大國際頂級會議之一,每兩年舉辦一次。ECCV 2022 將在10月23日-27日的以色列特拉維夫(Tel-Aviv)舉行。和剛剛過去的CVPR同樣,這個會議也將採取線下和線上混合形式召開。

論文解讀:

圖1:論文概要

論文概述:

l 本論文中提出的基於原型的分類器學習方法結合了目標檢測框架,適用於智慧物品集合視覺檢出識別場景。

l 該方法可以減少實際應用場景中對人工的依賴,加快物品集合檢出識別流程,並且能夠提高視覺檢出識別準確率。

l 由於物品集合單品示例與檢出識別影象間存在領域差距,單品示例中只有單個物品集合,而檢出識別影象中是多個多類物品集合的任意組合,這是物品集合視覺檢出識別任務的一個主要挑戰。

l 本文提出的通過物品集合單品示例進行基於原型的分類器學習方法,在目前規模最大的物品集合視覺檢出識別資料集上的結果明顯優於現有先進方法。

創新背景:

物品集合視覺檢出識別任務旨在對物品進行精確的檢出與識別,包括識別每一類物品是否存在及其數量。該任務的一個主要挑戰是訓練資料(單品示例)與測試資料(檢出識別影象)間存在的巨大領域差距。

為了縮小這種差距,本文提出了通過單品示例進行基於原型的分類器學習方法。通過揭示表徵類別語義的優勢,首先從單品示例中獲取每個物品集合類別的原型表示。在原型的基礎上,生成包含背景類別的分類器,不僅可以識別細粒度的物品類別,還可以區分來自檢出識別影象的背景候選框。此外,本文還通過對物品候選框分類置信度分數的鑑別性重排和全域性層面的多標籤損失,來提升模型效能。

主要貢獻:

1. 提出了基於原型的分類器學習方法,用於處理物品集合視覺檢出識別任務,特別是緩解領域差距問題。

2. 設計了一個鑑別性的物品候選框分類置信度分數重排方法,從而增強基於原型的分類器的鑑別能力。

3. 基於目前最大規模的物品集合視覺檢出識別資料集進行實驗,本文模型在整單物品集合的檢出識別準確率上明顯優於現有的解決方案。

這是一種針對物品集合視覺檢出識別的基於原型的分類器學習方法,結合了二階段目標檢測網路,包括以下步驟:

步驟1:由一個預訓練的網路提取單品示例的特徵並得到各類以及背景類原型,通過一個基於原型的分類器生成器生成包含背景類的物品候選框分類器。

步驟2:物品集合的檢出識別影象輸入二階段目標檢測網路,由區域候選網路生成物品候選框,使用步驟1生成的物品候選框分類器對這些物品候選框進行分類。

步驟3:根據步驟2得到物品候選框分類置信度分數,對此進行基於背景類別的鑑別性重排,有利於對細粒度類別分類,同時提高了分類器的鑑別能力;另外,使用多例項損失對檢出識別影象中各類物品的共現關係進行建模。

本方法與現有技術相比,其顯著優點為:

(1) 本文方法使用基於原型的分類器學習方法,對單品示例與檢出識別影象間存在的領域差距進行了彌合,提供了一種不同於現有方法路徑。

(2) 本文提出了基於背景類別的鑑別性重排方法,針對語義相近的細粒度物品集合類別進行分類。

(3) 與現有方法相比,本文方法效能更佳且所需計算資源更少。

創新奇智CTO張發恩(本論文作者之一)指出:“創新奇智提出的通過單品示例進行基於原型的分類器學習方法,可以減少實際應用場景中對人工的依賴,加快物品集合檢出識別流程,並且能夠提高視覺檢出識別準確率。由於物品集合單品示例與檢出識別影象間存在領域差距,單品示例中只有單個物品集合,而檢出識別影象中是多個多類物品集合的任意組合,這是物品集合視覺檢出識別任務的一個主要挑戰。本文提出的通過物品集合單品示例進行基於原型的分類器學習方法,在目前規模最大的物品集合視覺檢出識別資料集上的結果明顯優於現有先進方法。”

製造業的物品檢測需求量多而複雜。傳統的方式不僅耗時耗力,而且檢測準確率不高。創新奇智提出的通過單品示例實現對物品集合的檢測,非常適用於諸如汽車零部件、消費電子裝置等有批量產品檢測需求的場景,不僅能夠加快檢測流程,而且能提升檢測準確率,為企業降本增效帶來直接助益。

雷峰網版權文章,未經授權禁止轉載。詳情見 轉載須知

「其他文章」