又一篇CVPR 2022論文被指抄襲,平安保險研究者控訴IBM蘇黎世團隊
昨天,有人在 reddit 上發帖稱,IBM蘇黎世研究中心剽竊了自己的論文,而且還被 CVPR 2022 接收了。
這位發帖者寫道:
我叫 Xianbiao Qi,是一位有十多年研究經驗的計算機視覺研究者。我寫這個博客是為了投訴一個嚴重的案例:IBM蘇黎世研究中心的員工蓄意剽竊我們的論文。他們並不是照抄文本,而是剽竊想法。
Qi 提到的疑似被抄襲的論文題為「PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML(平安 VCGroup 為 ICDAR 2021 科學文獻解析競賽任務 B 提供的解決方案:HTML 表格識別)」,作者來自平安保險和平安科技,上傳 arXiv 的時間是 2021 年 5 月份,2021 年 7 月份公佈了代碼,2021 年 9 月發佈了 Tablemaster 預訓練模型,2021 年 11 月發佈了 tablemaster_mmocr docker 環境。論文中提到的競賽是 2021 年 4 月結束的,由IBM的另一個團隊主辦。
論文鏈接:http://arxiv.org/pdf/2105.01848.pdf
如論文標題所述,這篇文章為 ICDAR 2021 科學文獻解析競賽任務 B(HTML 表格識別)提供了一套解決方案。具體來説,他們將表格內容識別分為四個子任務:表格結構識別、文本行檢測、文本行識別和框分配。表格結構識別算法是基於一種魯棒的圖像文本識別算法 MASTER 定製的。PSENet 用於檢測表圖像中的每個文本行。文本行識別模型也建立在 MASTER 之上。最後,在框分配階段,他們將 PSENet 檢測到的文本框與通過表結構預測重構的結構項相關聯,並將文本行的可識別內容填充到對應項中。
被指抄襲的IBM論文題為「TableFormer: Table Structure Understanding with Transformers(TableFormer:用 Transformer 理解表結構)」,上傳 arXiv 的時間是 2022 年 3 月份,提交給 CVPR 的時間未知。
論文鏈接:http://arxiv.org/pdf/2203.01017.pdf
在這篇論文中,IBM的研究人員提出了一種新的表結構識別模型,它從兩個方面改進了最新的端到端深度學習模型(即來自 PubTabNet 的 encoder-dual-decoder)。首先,他們引入了一種新的目標檢測解碼器用於表格單元格。通過這種方式,他們可以直接從 PDF 源中獲取編程式 PDF 的表格單元格內容,從而避免了定製 OCR 解碼器的訓練。這種架構上的改變帶來了更精確的表格內容提取。其次,他們將 LSTM 解碼器替換為基於 transformer 的解碼器。
Qi 表示,IBM的這篇論文剽竊了他們的方法論、預處理、後處理、可視效果、推理、系統級解決方案、代碼、預訓練模型等內容,但「為了不被抓住」,他們沒有引用 Qi 等人的論文。
接下來,Qi 用十幾張圖展示了他認為IBM存在抄襲的地方。
Qi 展示的疑似抄襲點 9:誤導讀者。
在看了 Qi 給出的示例後,有人認為這些都是非常有力的證據,IBM團隊很難證明自己的論文是原創的,Qi 應該向 CVPR 程序委員會投訴。
不過,也有人認為,這些證據不夠有力:「兩個小組研究的是同一個問題,使用的是相同的公開數據,他們的解決方案也有相似之處。但這並不意味着一方照搬另一方。例如「疑似抄襲點 1」中所展示的內容就不是那麼接近」。
目前,我們還沒有在帖子下方看到IBM論文作者的迴應。
不過,值得一提的是,這並不是今年 CVPR 曝出的唯一一件疑似抄襲事件。幾天前,一位網友在 YouTube 上爆料説, 首爾大學的一篇論文抄襲了十幾篇其他論文 ,目前該論文作者已經出來道歉並撤稿。
或許,頂會論文在查重上面需要多下點功夫了。
參考鏈接:http://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/
- 從AI為寵物投保這個「小事」講起,保險變革開始了
- 華為MindSpore架構師王紫東:當生物計算領域「遇災」,MindSpore做了何解?
- 從產線到星空,這些AI工程師帶着算法上天入地
- 數實融合驅動數字未來 影譜科技攜沉浸式數字技術亮相2022服貿會
- 驅動虛實融合,影譜科技在WAIC推出多款智能視覺及元宇宙新品
- 英偉達和Ampere共同推出雲遊戲Arm服務器:每台最多支持160個用户
- 擴散模型背後數學太難了,啃不動?谷歌用統一視角講明白了
- 悟空搜索“降世”,能否大鬧搜索引擎“天宮”?
- 蘑菇車聯與北京通州達成合作,打造車路雲一體化智慧交通系統
- LeCun沒看好的AGI,傳奇程序員John Carmack:已創業,融資兩千萬美元
- 蘑菇車聯與無錫梁溪區簽約,將打造數字孿生城市交通底座
- 這場比賽,讓上百個AI智能體「捲起來了」
- 大模型時代,那些一起訓練AI模型的企業是怎麼應對數據顧慮的?
- 數字人賽道熱度正高,AI技術如何創造不一樣的“靈魂”?
- Unity否決175億美元併購提議:準備自己收購廣吿公司
- 消費級GPU可用,文本轉圖像開源新模型Stable Diffusion生成宇宙變遷大片
- 全球遊戲引擎商業化進入新階段,國內頭號玩家Cocos“三分天下”
- 墨芯獲評大灣區高成長性企業TOP50
- 圖神經網絡發Nature子刊,卻被爆比普通算法慢104倍,質疑者:灌水新高度?
- 亞馬遜欲17億美元收購iRobot,掃地機器人“含金量”幾何?