OCR產業應用實戰,多類別電錶讀數識別方案詳解

語言: CN / TW / HK

我國電力行業發展迅速,電錶作為測電裝置經歷了普通電錶、預付費電錶和智慧電錶三個階段的發展。在產業場景中,表的種類多達十幾種,過去依賴人工抄表,成本很高。如果能夠採集到大量電錶圖片,藉助人工智慧技術批量檢測和識別,將會大幅提升效率。

本次飛槳產業實踐範例庫開源電錶讀數識別場景應用,提供了從資料準備、技術方案、模型訓練優化,到模型部署的全流程可複用方案,降低產業落地門檻。

⭐專案連結⭐

https://github.com/PaddlePaddle/awesome-DeepLearning

所有原始碼及教程均已開源,歡迎大家使用,star鼓勵~

基於深度學習技術

實現電錶讀數識別

本場景要解決多類別電錶識別任務,從技術上需要對多種類別的電錶表數和表號進行檢測再識別,從資料到模型面臨著多重問題。

專案難點:

  • 在資料方面,電錶種類多、資料少、拍攝角度多樣且部分資料反光嚴重。

  • 如何從零標註電錶資料,選擇何種標註軟體能夠最快速度構建資料集?

  • 技術路線的選擇也面臨多方面的問題,例如是通過文字檢測來反向微調,還是通過目標檢測從零訓練?

本專案將一一解決這些難點。

125c26eee2a802a3851070750a5137cf.png

專案方案:

基於上述難點,飛槳開發者技術專家不斷進行嘗試,最終選用了飛槳文字識別套件PaddleOCR中的PP-OCR模型進行了微調與優化,其檢測部分基於DB的分割方法實現,直接解決了電錶資料中的傾斜問題,通過再造資料集來擴充識別資料集,訓練識別模型。PP-OCR模型經過大量實驗,其泛化性也足以支撐複雜垂類場景下的效果。

55ebe92b02890daa80f56babde0fcb4d.png

在資料標註工具上,使用PPOCRLabel實現半自動標註,內嵌PP-OCR模型,一鍵實現機器自動標註,且具有便捷的修改體驗。支援四點框、矩形框標註模式,匯出格式可直接用於PaddleOCR訓練,標註效率顯著提升。

35c5c6480ef1a85410b026df8c695fa5.gif

方案優化:

在優化方面,首先對PP-OCR模型的檢測部分進行初步微調,然後通過對資料的進一步分析,發現原始影象解析度較大,進而調整EastRandomCropData的尺寸,放大輸入模型前的影象尺度。通過CopyPaste資料增強解決資料量小的問題,並且根據實際情況調小學習率。

專案效果:

最終在評測資料集上從原先的Hmeans=0.3優化到0.85。除此之外,本專案也嘗試了一部分目標檢測演算法。具體的優化過程和詳細解釋,歡迎大家關注直播!

fe71824572d54f911ac1cf1b91a68de6.png

微調前後對比

部署方面使用飛槳原生推理庫Paddle Inference完成,滿足使用者批量預測、資料安全性高、延遲低的需求,快速在本地完成部署方案。

產業實踐範例教程

助力企業跨越AI落地鴻溝

飛槳產業實踐範例,致力於加速AI在產業落地的前進路徑,減少理論技術與產業應用的差距。範例來源於產業真實業務場景,通過完整的程式碼實現,提供從資料準備到模型部署的方案過程解析,堪稱產業落地的“自動導航”。

  • 真實產業場景:與實際具有AI應用的企業合作共建,選取企業高頻需求的AI應用場景如智慧城市-安全帽檢測、智慧製造-表計讀數等;

  • 完整程式碼實現:提供可一鍵執行的程式碼,在“AI Studio一站式開發平臺”上使用免費算力一鍵Notebook執行;

  • 詳細過程解析:深度解析從資料準備和處理、模型選擇、模型優化和部署的AI落地全流程,共享可複用的模型調參和優化經驗;

  • 直達專案落地:百度高工手把手教使用者進行全流程程式碼實踐,輕鬆直達專案POC階段。

精彩課程預告

為了讓小夥伴們更便捷地應用電錶讀數範例教程,我們邀請了飛槳開發者技術專家於3月3日20:30-21:00為大家深度解析從資料準備、方案設計到模型優化部署的開發全流程,手把手教大家進行程式碼實踐。

歡迎小夥伴們掃碼進群,免費獲取直播課和回放影片連結,更有機會獲得覆蓋智慧城市、工業製造、金融、網際網路等行業的飛槳產業實踐範例手冊!也歡迎感興趣的企業和開發者與我們聯絡,交流技術探討合作。

掃碼報名直播課,加入技術交流群

422788e11e8ebba17e6942d7e4c761dd.png

00f828ea664fe528a38b47cf1b35c74a.png

5c469cdc880278f435b1b2c5c6635b90.gif

關注飛槳公眾號,獲取更多技術內容~

本文同步分享在 部落格“飛槳PaddlePaddle”(CSDN)。
如有侵權,請聯絡 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

「其他文章」