3毫秒極速識別,一個4.1k Satr的開源專案

語言: CN / TW / HK

人臉、車輛、人體屬性、卡證、交通標識等經典影象識別能力,在我們當前數字化工作及生活中發揮著極其重要的作用。業內也不乏頂尖公司提供的可直接呼叫的API、SDK,但這些往往面臨著定製化場景 泛化效果不好、價格昂貴、黑盒可控性低、技術壁壘難以形成 多諸多痛點。

而今天小編要給大家推薦的是一個 完全開源免費的、覆蓋人、車、OCR等9大經典識別場景 、在CPU上可 3毫秒實現急速識別、一行程式碼就可實現迭代訓練 的專案PaddleClas!

圖1  PaddleClas 影象分類應用示意圖

話不多說,趕緊送上傳送門,識貨的小夥伴趕緊嘗試一下吧!

點選閱讀原文GET連結

記得Star收藏防止走丟哦!

https://github.com/PaddlePaddle/PaddleClas

下面小編就來詳細拆解下這個專案的過人之處吧!

圖2 9大場景模型效果示意圖

1

亮點一

完美平衡精度與速度

從大名鼎鼎的Resnet50到如今火熱的Swin-Transformer,模型精度不斷被重新整理,但是預測效率並不高。 即使是Swin-Transformer最小的模型,在CPU上的預測速度也超過100ms,遠遠無法滿足產業實時預測的需求。

而使用MobileNet系列等輕量化模型可以保證較高的預測效率,在CPU上預測一張影象大約3ms,但是模型精度往往和大模型有很大差距。

PaddleClas推出的 超輕量影象分類方案 (Practical Ultra Light Classification,簡稱PULC),就完美解決上述產業落地中演算法精度和速度難以平衡的痛點。

表1 不同模型精度速度結果對比

如圖所示,它的 精度與Swin-Transformer等大模型比肩,預測速度卻可以快30倍以上,在CPU上的推理時長僅需2ms

2

亮點二

易用性極強

PULC方案不僅完美地平衡了精度與速度,還充分考慮了產業實踐過程中需要定製化的對演算法快速迭代的需求,只需一行命令,就可完成模型訓練。

與此同時,PaddleClas 團隊還發布了包括 人、車、OCR在內的9大場景模型,僅需2步 就能實現業務 POC 效果驗證,訓練、推理、部署一條龍,真正實現“開箱即用”。

不僅如此,專案還匹配了詳細的中文使用文件及產業實踐範例教程。

圖3 使用文件及範例示意圖

3

亮點三

整合超多硬核技術

超輕量影象分類方案(PULC)集成了業界4大業界領先的優化策略:

圖4 超輕量影象分類方案(PULC)示意圖

PP-LCNet輕量級骨幹網路

PP-LCNet作為針對CPU量身打造的骨幹網路模型,在速度、精度方面均遠超如MobileNetV3等同體量演算法, 多個場景模型優化後,速度較SwinTransformer的模型快30倍以上,精度較MobileNetV3_small_0.35x高18個點

SSLD預訓練權重

SSLD半監督蒸餾演算法可以使小模型學習到大模型的特徵和ImageNet22k無標籤大規模資料的知識。 在訓練小模型時,使用SSLD預訓練權重作為模型的初始化引數,可以使不同場景的應用分類模型獲得1-2.5個點的精度提升。

資料增強策略整合

該方案融合了影象變換、影象裁剪和影象混疊3種資料增強方法,並支援自定義調整觸發概率,能使模型的泛化能力大大增強,提升模型在實際場景中的效能。 模型可以在上一步的基礎上,精度再提升1個點左右。

SKL-UGI知識蒸餾演算法

SKL(symmetric-KL)在經典的KL知識蒸餾演算法的基礎上引入對稱資訊,提升了算 法的魯棒性。 同時,該方案可以方便地在訓練中加入無標籤訓練資料(Unlabeled General Image),可以進一步提升模型效果。 該演算法可以使模型精度繼續提升1-2個點。

4

服務真實場景需求

20種產業演算法落地方案

不僅如此,PaddleClas團隊考慮到真實產業應用面對的各種軟硬體環境和不同的場景需求,在提供PULC方案的同時,還提供了包括 3種訓練方式、5種訓練環境、3種模型壓縮策略和9種推理部署方式在內的20種產業演算法落地方案

表2 PaddleClas訓練推理部署功能支援列表

其中值得高度關注的有:

01 分散式訓練

飛槳分散式訓練架構具備4D混合並行、端到端自適應分散式訓練等多項特色技術。 在PP-LCNet訓練中,4機8卡相較於單機8卡加速比達到3.48倍,加速效率87%,精度無損。

02 模型壓縮

飛槳模型壓縮工具PaddleSlim功能完備,覆蓋模型裁剪、量化、蒸餾和NAS。 影象分類模型經過量化裁剪後,移動端平均預測耗時減少24%。

03 移動端/邊緣端部署

飛槳輕量化推理引擎Paddle Lite適配了20+ AI 加速晶片,可以快速實現影象分類模型在移動裝置、嵌入式裝置和IOT裝置等高效裝置的部署。

以上所有模型、程式碼均在PaddleClas中開源提供,還有超詳細文件教程和範例專案,趕緊檢視全部開原始碼並Star收藏吧~

連結指路

https://github.com/PaddlePaddle/PaddleClas

更多閱讀

  • 官網地址:

https://www.paddlepaddle.org.cn

  • PaddleClas專案地址:

GitHub: https://github.com/PaddlePaddle/PaddleClas

Gitee: https://gitee.com/paddlepaddle/PaddleClas

更多精彩

OpenJDK 提議將提供 Java 類檔案 API

Rust/PostgreSQL 最受喜愛,PHP 薪水偏低

Linus:Rust或將出現在Linux 5.20

這裡有最新開源資訊、軟體更新、技術乾貨等內容

點這裡 ↓↓↓ 記得 關注✔ 標星:star: 哦~

覺得不錯,請點個 在看