開發者工具|15款音視頻開發者必備實用工具,看看你用過幾個?
本文正在參加「金石計劃 . 瓜分6萬現金大獎」https://juejin.cn/post/7162096952883019783
對於音視頻開發者來説,有個高效的輔助工具能大大提升開發效率。今天博主推薦這些年來桌面必備的工具,如果您覺得對你有用,可以收藏防止下次找不到。
🔨 推薦1 Ghips
📌 一句話描述 :僅
600KB
的開源軟件,通過GitHub官方API獲取所有IP,並自動找到最快IP。
👀 開源地址
https://github.com/aardio/Ghips
⚓️ 下載鏈接
https://github.com/aardio/Ghips/releases/latest/download/Ghips.7z
🎯 功能介紹
Ghips
通過GitHub
官方API獲取所有IP
,並自動找到最快IP
。將得到的最快IP寫入到本地hosts
。
注意:更新
IP
後首次訪問GitHub
會比較慢,稍等就快了。
--------------------------------
🔨 推薦2 ScreenToGif
📌 一句話描述 :提供錄屏轉
gif
、gif
編輯、視頻轉gif
等功能。
👀 開源地址
https://github.com/NickeManarin/ScreenToGif
⚓️ 下載鏈接
https://github.com/NickeManarin/ScreenToGif/releases
🎯 功能介紹
主要包含4個主要入口:
- 錄像機:用於錄屏製作gif或視頻
- 攝像頭:實時採集攝像頭數據製作gif或視頻
- 畫板:提供白板,實時記錄畫筆繪製畫面,保存為gif或視頻
- 編輯器:編輯視頻或gif,可以將視頻或gif相互轉換
對於錄製視頻,ScreenToGif
可選定屏幕區域執行錄屏,並可設定fps
,如下圖所示。
對選定的視頻
、gif
或錄製好的內容
,包含如下所示的編輯功能
📢推薦總結:凡是涉及到gif相關的工作,強烈推薦Screen2Gif工具
--------------------------------
🔨 推薦3 屏幕拾色器
📌 一句話描述 :ColorPicker是一款基於MFC實現的屏幕拾色器。
👀 開源地址
https://github.com/hufuman/colorpicker
⚓️ 下載鏈接
https://raw.githubusercontent.com/hufuman/colorpicker/master/ColorPicker.exe
🎯 功能介紹
鼠標所移之處實時顯示RGB值,當確定選取當前位置的像素值時,按快捷鍵:ctrl + 1
。
--------------------------------
🔨 推薦4 OBS Studio
📌 一句話描述 :對個人電腦配置要求低,只需推流地址即可實現屏幕內容錄製並推流直播。
👀 開源地址
https://github.com/obsproject/obs-studio?source=juejin&article56
⚓️ 下載鏈接
https://obsproject.com/?source=juejin&article56
🎯 功能介紹
OBS Studio是一款免費開源的屏幕錄製和實時流媒體軟件,支持Windows、Linux和Mac操作系統。對資源佔用較少,配置要求底。只需要有推流地址比如抖音推流地址,即可完成屏幕實時錄製推流到抖音直播。
對於直播開發者來説,OBS是一款不錯的測試客户端。
--------------------------------
🔨 推薦5 ffmpeg
📌 一句話描述 :FFmpeg是可以用於音頻、視頻、圖像格式轉換、編解碼、切換壓縮算法等非常強大的工具。
👀 開源地址
https://github.com/FFmpeg/FFmpeg
⚓️ 下載鏈接
https://github.com/FFmpeg/FFmpeg/releases
🎯 功能介紹
毫不誇張地説,市面上80%以上視頻處理類的軟件(或App)底層都用到了ffmpeg庫。對於ffmpeg庫,底層通過C++直接調用;對於非開發者而言,可以直接調用官方編譯好的工具通過命令行調用。
- 圖片方面,圖片格式轉換,圖片轉視頻等。
- 視頻採集方面,ffmpeg可以設置幀率(fps),編解碼算法(h264,h265等),設置碼率(bps)等。
- 視頻格式方面,ffmpeg可以實現多種視頻格式之間的相互轉換(wma,rm,avi,mod等)。
- 直播方面,ffmpeg可以推流直播。
--------------------------------
🔨 推薦6 Image Watch
📌 一句話描述 :Opencv官方出品的VisualStudio插件,它可以讓開發者在調試一個OpenCV程序時,直觀地看到內存中的圖像,並能直接在調試界面中做一系列的圖像操作。
⚓️ 獲取方式
VisualStudio菜單 -> 工具 -> 擴展和更新(U)... -> 聯機 -> 在右上角的搜索欄中直接搜索Image Watch -> 在搜索的結果點擊下載即可。
🎯 功能介紹
在需要可視化的Mat對象後面加一個斷點,觸發斷點後,在ImageWatch界面中會列出當前上下文中的所有Mat對象,點擊Mat對象即可顯示對應的圖片,並且放大後可以看到具體的像素值。
--------------------------------
🔨 推薦7 Open Image Debugger
📌 一句話描述 :Open Image Debugger用於在調試期間可視化內存圖片,與Image Watch功能類似,不過Open Image Debugger更多聚焦在Linux和Mac系統上。
👀 開源地址
https://github.com/OpenImageDebugger/OpenImageDebugger
⚓️ 下載鏈接
https://github.com/OpenImageDebugger/OpenImageDebugger/releases/tag/v1.3.0
🎯 功能介紹 Open Image Debugger用於在調試期間可視化內存圖片, 圖片對象可以為Opencv的Mat以及Eigen的matrices,兼容GDB和LLDB。主要包含以下特性:
- GUI交互:
- 滾輪放縮,拖拽移動緩存區
- 對緩存區順時針或逆時針旋轉90度
- 跳轉到任意像素位置
- 緩存值:放大到極限後,顯示對應的像素數值。
- 自動更新:緩存視圖會自動更新內容。
- 自動對比度:緩衝區中的整個值範圍可以自動映射到可視化範圍[0,1],其中0表示黑色,1表示白色。
- 對比度範圍可以手動調整,這對於檢查具有極值(例如無窮大、nan和其他異常值)的緩衝區非常有用。
- 視圖鏈接在一起,在屏幕上移動任何單個緩衝區時同時移動所有關注的緩衝區。
- 支持的緩衝區類型:uint8_t,int16_t,uint16_t、int32_t、uint32_t,float和double
- 支持的緩衝通道:最多四個通道(灰度、兩個通道、RGB和RGBA)
- 支持GPU加速
📢推薦總結:對於使用QT Creator的應用,Open Image Debugger調試OpenCV還是非常有用的。
--------------------------------
🔨 推薦8 OpenCV
📌 一句話描述 :大名鼎鼎的Opencv,提供了彙編級優化過的圖像處理算法集。
👀 開源地址
https://github.com/opencv/opencv
⚓️ 官方網站
🎯 功能介紹
OpenCV
基於C++
實現,但提供了Python
、Java
、Matlab
等接口,並支持Windows
、Linux
、Mac
、Android
以及iOS
等主流操作系統。在圖像處理、圖像分類、目標檢測、圖像分割、風格遷移、圖像重構、超分辨率、圖像生成、人臉識別等CV
領域都有廣泛的使用。
簡單來説,Photoshop
裏面用到的功能都可以通過OpenCV
來實現, 就問你它強不強!
--------------------------------
🔨 推薦9 SRS(Simple Realtime Server)
📌 一句話描述 :一款簡單、高效的實時視頻服務器。
👀 開源地址
⚓️ 下載鏈接
https://github.com/ossrs/srs/releases
🎯 功能介紹
SRS(Simple Realtime Server)
是一個簡單高效的實時視頻服務器,支持 RTMP
/WebRTC
/HLS
/HTTP-FLV
/SRT
/GB28181
,它是高性能的流媒體服務器。可以用來構建直播和視頻會議的後端服務。SRS
項目的目標是降低(不能消除)音視頻的門檻。
核心功能,如下:
更多技術細節可以參考官方文檔:https://ossrs.net/lts/zh-cn/docs/v4/doc/getting-started
🔨 推薦10 免費額度大的第三方實時音視頻SDK
對於新手來説,音視頻的門檻真的非常高。前面也説了音視頻開發門檻是無法消除的,最快的方式是藉助第三方搭建好的實時音視頻平台。市面上有很多,這裏我簡單介紹一下平時用的多的【即構平台】。
📌 一句話描述 :免費額度大,整體性價比高,適合個人開發者快速搭建一個帶有實時視頻或直播的App。
⚓️ 官方網址
🎯 功能介紹
- 實時音視頻, 可實現多人聊天室
- 即時通信,可實現聊天App
- 元宇宙,捏臉,虛擬形象聊天
--------------------------------
🔨 推薦11 wireshark
📌 一句話描述 :是一個網絡封包分析軟件,可以分析網絡實時收發數據包。
👀 開源地址 https://github.com/wireshark/wireshark
⚓️ 下載鏈接 https://www.wireshark.org/#download
🎯 功能介紹
- 支持分析數百種網絡協議,並實時更新最新的新協議。
- 支持在線抓包,離線分析。
- 支持主流操作系統平台。
- 支持豐富且強大的包過濾語法
- 支持讀取分析多種文件格式:
tcpdump
(libpcap
),Pcap NG
等。 - 支持抓取多種物理接口:
Ethernet
,IEEE 802.11
,PPP/HDLC
,ATM
,Bluetooth
,USB
等。 - 支持分析解密多種安全協議:
IPsec
,ISAKMP
,Kerberos
,SNMPv3
,SSL/TLS
,WEP
,WPA/WPA2
等。
--------------------------------
🔨 推薦12 mitmproxy
📌 一句話描述 :為滲透測試人員和軟件開發人員提供的交互式TLS攔截HTTP代理。
👀 開源地址
https://github.com/mitmproxy/mitmproxy
⚓️ 官方網站
🎯 功能介紹
- mitm提供了命令行、Web界面、Python庫三種使用方式。
-
命令行如下所示。
-
Web界面如下所示。
- Python庫, python調用方式如下: ```python from mitmproxy import http
def request(flow: http.HTTPFlow): # redirect to different host if flow.request.pretty_host == "example.com": flow.request.host = "mitmproxy.org" # answer from proxy elif flow.request.path.endswith("/brew"): flow.response = http.Response.make( 418, b"I'm a teapot", ) ```
--------------------------------
🔨 推薦13 protobuf
📌 一句話描述 :通過將結構化的數據進行序列化(串行化),用於通訊協議、數據存儲等領域的語言無關、平台無關、可擴展的序列化結構數據格式。
👀 開源地址
https://github.com/protocolbuffers/protobuf
⚓️ 下載鏈接
https://github.com/protocolbuffers/protobuf/releases
🎯 功能介紹
- 一種二進制數據交換格式。可以將
C++
中定義的存儲類的內容與二進制序列串相互轉換,主要用於數據傳輸或保存 - 定義了一種源文件,擴展名為
.proto
(類比.cpp
文件),使用這種源文件,可以定義存儲類的內容 protobuf
有自己的編譯器protoc
,可以將.proto
編譯指定語言源代碼,如.cc
、.py
、.js
等主流編程語言源碼。
--------------------------------
🔨 推薦14 protobuf inspector
📌 一句話描述 :對未知結構的
Protocol Buffer
數據逆向並可視化結構。
👀 開源地址
https://github.com/mildsunrise/protobuf-inspector
⚓️ 安裝使用
pip install protobuf-inspector
🎯 功能介紹
- 安裝庫
pip install protobuf-inspector
- 安裝完後可以直接使用命令行
protobuf_inspector < my-protobuf-blob
,其中my-protobuf-blob
是未知的pb
數據包。 - 示例如下:
shell $ protobuf_inspector < my-blob root: 1 <varint> = 1469046243471 2 <chunk> = "kotlin46" 7 <chunk> = bytes (5) 0000 00 01 03 04 07 ..... 8 <chunk> = empty chunk 9 <varint> = 250 10 <32bit> = 0x43480000 / 1128792064 / 200.000 14 <chunk> = message: 1 <chunk> = "POKECOIN" 14 <chunk> = message: 1 <chunk> = "STARDUST" 2 <varint> = 100
--------------------------------
🔨 推薦15 PPOCR
📌 一句話描述 :非常小的OCR模型,可以用於日常圖片中文字提取。
👀 開源地址 https://github.com/PaddlePaddle/PaddleOCR
⚓️ 官方教程
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/README_ch.md
🎯 功能介紹
1. 在線網站體驗:超輕量PP-OCR mobile
模型體驗地址:https://www.paddlepaddle.org.cn/hub/scene/ocr
2. 移動端demo
體驗:安裝包DEMO
下載地址(基於EasyEdge和Paddle-Lite, 支持iOS和Android系統)
3. 一行命令快速使用:快速開始(中英文/多語言/文檔分析)