音訊變速 | libsonic 開源庫的介紹與實踐

語言: CN / TW / HK

在做音視訊編輯的時候,大家關注更多的是視訊開發,熱衷於 FFmpeg、OpenGL 這些技巧,實際上音訊開發也是很重要的,甚至可以說音訊開發比視訊開發更難一點。

對音訊的常見處理就是變速、變調、混音這些,一般都是用開源庫來搞定,常見的就是 libsonic 和 libsoundtouch 兩個,當然有實力的公司會自己研發音訊演算法。

本篇文章會簡單介紹 libsonic 的使用。

libsonic 獲取

libsonic 是一個支援音訊倍速播放的開源庫,並且支援大於 2 倍速的播放,它的主頁地址如下:

https://android.googlesource.com/platform/external/sonic/+/refs/heads/master/doc/index.md

可以通過該連結下載 libsonic 庫:

git clone git://github.com/waywardgeek/sonic.git

這個倉庫裡面內容還挺全的,包含了 Java 和 C 版本的實現和使用演示,很方便做移植。

如果你只需要用到變速和音量調整,那麼使用 sonic_lite.h 和 sonic_lite.c 兩個檔案就行了,這裡面對功能做了裁剪。

libsonic 主頁上還提供了一個 Android NDK 版本的倉庫,通過該連結可下載:

git clone git://github.com/waywardgeek/sonic-ndk.git

不過這個版本有的太老舊了,還是 Android.mk 的接入方式,現在都換成 CMake 接入了。

有興趣的同學可以寫一個 sonic-ndk CMake 版本的封裝庫,說不定能在 Github 上刷一波 star 呢。

libsonic 使用

libsonic 的呼叫介面不多,具體使用完全可以參考給的程式碼演示。

以下是一個音訊倍速的使用程式碼:

```cpp

/ Run sonic_lite. /

static void runSonic(char inFileName, char outFileName, float speed, float volume) {

waveFile inFile, outFile = NULL;

// 定義輸入和輸出的 buffer

short inBuffer[SONIC_INPUT_SAMPLES], outBuffer[SONIC_INPUT_SAMPLES];

int samplesRead, samplesWritten, sampleRate, numChannels;

// 開啟輸入檔案,並且獲取輸入檔案的相關資訊

inFile = openInputWaveFile(inFileName, &sampleRate, &numChannels);

if (numChannels != 1) {

fprintf(stderr, "sonic_lite only processes mono wave files.  This file has %d channels.\n",

numChannels);

exit(1);

}

if (sampleRate != SONIC_SAMPLE_RATE) {

fprintf(stderr,

"sonic_lite only processes wave files with a sample rate of %d Hz.  This file uses %d\n",

SONIC_SAMPLE_RATE, sampleRate);

exit(1);

}

if (inFile == NULL) {

fprintf(stderr, "Unable to read wave file %s\n", inFileName);

exit(1);

}

// 開啟輸出檔案

outFile = openOutputWaveFile(outFileName, sampleRate, 1);

if (outFile == NULL) {

closeWaveFile(inFile);

fprintf(stderr, "Unable to open wave file %s for writing\n", outFileName);

exit(1);

}

// 初始化 sonic 並且設定速度 speed 和音量 volume

sonicInit();

sonicSetSpeed(speed);

sonicSetVolume(volume);

do {

// 從輸入檔案中讀取 sample

samplesRead = readFromWaveFile(inFile, inBuffer, SONIC_INPUT_SAMPLES);

if (samplesRead == 0) {

sonicFlushStream();

} else {

// 將讀取的 sample 給到 sonic 中的 sonicStream

// sonicStream 會根據 speed 和 volume 做相應處理

sonicWriteShortToStream(inBuffer, samplesRead);

}

// 將 sonic 中 sonicStream 處理後的資料給到 outBuffer

// 並將 outBuffer 寫入到輸出檔案中

do {

samplesWritten = sonicReadShortFromStream(outBuffer, SONIC_INPUT_SAMPLES);

if (samplesWritten > 0) {

writeToWaveFile(outFile, outBuffer, samplesWritten);

}

} while (samplesWritten > 0);

} while (samplesRead > 0);

closeWaveFile(inFile);

closeWaveFile(outFile);

}

```

這個程式碼示例還是比較簡單易懂的。

首先是檢查輸入和輸出檔案是不是有問題,這一點很基礎但也非常重要。

程式碼中用到的示例檔案是 wav 格式的,libsonic 倉庫中有對應的資源可以下載,不用自己滿世界找檔案了。

wav 檔案的讀取可以用倉庫中的 wave.c 和 wave.h 檔案操作。

接下來就是從輸入檔案中讀取 sample ,並交由 libsonic 處理,最後將處理好 sample 寫入到輸出檔案中。

這有個概念就是:視訊的處理,我們都是說一幀一幀的,音訊就沒有幀的概念,一般都是說取樣點,比如要處理多少個取樣點之類的說法。

程式碼示例中,readFromWaveFile 方法從檔案中讀取 sample ,sonicWriteShortToStream 方法將 sample 交由 libsonic 處理。

libsonic 中有個 sonicStream 的結構,它用來儲存變換後的資料,這裡面會根據設定的 speed 和 volume 做處理。

最後再通過 sonicReadShortFromStream 將資料從 libsonic 讀出,然後通過 writeToWaveFile 方法寫入到輸出檔案中。

經過測試,以上方法確實可以實現音量調節和變速的效果,並且在變速的同時保持著原來的音調。

小結

以上就是關於 libsonic 的介紹與實踐,除了 wav 格式檔案,pcm 格式資料也同樣可以做變速的。

關注公眾號 音視訊開發進階 ,在後續還會進行更新原始碼分析等更多內容,敬請期待~~~