關於我用 Vue 寫的「微軟語音合成工具」差點被百度收購這件事

語言: CN / TW / HK

theme: awesome-green

image.png

某天在公司的下午,收到了來自百度營銷中心的發來的信息,是關於我用 Electron + Vue + ElementPlus + Vite 構建的一款 「 微軟語音合成工具 」的,至此開啟了不尋常的一段旅程 🎬

那麼關於百度收購的進展,文章結尾有 🤑

那麼就讓我先來介紹一下這個項目

這個軟件能做什麼 ?

那到底這個軟件能做什麼呢?能吸引百度都來看看

image.png

1. 普通文本轉換為語音

功能介紹: 將簡單的文本轉為語音

使用方法:

1.  將文本複製到下方的文本框,即內容輸入區域
2.  右邊控制欄選擇需要的語音、風格和角色等
3.  點擊`開始轉換`

注意:

1.  文本較長時,軟件內部會自動對文件進行切片,每 300 字左右檢測下一個標點符號,並在此處分割,依次轉為語音後自動拼接
2.  文本較長且沒有標點符號,會轉換失敗
3.  過長的文本,即使有標點符號,轉換也可能會出問題(暫時未定未到問題原因)
4.  幾千字以上或者上萬字推薦自己分成多個 txt 文件批量轉換
5.  可以在文字中加入 SSML 標籤語言解決停頓、中斷、多音字情況
6.  底部控制欄綠色的下載按鈕可以在轉換完成後下載到

2. SSML 轉換為語音

功能介紹: 將 SSML 標籤文本轉為語音

使用方法:

1.  將 SSML 標籤內容寫入下方的文本框,即內容輸入區域
2.  右邊控制欄選擇需要的語音、風格和角色等
3.  點擊開始轉換

3. 文本文件批量轉換

功能介紹: 將多個 txt 文檔分別轉為 MP3 文件

使用方法:

1.  點擊選擇文件可以選擇多個文本文件,選擇完成後,可以看到文件的路徑、字數以及當前為ready狀態
2.  不需要的文件可以點擊同行的刪除按鈕
3.  在右側的設置區域配置好相應的選項後,點擊開始轉換,即可轉換多個文件為 mp3;默認保存路徑為桌面,可以再設置頁面設置保存文件路徑

注意:

1.  文本較長時,軟件內部會自動對文件進行切片,每 300 字左右檢測下一個標點符號,並在此處分割,依次轉為語音後自動拼接
2.  文本較長且沒有標點符號,會轉換失敗
3.  【重要】文本文件格式應為utf-8

4. 控制欄

功能介紹: 對轉換的語音進行精細化控制

使用方法:

1.  選擇設置國家語言。軟件不支持翻譯,意思是你輸入的文本內容,因該是此語言能夠解析的
2.  選擇設置語音,可以在右側點擊綠色播放按鈕試聽該聲音
3.  選擇設置風格、角色、語速和音調
4.  這些配置修改完成後可以保存配置,放便下次直接使用
5.  如果你給配置的名字設置為默認,則打開軟件後會直接顯示這個配置

5. 設置頁面

功能介紹:

1.  下載路徑:轉換後的文件保存路徑
2.  自動播放:文本/ssml 語言轉語音後,是否自動播放
3.  版本更新彈窗提醒:發現新版本後是否彈窗提醒
4.  試聽文本:在選擇語音時,點擊聲音右側播放按鈕播放的內容
5.  模板編輯:刪除在控制欄保存過的聲音配置

注意:

1.  下載路徑、試聽文本修改完成後需要點擊確認
2.  所有設置完畢後推薦點擊刷新配置,不然可能會失效

怎麼才能體驗一下 ?

Gitee 下載地址

藍奏雲 下載地址

1. 下載並解壓

下載最新版本的壓縮文件,解壓裏面的tts-vue_1.x.x到任意位置後,運行此安裝程序

image.png

2. 運行安裝程序

💡 提示

首次安裝可以選擇保存位置,再次安裝會默認選擇以前的安裝位置,並且會卸載舊版本並重新安裝

選擇為當前用户還是所有用户安裝,點擊下一步

image.png

選擇安裝位置,點擊安裝

image.png

🎉 恭喜您,完成了安裝步驟,安裝成功後即可運行該程序

image.png

嘗試點擊右下角的 開始轉換 按鈕,開始你的第一次文本轉語音吧


通過源碼編譯

通過源碼編譯的方法適合有開發能力和編程基礎的小夥伴,有能力的小夥伴更推薦下載源碼編譯運行。可以直接在控制枱查看一些輸出內容,更方便調試和修改

1. 下載源碼

源碼可以從以下倉庫獲取:

github: https://github.com/LokerL/tts-vueopen in new window

gitee: https://gitee.com/LGW_space/tts-vue

```js git clone https://github.com/LokerL/tts-vue.git

OR

git clone https://gitee.com/LGW_space/tts-vue.git ```

或者你可以在倉庫直接下載源碼的壓縮包。

2. 安裝依賴

在項目根目錄運行

js npm i 運行

js npm run dev 項目打包

js npm run build


常見問題

1. 轉換時間過長或轉換失敗如何查看原因 ?

解決方法:

點擊 設置打開日誌,查看日誌文件

日誌文件保存路徑:C:\Users\用户名\AppData\Roaming\tts-vue\logs(記得定期手動清理日誌)

停在「創建webscoket連接...」是因為網絡問題

停在「第3次上報...」是你的文本里面有無法解析的內容

經過我多次嘗試,轉換 4 篇 800 字以上的高考作文用時只要 15-20 秒鐘

2. 如何調整多音字的讀音或添加中斷或暫停等 ?

解決方法:

文本內容輸入這個試試,簡單的讀音例子

```
  你好啊
  讀 <phoneme alphabet="sapi" ph="chong 2 liang 4">重量</phoneme> 是不對的
  要讀成“重量”
```

image.png

3. 批量轉換失敗或者聽到都是“汪汪汪”(one one one)的聲音

可能出現問題的原因:

微軟那個接口只允許 utf-8,其他編碼的文本都會變成 1,英文讀起來就是 one,連着就是汪汪汪了

解決方法:

  1. 已經存在的 ANSI 編碼的文本文檔,可以點擊文件 → 另存為 → 編碼:UTF-8
  2. 新建的文本文檔保存文件格式及的選擇 UTF-8

4. 點擊下載沒反應,下載文件為文本文檔?

可能出現問題的原因:

1.  正確的下載方法是轉換完成後點擊綠色的下載圖標,而不是播放器控件的擴展下載,點播放器控件的下載會默認保存為 xxxx.txt
2.  點擊綠色下載沒反應?因為默認保存位置是桌面,所以要檢查當前登錄的賬户有沒有寫入桌面文件的權限

解決方法:

1.  嘗試更改默認下載位置為其他盤
2.  以管理員身份運行此軟件
3.  要是想直接用播放器控件下載音樂,可以在保存的時候更改文件名後綴為.mp3 即可(如果你已經下載完了,可以嘗試更改下載的文本文檔.txt 後綴名為.mp3)

百度到底有沒有收購?

大家進來應該都是比較在意這個,那麼至於百度有沒有收購...

em....

image.png

這個項目吧,用來的本來就是微軟的接口,且,百度也有自己的接口

所以百度的工作人員只是以為有跨時代的技術進展才來試探打聽的 😂