關於我用 Vue 寫的「微軟語音合成工具」差點被百度收購這件事
theme: awesome-green
某天在公司的下午,收到了來自百度營銷中心的發來的信息,是關於我用 Electron + Vue + ElementPlus + Vite
構建的一款 「 微軟語音合成工具 」的,至此開啟了不尋常的一段旅程 🎬
那麼關於百度收購的進展,文章結尾有 🤑
那麼就讓我先來介紹一下這個項目
這個軟件能做什麼 ?
那到底這個軟件能做什麼呢?能吸引百度都來看看
1. 普通文本轉換為語音
功能介紹: 將簡單的文本轉為語音
使用方法:
1. 將文本複製到下方的文本框,即內容輸入區域
2. 右邊控制欄選擇需要的語音、風格和角色等
3. 點擊`開始轉換`
注意:
1. 文本較長時,軟件內部會自動對文件進行切片,每 300 字左右檢測下一個標點符號,並在此處分割,依次轉為語音後自動拼接
2. 文本較長且沒有標點符號,會轉換失敗
3. 過長的文本,即使有標點符號,轉換也可能會出問題(暫時未定未到問題原因)
4. 幾千字以上或者上萬字推薦自己分成多個 txt 文件批量轉換
5. 可以在文字中加入 SSML 標籤語言解決停頓、中斷、多音字情況
6. 底部控制欄綠色的下載按鈕可以在轉換完成後下載到
2. SSML 轉換為語音
功能介紹: 將 SSML 標籤文本轉為語音
使用方法:
1. 將 SSML 標籤內容寫入下方的文本框,即內容輸入區域
2. 右邊控制欄選擇需要的語音、風格和角色等
3. 點擊開始轉換
3. 文本文件批量轉換
功能介紹: 將多個 txt 文檔分別轉為 MP3 文件
使用方法:
1. 點擊選擇文件可以選擇多個文本文件,選擇完成後,可以看到文件的路徑、字數以及當前為ready狀態
2. 不需要的文件可以點擊同行的刪除按鈕
3. 在右側的設置區域配置好相應的選項後,點擊開始轉換,即可轉換多個文件為 mp3;默認保存路徑為桌面,可以再設置頁面設置保存文件路徑
注意:
1. 文本較長時,軟件內部會自動對文件進行切片,每 300 字左右檢測下一個標點符號,並在此處分割,依次轉為語音後自動拼接
2. 文本較長且沒有標點符號,會轉換失敗
3. 【重要】文本文件格式應為utf-8
4. 控制欄
功能介紹: 對轉換的語音進行精細化控制
使用方法:
1. 選擇設置國家語言。軟件不支持翻譯,意思是你輸入的文本內容,因該是此語言能夠解析的
2. 選擇設置語音,可以在右側點擊綠色播放按鈕試聽該聲音
3. 選擇設置風格、角色、語速和音調
4. 這些配置修改完成後可以保存配置,放便下次直接使用
5. 如果你給配置的名字設置為默認,則打開軟件後會直接顯示這個配置
5. 設置頁面
功能介紹:
1. 下載路徑:轉換後的文件保存路徑
2. 自動播放:文本/ssml 語言轉語音後,是否自動播放
3. 版本更新彈窗提醒:發現新版本後是否彈窗提醒
4. 試聽文本:在選擇語音時,點擊聲音右側播放按鈕播放的內容
5. 模板編輯:刪除在控制欄保存過的聲音配置
注意:
1. 下載路徑、試聽文本修改完成後需要點擊確認
2. 所有設置完畢後推薦點擊刷新配置,不然可能會失效
怎麼才能體驗一下 ?
1. 下載並解壓
下載最新版本的壓縮文件,解壓裏面的tts-vue_1.x.x
到任意位置後,運行此安裝程序
2. 運行安裝程序
💡 提示
首次安裝可以選擇保存位置,再次安裝會默認選擇以前的安裝位置,並且會卸載舊版本並重新安裝
選擇為當前用户還是所有用户安裝,點擊下一步
選擇安裝位置,點擊安裝
🎉 恭喜您,完成了安裝步驟,安裝成功後即可運行該程序
嘗試點擊右下角的 開始轉換 按鈕,開始你的第一次文本轉語音吧
通過源碼編譯
通過源碼編譯的方法適合有開發能力和編程基礎的小夥伴,有能力的小夥伴更推薦下載源碼編譯運行。可以直接在控制枱查看一些輸出內容,更方便調試和修改
1. 下載源碼
源碼可以從以下倉庫獲取:
github: http://github.com/LokerL/tts-vueopen in new window
gitee: http://gitee.com/LGW_space/tts-vue
```js git clone http://github.com/LokerL/tts-vue.git
OR
git clone http://gitee.com/LGW_space/tts-vue.git ```
或者你可以在倉庫直接下載源碼的壓縮包。
2. 安裝依賴
在項目根目錄運行
js
npm i
運行
js
npm run dev
項目打包
js
npm run build
常見問題
1. 轉換時間過長或轉換失敗如何查看原因 ?
解決方法:
點擊 設置
→ 打開日誌
,查看日誌文件
日誌文件保存路徑:C:\Users\用户名\AppData\Roaming\tts-vue\logs(記得定期手動清理日誌)
停在「創建webscoket連接...」是因為網絡問題
停在「第3次上報...」是你的文本里面有無法解析的內容
經過我多次嘗試,轉換 4 篇 800 字以上的高考作文用時只要 15-20 秒鐘
2. 如何調整多音字的讀音或添加中斷或暫停等 ?
解決方法:
文本內容輸入這個試試,簡單的讀音例子
```
你好啊
讀 <phoneme alphabet="sapi" ph="chong 2 liang 4">重量</phoneme> 是不對的
要讀成“重量”
```
3. 批量轉換失敗或者聽到都是“汪汪汪”(one one one)的聲音
可能出現問題的原因:
微軟那個接口只允許 utf-8,其他編碼的文本都會變成 1,英文讀起來就是 one,連着就是汪汪汪了
解決方法:
- 已經存在的 ANSI 編碼的文本文檔,可以點擊文件 → 另存為 → 編碼:UTF-8
- 新建的文本文檔保存文件格式及的選擇 UTF-8
4. 點擊下載沒反應,下載文件為文本文檔?
可能出現問題的原因:
1. 正確的下載方法是轉換完成後點擊綠色的下載圖標,而不是播放器控件的擴展下載,點播放器控件的下載會默認保存為 xxxx.txt
2. 點擊綠色下載沒反應?因為默認保存位置是桌面,所以要檢查當前登錄的賬户有沒有寫入桌面文件的權限
解決方法:
1. 嘗試更改默認下載位置為其他盤
2. 以管理員身份運行此軟件
3. 要是想直接用播放器控件下載音樂,可以在保存的時候更改文件名後綴為.mp3 即可(如果你已經下載完了,可以嘗試更改下載的文本文檔.txt 後綴名為.mp3)
百度到底有沒有收購?
大家進來應該都是比較在意這個,那麼至於百度有沒有收購...
em....
這個項目吧,用來的本來就是微軟的接口,且,百度也有自己的接口
所以百度的工作人員只是以為有跨時代的技術進展才來試探打聽的 😂