【聲入人心：音訊新體驗】

語言: CN / TW / HK

時間 2021-09-08 13:03:10 LiveVideoStack

主題: 語音識別人工智慧

在過去的一年中，我們可以看到多媒體特別是音視訊技術的能力在嚴峻的挑戰下，為各行各業帶來了巨大的變化。疫情過後，又會有哪些多媒體新技術、新實踐呈現在大眾的視野當中？為行業的發展與應用帶來哪些新的趨勢與機會？

10月29日-30日，LiveVideoStackCon 2021 音視訊技術大會 北京站，一同探討視訊行業與技術發展的挑戰與更多機會。

文末福利：往屆(部分)精彩演講視訊及內容整理

. 聲入人心：音訊新體驗 .

從K歌、遊戲、電影到音樂教學，更好的聲音表現力將給使用者體驗帶來質的提升。本專題將討論最新的音訊方案，涉及全景聲、語音合成、語音識別、回聲消除等。

. 講師與議題 .

SPEAKER

of 2021

喬寧博 /

騰訊專家研究員

微信通話音訊技術負責人

2011年畢業於四川大學，從事音訊實用技術研發十餘年。加入騰訊後主導了微信等產品的音訊技術研發，目前主要負責微信音訊通話、語音訊息、短視訊等各類音訊相關業務的技術研發和團隊管理，擁有豐富的音訊技術研究與網際網路產品業務實踐經驗。團隊研發的音訊技術，除應用於微信通話外，在遊戲語音通話中也有廣泛應用。

TOPIC：

.微信億級通話的音訊技術優化之路.

微信通話系統的語音質量提升歷程分享。從信源和通道質量保障上，本次演講將詳細介紹打造高品質語音通話的關鍵路徑，為億級使用者提供優質通話服務。講解端到端各節點可能遇到的問題，以及相應解決方案。

SPEAKER

of 2021

沈俊聰/

荔枝音訊技術負責人

2010年7月到2013年3月，在華為擔任音訊演算法工程師，負責華為手機的語音增強等模組。2013年4月到現在，在荔枝擔任音訊技術負責人，先後帶領團隊完成了幾個重要專案：手機端音訊節目錄制工具，讓使用者低門檻錄製高音質音訊節目；高音質音訊直播引擎，讓使用者很容易就能在手機上進行高清語音直播；AI聲音理解後臺，能對不同聲音事件進行快速分類；

TOPIC：

.荔枝語音直播中的高音質技術實踐.

荔枝在語音直播中，用到了多種音訊處理技術，譬如結合場景檢測的智慧降噪技術，能大大提升音樂等場景音質；自研的回聲抑制技術，雙講效能得到很大提升。智慧語音加減速技術，讓延時較低的情況下保持聲音自然清晰；線上機型匹配等技術，讓機型適配更高效。

SPEAKER

of 2021

高月潔/

網易雲音樂

高階音訊演算法工程師

主要研究領域為歌唱評價與嗓音分析。負責音街（網易雲旗下K歌app）的綜合評分系統設計與演算法研發，參與音街歌手能力圖譜專案，參與Look直播、雲音樂嗓音相關演算法研發。

TOPIC：

.K歌中的歌唱評價與嗓音分析.

音樂專家在評價歌唱行為時，可通過生理機能與演唱完成度兩個層面對演唱者進行分析。傳統的歌唱評價演算法只對音準進行打分，維度較為片面。作為國內首創的綜合評分功能，音街的綜合評分系統可對使用者的音準、節奏、氣息、顫音、滑音、情感等維度進行綜合評價，這些多維度評分在增加演唱趣味性的同時，也可為作品分發提供可用的標籤。同時，對使用者嗓音、演唱行為進行綜合分析，可建立歌手能力圖譜，依據使用者嗓音條件，為他推薦適合演唱的歌曲。本次分享將圍繞歌唱與嗓音分析，介紹相關的體系與演算法實現。

SPEAKER

of 2021

張俊博/

小米語音技術專家

博士畢業於中國科學院聲學研究所，多年從事智慧語音技術的研究和應用，在語音識別、發音評測、語音合成等領域都做過深入的工作，在頂級會議和期刊發表論文10餘篇。目前在小米負責若干項語音新技術的研發。

TOPIC：

.聲音成分的檢測與分離.

本次演講將詳細介紹語音技術中聲音成分檢測與分離的應用與實踐。

點選閱讀原文瞭解更多大會相關資訊，

獲取往屆（部分）精彩演講視訊及內容整理

本文分享自微信公眾號 - LiveVideoStack（livevideostack）。
如有侵權，請聯絡 [email protected] 刪除。
本文參與“OSC源創計劃”，歡迎正在閱讀的你也加入，一起分享。

「其他文章」