【聲入人心:音訊新體驗】

語言: CN / TW / HK

在過去的一年中,我們可以看到多媒體特別是音視訊技術的能力在嚴峻的挑戰下,為各行各業帶來了巨大的變化。疫情過後,又會有哪些多媒體新技術、新實踐呈現在大眾的視野當中?為行業的發展與應用帶來哪些新的趨勢與機會?


10月29日-30日LiveVideoStackCon 2021 音視訊技術大會 北京站,一同探討視訊行業與技術發展的挑戰與更多機會。

文末福利:往屆(部分)精彩演講視訊及內容整理




. 聲入人心:音訊新體驗 .

從K歌、遊戲、電影到音樂教學,更好的聲音表現力將給使用者體驗帶來質的提升。本專題將討論最新的音訊方案,涉及全景聲、語音合成、語音識別、回聲消除等。

. 講師與議題 .


SPEAKER

of 2021

喬寧博 / 

騰訊專家研究員

微信通話音訊技術負責人

2011年畢業於四川大學,從事音訊實用技術研發十餘年。加入騰訊後主導了微信等產品的音訊技術研發,目前主要負責微信音訊通話、語音訊息、短視訊等各類音訊相關業務的技術研發和團隊管理,擁有豐富的音訊技術研究與網際網路產品業務實踐經驗。團隊研發的音訊技術,除應用於微信通話外,在遊戲語音通話中也有廣泛應用。 


TOPIC:

.微信億級通話的音訊技術優化之路.

微信通話系統的語音質量提升歷程分享。從信源和通道質量保障上,本次演講將詳細介紹打造高品質語音通話的關鍵路徑,為億級使用者提供優質通話服務。講解端到端各節點可能遇到的問題,以及相應解決方案。


SPEAKER

of 2021

沈俊聰/ 

荔枝  音訊技術負責人

2010年7月到2013年3月,在華為擔任音訊演算法工程師,負責華為手機的語音增強等模組。2013年4月到現在,在荔枝擔任音訊技術負責人,先後帶領團隊完成了幾個重要專案:手機端音訊節目錄制工具,讓使用者低門檻錄製高音質音訊節目;高音質音訊直播引擎,讓使用者很容易就能在手機上進行高清語音直播;AI聲音理解後臺,能對不同聲音事件進行快速分類;

TOPIC:

.荔枝語音直播中的高音質技術實踐.

荔枝在語音直播中,用到了多種音訊處理技術,譬如結合場景檢測的智慧降噪技術,能大大提升音樂等場景音質;自研的回聲抑制技術,雙講效能得到很大提升。智慧語音加減速技術,讓延時較低的情況下保持聲音自然清晰;線上機型匹配等技術,讓機型適配更高效。



SPEAKER

of 2021

高月潔/ 

網易雲音樂  

高階音訊演算法工程師

主要研究領域為歌唱評價與嗓音分析。負責音街(網易雲旗下K歌app)的綜合評分系統設計與演算法研發,參與音街歌手能力圖譜專案,參與Look直播、雲音樂嗓音相關演算法研發。


TOPIC:

.K歌中的歌唱評價與嗓音分析.

音樂專家在評價歌唱行為時,可通過生理機能與演唱完成度兩個層面對演唱者進行分析。傳統的歌唱評價演算法只對音準進行打分,維度較為片面。作為國內首創的綜合評分功能,音街的綜合評分系統可對使用者的音準、節奏、氣息、顫音、滑音、情感等維度進行綜合評價,這些多維度評分在增加演唱趣味性的同時,也可為作品分發提供可用的標籤。同時,對使用者嗓音、演唱行為進行綜合分析,可建立歌手能力圖譜,依據使用者嗓音條件,為他推薦適合演唱的歌曲。本次分享將圍繞歌唱與嗓音分析,介紹相關的體系與演算法實現。



SPEAKER

of 2021

張俊博/ 

小米  語音技術專家

博士畢業於中國科學院聲學研究所,多年從事智慧語音技術的研究和應用,在語音識別、發音評測、語音合成等領域都做過深入的工作,在頂級會議和期刊發表論文10餘篇。目前在小米負責若干項語音新技術的研發。


TOPIC:

.聲音成分的檢測與分離.

本次演講將詳細介紹語音技術中聲音成分檢測與分離的應用與實踐。





點選 閱讀原文 瞭解更多大會相關資訊,
獲取往屆(部分) 精彩演講視訊 內容整理

本文分享自微信公眾號 - LiveVideoStack(livevideostack)。
如有侵權,請聯絡 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。