AI,能為1.2億聽障老人做點什麼

語言: CN / TW / HK

「突然聽不見了,內心會非常煩躁,也比較恐懼。看別人的嘴巴在動,但就是聽不到對方說什麼。以前非常喜歡和人交流,後面就不想和鄰居、家人說話了,感覺別人開始嫌棄我了。」

今年 82 歲的韓敬秋,右耳還能聽見一些聲音,左耳已經全聾。伴隨著聽力的減退,原本開朗熱情的性格逐漸變得孤僻。每天下午五點左右,他會一個人出門遛彎,然後徑直回家。韓敬秋的六個兒女都在外務工,因為疫情三年沒回家了。提起這件事,他更加傷感:「我現在見不到他們的人,又聽不到他們的聲音,心裡挺不是滋味的。」

韓敬秋老人

今年 75 歲的陳雄芳同樣深受聽力減退之苦: 「因為我聽不到,所以說話會非常大聲,有時候晚上叫老伴,因為聲音過大也會嚇著家人。時間長了,老伴也就不和我交流了。我越樂觀,越想說話,老伴就越生氣;老伴越生氣,就越打擊我的樂觀心態。」

像韓敬秋、陳雄芳這樣的老人,只是我國龐大的老年聽障人群中的兩位。據《中國聽力健康現狀及發展趨勢》資料顯示,我國 65 歲以上⽼年⼈群罹患聽⼒障礙的⼈數⽬前已達 1.2 億。

他們曾為這片土地奉獻青春,但隨著年齡的增長、身體機能的老化,聽力逐漸被「蠶食」。一開始聽不清蟲鳴鳥叫,到最後甚至聽不清朋友和至親的聲音。

在聽不見的表象之下,是衍⽣出的交流、機能以及⼼理問題,很多⽼年聽障人士常常感受到孤單、沮喪、焦慮等情緒,與身邊人的交流障礙,讓他們越來越多地自我懷疑、情緒失控甚至出現認知障礙,引發一系列家庭和社會關係的矛盾……

老年人聽障,已經變成了亟待關注的社會問題。

讓老人戴上一款平價、好用的助聽器,有多難?

面對聽障問題,接受聽力檢測、佩戴助聽器等醫療干預服務是非常重要且有效的。這些措施能極大程度上改善他們的聽覺交流障礙,解決生活中的很多不便。

然而據統計,在我國 65 歲以上的聽力障礙老年人中,需要助聽器干預的人數高達 6300 萬,但實際佩戴助聽器的人數卻不足 6.5%。等到聽力下降到有自主就醫意識的時候,很多老人的聽損通常已經達到最高 70dB 的重度障礙,即使在安靜環境中也聽不到他人的談話內容。

即便如此,很多聽障老人 還是認為自己「沒必要」佩戴助聽器。

導致這種現象的因素很複雜:一方面是因為國內聽力知識的教育基礎比較薄弱,包括老人們自己在內,很多人都存在認知誤區,以為聽障是一件隨著變老自然發生的事情,沒必要干預治療。

另外一些影響因素更為客觀:進口助聽器產品價格不菲,再加上國內助聽器市場主要通過醫院配合銷售,線下驗配價格較高,一部分老人不願或不能承擔醫保範圍之外的這些花費。很多老人每個月只有一兩千塊的收入,如果添置一副效果好的進口助聽器,一次就要花掉大半年的生活費。

相比之下,國產助聽器產品的價格更具優勢。但在技術積累上與進口助聽器產品有著不小的差距。 如何在效能上追趕進口產品,成為了國內助聽器產業的「卡脖子」問題。

現代助聽器裝置通常含有小型的計算機晶片,根據聽力損失程度通過放大器對聲音進行有針對性的調整,比如讓低頻和中頻聲音正常進入耳朵,僅放大高頻聲音。基於助聽器晶片的演算法設計,決定了產品最終的使用感受。

聽障人士可以同時聽到直達聲和處理後的聲音,直達聲和被助聽器處理聲音之間的時間差在專業領域被稱為 「時延」 。這個時延由軟硬體系統和演算法處理帶來,因此既需要低時延的演算法設計,又要對系統進行時延優化。

目前常見的專業助聽器裝置整機時延在 5ms 到 10ms 之間,如果超過 10ms,使用者會感覺聲音空曠、有「管道感」。和進口助聽器產品相比,國產助聽器產品在這方面仍存在差距。

和一般的擴音裝置不同,基於美觀、佩戴舒適度、體積重量等限制條件,助聽器不可能採用太大容量的電池。而且助聽器不同於耳機,需要長時間佩戴,一次佩戴時長可達 8~10 小時。這也對 「功耗」 提出了很高的要求。

此外,對助聽器來說, 「音質」 處理也是至關重要的產品指標。據權威機構 MarkeTrak 的市場調研結果,在 10 個最影響助聽器使用者滿意度的因素中,與音質相關的就佔了 5 個:可懂度、自然度、細節豐富程度、嘈雜環境下的舒適度、佩戴者聽自己聲音的舒適度。

在低時延、低功耗的雙重限制條件下,實現好音質對處理演算法提出了苛刻的要求。通常,助聽器廠商會基於助聽器晶片自帶演算法進行調參或二次開發,但並不能完全滿足使用者在日常生活繁雜場景中的精確需求。

如何讓助聽器產品做到 低時延、低功耗、好音質 ,這三點對於助聽器能否在老年聽障人群中普及很重要,也是國產助聽器能否趕超進口助聽器的關鍵。

AI 能做點什麼?

眼下,上述問題已經有了更好的解決方案。

為了讓技術能夠切實改善聽障老人們的生活,騰訊會議天籟實驗室選擇切入助聽器市場,攜手助聽器廠商智聽科技行聯合研發,推出了摯聽(騰訊天籟 inside)助聽器「公益助老款」。騰訊天籟 inside 音訊解決方案包含的一系列最先進的核心技術,都已經整合到該產品之中。

9 月 25 日,在騰訊天籟行動 2022 年度釋出會上, 這款助聽器正式面世。基於騰訊天籟實驗室的助聽器核心演算法解決方案, 這款產品將複雜場景下語音的清晰度及可懂度提升了 85%,讓千元級的國產助聽器實現了媲美萬元級進口助聽器的效能。

摯聽(騰訊天籟 inside)助聽器

具體來說,摯聽(騰訊天籟 inside)助聽器在波束成形、嘯叫抑制、聲學場景識別、AI 降噪、寬動態範圍壓縮五個方面進行了創新。

對於大多數佩戴助聽器滿意度不高的聽障患者,嘯叫現象是最主要的原因之一。很多老人在聽力減退初期,會購買一些幾百塊的助聽器,但嘯叫嚴重、助聽效果很差。用他們的話說,就是「越戴越聾」。

嘯叫問題會在相當程度上損害患者的殘餘聽力和硬體裝置。常見嘯叫檢測和抑制方法更多的是一種補救策略,更有效的方法應該是在嘯叫出現前進行抑制。比如業界採用過 LMS、NLMS 等經典的回聲消除演算法,但是對於助聽器來說,由於期望訊號和輸入訊號的相關性,傳統自適應演算法未必產生良好效果。

與其「亡羊補牢」,不如「未雨綢繆」。針對該問題,在結合業界常見的相位調製、增益控制、陷波器陷波、空域濾波和聲學環境建模等方法的基礎上,天籟實驗室提出了嘯叫抑制系統性的解決方案。針對全頻帶聽損達 80dB HL 的極重度聽障人士, 即使在佩戴和摘下助聽器、戴帽子、打電話、用手遮擋助聽器等極易產生嘯叫的情況下,也基本無嘯叫產生。

經使用者測試,體驗效果可對標甚至超過進口助聽器品牌中的高階產品。

還有一項進階需求,就是多場景識別。即使是年紀很大的老人,日常生活所去到的環境也是非常多樣的:

  • 在公園散步,一陣大風颳過,風噪該如何處理?

  • 在嘈雜的餐廳吃飯,不想聽到過強的噪音,又需要和對面的人進行語言交流?

  • 在欣賞音樂時,如何高度還原音樂訊號?

再加上,我國老年人有自己獨特的生活習慣,不同地區也有不同的方言,場景也多了麻將館等特殊環境。如何識別不同的聲學場景,給予不同的處理策略,成為助聽器設計的挑戰性技術問題。

像線性判別、支援向量機、隱式馬爾科夫鏈、貝葉斯分類器等經典 AI 方法,都是常見的用於聲場分類的演算法。在這些方法的基礎上,天籟助聽器演算法利用最新的深度學習模型,讓這個問題有了更優解:聲學場景分類演算法會實時檢測麥克風輸入訊號,檢測、識別聲音場景訊號特徵,一旦場景發生變化,識別完成之後給各個具體執行訊號處理單元下發任務,進行降噪、增益、壓縮、方向性等處理,輸出適合當前場景的聲音效果。

目前市場上的一些產品也會提供聲學場景的切換功能,但大多是通過手機 App 來操作,這種模式在老人真正使用時並不方便。而 天籟助聽器演算法真正實現了聲場的智慧切換,佩戴者無需手動操作,即可及時獲得最適合當前環境的聽覺體驗, 提升了使用者體驗的同時,也提高了早期產品適應性,減少了重新驗配的次數。

特別的是,天籟助聽器演算法 內建了數百種常見的生活場景噪聲 ,比如洗菜的水聲、關門聲、切菜聲、杯子掉在地上的聲音等等,實現了有針對性的 AI 降噪。將這些響度較高的突發噪聲降掉,是聽障人士聽著清、聽得懂的關鍵所在。

基於騰訊會議音訊技術的深厚積累在該問題的解決中發揮了重要作用,騰訊會議天籟實驗室在嚴苛的條件約束下不斷實驗、測試、迭代,找到了各種條件之間的平衡,既降掉了噪聲,又能保證語音訊號不失真,讓一款千元級國產助聽器也能擁有萬元級進口助聽器產品的好音質。

由於助聽器需要長時間佩戴,摯聽(天籟 inside)助聽器在進行演算法選型的時候,充分考慮了演算法的計算複雜度,再結合硬體平臺進行了大量細緻的優化。 最終整個助聽演算法可支援使用者一次充電佩戴 10 個小時。

科技向善,造福聽障老人

實際上,在摯聽(天籟 inside)助聽器正式推出之前,這些前沿技術及產品已經走進了很多聽障老人的家。

騰訊天籟實驗室聯合中國老齡事業發展基金會等單位,在 2022 年 3 月成立了「天籟銀髮關愛基金」,首期關愛基金已於 4 月底落地廣東韶關,為 500 位有聽力障礙且家庭經濟困難的老人免費提供了帶有天籟音訊 AI 技術的助聽器。

助聽器驗配也是在老年聽障人群中的落地挑戰之一。基於「天籟行動」的長期技術積累,天籟實驗室提出了創新性的自主驗配方案,結合全面可配置的寬動態範圍壓縮演算法,更好地解決了老年人聽障「最後一公里」的問題。

在騰訊天籟行動 2022 年度釋出會上, 「銀髮聽力健康」小程式 也正式釋出。老人們可以在家屬的幫助下使用「聽覺能力評估」與「聽力健康科普」兩部分功能,在家就能享受到從聽力篩查到康復訓練的科普資訊和功能服務。

「銀髮聽力健康」小程式

這一系列動作,正是騰訊「科技向善」理念的寫照。兩年來,天籟行動始終堅持走近、理解聽障人群的真實需求,用自身的技術釋放出更多公益價值。

在中國逐漸步入重度老齡化社會的今天,可以看到,AI 技術在助力解決聽障問題的應用上有著廣闊的前景,值得注意的是,這一落地過程處在技術適應和改造階段。要想幫助更多老人們聽見、聽清世界,還需要政府、公益以及像騰訊這樣的商業化等多方力量齊頭並進、付出長期努力。

「其他文章」