AI,能为1.2亿听障老人做点什么
「突然听不见了,内心会非常烦躁,也比较恐惧。看别人的嘴巴在动,但就是听不到对方说什么。以前非常喜欢和人交流,后面就不想和邻居、家人说话了,感觉别人开始嫌弃我了。」
今年 82 岁的韩敬秋,右耳还能听见一些声音,左耳已经全聋。伴随着听力的减退,原本开朗热情的性格逐渐变得孤僻。每天下午五点左右,他会一个人出门遛弯,然后径直回家。韩敬秋的六个儿女都在外务工,因为疫情三年没回家了。提起这件事,他更加伤感:「我现在见不到他们的人,又听不到他们的声音,心里挺不是滋味的。」
韩敬秋老人
今年 75 岁的陈雄芳同样深受听力减退之苦: 「因为我听不到,所以说话会非常大声,有时候晚上叫老伴,因为声音过大也会吓着家人。时间长了,老伴也就不和我交流了。我越乐观,越想说话,老伴就越生气;老伴越生气,就越打击我的乐观心态。」
像韩敬秋、陈雄芳这样的老人,只是我国庞大的老年听障人群中的两位。据《中国听力健康现状及发展趋势》数据显示,我国 65 岁以上⽼年⼈群罹患听⼒障碍的⼈数⽬前已达 1.2 亿。
他们曾为这片土地奉献青春,但随着年龄的增长、身体机能的老化,听力逐渐被「蚕食」。一开始听不清虫鸣鸟叫,到最后甚至听不清朋友和至亲的声音。
在听不见的表象之下,是衍⽣出的交流、机能以及⼼理问题,很多⽼年听障人士常常感受到孤单、沮丧、焦虑等情绪,与身边人的交流障碍,让他们越来越多地自我怀疑、情绪失控甚至出现认知障碍,引发一系列家庭和社会关系的矛盾……
老年人听障,已经变成了亟待关注的社会问题。
让老人戴上一款平价、好用的助听器,有多难?
面对听障问题,接受听力检测、佩戴助听器等医疗干预服务是非常重要且有效的。这些措施能极大程度上改善他们的听觉交流障碍,解决生活中的很多不便。
然而据统计,在我国 65 岁以上的听力障碍老年人中,需要助听器干预的人数高达 6300 万,但实际佩戴助听器的人数却不足 6.5%。等到听力下降到有自主就医意识的时候,很多老人的听损通常已经达到最高 70dB 的重度障碍,即使在安静环境中也听不到他人的谈话内容。
即便如此,很多听障老人 还是认为自己「没必要」佩戴助听器。
导致这种现象的因素很复杂:一方面是因为国内听力知识的教育基础比较薄弱,包括老人们自己在内,很多人都存在认知误区,以为听障是一件随着变老自然发生的事情,没必要干预治疗。
另外一些影响因素更为客观:进口助听器产品价格不菲,再加上国内助听器市场主要通过医院配合销售,线下验配价格较高,一部分老人不愿或不能承担医保范围之外的这些花费。很多老人每个月只有一两千块的收入,如果添置一副效果好的进口助听器,一次就要花掉大半年的生活费。
相比之下,国产助听器产品的价格更具优势。但在技术积累上与进口助听器产品有着不小的差距。 如何在性能上追赶进口产品,成为了国内助听器产业的「卡脖子」问题。
现代助听器设备通常含有小型的计算机芯片,根据听力损失程度通过放大器对声音进行有针对性的调整,比如让低频和中频声音正常进入耳朵,仅放大高频声音。基于助听器芯片的算法设计,决定了产品最终的使用感受。
听障人士可以同时听到直达声和处理后的声音,直达声和被助听器处理声音之间的时间差在专业领域被称为 「时延」 。这个时延由软硬件系统和算法处理带来,因此既需要低时延的算法设计,又要对系统进行时延优化。
目前常见的专业助听器设备整机时延在 5ms 到 10ms 之间,如果超过 10ms,用户会感觉声音空旷、有「管道感」。和进口助听器产品相比,国产助听器产品在这方面仍存在差距。
和一般的扩音设备不同,基于美观、佩戴舒适度、体积重量等限制条件,助听器不可能采用太大容量的电池。而且助听器不同于耳机,需要长时间佩戴,一次佩戴时长可达 8~10 小时。这也对 「功耗」 提出了很高的要求。
此外,对助听器来说, 「音质」 处理也是至关重要的产品指标。据权威机构 MarkeTrak 的市场调研结果,在 10 个最影响助听器用户满意度的因素中,与音质相关的就占了 5 个:可懂度、自然度、细节丰富程度、嘈杂环境下的舒适度、佩戴者听自己声音的舒适度。
在低时延、低功耗的双重限制条件下,实现好音质对处理算法提出了苛刻的要求。通常,助听器厂商会基于助听器芯片自带算法进行调参或二次开发,但并不能完全满足用户在日常生活繁杂场景中的精确需求。
如何让助听器产品做到 低时延、低功耗、好音质 ,这三点对于助听器能否在老年听障人群中普及很重要,也是国产助听器能否赶超进口助听器的关键。
AI 能做点什么?
眼下,上述问题已经有了更好的解决方案。
为了让技术能够切实改善听障老人们的生活,腾讯会议天籁实验室选择切入助听器市场,携手助听器厂商智听科技行联合研发,推出了挚听(腾讯天籁 inside)助听器「公益助老款」。腾讯天籁 inside 音频解决方案包含的一系列最先进的核心技术,都已经集成到该产品之中。
9 月 25 日,在腾讯天籁行动 2022 年度发布会上, 这款助听器正式面世。基于腾讯天籁实验室的助听器核心算法解决方案, 这款产品将复杂场景下语音的清晰度及可懂度提升了 85%,让千元级的国产助听器实现了媲美万元级进口助听器的性能。
挚听(腾讯天籁 inside)助听器
具体来说,挚听(腾讯天籁 inside)助听器在波束成形、啸叫抑制、声学场景识别、AI 降噪、宽动态范围压缩五个方面进行了创新。
对于大多数佩戴助听器满意度不高的听障患者,啸叫现象是最主要的原因之一。很多老人在听力减退初期,会购买一些几百块的助听器,但啸叫严重、助听效果很差。用他们的话说,就是「越戴越聋」。
啸叫问题会在相当程度上损害患者的残余听力和硬件设备。常见啸叫检测和抑制方法更多的是一种补救策略,更有效的方法应该是在啸叫出现前进行抑制。比如业界采用过 LMS、NLMS 等经典的回声消除算法,但是对于助听器来说,由于期望信号和输入信号的相关性,传统自适应算法未必产生良好效果。
与其「亡羊补牢」,不如「未雨绸缪」。针对该问题,在结合业界常见的相位调制、增益控制、陷波器陷波、空域滤波和声学环境建模等方法的基础上,天籁实验室提出了啸叫抑制系统性的解决方案。针对全频带听损达 80dB HL 的极重度听障人士, 即使在佩戴和摘下助听器、戴帽子、打电话、用手遮挡助听器等极易产生啸叫的情况下,也基本无啸叫产生。
经用户测试,体验效果可对标甚至超过进口助听器品牌中的高端产品。
还有一项进阶需求,就是多场景识别。即使是年纪很大的老人,日常生活所去到的环境也是非常多样的:
-
在公园散步,一阵大风刮过,风噪该如何处理?
-
在嘈杂的餐厅吃饭,不想听到过强的噪音,又需要和对面的人进行语言交流?
-
在欣赏音乐时,如何高度还原音乐信号?
再加上,我国老年人有自己独特的生活习惯,不同地区也有不同的方言,场景也多了麻将馆等特殊环境。如何识别不同的声学场景,给予不同的处理策略,成为助听器设计的挑战性技术问题。
像线性判别、支持向量机、隐式马尔科夫链、贝叶斯分类器等经典 AI 方法,都是常见的用于声场分类的算法。在这些方法的基础上,天籁助听器算法利用最新的深度学习模型,让这个问题有了更优解:声学场景分类算法会实时检测麦克风输入信号,检测、识别声音场景信号特征,一旦场景发生变化,识别完成之后给各个具体执行信号处理单元下发任务,进行降噪、增益、压缩、方向性等处理,输出适合当前场景的声音效果。
目前市场上的一些产品也会提供声学场景的切换功能,但大多是通过手机 App 来操作,这种模式在老人真正使用时并不方便。而 天籁助听器算法真正实现了声场的智能切换,佩戴者无需手动操作,即可及时获得最适合当前环境的听觉体验, 提升了用户体验的同时,也提高了早期产品适应性,减少了重新验配的次数。
特别的是,天籁助听器算法 内置了数百种常见的生活场景噪声 ,比如洗菜的水声、关门声、切菜声、杯子掉在地上的声音等等,实现了有针对性的 AI 降噪。将这些响度较高的突发噪声降掉,是听障人士听着清、听得懂的关键所在。
基于腾讯会议音频技术的深厚积累在该问题的解决中发挥了重要作用,腾讯会议天籁实验室在严苛的条件约束下不断实验、测试、迭代,找到了各种条件之间的平衡,既降掉了噪声,又能保证语音信号不失真,让一款千元级国产助听器也能拥有万元级进口助听器产品的好音质。
由于助听器需要长时间佩戴,挚听(天籁 inside)助听器在进行算法选型的时候,充分考虑了算法的计算复杂度,再结合硬件平台进行了大量细致的优化。 最终整个助听算法可支持用户一次充电佩戴 10 个小时。
科技向善,造福听障老人
实际上,在挚听(天籁 inside)助听器正式推出之前,这些前沿技术及产品已经走进了很多听障老人的家。
腾讯天籁实验室联合中国老龄事业发展基金会等单位,在 2022 年 3 月成立了「天籁银发关爱基金」,首期关爱基金已于 4 月底落地广东韶关,为 500 位有听力障碍且家庭经济困难的老人免费提供了带有天籁音频 AI 技术的助听器。
助听器验配也是在老年听障人群中的落地挑战之一。基于「天籁行动」的长期技术积累,天籁实验室提出了创新性的自主验配方案,结合全面可配置的宽动态范围压缩算法,更好地解决了老年人听障「最后一公里」的问题。
在腾讯天籁行动 2022 年度发布会上, 「银发听力健康」小程序 也正式发布。老人们可以在家属的帮助下使用「听觉能力评估」与「听力健康科普」两部分功能,在家就能享受到从听力筛查到康复训练的科普信息和功能服务。
「银发听力健康」小程序
这一系列动作,正是腾讯「科技向善」理念的写照。两年来,天籁行动始终坚持走近、理解听障人群的真实需求,用自身的技术释放出更多公益价值。
在中国逐渐步入重度老龄化社会的今天,可以看到,AI 技术在助力解决听障问题的应用上有着广阔的前景,值得注意的是,这一落地过程处在技术适应和改造阶段。要想帮助更多老人们听见、听清世界,还需要政府、公益以及像腾讯这样的商业化等多方力量齐头并进、付出长期努力。
- 解密数字时代 AI 加持之道,网易智企联合机器之心发布 AI 应用实践白皮书
- INDEMIND:高需求和低渗透之间,服务机器人为何规模化落地难?
- AI,能为1.2亿听障老人做点什么
- 探索计算机视觉前沿,蚂蚁技术研究院4篇论文入选NeurIPS
- 蘑菇车联推出L4巴士及「汽车大脑」,由公共服务切入商业运营
- ECCV 2022 | 无需下游训练,Tip-Adapter大幅提升CLIP图像分类准确率
- “天池杯”全国中小学科技少年AI领航计划启动
- 存储和操作n维数据的难题,谷歌用一个开源软件库解决了
- 炸响平地惊「雷」,自动驾驶公司能否接下「雷神」之锤
- OpenDILab幕后的「孤勇者」:AI研究员、电竞冠军和他们的开源梦
- 寒武纪行歌获博世创业投资公司投资,携手助力自动驾驶产业发展
- 华为云位居中国DevOps市场领导者,份额、战略双第一!
- 还只会卷论文吗?70页报告解密顶级大厂如何玩转AI技术(附完整下载链接)
- 现在都2202年了,用CPU做AI推理训练到底能不能行?
- 中山大学通过深度学习分子模拟加速有理PROTAC设计,助力药物研发
- 覆盖100余篇论文,这篇综述系统回顾了CV中的扩散模型
- PillPack两位创始人将离职,亚马逊医疗健康业务布局“屡败屡战”
- 7199元起,英伟达RTX 40系显卡终于来了:基础性能翻倍,光追翻4倍
- 截屏带岛、玩王者荣耀看不见金币,iPhone 14 Pro灵动岛翻车了
- 数据安全公司Fortanix完成C轮融资,是时候采用一种新的企业数据安全方法了!