2021年3月,世界卫生组织(WHO)发布的首次《世界听力报告》指出,目前世界上超过15亿人(约为世界人口总量的1/5)听力受损,其中4.3亿人听力损失程度为中度或中度以上。预计到2050年,听力受损的人数可能会达到30亿人,超过7亿人需要听力康复帮助。据我国第二次全国残疾人抽样调查显示,目前我国有2780万听障人士,全国每年新增聋儿2.3万人,其中重度、极重度聋儿的比例占74%。对于听障患者来说,轻度—中重度听力损失的患者可以借助传统的助听器实现听觉补偿,重度—极重度感音神经性聋患者则主要采取人工耳蜗植入的方法来辅助听觉和言语康复。
人工耳蜗的发展
1800年,意大利科学家Alessandro Volta(发明了电池)利用电池为研究工具,证实了电刺激可以使正常人的耳朵产生听觉。1940年,美国科学家Clark Jones等人在20例中耳炎患者中耳内使用电极刺激,让患者听到了声音。在同一时代,Homer Dudley发明了提取言语基频、频域各分量强度和频域总能量来合成可理解的言语的“语音合成声码器”;Glenn Wever记录和描述了耳蜗电位,即耳蜗受到声音刺激后被测量到的电位;SS Stevens论述了经典的电刺激耳蜗产生听觉的原理,即描述来自于基底膜对耳蜗内电压变化产生的机械振动响应的“电听觉”。

人工耳蜗植入体的发展经历了实验、植入可行性研究、商品化三个阶段。早期阶段多采用单侧人工耳蜗植入,现在主流的植入方式为双耳双模式聆听(一侧植入人工耳蜗,另一侧坚持佩戴助听器)和双侧人工耳蜗植入。
语后聋患者再适应困难
在讨论人工耳蜗听音乐的问题之前,我们可以先来听一段音频。
人工耳蜗的音效听起来像不像是在放烟花?
就和电影《金属之声》里描述的一样,对语后聋患者来说,人工耳蜗刚开机时,之前能听懂的东西现在反而听不懂了,之前没关注过的噪声现在反而变得明显了——正常听力和人工耳蜗听到的声音,天差地别。健全的耳蜗的频率分辨率是现有的人工耳蜗完全无法比拟的,后聋患者的大脑适应了高频率分辨率的信号,猛地一听低频率分辨率的信号,大脑不知道应该怎么反应,导致听不懂。
语后聋患者需要像新生儿感知世界一样,重新去认识每种声音听起来是什么样的,这其中需要付出的耐心和努力是语前聋患者的百倍。就像自适应滤波器在迭代时的一大难题,滤波器收敛后重新辨识新的系统,会比随机初始化后辨识新的系统要需要更长的时间。相应的,对于语前聋患者,人工耳蜗植入的越早,对耳蜗的适应会越好,也是这个道理。
人工耳蜗植入康复效果:音乐感知能力评估
植入人工耳蜗后,音乐感知能力是评估术后康复效果的重要指标,临床常用音乐感知评估量表和音乐能力评估量表进行测试。国外开发出了音乐感知评估量表包括“音乐感知临床评测”、“人工耳蜗音乐感知能力”、“人工耳蜗音乐欣赏能力”、“蒙特利尔失歌症评估测试”等等。音乐能力评估量表包括“慕尼黑音乐问卷”、“爱荷华音乐背景语鉴赏问卷”、“小儿音乐能力等级量表”等等。这些量表的测试结果表明,人工耳蜗植入者和正常听力人对音乐的感知能力差别较大,很容易混淆各种乐器,也不易感受到谐波,只有在节奏方面感受没和正常听力没有差别。
人工耳蜗编码重点:言语而不是音乐
人工耳蜗的核心技术是将声波转换成电脉冲信号的言语编码策略,这一过程可以分为:声信号的转换语传输、电信号的接收、电信号的感知。目前临床使用的人工耳蜗,其言语编码策略侧重于提高语音的理解。
目前的言语编码策略大致原理为:
第一步,人工耳蜗的传声器将声信号转换为电信号,记录形式为数字信号,经多个带通滤波器提取不同频段的信号能量,由半波整流器提取包络,由低通滤波器去除部分高频成分,最终提取每个频段声能量的完整光滑的时域包络。
第二步,这些包络对一定频率的电脉冲波进行振幅调制以生成电信号,分别传输至对应的刺激电极,激活植入者耳蜗不同区域的螺旋神经节细胞以感知声音。

图源:耳蜗螺旋神经节转录组分析最新研究进展——中国科学院脑科学与智能技术卓越创新中心 (cas.cn)
此种言语编码策略包含的信息的表现形式是:
- 位置编码:不同位置的电极刺激不同区域的螺旋神经节细胞,反映频域信息;
- 时间编码:螺旋神经节细胞感受电刺激的时间间隔,反映时域信息;
- 低通滤波器的截止频率决定时域信息的多少。
人工耳蜗编码后的信号遵循耳蜗音位配布原理:
- 蜗顶低频区主要通过时间编码来传递信息;
- 蜗底高频区主要通过位置编码来传递信息;
- 中间频率主要通过时间和位置编码共同作用。
但是,耳蜗的螺旋神经节细胞的分区功能仍存在争议,因此这种编码方式可能对于信息的传递并不如想象得那么好。临床表现证明,植入人工耳蜗可以显著提高重度听损患者的言语交流能力,但对于音乐这种更为复杂的声信号的感知能力仍然明显不足。
和语音相比,音乐要复杂得多,因为音乐的频率和动态范围更加广泛。如下图所示的各截取片段的时域采样信号和时频图,左图是英语,中图是蓝色多瑙河,右图是一首英文流行歌曲。

无论是在纸面上,还是被说出来,语言始终是符号,对于语音来说,只提取基频、谐波、包络和能量信息,再加上时域信息,已经足够反应一句话的意思,在语音识别中这些特征也常常是有效的。但对于音乐这种更侧重于感受而不是理解的信号来说,人工耳蜗粗糙的结构设计,会影响植入者对音色的识别能力。
人工耳蜗的电极:数量和极间干扰
现在,你可以回去再听一遍那个音频。是不是随着电极通道数的增加,能够听到的细节更多?
目前大多人工耳蜗的有效电极通道数在12-22个,只有个别信号的电极可以覆盖蜗尖达到全频覆盖。研究表明,要达到良好的音乐感知效果,可能至少需要64个电极通道。然而,电极数越多,各电极之间互相干扰的可能性就越大。想激活电极A,反而顺带激活了临近的电极BCD,会导致植入者对声音的感知产生混乱,严重时甚至会发生电极短路。因此,人工耳蜗植入者对古典音乐的感知,可能要比对流行音乐的感知要来得好一点。

图源:金属之声
在之前,不同语种的言语编码策略的不同,曾被学者认为是国内植入国外耳蜗的患者,其言语理解程度不尽人意的原因。但是“音乐无国界”,或许在突破人工耳蜗音乐感知的难题的同时,言语理解也能够有相应的提高也说不定。
参考文献:
[1] 王斌,杨华,陈晓巍,曹克利,高志强.人工耳蜗技术:过去、现在与未来[J].中国科学:生命科学,2021,51(08):1040-1049.
[2] 贾慧,徐百成,边盼盼,郭玉芬.双耳双模式聆听与双侧人工耳蜗植入研究进展[J].中华耳科学杂志,2021,19(04):658-661.
[3] 人工耳蜗听起来怎么样?- 知乎 (zhihu.com)
https://zhuanlan.zhihu.com/p/56499933
[4] 听力康复 | 人工耳蜗享受不了音乐?不存在的 - 知乎 (zhihu.com)
https://zhuanlan.zhihu.com/p/57476800
[5] 蔡洁青. 人工耳蜗植入者音乐感知能力的评价与分析[D].南方医科大学,2019.
[6] 吴雨桐,徐百成,郭玉芬.人工耳蜗植入者音乐感知能力的研究进展[J].中华耳科学杂志,2021,19(03):518-521.