Human Ear Acoustic Waves Visualization
深度分析

人类听觉解析:你的耳朵到底在做些什么

有没有想过为什么某些频率会刺耳,或者为什么100Hz的低音需要比1kHz的音调大100倍才能听起来一样响?这里是对人类听觉的深入探讨,并配有音频错觉演示。

6 分钟阅读
文章

声学之旅:外耳、中耳和内耳

声音最终不过是波动的机械气压,然而人体将这些看不见的冲击波转化为音乐、语言和环境感知的深刻情感体验。耳朵不仅仅是一个被动的漏斗;它是一个活跃的、高度调谐的生物力学分析器。

但是字面意义上的气压是如何变成神经信号的呢?要理解这一点,我们必须追踪声波的旅程:从它击中你头部侧面的那一刻起,到你大脑将其识别为交响乐的那一瞬间。

人耳作为一个阻抗匹配变压器和精确的频率分析仪,能够检测到比单个原子直径还小的振动,同时也能承受大约一万亿倍的声学能量而不会立即受损。

Anatomy of the Human Ear Diagramfrequency masking technicalhearing age loss

当声波首先到达时,它会遇到耳廓——外耳可见的肉质部分。耳廓的不对称凸起不仅仅是装饰;它们充当复杂的定向滤波器。根据声音是从你的上方、下方还是后方发出的,耳廓以不同的方式塑造声波,导致特定的高频抵消,从而使你的大脑计算出声音的位置。

随着声波在耳道中传播,它撞击鼓膜。耳道在 3kHz 左右自然共振,在这个关键频带中,甚至在声音到达鼓膜之前由于它的存在机械放大了近10分贝的频率。这种进化特征完美地重叠了人类语言辅音的主要光谱能量。

接下来,鼓膜振动听小骨——锤骨、砧骨和镫骨。这是人体中最小的三块骨头。由于液体比空气更难移动,中耳必须将声压集中大约超过20倍的系数,才能将波有效地传递到充满液体的内耳耳蜗中。

耳蜗是一个蜗牛状、充满液体的器官,沿基底膜排列着成千上万个微小的毛细胞。高频引起膜底部的振动,而低频则传得更远以在顶点共振。在这里,机械运动最终转化为电神经冲动——真听觉感知的开始。

频域:从次声波到超声波

人类听觉通常定义为跨越20Hz到20,000Hz (20kHz)。低于20Hz的频率被称为次声波。虽然我们不能将它们作为明显的音调“听见”,但我们的身体可以将它们感知为物理振动,通常将内脏次声解释为一种不安或敬畏感——这是一种经常在电影中被利用的现象。

在相反的一端,超过20kHz的频率会陷入超声波。狗、蝙蝠和海豚严重依赖这种光谱,但对于人类来说,高频极限界会在童年之后立即恶化。以下音频测试从50Hz扫描到18kHz。注意声音到底什么时候消失。

听力范围自动测试
0:000:00

50Hz → 18kHz。如果你在最后只听到了寂静,这很正常。

Fletcher-Munson 等响度曲线

也许人类听力中最违反直觉的怪癖就是我们的非线性频率响应曲线。简单地说:我们的耳朵是有偏见的。以完全相同的物理振幅(在SPL中测量)播放100Hz的贝斯合成器和1000Hz的人声轨对人类听众来说是不一样的响亮程度。

20世纪30年代,Harvey Fletcher 和 Wilden A. Munson等研究人员发现,人类的耳朵如果在安静地倾听的时候,会对中频声音产生了压倒性的敏感,而对低音异常迟钝。为了让一个低音在低音量下听起来像中频音调一样响,这个声调必须要具备更大规模的声功率。

这种生物学的怪癖是为什么在晚上把音量调得很低时音乐听起来“平平”且没有生命力的直观原因——你的耳朵实际上已经把低音滤掉了。

1kHz vs 100Hz (相同振幅)
0:000:00

与1kHz相比,100Hz听起来非常安静。

1kHz vs 100Hz (等响度)
0:000:00

100Hz现在被大幅增强以至于听起来一样响。

听觉掩蔽:MP3文件如何欺骗你的大脑

除了频率偏差,我们的听力系统还受到一种称为听觉掩蔽的处理限制的影响。如果大的声音和小的声音同时出现(或彼此隔了几毫秒内),那么更大的声音会真的把你对相对安静的声音擦除。

发生这种情况是因为喧哗的声音实际上占据了耳蜗中毛细胞的处理,使它们进入一个简短的不应期,在这个不应期内它们无法记录更微弱的瞬变。人类听觉的这个“缺陷”是MP3和AAC等心理声学数据压缩算法的整个基础核心。

频率掩蔽演示
0:000:00

当噪音爆发时,稳定的音调会完全被掩蔽。