人类听觉解析：你的耳朵到底在做些什么 — HaoPicks

声学之旅：外耳、中耳和内耳

声音最终不过是波动的机械气压，然而人体将这些看不见的冲击波转化为音乐、语言和环境感知的深刻情感体验。耳朵不仅仅是一个被动的漏斗；它是一个活跃的、高度调谐的生物力学分析器。

但是字面意义上的气压是如何变成神经信号的呢？要理解这一点，我们必须追踪声波的旅程：从它击中你头部侧面的那一刻起，到你大脑将其识别为交响乐的那一瞬间。

人耳作为一个阻抗匹配变压器和精确的频率分析仪，能够检测到比单个原子直径还小的振动，同时也能承受大约一万亿倍的声学能量而不会立即受损。

当声波首先到达时，它会遇到耳廓——外耳可见的肉质部分。耳廓的不对称凸起不仅仅是装饰；它们充当复杂的定向滤波器。根据声音是从你的上方、下方还是后方发出的，耳廓以不同的方式塑造声波，导致特定的高频抵消，从而使你的大脑计算出声音的位置。

随着声波在耳道中传播，它撞击鼓膜。耳道在 3kHz 左右自然共振，在这个关键频带中，甚至在声音到达鼓膜之前由于它的存在机械放大了近10分贝的频率。这种进化特征完美地重叠了人类语言辅音的主要光谱能量。

接下来，鼓膜振动听小骨——锤骨、砧骨和镫骨。这是人体中最小的三块骨头。由于液体比空气更难移动，中耳必须将声压集中大约超过20倍的系数，才能将波有效地传递到充满液体的内耳耳蜗中。

耳蜗是一个蜗牛状、充满液体的器官，沿基底膜排列着成千上万个微小的毛细胞。高频引起膜底部的振动，而低频则传得更远以在顶点共振。在这里，机械运动最终转化为电神经冲动——真听觉感知的开始。

人类听觉通常定义为跨越20Hz到20,000Hz (20kHz)。低于20Hz的频率被称为次声波。虽然我们不能将它们作为明显的音调“听见”，但我们的身体可以将它们感知为物理振动，通常将内脏次声解释为一种不安或敬畏感——这是一种经常在电影中被利用的现象。

在相反的一端，超过20kHz的频率会陷入超声波。狗、蝙蝠和海豚严重依赖这种光谱，但对于人类来说，高频极限界会在童年之后立即恶化。以下音频测试从50Hz扫描到18kHz。注意声音到底什么时候消失。

听力范围自动测试

0:000:00

50Hz → 18kHz。如果你在最后只听到了寂静，这很正常。

也许人类听力中最违反直觉的怪癖就是我们的非线性频率响应曲线。简单地说：我们的耳朵是有偏见的。以完全相同的物理振幅（在SPL中测量）播放100Hz的贝斯合成器和1000Hz的人声轨对人类听众来说是不一样的响亮程度。

20世纪30年代，Harvey Fletcher 和 Wilden A. Munson等研究人员发现，人类的耳朵如果在安静地倾听的时候，会对中频声音产生了压倒性的敏感，而对低音异常迟钝。为了让一个低音在低音量下听起来像中频音调一样响，这个声调必须要具备更大规模的声功率。

这种生物学的怪癖是为什么在晚上把音量调得很低时音乐听起来“平平”且没有生命力的直观原因——你的耳朵实际上已经把低音滤掉了。

1kHz vs 100Hz (相同振幅)

0:000:00

与1kHz相比，100Hz听起来非常安静。

1kHz vs 100Hz (等响度)

0:000:00

100Hz现在被大幅增强以至于听起来一样响。

除了频率偏差，我们的听力系统还受到一种称为听觉掩蔽的处理限制的影响。如果大的声音和小的声音同时出现（或彼此隔了几毫秒内），那么更大的声音会真的把你对相对安静的声音擦除。

发生这种情况是因为喧哗的声音实际上占据了耳蜗中毛细胞的处理，使它们进入一个简短的不应期，在这个不应期内它们无法记录更微弱的瞬变。人类听觉的这个“缺陷”是MP3和AAC等心理声学数据压缩算法的整个基础核心。

频率掩蔽演示

0:000:00

当噪音爆发时，稳定的音调会完全被掩蔽。