文章摘要
人耳并非通过傅里叶变换处理声音,而是通过耳蜗基底膜进行频率分离:基底膜不同部位因物理特性差异分别响应不同频率,高频在较硬的基部,低频在较软的顶端,形成对数频率分布。
文章总结
人耳并不进行傅里叶变换
让我们探讨耳蜗如何进行声音处理!
鼓膜(耳膜)通过气压变化(声波)产生振动。中耳骨骼将这些振动放大并传递至充满液体的蜗牛状耳蜗。振动通过液体传导至基底膜,该膜具有惊人的频率分离功能:较硬且较轻的基部与信号的高频成分共振,而较柔软且较重的顶端则与低频共振。在这两端之间,共振频率在空间上呈对数递减。
基底膜上的毛细胞会根据其所在位置的频率来回摆动。但摆动如何转化为电信号呢?这种机械电转导过程就像苏斯博士笔下的世界:连接毛细胞末端的弹簧会以振动频率开闭离子通道,从而引发神经递质释放。布鲁诺称之为"活板门"。
显然,耳朵的硬件结构非常适合进行频率分析。神经纤维作为滤波器提取信号的时间和频率信息。下图展示了时域中的滤波器示例:左侧滤波器时间定位更精确(能清晰显示频率出现的时间点),右侧滤波器时间特异性较低但频率分布更均匀。
如果耳蜗进行傅里叶变换,就能完美契合工程领域的信号分析方式,但事实并非如此!傅里叶变换没有明确的时间精度,更接近右侧波形,这与耳蜗滤波器的特性不符。
我们可以将不同滤波方案可视化为时频域的划分。最左侧方框代表高时间分辨率(类似左侧滤波器),但缺乏频率成分信息;而傅里叶变换(类似右侧滤波器)能精确分解频率,却无法定位频率出现的时间。实际上,耳蜗的处理方式介于小波变换和加博变换之间:高频时牺牲频率分辨率换取时间分辨率,低频时则相反。
这种时频精度权衡为何是良好的表征方式?卢伊基(2002年)提出理论认为,这些滤波器是减少自然声音表征冗余的策略。通过对环境声音、动物发声和人类语音进行独立成分分析(ICA),发现每类声音的权衡方式各不相同。有趣的是,人类语音似乎占据了独特的时频空间,有观点认为语音进化就是为了填补其他声音未占据的时频区域。
这一理论暗示:形成与生态相关的表征具有意义,因为行为依赖于环境。不仅在听觉领域,其他感觉模态也是如此。这为即将讨论的"高效编码"理论埋下伏笔。
我们探讨了感觉编码初期的一些惊人机制,但这只是冰山一角。关于这些计算如何发生的问题,将在下一讲深入探讨神经元生物物理学时详细展开。
[注1] 这种音调拓扑组织(频率到空间的映射)也存在于其他感觉的皮层中,如视觉的视网膜拓扑和触觉的躯体拓扑。
[注2] 人类音高感知与频率呈对数关系,这或许并非巧合。
[注3] 虽然有人建议比较短时傅里叶变换,但其存在分辨率问题,且仍不符合耳蜗的工作机制。
评论总结
以下是评论内容的总结:
关于耳蜗是否进行傅里叶变换的讨论
- 反对观点认为耳蜗的机制更接近小波或Gabor变换,而非严格的傅里叶变换(评论6、7)。
- "the ear does not do a Fourier transform, but it does do a time-localized frequency-domain transform akin to wavelets"(评论6)
- "Perhaps the ear does someting more vaguely analogous to a discrete Fourier transforms on samples of data"(评论7)
- 支持观点认为耳蜗的生物机制与傅里叶变换有相似性,但存在差异(评论3、4)。
- "the cochlea is where you can begin to talk about bio-FT phenomenon"(评论3)
- "what the ear does mechanistically is applying a temporal 'weigting function'"(评论4)
- 反对观点认为耳蜗的机制更接近小波或Gabor变换,而非严格的傅里叶变换(评论6、7)。
对傅里叶变换术语的澄清
- 严格来说,傅里叶变换与傅里叶级数不同,耳蜗的机制介于两者之间(评论4)。
- "Fourier Transform in the strictest sense implies an infinite 'sampling' period"(评论4)
- 严格来说,傅里叶变换与傅里叶级数不同,耳蜗的机制介于两者之间(评论4)。
人类语音演化的理论
- 人类语音可能占据了声音频谱中未被占据的 niche(评论6、10)。
- "human speech evolved to occupy an unoccupied space in frequency vs. envelope duration space"(评论6)
- "the 'dawn chorus' is composed of a vast number of species making noise, but who are able to pick out mating calls"(评论10)
- 人类语音可能占据了声音频谱中未被占据的 niche(评论6、10)。
其他观点
- 对耳蜗机制的物理模型提出疑问(评论8)。
- "what are the chances, that it uses sinus waves as a base for the vector-space?"(评论8)
- 对智能设计的提及(评论11)。
- 对耳蜗机制的物理模型提出疑问(评论8)。
总结:评论主要围绕耳蜗是否进行傅里叶变换展开,多数观点认为耳蜗的机制更接近小波或Gabor变换,同时讨论了人类语音演化的理论。术语的澄清和物理模型的疑问也是讨论的重点。