声音识别

2024-01-20

    声音识别 :

在日常生活中,个体往往会接收到来自多个声源的信息,这些信息需要进行分解、确定来源并进行识别。例如,心理学研究中经典的“鸡尾酒会问题”就涉及在一个复杂的声音环境下如何接收、加工和识别一个与个体密切相关的声音信息。声音识别的研究也被应用于信号处理等实际应用领域。

通常,声源基于自身的共振属性,会形成特定的振动模式并产生声压进行传播。因此,个体所接收到的由特定声源发出的声波往往具有特殊的频率、强度和时间属性,这些属性能够帮助个体进行声音识别。个体进行声音识别的线索是声音变化的同步性,包括声波的起始点和波幅变化。具体来说,复杂声音包含了各种频率成分的声音,其中来自同一声源的声音会呈现同步的强度变化,同起同止,这些声音就会倾向于被感知为同一个声音。听觉系统对频率成分同步性的敏感性可以达到1/20秒,在一组声音中只要出现细微的不同步,就会被个体接收到,将其感知为不同的声音。因此,遵循同一变化模式是声音的各频率成分被感知为同一声源的必要条件。

与声音频率有关的另一个线索是一组声音频率是否构成和声关系。和声关系是指不同的声音频率之间呈倍数关系。例如,小提琴的A弦会发出一组频率为440赫、880赫和1320赫的声音,其中的两个高频音是基频的倍数,这组声音即可构成和声关系。一般说来,相比非和声,个体更倾向于将和声感知为单一的声音对象。在日常生活中,大量重要的声音(如言语和音乐)都是由和声频率构成的。

此外,声源的空间位置也能作为声音识别的线索,因此,与辨别声源空间方位有关的信息,如声音强度差、时间差等双耳线索,都可为声音识别提供参考。然而由于在很多情况下,复杂声音可来源于同一个空间位置(如多个声音经由同一个扬声器发出),因此听觉定位信息并不是声音识别的充分和必要线索,往往要与其他线索结合使用。

对人类来说,言语是一类特殊而重要的声音信息,尽管这些信息在物理特性上与其他声音信息可能没有很大的差别,但是其所包含的沟通信息是声音识别的重要线索。举例来说,言语声音往往受到上下文声音的影响(如连音、语音语调的变化),这些特殊性在区分言语和非言语声音的过程中起到了非常重要的作用。