信号检测论的统计学原理:信号检测论的统计学原理
上面谈到,信号检测论是人们在同噪音干扰进行斗争中总结出的方法,实质上是有意识地利用信号和噪音的统计特性来尽可能地抑制噪音,从而提取信号的。信号检测论是在多学科基础上形成的。统计决策理论是信号检测
论的数学基础。
我们知道,统计学是关于经验数据的一种数学推理,它的主要工具是概率论。通常它的目的是对一大堆数据进行一种简单的描述或使之精炼化,使得人们易于理解,并使之与研究的已知情况符合。大家知道,这种数据的精炼化可以用均值、方差和置信度等量来表达。根据统计学原理,可以把从噪音干扰中接收信号的过程看作为一个统计判断过程,即用统计判断方法,根据接收的混合波形作出信号存在与否的判断。从1953年起,人们开始将统计检测、参量估计、统计判断以及序列分析等统计学工具用于信号检测问题,并建立起一整套信号检测的统计理论。
下面我们来分析信号检测论的统计学原理。心理学上的信号检测实验一般是在信号和背景不易分清的条件下进行的。对信号检测起干扰作用的背景叫噪音(noise),这“噪音”不仅是指纯音信号出现时其他的噪音而言的;在视觉实验中,伴随着亮点信号出现时的照度均匀的背景也叫做“噪音”。总之,对信号起着干扰作用的因素都可当作“噪音”。一般的心理物理的辨别实验,其中包含着刺激A和刺激B。在这种情况下,可将其中一个刺激作为噪音,另一个作为信号。主试呈现的刺激,有时只呈现“噪音”刺激(以N表示);有时在信号刺激加噪音刺激同时呈现(以SN表示),让被试对信号刺激做出反应。在呈现刺激前,主试要先告诉被试者N和SN各自出现的概率。这个概率称为先定概率(或先验概率)(priorprobability)。同时对被试者说明判定结果的奖惩办法。因为先定概率和奖惩办法都将影响被试者的判定标准(见本章三节),每次实验呈现的是N还是SN是随机安排的。主试在呈现刺激之前(约2秒前)要先给被试者一个预备信号。
在信号检测实验中,被试者对有无信号出现的判定,可以有四种结果:
1.击中当信号出现时(SN),被试报告为“有”,这称为击中(或中的)(hit),以Y/SN表示。我们把这个判定的概率称为击中的条件概率,以P(H)或P(Y/SN)表示。
2.虚惊当只有噪音出现时(N),被试报告“有”,这称为虚惊(或误报)(falsealarm),以Y/N表示。我们把这个判定的概率称为虚惊条件概率,以P(FA)或P(Y/N)表示。
3.漏报当有信号出现时,被试报告为“无”,这称为漏报(或失察)(miss),以n/SN表示。把这种判定概率称为漏报条件概率,以P(M)或P(n/SN)表示。
4.正确拒斥当无信号而只有噪音出现时,被试报告为“无”,这称为正确拒斥(correctrejection)或正确(correct),以n/N表示。我们把这个判定的条件概率称为正确拒斥的条件概率,以P(CR)或P(n/N)来表示。
这样,噪音背景下的信号检测实验,在每种刺激状态下都存在二种反应可能,其组合就构成一个两择一判决矩阵(见表5-6),其中H和CR是正确反应,M和FA是错误反应。如果用概率表示,则显然有
P(H)+P(M)=1
P(FA)+P(CR)=1
从式中可见,其他两个条件概率是这两个条件概率的补数,即知道其中一个数,就可求出互补的另一个数:
P(H)=1-P(M)
P(FA)=1-P(CR)
因此,被试的判定,虽然有四种结果,但判定的条件概率一般只用击中的条件概率和虚惊的条件概率两种,即P(M)和P(FA)。
以上这四种判定结果,往往用一矩阵表示,见表5-6。
表5-6两择一判决矩阵
刺激有信号无信号
反应
有信号击中HP(H)漏报MP(M)
无信号虚惊FAP(FA)正确拒斥CRP(CR)
(采自Green&Swets,1966)
从统计学观点来看,信号检测即是要检验两个统计假设H0(无信号)和H1(有信号)的真伪。设想检测者测量单一变量X,并以此为根据选择H0或H1。在无噪音条件下,当X=A0时,H0为真;当X=A1时,H1为真(图5-7)。但在噪音背景下,无信号时X并不总是等于A0,有信号时X也并不总是等于A1,而是分别形成两个概率分布P0(X)和P1(X)。这时,检测者需要确定一个反应标准Xc,将X分成二个值域,当X≤Xc时,判定H0为真;当X≥Xc时,判定H1为真(图见5-8)。
在噪音背景下,无论将Xc确定在哪一位置,都存在有错误的可能,即虚惊错误FA和漏检错误M。如图5-8所示,曲线P0(X)在Xc右面部分所包含面积为虚惊率QFA,曲线P1(X)在Xc左面部分所包面积为漏检率QM,两者均可用积分方法求得:
¥
QFA=òXCP0(X)dX[公式5-5]
QM=ò-X¥CP1(X)dX[公式5-6]因此,在信号分布和噪音分布不变的情况下,检测者选择的反应标准Xc将影响P(H)、P(M)、P(FA)和P(CR)。反应标准的选择,称为检测者的反应偏向,它是信号检测论(SDT)的两个独立指标之一。
为了形象地理解上述原理,我们可想象日常生活中这样一个例子。假设有一个气象观察员,每天要在两个选择中进行判决。H0表示明天是雨天;H1
表示明天是晴天。这个判断根据单一量进行,这个量就是在过去24小时内气压表压力的平均变化率X。从多年积累下来的记录计算出能描述在雨天前一天的变化率分布的概率密度函数P0(X),以及能描述在晴天前一天的变化率分布密度函数P1(X)。例如,变化率X可能是正态分布的,其中A0<C<A1,这些密度函数画在图5-8中。第一个概率密度函数意味着在雨天前一天气压表指针下降,平均下降率为A0,但下降率并不总是相同的,有时高一点,
有时低一点,高低的原因观察者不可能完全知道。同理,第二个曲线表示在晴天的前一天,气压表通常是上升的,平均上升率为A1。
利用上面的这些信息,这个气象观察员将怎样来确定他的策略呢?从两个概率密度函数的结构可以看出,把X取值的范围作一个简单的两段划分就
已够了,区域R0由X<Xc组成,当X在R0取值时,就选择假设H0,而区域R1由X>Xc组成。但是不论观察员把X0放在什么地方,他有时仍会作出错误的判断。事实上,当实际是H0而选择的是H1的概率,即所谓第一类错误(typeⅠerror),为QFA。曲线P0(X)在Xc的右边所包面积就代表这个积分(见图5-8),亦即为虚惊率(probabilityoffalsealarm)。当实际是H1而选择的是H0的概率时,即第二类错误(typeⅡerror)’为QM。曲线P1(X)在Xc左边所包的面积就代表这个积分,亦即为漏报率(probabilityof
miss)。
观察员所用的值Xc依赖于这些错误要付出多少代价。为了使问题更确定
一些,我们设想这个气象观察员对于每种错误要付出一定量的罚金:对于第一类错误,他要付出C0,对于第二类错误他要付出C1,乘积C0QFA称为与H0相联系的风险;同理,乘积C1QM是与假设H1相联系的风险。
由上可见,统计决策理论是信号检测论的数学基础。
信号检测论的统计学原理
2023-07-04