区间估计置信区间的一种。
一个总体平均数的置信区间分两种情况。(1)设总体X~N(μ,σ2),方差σ2已知,(X1,X2,…,Xn)是取自X的随机样本,构造统计量服从标准正态分布,当置信度为1-α时,可查标准正态分布表得双侧α百分位点Zα/2,满足P{-Zα/2≤≤Zα/2}=1-α,进一步改写为P{-Zα/2·≤μ≤ Zα/2·}=1-α,从而μ的置信度为(1-α)(或100(1-α)%)的置信区间为(-Zα/2·, Zα/2·),或写成μ∈±Zα/2·。该置信区间亦可使用于下列情况:若X的分布未知或非正态,当样本容量n足够大(如大于30),上面的统计量Z接近于N(0,1)分布。
上述估计区间的半径为Zα/2·,是区间估计的精度,依赖置信系数1-α,总体标准差σ或方差σ2,样本容量n三个因素。
当1-α越大时,α越小,这时Zα/2会增大;当σ越大时,则半径越大;n越大,半径越小。在σ与α固定时,加大n,提高样本的代表性,从而可提高估计精度。
(2)若总体X~N(μ,σ2),但方差σ2未知,构造统计量t=服从自由度为n-1的t分布,这里的S=Sn,即S=。对预先给出的1-α,查t分布数值表得双侧α分位点tα/2,它满足P{-tα/2≤≤tα/2}=1-α。
变形后可得μ的置信度为(1-α)的置信区间为±tα/2·。
上面假定的条件“X是正态的”,在小样本时是不能缺少的。但若是大样本,总体X不一定要求正态,上面的估计仍近似可用。