随机采样

2024-01-07

    随机采样 :

随机采样的逻辑是:因为采样避免了选择偏差,所以应该产生一个代表性样本(即样本可以代表总体),进而根据样本特征可以推断总体特征。

常用的随机采样方法主要有简单随机采样、分层采样、系统采样等。①简单随机采样。是最基本的采样方式,是其他采样方式的基础,其他随机采样方式都在其基础上发展而来。在采样的整个过程中,一个总体中每个成员的入选概率是均等的。对于总体较小的情况,可用抽签等方式建构样本;而对于总体很大的情况,则可通过计算机程序辅助完成。优点是不存在分类错误,只需要最少关于总体的知识。②分层采样。先依据一种或几种特征将总体分为若干个子总体。每一个子总体称作一个层,然后从每层中随机抽取一个子样本。这些子样本合起来就是总体的一个样本。分层采样在实际采样调查中应用广泛。在同样样本容量的情况下,它比简单随机采样的精度高、管理方便、费用少、效度高。③系统采样。又称等距采样。在系统采样中,先将总体从1~N相继编号,并计算采样距离K=N/n。式中N为总体单位总数;n为样本容量。然后在1~K中抽一个随机数k1,作为样本的第一个单位,接着在总体N中抽取第k1+K,第k1+2K,第k1+3K,…,第k1+(n-1)K,即抽取n个单位为止。例如,假设一个班共有50个学生,研究者希望从中系统采样10个学生,则K=50/10=5。接下来可以要求这些学生站成一队并从1开始依次编号。然后,从第1至第5个学生中随机抽取一个学生(参考简单随机采样法),如第3个学生(k1=3)。被抽取的学生依次为:8,13,18,…,48,加上k1,共10个学生。

即使完全随机采样,也会出现样本不完全能代表总体的情况,即出现采样误差,而且这种误差是不可避免的。采样误差越小,样本就越有代表性。一般来说,采样数目越多,采样误差越小;采样数目越少,采样误差越大。不重复采样比重复采样的采样误差小。