在市场调查中,我们常常会遇到样本量的选择问题,样本量的大小涉及调研中包括的人数或单元数。确定样本量要涉及财务、统计和管理3个方面。通常情况下,样本量越大,抽样误差越小。样本成本随着样本量增加呈线性递增, 抽样误差却只是以样本量相对增加速度的平方根的速度递减。样本量计算还反映管理方法的问题。例如要求多高的估计精确度? 实际总体值在所选定的置信区间内的置信度是多少?答案有许多种可能性。
从定性角度分析,考虑因素包括:决策的重要性、调研的性质、变量个数、数据分析的性质、同类研究中所用的样本量、发生率、完成率、资源限制等。具体地说,重要的决策需要更多和更准确的信息,这时就需要较大的样本量;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本量;收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如作许多分类等,也需要较大的样本量。调查要达到较好的成本收益比,样本量必须适当。样本容量的确定受到调查总体的规模大小,调查总体内部的差异程度,对调查结果的可信度、精确度的要求和抽样方法等因素的影响。
从定量角度分析,抽样方法具有自己的样本量计算公式。当然,样本量的确定也要考虑调查条件,如果人力、物力、财力及时间允许,样本量可大一点。反之,就应当减少样本量。根据统计学的要求,样本量一般不应低于50。统计学中,随机抽样所需样本的计算公式为
式中,t在数理统计中称为概率度,表示相对误差范围,比如根据正态分布, 当要求所抽取样本可信度为68%时,t=1;当要求可信度为95.5%时,t=2; 当要求可信度为99.7%时,t=3。δ为总体标准差;Δ为误差范围,等于均值与允许误差的乘积。
根据样本量计算公式,样本量的大小取决于:(1)研究对象的变动程度;(2)所要求或允许的误差大小;(3)要求推断的置信程度。可信度和误差范围通常由调查者自己确定,总体标准差可以利用该总体过去的资料、其他类似总体的资料或者试验性调查的资料来估计。
下面举例说明。在对某个对象进行调查时,将利用试验性调查获得正式调查所需的样本量。选择的试验性调查样本量为统计学需要的最低样本量(50个)。经小规模试验性调查(50个样本),调查对象平均值假设为3.921,标准差为0.846。现要求可信度为95.5%, 允许误差为5%, 进行调查所选择的样本量则为(参考正态分布概率表知道t=2):
在调查中,假设有样本总量限制,如样本总量为1000,而需要的样本量75占总体容量的比例达到了7.5%, 超出了统计学要求的5%的比例, 即本调查属于有限总量下的抽样调查,所以需要调整样本容量,根据有限总体修正系数(N-n)/(N-1)进行样本量的调整,计算公式如下:
式中:n′——修正后的样本量;n——原样本量;N——总量。
所以,可以得到
最终选择的调查样本是70个。
|