论文:数学抽样方法在生活中的应用
通过一个典型案例,说明数学抽样方法在现实生活中的具体应用:为了了解普通居民对一种新产品的接受程度,需要在某市选取1000户家庭进行市场调查,从每户家庭中选取1户家庭成员作为调查对象。整体抽样设计由于一个城市的户数可能多达百万,所以除了一些大型的市场调研机构和国家统计部门外,大多数企业都没有如此庞大的户数清单。这种情况决定了抽样设计只能采用多阶段抽样方法。根据调查要求,抽样分为两个阶段。第一阶段是从全市居委会名单中选取50个样本居委会,第二阶段是从每个选取的居委会中选取20户。从统计或者民政部门可以得到一个城市的居委会名单。居委会编号后,通过电脑生成随机数,就可以简单地选出所需的50个居委会。如果居委会名单中还包括居委会的户数等信息,在选择时可以采用不等概率选择的方法。如果一个居委会被抽中的概率与居委会的户数成正比,这种方法叫PPS(概率与规模成正比)抽样法。PPS抽样是一种“自加权”的抽样方法,保证不同规模的居委会抽取20户时,每户样本的代表性是相同的,这样就可以直接对最终结果进行平均。当然,如果数据不足以进行PPS抽样,那么事后加权法也可以有效推断调查结果。居委会内抽样居委会选定后,将使用居委会地图进行居民的选择。这时候就需要派一些采样器到居委会,画出住户的分布图。抽样人员需要了解居委会的实际位置和覆盖范围,并计算每栋楼的实际户数。然后,根据样本量的要求,抽样人员通过等距或其他方法选取几户作为最终样本。确保受访者的访问员根据抽样人员选择的样本家庭进行家庭访问。谁是实际回答者是抽样设计的最后一个问题。如果调查的内容涉及到被调查者的家庭情况,可以根据成员在家庭生活中的地位来确定被调查者的选择,例如使用电脑最多的人,收入最高的人,实际负责购买决策的人等等。如果调查内容涉及个人行为,家庭中的每个成年人都可以是被调查者。这时候就需要进行第二轮抽样了,因为如果让采访者人为地确定被采访者,最终被采访者可能会偏向某一类人,比如家庭中比较容易接近的老人和女性。家族中的第二种抽样方法是美国著名抽样专家莱斯利·基什发明的,一般称为基什表法。访员入户后,先记录住户中所有符合调查条件的家庭成员人数,并按年龄进行排序和编号。随后,访员根据被访户数与家庭人口数的交集,在表中找出一个数,将该数对应的家庭成员作为被访人。以上案例是典型的入户调查两阶段现场抽样设计。从整个设计过程可以看出,入户后居委会、住户、调查对象的选择都体现了随机性原则。在任何一个环节,如果违背了随机性原则,都可能对调查结果造成不可估量的偏差。调查中的抽样设计是一个复杂的技术环节,非专业研究人员需要特别注意这个问题。