学生。决定调查的各个阶段为学校、寝室、学生,在寝室利用随机数表抽取学生。 第二步:确定样本量及各阶段样本量的配置
按简单随机抽样时,在置信度为t=95%时,绝对误差为d=5%,取方差大到最大的比例,则全市的样本量应为:
n0=t2*P*Q/d2≈22*0.5*0.5/0.052=400(人)
根据以往的经验,估计回答的概率为a=90%,因此调整样本量为: n1=n0/a=400/0.9≈445(人)
由于多阶段抽样的效率比随机抽样的效率低,取设计效应deff=1.35,则全市范围内应调查的样本学生为:
n2= n0*deff=445*1.35=600(人) 各阶段的配置分别为: 初级单元:6个学校
二级单元:150个寝室,每个学校抽25个寝室 三级单元:600个学生,每个寝室抽4名学生 1、抽样方法
以全长沙市的在读大学生为总体,采用多阶段抽样方法抽取样本。
第一阶段,先以长沙市的每个高等院校为初级单元。按不等概的PPS抽样(即按学校的人数确定相应的抽样比率)从中抽取6个学校。
第二阶段,在每个被抽中的学校中,将全校所有的寝室依次进行编号,赋予每个寝室一个与编号一样的代码;根据所有的寝室数除以样本量25,确定抽样间距;然后对代码进行随机起点的等距抽样,则被抽中的寝室为样本寝室。
第三阶段,分别在每个样本寝室中,按随机二维数列表抽取4名学生(若寝室的人数不足,就从下一个寝室补充完整)。 四、实地调查及调查时间
受时间、经济等因素的影响,我们无法调查足够的学校,只是在铁道校区进行了切实有效的调查。在调查中要确切到达每一个被抽中的寝室,要保证调查的质量,获得真实有效的资料。 调查时间: 2006年12月1日(星期五)21:00---23:00
调查人员及地点: 由小组的人员分别到被抽中的寝室同时进行调查。 五、问卷与数据的审核
对实地调查后取得的数据资料,首先整理审核。 审核步骤:
(一).查对所有抽中的样本是否都进行了调查,调查问卷有无遗漏。本次调查共发出问卷100份,收回97份,作废3份,有效问卷共计94份 。
(二).对更换的样本点检查其代表性,出现较大差异的,重新更换调查;
(三).审查调查问卷指标有缺项的,采用填充法补齐,具体方法是联系上下问题的答案进行预测性填充。
(四).对填报指标进行逻辑审查,如出现前后矛盾的答案,根据其回答整个问卷的态度推断错选项,去除错选项。
(五).评估调查指标是否准确真实。对审核后的调查表仔细录入,杜绝录入差错。 (六)、数据录入与分析和提交结果的方式 1.数据的录入方式:
将原始数据转化成计算机认可的数据,将A B C等选项依次编号为1 2 3等录入;对开放式的问题编码,在备选框里注明解释项;对于多选题,如Q2,一共有6个选项,则设置六个0-1变量,依次为Q201.Q202.Q203.Q204.Q205.Q206,如选了此项,则标记为1,以备SPSS中进行多
响应二分变量法分析; 2.整理分析数据:
本次分析借助EXCEL和SPSS软件进行作图和分析。 3.对数据进行解释; 4.写出调查报告。
5.提交结果的方式:以书面的形式提交调查报告。
从一个总体中抽出一个具有代表性的样本,可按下列程序进行. 方案三:
一、确定抽样方法
随机抽样包括简单随机抽样、系统抽样、分层抽样三种抽样方法.其关系如下表. 类型 简单随机抽样 系统抽样 共同点 各自特点 相互联系 适应范围 每个个体被抽到从总体中逐个抽最基本的随机抽总体中的个体数样本中的机会是取 样方法 目较少 均等的 将总体均匀分成在第一部分抽样总体中的个体数几部分,按事先确时采用简单随机目较多 定的规则在各部抽样 分抽取 分层抽样 将总体分成几层,各层抽样时采用总体由差异明显分层进行抽取 简单随机抽样或的几部分组成 系统抽样 由于三种抽样方法适应的范围不同,对于给定的抽样问题首先要选择相匹配的抽样方法.只有理解三种抽样方法的含义,才会做到这一点.看下面的几个例子:
问题1:某市为了支援西部教育事业,现从报名的18名志愿者中选取6人组成志愿小组.为了保证对每个志愿者的公平性,如何确定志愿小组的名单.
问题2:某学校有在编教师160人.其中老年教师16人,中年教师112人,青年教师32人.教育部门为了了解教师的健康状况,要从中抽取一个容量为20的样本.试确定用何种方法抽取.
问题3:某工厂平均每天生产某种零件大约1000件,要求产品检验员每天抽取50件,检查其质量状况.试问运用那种抽样方法最合理.
剖析:问题1的总体中的个体数目较少,运用简单随机抽样法抽样;简单随机抽样法有两种,分别为抽签法和随机数法,两法皆适合此题;问题2中的总体由差异明显的几部分组成,故采用分层抽样法抽样;问题3中的总体容量大,样本容量也大,可用系统抽样法抽样. 二、设计抽样的方法步骤
明确了一个抽样问题采用的抽样方法后,接下来根据选择的抽样方法的特点设计抽样的方法步骤.那么上述三个问题如何设计抽样的方法步骤呢? 问题1的抽样方法常常设计为以下几个步骤. 采用抽签法:
(1)编号:将18名志愿者编号,号码为01,02,?,18.
(2)制签:将号码分别写在一张纸条上,揉成团,制成号签.
(3)搅匀:将做成的号签方入一个不透明的袋子中,并充分搅匀. (4)抽签:从袋子中依次抽取6个号签,并记录上面的编号. (5)定样:所得号码对应的志愿者就是志愿小组的成员. 简记为五步走:编号、制签、搅匀、抽签、定样.
采用随机数法
(1)编号:将18名志愿者编号,号码为00,01,?,17(同抽签法编号一致也可,但号码的位数要相同).
(2)数表定位:在随机数表中任选一数,如第1行第1列的数0.
(3)读表并录号:从选定的数0开始向右读(读数的方向也可向左、向上、向下),得到一个两位数03,由于 (03理解为3),说明号码在总体内,将它记录;继续向右读,得到47,由于 ,将它去掉,按照这种方法继续向右读,直到记录的号码为03,16,11,14,10,07. (4)定样:所得号码对应的志愿者就是志愿小组的成员. 简记为四步走:编号、数表定位、读表录号、定样. 问题2的抽样方法常常设计为以下几个步骤.
(1)计算抽样比 ,其中 表示样本容量, 表示总体中个体的数目,下同.
(2)样本容量的分配:样本中的老年教师人数为 ;样本中的中年教师人数为 ;样本中的老年教师人数为 .
(3)层内抽样:运用抽签法在16位老年教师中抽取2人,运用系统抽样法在112位中年教师中抽取14人,:运用抽签法在32位青年教师中抽取4人
(4)定样:把层内抽样得到的教师汇在一起,得到所求的样本.
说明:在样本容量分配时,名额一定取正整数.一旦出现小数,要四舍五入.但名额之和等于样本容量(有时需权衡取整).
问题3的抽样方法常常设计为以下几个步骤.
(1)编号:把1000个零件编号,号码为000,001,002,?,999.
(2)确定段数及间隔数k:把编号分成50段,间隔数 k=1000|50=20.
(3)确定首码:在第1段编号为000~019的个体中,用简单随机抽样法确定样本中首个个体编号 i( i<019)
(4)确定样本中个体编码:按照一定的规律,通常是首个个体编号 加上间隔数 得到第2个个体编号( i+20),在加20得到第3个个体编号( i+40),依次下去,直到得到最后一个个体编号( i+980),共50个编号.
(5)定样:所得编好对应的零件组成样本.
说明:当间隔数 k不是整数时,需要在编号之前在总体中随机剔除个体数为( N-[N|n]xn),其中[N|n] 表示不超过N|n 的最大整数.
怎样抽样?如何确定抽样方法
在设计一个抽样调查时,我们通常需要做的工作是:定义总体及抽样单元、确定或构置抽样框、选择抽样技术、确定样本量的大小、制定实施细节并实施。这里我们着重介绍一下定量研究的抽样方法和样本量这两个技术环节。
最基本的定量研究的抽样方法分为两类,一类为非概率抽样,一类为概率抽样。
一、非概率抽样
非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。 偶遇抽样(方便抽样)
常见的未经许可的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。偶遇抽样是所有抽样技术中花费最小的(包括经费和时间)。抽样单元是可以接近的、容易测量的、并且是合作的。但尽管有许多优点,这种形式的抽样还是有严重的局限性。
许多可能的选择偏差都会存在,如被调查者的自我选择、抽样的主观性偏差等。这种抽样不能代表总体和推断总体。因此,当我们在进行街头访问或邮寄调查时,一定要谨慎对待调查结果。 判断抽样
判断抽样是基于调研者对总体的了解和经验,从总体中抽选\有代表性的\典型的\单位作为样本,例如从全体企业中抽选若干先进的、居中的、落后的企业作为样本,来考察全体企业的经营状况。如果判断准,这种方法有可能取得具有较好代表性的样本,但这种方法受主观因素影响较大。 配额抽样
配额抽样是根据总体的结构特征来给调查员分派定额,以取得一个与总体结构特征大体相似的样本,例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自由度就很大了。唯一的要求就是所选的元素要适合所控制的特性。这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额,配额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。另外,用这种方法进行选择时,往往存在调查员的选择偏好,因而也难以避免主观因素的影响。如果在严格控制调查员和调查过程的条件下,可使配额抽样获得与某些概率抽样非常接近的结果。在进行配额抽样时,要特别注意配额与调查结果之间的密切联系。 雪球抽样
雪球抽样是先选择一组调查对象,通常是随机地选取的。访问这些调查对象之后,再请他们提供另外一些属于所研究的目标总体的调查对象,根据所提供的线索,选择此后的调查对象。这一过程会继续下去,形成一种滚雪球的效果。此抽样的主要目的是估计在总体中十分稀有的人物特征。由于后来被推荐的人可能类似于推荐他们的那些人,因此这种方式的调查也是非概率的。 二、概率抽样
非概率抽样包括简单随机抽样,分层抽样,等距抽样,整群抽样等,每个样本的中选概率是已知的,因此可以计算抽样误差。通常的实地调查中,是把这几种抽样方法相互结合。 简单随机抽样
总体中的每一个元素都有一个相等的被抽中概率。简单随机抽样可以通过抽签法和随机数字表方法来实现。先确定或搜集一个抽样框,将抽样框中的每个元素都编上号。然后把所有抽签抽中的号码的元素或随机数字对应的号码的元素做为样本进行调查。 等距抽样(系统抽样)
按照某种顺序给总体中所有单元编号,然后随机地抽取一个编号作为样本的第一个单元,样本的其它单元则按照某种确定的规则抽取(如等距原则),这种抽样方法称为系统抽样。其中最常用最简单的系统抽样叫等距抽样。 分层抽样
分层抽样的特点是先将总体按照某种特征或指标分成几个排斥的又是穷尽的子总体,或层,然后在每个层内按照随机的方法抽取元素。其原则是子总体内元素间差异可能小,而不同子总体间差异大。 整群抽样
整群抽样首先将总体划成许多相互排斥的子总体或群,然后以群为初级抽样单元,按某种概率抽样技术,如简单随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查。
多级抽样
也叫多阶段抽样。它是在第一阶段从所有群中抽取若干群,在每个抽中的群中,再抽取若干单元进行调查。它与分层抽样的区别在于第一层是抽取部分,与整群抽样的区别在于第二阶段是抽取部分。这在实际实施中是最为常见的一种抽样方式。同时它的抽样精度比整群抽样高,操作性更强。 什么时候用概率抽样,什么时候用非概率抽样,应当根据各种条件来决定,例如研究的性质、对误差容忍的程度、抽样误差与非抽样误差的相对大小、总体中的变差、以及统计上的操作上的考虑等。尽管非概率抽样不能推断总体,不能计算抽样误差,但在实际调查中仍常被应用。一方面是操作的考虑,减少非抽样误差的发生,另一方面也是因为所调查内容不需投射总体,而且一般总体的同质性较强。如概念测试、包装测试、名称测试以及广告测试等,这类研究中,主要的兴趣集中在样本给出各种不同应答的比例。概率抽样用于需要对总体给出很准确的估计的情况,例如要估计市场占有率、整个市场的销售量、估计某个地区的电视收视率等。还有全国性的市场跟踪研究(提供有关产品分类和品牌使用率等信息的研究),以及用户的心理特征和人口分布的研究等,都采取概率抽样。但在概率抽样时要特别注意控制调查过程中的非抽样误差。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库社会统计学复习资料(2)在线全文阅读。
相关推荐: