抽样方案设计(十一篇)
为了确保事情或工作有序有效开展,通常需要提前准备好一份方案,方案属于计划类文书的一种。那么方案应该怎么制定才合适呢?以下是小编为大家收集的方案范文,欢迎大家分享阅读。
抽样方案设计篇一
调查目的:通过对吸毒者的调查建立一种“如何成为吸毒者”的理论。这一研究对了解吸毒者的情况,并制订政策和措施解决这一社会问题有现实意义,对于认识越轨行为的产生过程有普遍的理论意义。
理论假设:心理学家常以个人心理特征来解释越轨行为。但本研究的设想是,越轨行为的产生是人的一系列社会经历连续作用的结果。人们在这些社会经历中逐渐形成了一定的观念、认知和情景判断,它们导致了特定的行为动机和行为倾向。因此,应当以个人的寉经历来解释越轨行为。
2、研究类型:描述性研究、纵向研究、个案研究、理论性研究
调查方式:实地(个案)研究
调查方法:无结构访问法、长期观察
资料分析方法:定性分析、主观理解法
3、调查范围:美国某一城市
分析单位:个人。
抽样单位:个人。
4、抽样方案:
以所认识的几个吸毒者为首批调查对象兩这些吸毒者介绍他们所认识的吸毒者,再调查第二批、第三批……共调查50人(这种抽样方法称为非概率抽样,或“滚雪球”式的抽样)。
5、调查内容:
吸毒者的吸毒经历。如何开始,中间经历哪些过程,现在是什么状况,开始是多少,中间是多少,现在是多少,都有什么感受则否戒毒,都受哪些因素影响才开始吸毒的,等等。
调查提纲:
根据以上内容自由交谈,无调查表格。事后根据录音或回想作详细的访谈记录。
6、调查场所:由被调查者选择他们认为合适的场所和时间接受访问
时间计划:在第一次访问之后间隔几个月或半年后再访问一次,共访问再次或三次,调查时间大约一年半。
7、调查经费和物质手段(略)。
8、调查员:课题组有3人,每个人负责自己的调查对象。
抽样方案设计篇二
一、调查目的
随着经济的不断发展,人们生活水平的提高,消费观念也在改变。然而,现在出现的消费攀比、奢侈消费、从众消费等不理性消费比比皆是。大学生作为社会中的一个特殊的消费群体,其消费现状在某种程度上折射出当今大学生的生活状态和价值取向,其消费观念的塑造和培养将对一生的品德和行为产生重要的影响。因此,为了了解我校大学生的消费观念、消费手段其及消费来源等,我们设计了这个课题——“大学生消费调查计划书”。
二、调查内容
1、大学生每月的总共支出。,
2、大学生消费的恩格尔系数比率。
3、大学生主要消费目的、对象及用途(分男女生)
4、大学生消费是否有经过思考、还是遇见就买。
5、大学生对自己消费的最终评价(是否值得)。
6、大学生对节制消费又是怎样看待,怎么样看待合理消费。
三、调查方式
(一)、调查对象:江西师范大学全体大学生。
(二)、调查人员:流光溢彩调查小分队。
(三)、调查方法:采取抽样的形式进行问卷调查、观察+行为资料分析法
由于学校学生人数较多,其月消费状况很难通过全面调查方式获得,只有采用抽样调查的方式获得。抽样调查是按照随机原则,从全体研究对象(总体)中抽取一部分调查单位(样本)进行调查,根据调查获得的样本信息来推断总体数量特征的一种调查研究方法。此次抽样调查是以我校所有的大学生为总体,以各学院的学生为子总体进行抽样设计。对于问卷调查的结果有一定的缺陷性,问卷所提及的问题不能涵盖学生生活消费的全部。所以加上采用观察+行为资料分析法对学校的一些商店进行踩点分析。用来弥补问卷调查的不足性。从两个调查资料综合分析中。做出调查报告。
问卷总数为400份。问卷设有28个问答题,1个简答题。
可采取以下两种方法进行抽样:
1、随机抽样 对全校大学生进行随机抽样调查
2、分层抽样 分层技术是在实际中最常采用的抽样技术之一,分层抽样实施起来灵活方便,而且也便于组织。先按学院分放,再按班级学生比例发放
此次,我们将采用两种方式相结合的方式进行抽样,先随机选取五个学院,按照各学院学生比例进行问卷发放,然后,按各班学生比例分配,最后到达班级随机发放。
3、具体步骤:
①分配负责设计问卷人员;
②发放问卷过程中对一部分同学进行采访调查;
③收回问卷并进行统计分析;
对学校各个超市的销售数据进行统计。对学校的各个水果小卖部进行蹲点观察。得出数据。和问卷调查数据综合分析。做出调查报告。
四、调查过程:
1、对调查总体抽样:选商学院、政法学院、音乐学院、体育学院、文学院等五个学院为样本。按照各学院学生比例进行问卷发放,然后,按各班学生比例分配,最后到达班级随机发放。分配人员蹲点和超市调查。
2、调查过程
①查阅相关文献资料,编写问卷初稿;
②采纳同学、老师们合理的意见和建议,进一步修改调查问卷,形成调查问卷正式稿;
③使用调查问卷正式稿进行调查;
④使用各个超市和小卖部的数据进行调查。
五、日程安排:
调查方案、问卷的设计 ⋯⋯⋯⋯⋯⋯2个工作日
调查方案、问卷的修改、确定 ⋯⋯⋯⋯⋯⋯1个工作日
人员安排 ⋯⋯⋯⋯⋯⋯1个工作日
实地调查 ⋯⋯⋯⋯⋯⋯3个工作日
数据初步处理 ⋯⋯⋯⋯⋯⋯2个工作日
数据统计分析 ⋯⋯⋯⋯⋯⋯3个工作日
调查报告撰写 ⋯⋯⋯⋯⋯⋯2个工作日
论证阶段 ⋯⋯⋯⋯⋯⋯1个工作日
抽样方案设计篇三
前言:
公司某海外客户在其《供应商质量手册》中规定成品验收采用c=0抽样方案。所谓c=0抽样方案通常又被大家称为零缺陷抽样方案,即只有抽样产品全部经检验全部合格,整批产品才能够被接收;而只要在验收过程中发现有一个不良品,整批产品将被判为不合格。客户的这一要求在公司内部引起了一些同事的担心,认为这样的要求是不是过于严格了?我们公司根本做不到,甚至有同事认为客户这样的要求是“霸王”条款。
事实上,c=0抽样方案目前在国内已经被广泛使用。它和国内应用较多的gb2828抽样方案一样,就方案本身来讲不存在严格不严格的概念。我们知道,在应用gb2828时,一个抽样计划严格与否取决于我们对于aql的选择。aql值小,抽样计划就严格;aql值大,抽样计划就宽松。同样的,c=0抽样方案也规定了一系列与gb2828相同的aql值,选择哪个aql值完全在于我们自己的选择以及与客户的协商来决定。所以有关“c=0抽样方案过于严格”的论断完全不成立,出现这种认识仅仅是因为大家不了解c=0抽样方案。
需要说明的是,该客户的《供应商质量手册》是根据iso/ts16949(即gb/t18305)建立的,而iso/ts16949在7.1.2 条款中明确要求接收水平必须是零缺陷。(iso/ts16949 7.1.2接收准则:组织应规定接收准则,要求时,由顾客批准。对于计数型数据抽样,接收水平应是零缺陷。)所以,客户的要求是根据的,不存在任何“霸王”要求。
1、抽样检验简介
抽样检验又称为统计抽检检验,是指从交验的一批产品中,随机抽取若干单位产品组成样本进行检验,通过对样本的检验结果对整批产品做出质量判定的过程。
我们知道,检验是不产生价值的工作,因此如何更经济、快捷的进行检验就直接关系到生产的成本和效率。统计抽样检验理论是美国贝尔实验室的道奇和罗米格于1929年创立的,它和1924年休哈特提出的统计过程控制(控制图)一起被视为质量管理从质量检验阶段进入统计质量控制阶段的两个标志性成果。统计抽样检验理论的出现改变了以往那种依靠大批量检验来保障产品质量的工作方式。
从1950年美军发布mil-std-105抽样标准起,统计抽样检验在全世界逐步推广开来。mil-std-105的升级、延伸版本被国际标准化组织以及许多国家的国家标准采用。美军mil-std-105标准共经历a~e五个版本,该标准目前已经被美军废止。
2、两种“零缺陷”抽样方案
1965年,美国的一位大学教授尼古拉斯•斯托格力亚发表c=0抽样方案,几经改版,目前最新的版本为第四版。c=0抽样方案是根据mil-std105 修改而成,接收准则限定为“0收1退”,因而又被人们称为“零缺陷”抽样方案。
虽然到目前为止,c=0抽样方案还不是国际以及任何国家的国家标准,但由于“零缺陷”的质量理念已经深入人心,在加上iso/ts16949:20__中有明确的条文要求,在企业界已经得到了广泛的应用。1994年,美国三大汽车厂商(通用、福特、克来斯勒)发布了qs9000质量体系标准,qs9000中的4.10.1.1条款就明确要求:接收准则必须是零缺陷。qs9000的这一要求,促进了c=0抽样方案的被迅速推广应用。在qs9000被国际标准化组织采纳为国际标准iso/ts16949之后,使得c=0抽样方案的应用又进一步扩大。
20__年,为了表彰尼古拉斯•斯托格力亚教授创制c=0抽样方案的突出贡献,美国质量学会把当年的谢宁奖章颁给已经退休的尼古拉斯•斯托格力亚教授。美国质量学会在表彰词中说:他最伟大的贡献是开发了一套实用、便于使用、经济的零缺陷的数字抽样方案。他的方法在军事和商用上,节省了数以百万计的美元。由于他的方法被证明实用、简易并且经济,因而被广泛接受。
1996年,美军推出新版的抽样标准mil-std-1916。和c=0抽样方案一样,mil-std-1916也限定它的接收准则为“0收1退”,所以mil-std-1916也可以称为零缺陷抽样方案。mil-std-1916不再像mil-std-105那样强调抽样的技术,而是转为要求供应商建立预防性的质量体系和有效的过程质量控制系统。mil-std-1916强调以事先的预防代替事后的检验。
由于iso/ts16949只要求了“接收水平应是零缺陷”,并没有明确规定应采用c=0抽样方案还是mil-std-1916。对于企业来说,使用哪一种“零缺陷”抽样方案可以结合企业自身以及客户的具体要求来决定。
3、国内抽样标准的应用情况
1981年我国开始参照iso2859(即mil-std-105d)制订中国的统计抽样标准gb2828。gb2828经过1987年和20__年两次修订,目前在国内应用最为广泛。虽然mil-std-105在美国已经被废止,但是该标准目前在我国仍有许多企业在使用,甚至还有少数企业在使用早期的版本mil-std-105d。
目前,c=0抽样方案已经在我国众多的汽车行业企业和其它自愿采用iso/ts16949标准的企业中被广泛的使用。
4、“零缺陷”的概念
“零缺陷”(c=0)抽样方案是根据mil-std-105修改而来,有关统计抽样的概念与gb2828出自同源,gb2828相关的术语定义在“零缺陷”(c=0)抽样方案都可以使用。为了突出“零缺陷”这一重要概念,“零缺陷”(c=0)抽样方案把gb2828中“不合格”、“不合格品”两个术语修改为“缺陷”、“缺陷品”。
由于“零缺陷”(c=0)抽样方案的判定准则限定为“0收1退”,只要出现一个缺陷品,不论批量大小、样本多少,都可以判整批不合格。突出“零缺陷”观念,可以促进大家质量意识提升。
“零缺陷”(c=0)抽样方案的另外考虑是:如果你的质量相当差,大于0的允收数并没有多大的帮助;当你的抽样计划允收数大于零,你在授权你的检验人员接受一些可能没有用的产品;零缺陷强制对任何不合格采取措施;如果你正在努力迈向零缺陷,那你怎能容许你的抽样计划允许有缺陷数呢?
我们看到许多公司常常使用“零缺陷”的概念来进行质量宣传,但“零缺陷”的精神要怎么去贯彻落实呢?如果我们一方面宣传着“零缺陷”,另一方面仍然在使用gb2828的抽样方案来接收不良品,那本身就是一个自相矛盾的笑话。
5、“零缺陷”(c=0)抽样方案的简便性
与gb2828相比“零缺陷”(c=0)抽样方案不存在加严、放宽与正常检验之间的转移规定,也没有二次及多次抽样计划。“零缺陷”(c=0)抽样方案仅使用一张主抽样表,相对gb2828的几十张抽样表大大简化,即方便学习,也便于使用管理。同时,“零缺陷”(c=0)抽样方案不仅适用于逐批检验,也适用于孤立批次检验。
6、推行“零缺陷”(c=0)抽样方案的益处
6.1有助于形成严谨务实的工作作风
虽然三星电气品质管理部门在现行的成品检验标准中,把产品功能参数类检验项目的抽样计划规定为不合格品gb2828 ⅱ aql=0.65%;而外观类检验项目则规定为不合格品gb2828 ⅱ aql=1.0% 。但是否严格按抽样计划进行了抽检还是一个问题。检验员们在被问题按何种标准检验产品时,常常会回答:按gb2828检验。但是我们是按gb2828的哪一级检验水准?各种质量特性分别选取何种aql值呢?大家答不上来。
事实上,一批产品在抽检时应该抽取多少样本?以及如何判定合格与否?往往都是主管人员凭感觉、凭个人经验的指示。这样做的问题是:抽检工作缺少合理性,抽检判定缺少公平性,对出厂产品的质量风险把控也不具有科学性。
不论我们选用gb2828或是“零缺陷”(c=0)抽样方案,标准一旦确立,就一定要保证按标准进行检验。必须改变那种靠人的主观经验判定的不良习惯,促使工作严谨性。而由于“零缺陷”(c=0)抽样方案的易学易用性,更有助于帮助我们形成严谨、务实的工作作风。
6.2选用“零缺陷”(c=0)抽样方案更经济
在选取相同aql值的情况下,“零缺陷”(c=0)抽样方案的抽检风险概率与gb2828类似,同时抽检量大大减少。与gb2828一样,应用“零缺陷”(c=0)抽样方案时同样需要为不同类别的质量特性规定不同的aql(接收质量限)。“零缺陷”(c=0)抽样方案适用于:期望是生产的产品完全达到规范要求。对一些非关键的特性希望用比较少的检验。比如三星电气公司的电能表产品,对于表计功能、性能等主要质量特性是客户重点关注的,而且也必须满足“零缺陷”;而对于外观等次要质量特性,客户通常并不会像对待工艺品一样深究,就不必要维持大量的抽检,那样明显是不经济的。
6.3将帮助我们树立“零缺陷”的质量意识并提升产品质量水平
由于“零缺陷”(c=0)抽样方案的判定准则限定为“0收1退”,只要出现一个不良品,就可以判整批不合格,就必须采取全检返措施。在推行的初期无疑将会加大效率和成本的压力,从而促使整个公司真正树立“零缺陷”的观念,不容忍一个不良品。
当我们每个人都形成了不能够容忍不良品和不能够容忍工作差错之后,相信我们的产品质量水平也一定会相应的提升。
6.4有助于提升客户信心,并帮助拓展海外市场。
目前,“零缺陷”的质量观念已经风靡全球,如果期望打入欧美日等成熟的高端市场,我们必须使用顾客能够听懂的“零缺陷”质量语言来跟顾客接轨。
6.5“零缺陷”(c=0)抽样方案契合公司的经营理念
公司倡导精确、高效、务实、简单的工作文化,而“零缺陷”(c=0)抽样方案恰好符合这四个词的要求。
总之,“零缺陷”是目前企业质量管理的潮流所向,我们应当把本次客户的要求转化为公司内部改进的一次机会,积极的迎难而上:推行c=0抽样方案,树立零缺陷意识!
抽样方案设计篇四
一、概述:药品生产中所使用的原辅料、包装材料,进厂时都需要进行检验,但是无论是什么材料,来料的量都不会小,不可能做到全数检验。那么我们就会根据国标、药典或者企业自身的规定,对需要检验的物品进行抽样。
如使用gb/t2828.1-20__选择抽样方案,确定好检验水平,接受质量限(aql),采用正常一次抽样检验,在表2-a中就能查出抽样方案,那么怎么证明我们所选抽样方案是有效的呢?下面针对计数和计点两种方案有效性的确定加以说明。
二、计数抽样方案——二项分布
假定接收质量限aql=2.5,抽样方案是l(500,21);确定方案是否有效,其实就是验证确认下在其置信水平下,不合格品率是否小于等于aql值;借助excel和mintab软件演示下验证和确认的过程。
第一步:计数抽样符合二项分布,利用excel中binomdist函数,可以计算出生产方风险,利用单变量求解,求出使用方风险为10%时,不合格品率(使用方风险质量)。也可以查gb/t2828.1-20__“表6-a正常检验的使用方风险质量”查出使用方风险质量。
三、计点抽样方案——泊松分布
假定接收质量限aql=6.5,抽样方案是l(8,1);确定方案是否有效,其实就是验证确认下在其置信水平下,不合格品数是否小于等于aql值;借助excel和mintab软件演示下验证和确认的过程。
第一步:计点抽样符合泊松分布,利用excel中poisson函数,可以计算出生产方风险,利用单变量求解,求出使用方风险为10%时,不合格品数。也可以查gb/t2828.1-20__“表7-a正常检验的使用方风险质量”查出使用方风险质量。
将出现数改为2,得出90.36%置信水平下不合格数下限是0.065029>0.065,不合格数大于方案设定值,因此按照方案应该拒收。
四、小结:对于验证和确认二项分布和泊松分布的原理是一致的,过程中注意区分mintab所使用的选项工具即可。
抽样方案设计篇五
一、前言
最近很多同学都反映学校食堂存在很多问题,,这些问题困扰着我们同学的日常生活,同学们对此抱怨连连,为此我们准备制定相应的市场调查方案,来具体了解学生的实际需求和想法
二、调查的目的和意义
为详细了解食堂问题各方面的情况制定了合理的调查方案书。目的及意义如下
1全面了解学生对学校食堂的需求和学生对食堂的满意度
2调查学校食堂的价格,服务,菜式的销售现状
3了解学生的消费观点和习惯
从以上几点中分析研究,来发掘出一些食堂的服务改进措施及学校对食堂的有效管理措施
三、调查内容:
市场调查的内容要根据市场调查的目的来确定学生对食堂餐厅的服务情况的评价。该次调查中主要内容有以下几个方面:
1.调查学生对餐厅提供的饭菜口味,种类分量,价格
2.调查学生对餐厅的卫生条件和其舒适程度
3.调查学生对餐厅的工作人员的服务态度和服务水平
4.调查竞争者市场概况
四、调查对象和范围
针对学校食堂各项基础设施尚未完善,尤其学校餐厅饭菜质量备受学生关注。对于学生都焦点的问题,所以全校学生都是调查对象。个人的喜好以及家庭经济背景的差异、学生 月生活费之处的多少导致消费者购买习惯的差异。为了准确快速的得出调查结果此次调查决定采用随机抽样法,对在学校餐厅及在校外用餐的学生进行抽样调查,样本量为100。具体实施措施是:我们将在就餐期间随机抽取70名在校就餐同学,以及30名在校外就餐同学,分别了解他们对学校餐厅的满意度
五、调查方法
此次调查涉及人员较多,我组采用随机抽样方法进行,问卷共设计15 各小题,涉及调查餐厅的各个方面。调查的实施要求本组人员进行面对面的街头访问,最后的资料整理由本组人员分工处理
六、资料分析
1.学生对学校食堂的伙食情况分析
2.对学校食堂的服务情况分析
七、经费预算
1.调查问卷准备100份,打印0.1元/份,复印0.1元/份,共10元
2.活动经费(略)
八、附录
项目负责人:
调查方案、问卷的设计:
调查方案、问卷的修改:
调查人员:
调查数据处理:
调查数据的分析:
调查报告撰写:
调查计划书撰写:
抽样方案设计篇六
调查系统误差
首先,任何调查所获信息(调查数据)质量都存在误差,而这种误差在评估调查质量时都是必须的,作为调查管理者必须判断这些结果的精度范围。因此,这就需要仔细研究所使用的调研方法可能导致的误差类型。
(1)抽样误差
抽样过程中主要存在着以下两类误差:随机误差和系统误差。有时也称为偏差。调查中通常试图对目标总体中具有代表性的一个侧面进行调查而获得信息。它旨在根据抽取样本的调查结果而推测总体的情况。因此,即使样本选择过程是适当的,调查结果仍不免因偶然性而产生一定的误差(随机误差或随机抽样误差),这种误差是不可避免的,它只能随着抽样规模的增加而减小。通常在样本量设计时,我们可以以一定的置信水平来估计随机抽样的误差。
(2)系统误差
系统误差或偏差是指因调研设计或实施抽样设计中的错误或问题而产生的误差。如果抽样的结果与我们根据被调查对象的真实值所做的估计值总是有一定的偏差(固定的偏高或偏低),则抽样结果便很有可能存在系统误差。系统误差包括除随机抽样之外所有可能产生的误差。因此,有时系统误差又被称为非抽样误差,从系统上影响抽样调研的结果。非抽样误差分为样本设计误差和测量误差。样本设计误差是因样本设计或样本抽选过程而产生的误差。
样本设计误差的产生有多种原因:
抽样框误差
抽样框是指对于某一类人口类型和成员的一个总体清单。样本将从这个总体清单中加以选取。抽样框误差便是因不准确或不完整的抽样框而引起的误差。问题是,从包含抽样误差的抽样框中抽取的样本有时无法正确地代表调研目标的实际情况,这就存在抽样框误差。举个例子,以电话号码薄作为抽样框,在对某地区所有住户进行的某种意向调查时,就存在着抽样框误差。
调研对象范围误差
调研对象范围误差是因为对调研对象范围限定的不准确而引起的误差。例如,我们将某项研究对象限定在 35 岁以上,后来,我们发现不少 35 岁以下的年轻人也应该包含在这个研究之中,即当初的我们的限定范围是不正确的,这样的抽样便产生了误差。
选样误差
即使抽样框的组建与调研对象范围的确定都没有什么问题,抽样误差也有可能发生。抽选误差是因为不完整或不恰当的抽选过程,或者正确的抽选过程未得以恰当的执行而产生的误差。例如,在入户调查时,访问员会因为不同的原因绕开被认为是“不友好的”住户,这样的话便会产生选样误差。特别是在非随机抽样中,选样误差是一个更为严重的问题。
(3)测量误差
测量误差对于抽样调查的准确性来说,比随机误差更具危害性。在许多调查报告中,包括媒介上发布公众意向调查,都会给出一个误差指数。对很多调研报告使用者来说,一般认为这个指数是针对总体误差而言,其实并非如此。这个数字仅代表随机抽样误差,它并不包括样本设计误差,也没有涉及调研结果中的测量误差。
测量误差是指所获得的原始信息(实际价值)与经测量处理的信息之间的差异。在信息处理过程中会因多种因素而产生测量误差。
替代信息误差
是指实际所需的信息与调研者所收集信息之间的差距而产生的误差。这种误差与调研设计的主要问题有关,特别是对一些问题不恰当定义而产生的。
调研员误差
是指因调研员与被调研者之间的相互作用而引起的误差。调研员有时会自觉或不自觉地影响被调研者,使之给出不真实或不准确的回答。
测量工具误差
测量工具误差是指因测量工具或问卷而产生的误差。这种误差是由于所提出的问题或问卷设计中的某些因素而导致回答的偏差或者使回答时容易产生错误。这种类型的错误能够通过细致的问卷修改和在实地调研前进行充分的试调查而加以避免。
数据处理误差
主要是指调研资料或调研数据在向计算机输入过程中所产生的误差。例如,在计算机辅助电话访谈中,访问员可能错误地输入某个问题的答案。这类错误可以通过在数据录入以及调研结果处理过程中严格的质量控制加以避免。
拒访误差
如果我们从某个特定群体中抽选 400 个样本,理想的情况是对这 400 个样本都进行调查。而在实际中,这是很难实现的。在邮寄调研中,回答率一般在 5% 左右,甚至更低。因这种差异而引起的误差被称为“拒访误差”。很明显,回答率越高,拒访误差的影响便越小,因为拒访者在总体中占的比例减小了。
拒访误差在以下三种情况下发生:①在特定时间无法联系到被访者;②虽然得到了默许,但在当时的环境下不能或不愿意接受访谈;③虽然能够联系到被访者,但被访者拒绝接受访问。其中,最后一种情况最为严重。因为,前两种情况都有重新进行调研的可能。现在,拒访率已经达到了前所未有的水平,大约近 40% 。好在大部分人并非在所有情况下都拒绝访问。
回答误差
如果被访问者在某一特定问题的回答中有特定的偏向,则产生回答误差。回答误差的产生有两种基本的形式:有意错误与无意错误。有意错误的产生是因为被调查者故意对所提问题做出不真实回答;无意错误是指回答者希望能够做出真实、准确的回答,但却给出了不正确的答案。这种类型的误差可能是由于问题的格式、内容或其他原因造成的。
定量测量技术
(1)测量概念
市场调查测量是指在定量测量中将按特定的规则将数字或者符号合理分配给被调查的目标(包括人、态度、状态或者事件),将其特征量化的过程。量化概念强调的是:测量的不是被测量者本身,而是被测量者(通常是消费者)的态度、收入、品牌忠诚度以及相关因素等。
测量另一方面的关键是制定和理解规则,它指示被调查者该怎么做。如,“您对咖啡的喜好程度做出评价,非常喜欢为 5 分,不喜欢为 1 分,并按相应的标准分配 2 、 3 、 4 分”。
(2)测量程序
(3)测量标称
测量标称一般包括四种主要技术类型,详见下表。
(4)测量可靠性
测量的可靠性是指测量中可以避免随机误差,从而提供前后一致的数据的程度。随机误差越小,测量的客观性就越强,调查的结果就越可靠。
通常采用如下三种方法评估测量的可靠性;
二次测试法
为了评估测量的可靠性,采用在尽可能相同的条件下使用相同的测量工具进行重复测量,以确定测量的可靠性。
等价测试法
在同一时间内,使用尽可能类似的两种工具对同一目标进行测量,然后评估其可靠性。
比较测试法
在同一时间内,对测量的同一现象的不同样本进行比较。
抽样概念
抽样是市场调查执行中重要的环节,抽样方法选择的正确与否直接决定着调查数据的可靠程度,同时也就决定了调查的成败。
(1)总体与全域
总体或全域,是指在市场调查中能提供所需信息的个人或者群体的全体。通常,在调查之前分析人员的首要任务是定义同质总体,并常常涉及到与之密切相关的产品和服务目标市场的界定。
举例来说,一个研究人员正在为一种新型非处方感冒药进行产品创意测试。他也许会认为被调查的总体包括每个人,因为每个人都会有患感冒的可能性。但是即便如此,并非每个患者都会选择这种非处方药。在这种情况下,调查过程中的重要任务是确定哪些人是目标主体,这就要看感冒时他们是否选购或使用这种或多种品牌的药。只有那些购买或使用的人们,才应包括在总体内。
为总体下定义是抽样调查中关键的一步,为达到市场研究目的,我们在定义调查“总体”时常常基于已有的和潜在的顾客特征。
(2)抽样与普查
普查这一概念用于描述获取总体中每个成员的信息。市场调研中并不经常用到普查,因为其同质总体一般情况下包括成千上万的个体,这样大规模地进行普查在成本和时间上的耗费都是巨大的,以致于在通常情况下是不可行的。
统计学理论证明:一个相对较小、但精心选择的样本群能准确地反映出被抽查总体的特征,一个样本是总体所有成员的一个子集,从子集获得的有关信息,可以用来估测总体特征,这种方法就是抽样调查。
尽管市场调查中很少用到普查,但是有时它们也适用于某些案例。譬如,在某著名石油公司、麦当劳、中国电信等神秘顾客访问中,由于总体不大,因此采用的是普查的方式。另外,在工业品营销中,一个企业只向少量客户销售极为特殊的产品时,普查也是适当和可行的。
抽样步骤
抽样计划大致需要下列步骤,如下所示。
(1)定义总体(全域)
为了满足市场研究目标,确定可提供信息或与所需信息有关的个体或实体(所具有的特性是十分重要的。抽样总体可以从以下几方面特征进行描述:地域特征、人口统计学的特征、产品或服务使用情况、认知程度等。在调查中,从调查问卷开始部分的过滤性问题,可以看出某个体是否属于总体。在实际应用中,即使有总体和样本清单,但仍有必要使用过滤性问题识别合格的被访问者。
另外,为了确定总体,通常情况下,还需要确定那些应排除在外的被访问者的特征。例如,大部分商业市场调查就因为一些所谓的安全性问题而排除某些个体。通常,调查问卷上的第一个问题就是询问采访对象或其家庭成员是否从事市场调查、广告或生产与调查内容有关产品的工作,如果采访对象指出他们从事其中某项工作,那么就不必要去采访他了,这就是所说的安全性问题,因为这样的采访对象不保险。他们也许是竞争对手或为竞争对手服务的。
(2)选择调查方法
正如调查方法部分所描述的那样,资料收集方式对抽样过程有重要影响。例如,电话采访有一种内在优势,购物中心拦截顾客有着自身的劣势。
(3)选择抽样框
把抽样框定义为被调查总体的数据清单(数据库或者数据仓),从抽样框中可以抽出适合访问的样本单位。众所周知,一些抽样框原来根本是不存在的,因此,在调查的初期还要建立符合需要的抽样框。例如,在一项调查中,调查的总体是那些在近 30 天内打三轮或三轮以上十八洞高尔夫球的人。但是,根本就没有一种计算方法可以完全提供这份名单。在不存在传统意义上的抽样框的情况下,我们需要依据能够产生具有希望特征的样本个体的程序来建立新样本框。
(4)选择抽样方法
制定抽样计划的第四步是选择抽样方法。选择哪种抽样方法取决于研究目的、研究经费、时间限制、欲调查问题的性质等。可供选择的重要抽样方法可以分为两大类: 概率抽样与非概率抽样,每大类中又有许多可供选择的具体方法。
(5)确定样本量
一旦选定抽样方法,下一步就要确定合适的样本量。样本量的确定方法将在样本量确定单元中给出。
(6)制定抽样计划
无论使用概率或非概率抽样,在一个研究项目的资料收集阶段必须指定和明确选择样本单位的操作程序。对于成功的概率抽样的来说,这个程序更为重要,必须详细、清晰。若不能知道合适的选择样本单位的操作程序,则整个抽样程序会陷入困境。
(7)抽样计划的实施
在实施适于操作的抽样计划前,应先对其进行讨论研究。这一步很重要,它包括检查、确定是否要根据拟好的详细程序来实施计划。
样本量确定
确定样本的数量是抽样调查中的重要环节,在充分满足调查内容要求情况下合理的确定样本量不能不说是摆在每个调查公司面前的重要课题,过多的样本量设计只会给客户增加经济负担。
概率抽样的基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。因此,样本量的设计并不是越大越好,通常会受到经济条件的制约。
通常,在概率抽样的情况下,在确定样本量时会遇到如下情况:
预算:预算的多少直接影响着调查样本量的设计,通常某一项调查为满足调查要求必须有一个最低的预算指标。如果低于这个指标的预算,不能满足调查最低精度的话,建议要放弃这项调查任务。
子群分析:在任何样本量确定的过程中,都必须考虑被调查样本的子群数。也就是说,当被调查样本群子群数比较多的时候,样本量就必须相应扩大。如:某一项调查 400 个样本量是基本满足要求的,但如果将这些样本量划分为男和女各占 50 %的话,那么,每个子群只有 200 个样本。如果进一步按年龄组细分的话,假设是两个年龄组,那每一个子群只有 100 个样本,这样的样本量就不能满足最初设计的要求了,因此必须按照子群要求设计样本量则是最合理的。
统计分析:友邦顾问在确定样本量时通常在考虑上述具体情况下,会考虑如下统计方面的因素,即:总体调查标准差;抽样允许的误差和预期置信度。
样本量确定公式:在充分考虑所有统计因素基础上,友邦公司通常采用的简单随机抽样(特别是估计平均值时)的公式为:
n = z 2 σ 2 / e 2
其中, n 为适合的样本量; z 为调查置信度; σ 为总体标准差; e 为抽样误差范围
在解决“比例”方面的调查问题时,采用的抽样公式为:
n = z 2 [p(1-p)] / e 2
其中, n 为适合的样本量; z 为调查置信度; p 为样本的离散程度; e 为抽样误差范围
抽样方案设计篇七
在确定了研究对象的纳入、排除标准,即划分好设计人群后,从总体中抽取研究样本。抽样的方法非常重要,直接决定了样本是否能够代表总体,也就是外在真实性如何。
简单随机抽样(simple random sampling)是把符合要求的每一个个体都作为抽样的对象,通过随机化抽取,每个个体被抽中的机会是相等的。因为每个个体被抽中的机会是均等的,所以能保证研究样本对总体的代表性。举个小例子,假设我们研究需要从中抽取200人作为研究样本,总体为1000,如果采用简单随机抽样的方法来获得研究样本,那么总体中每个人被我们抽中的机率都是1/5。
简单随机抽样的优点是能获得良好代表性的研究样本,操作实施也比较容易理解;其缺点是在抽样范围较大时,需要对总体中每个研究对象进行编号并收集基本信息,工作量太大从而影响研究可行性。另一方面,当某一重要研究因素在人群中分布不均匀时,采用简单随机抽样可能会导致在总体中占比例较少的个体被遗漏,从而导致选择偏倚。分层抽样则可以很好地解决这一问题。
分层抽样(stratified sampling)是从分布不均匀的研究人群中抽取有代表性样本的方法。先按照研究对象的属性(如年龄、性别、病情、病程、临床亚型、职业、教育程度、民族等)将研究人群分为若干层,然后在每层内再开展随机抽样。
一定要注意,分层抽样要求层内变异越小越好,层间变异越大越好,这样可以提高样本的代表性,便于层间进行比较。分层随机抽样不能保证每个个体被抽中的概率相等,有可能处于不同分层之间的个体被抽中概率是不同的。
系统随机抽样也称机械随机抽样或等距随机抽样,即将总体单位按某一标志(如时间)排序,然后按一定间隔来随机抽取样本单位。例如,要从100件产品中抽取10件组成样本,首先将100件产品按某一标志排序,顺序编号为1~100;然后用抽签或查随机数表的方法确定1~10号中入选样本的编号(假定为4号);然后按等距原则依次确定入选样本的产品编号为14、24、34、44、54、64、74、84、94;最后由编号为4、14、24、34、44、54、64、74、84、94的10件产品组成样本。
整群抽样又称聚类抽样,是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群。然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
抽样方案设计篇八
简单抽样
总体内的各个个体被抽到的机会均等,就把这种抽样方法叫做简单随机抽样.
常用的简单随机抽样方法有两种——抽签法和随机数法.
特点:
1.总体个数是有限的.
2.被抽取的样本数n小于总体的个数n.
3.逐个抽取且不放回.
4.每个个体被抽到的概率都相等.
【总结】在简单随机抽样中,个体被抽到的概率与抽样次数无关,每次抽到的可能性均相等.
系统抽样
当总体的个数n较大时,将总体按照一定的顺序排列,采用简单随机抽样抽取第一个样本单元,再按顺序抽取其余的样本单元来得到所需要的样本,这种抽样叫做系统抽样,也叫等轴抽样.
系统抽样的步骤:
假设要从容量为n的总体中抽取容量为n的样本,步骤为:
(1)先将总体的n个个体编号.
例4.某学校有20__名学生,需从中抽取100个进行健康检查,采用何种抽样方法较好,并写出抽样过程.
【分析】总体中个体个数达20__,样本容量也达到100,用简单随机抽样中的抽签法与随机数法都不易操作,所以,采用系统抽样方法较好.于是,我们可以用系统抽样法进行抽样.具体步骤是:
(1)将总体中的个体编号为1,2,3,…,20__;
(3)在第一段1~20中用简单随机抽样确定起始编号,例如抽到5;
(4)将编号为5,25,45,…,1985的个体抽出,得到样本容量为100的样本.
例5.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是().
a.分层抽样 b.简单随机抽样
c.系统抽样 d.以上都不对
【分析】按照一定的规律进行抽取的抽样方法为系统抽样.
例6.某班级共有学生52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号同学在样本中,那么样本中还有一个同学的学号为________.
【分析】用系统抽样的方法是等距的.42-29=13,故样本中另外一个同学的编号为3+13=16.
例7.采用系统抽样的方法,从个体数为1 003的总体中抽取一个容量为50的样本,则在抽样过程中,被剔除的个体数为________,抽样间隔为________.
【分析】因为1003÷50=20...3,余数为3,为使总体中的个体数能够被50整除,需要剔除3,抽样间隔即为20.
【总结】系统抽样适用于总体中个体数较大且个体差异不明显的情况;若总体不能被所需样本数整除,则需要剔除余数,重新编号,取得整数.
分层抽样
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
分层抽样适用的条件:总体由差异明显的几部分组成.
例6.有40件产品,其中一等品10件,二等品25件,次品5件,现从中抽出8件进行质量分析,问应采取何种抽样方法().
a.抽签法 b.随机数表法
c.系统抽样 d.分层抽样
【分析】总体由差异明显的几部分组成,故应该用分层抽样.
例7.某城市有学校700所.其中大学20所,中学200所,小学480所,现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为().
a.70 b.20
c.48 d.2
【分析】由于学校总数为700所,所以抽样比为
【总结】当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样.
总结
抽样方案设计篇九
简单随机抽样
一般,设一个总体含有n个个体,从中逐个不放回地抽取n个个体作为样本(n≤n),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样。
简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。
直接抽选法。例如某项调查采用抽样调查的方法对某市职工收入状况进行研究,该市有职工56,000名,抽取5,000名职工进行调查,他们的年平均收入为10,000元,据此推断全市职工年收入为8,000--12,000元之间。
抽签法又称“抓阄法”。它是先将调查总体的每个单位编号,然后采用随机的方法任意抽取号码,直到抽足样本。在这里选取一个案例说明,如要在10个人中选取3个人作为代表,先把总体中的10个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取3次,就得到一个容量为3的样本。这就是抽签法,与直接抽样法类似。
另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。下面是随机数字表:
当然,随机抽样也有不足之处,它只适用于总体单位数量有限的情况,否则编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知信息等。在市场调研范围有限,或调查对象情况不明,难以分类,或总体单位之间特性差异程度小时采用此法效果较好。
抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便。如果标号的签搅拌得不均匀,会导致抽样不公平。而随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。
2分层抽样
分层抽样又称分类抽样或类型抽样,是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。一般地,在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取一定数量的个体,将各层次取出的个体合在一起作为样本。
分层抽样尽量利用事先掌握的信息,并充分考虑了保持样本结构和总体结构的一致性,这对提高样本的代表性是很重要的。当总体是由差异明显的几部分组成时,往往选择分层抽样的方法。其特点是将科学分组法与抽样法结合在一起,每个个体被抽到的概率都相等n/m。分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。
下面,是一个实例应用:
某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,应进行如下抽样,如图:
分层抽样与简单随机抽样相比,往往选择分层抽样,因为它有显著的潜在统计效果。也就是说,如果从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
总体中赖以进行分层的变量为分层变量,理想的分层变量是调查中要加以测量的变量或与其高度相关的变量。分层的原则是增加层内的同质性和层间的异质性。常见的分层变量有性别、年龄、教育、职业等。分层随机抽样在实际抽样调查中广泛使用,在同样样本容量的情况下,它比纯随机抽样的精度高,此外管理方便,费用少,效度高。
3系统抽样
系统抽样也称为等距抽样、机械抽样、sys抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1~n相继编号,并计算抽样距离k=n/n。式中n为总体单位总数,n为样本容量。然后在1~k中抽一随机数k1,作为样本的第一个单位,接着取k1+k,k1+2k……,直至抽够n个单位为止。
根据总体单位排列方法,系统抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。按照具体实施等距抽样的作法,系统抽样可分为:直线系统抽样、对称系统抽样和循环系统抽样三种。
在定量抽样调查中,系统抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。系统抽样得到的样本几乎与简单随机抽样得到的样本是相同的。
下面看一个例子,某产品的口味测试,需要运用等距抽样的方法从某校营销专业90名学生中抽选9名进行测试,如下图:
系统抽样方式也不是完美的,它相对于简单随机抽样方式最主要的优势就是经济性。系统抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用系统抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。由此可见,只要抽样者对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。
4整群抽样
整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
整群抽样优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等。
整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本时从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。
以上几种抽样方法的误差程度排序从大到小一般是:整群抽样、简单随机抽样、系统抽样、分层抽样。
5配额抽样
配额抽样也称“定额抽样”,是指调查人员将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。
例如一在一项关于某品牌洗发水的消费者座谈会的研究抽样中,研究对象为18—40岁的女性。已确定样本量为24人。研究者选择“经济收入”和“发型”为控制特征;并要求高低收入者各占50%,烫、直发型各占50%。根据上述要求一个配额抽样的控制表便可设计出来。如下表:
配额抽样和分层随机抽样相比较,既有相似之处,也有很大区别。配额抽样和分层随机抽样有相似的地方,都是事先对总体中所有单位按其属性、特征分类,这些属性、特征我们称之为“控制特性。”例如市场调查中消费者的性别、年龄、收入、职业、文化程度等等。然后,按各个控制特性,分配样本数额。但它与分层抽样又有区别,分层抽样是按随机原则在层内抽选样本,而配额抽样则是由调查人员在配额内主观判断选定样本。实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。
小结
数学抽样在生活中发挥着重要的作用,在我国,抽样法已被广泛应用于生产技术及社会生活各个领域。目前,国家统计调查制度中所包括的统计指标,依靠抽样方法取得的资料已达到三分之一左右。在城乡住户调查、农产品调查、价格统计、市场调查等领域,应用抽样调查已取得很好的成果,在人口统计、社会统计、交通统计、商业统计等领域,抽样调查也正在发挥越来越重要的作用。随着我国社会主义市场经济的发展,抽样调查的应用范围将逐渐扩大,所发挥的作用也将越来越大。
抽样方案设计篇十
01 非概率抽样(non-probability sampling)
又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。
其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。
常用的非概率抽样方法有以下四类:
▷ 方便抽样(convenience sampling)
指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。
优点:适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。
缺点:抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。
▷ 判断抽样(judgment sampling)
指由专家判断而有目的地抽取他认为“有代表性的样本”。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。
优点:适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。
缺点:该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。
▷ 配额抽样(quota sampling)
指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。
相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。
优点:适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。
缺点:容易掩盖不可忽略的偏差。
▷ 滚雪球抽样(snowball sampling)
指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象。
第一批被访者是采用概率抽样得来的,之后的被访者都属于非概率抽样,此类被访者彼此之间较为相似。例如:如在目前中国的小轿车车主等。
优点:可以根据某些样本特征对样本进行控制,适用寻找一些在总体中十分稀少的人物。
缺点:有选择偏差,不能保证代表性。
02 概率抽样(probability sampling)
又称随机抽样,指在总体中排除人的主观因素,给予每一个体一定的抽取机会的抽样。
其特点为,抽取样本具有一定的代表性,可以从调查结果推断总体;操作比较复杂,需要更多的时间,而且往往需要更多的费用。
常用的有以下六种类型:
▷ 简单抽样(simple sampling)
简单随机抽样(simple random sampling)又称纯随机抽样,是概率抽样的最基本形式。它是按等概率原则直接从含有n个元素的总体中随机抽取n个元素组成样本(n>n)。
常用的办法类似于抽签,即把总体的每一个单位都编号,将这些号码写在一张张小纸条上,然后放入一容器(如纸盒、口袋)中,搅拌均匀后,从中任意抽取,直到抽够预定的样本数目。这样,由抽中的号码所代表的元素组成的就是一个简单随机样本。
比如,某系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取出60人进行调查。为了保证抽样的科学性,他们先从系办公室得到一份全系学生的名单,然后给名单中的每个学生都编上一个号(从001到300)。抽样框编好后,他们又用300张小纸条分别写上001,002,…,300。他们把这300张写好不同号码的小纸条放在一个盒子里,搅乱后,随便摸出60张小纸条。然后,他们按这60张小纸条上的号码找到总体名单上所对应的60位同学。这60位同学就构成了他们本次的样本。这种方法简便易学。但当总体元素很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法往往在总体元素较少时使用。
对于总体元素很多的情形,我们则采用随机数表来抽样。本书后就附有一张随机数表,表中的数码和排列都是随机形成的,没有任何规律性(故也称为乱数表)。利用随机数表进行抽样的具体步骤是:
先取得一份总体所有元素的名单(即抽样框);
将总体中所有元素一一按顺序编号;
根据总体规模是几位数来确定从随机数表中选几位数码;
以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;
根据样本规模的要求选择出足够的数码个数;
依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。
▷ 系统抽样(systematic random sampling)
将总体中的各单元先按一定顺序排列,并编号,然后按照不一定的规则抽样。其中最常采用的是等距离抽样,即根据总体单位数和样本单位计算出抽样距离(即相同的间隔),然后按相同的距离或间隔抽选样本单位。例如:从1000个电话号码中抽取10个访问号码,间距为100,确定起点(起点<间距)后每100号码抽一访问号码。
系统抽样的具体步骤是:
给总体中的每一个个体按顺序编号,即制定出抽样框。
计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为n,样本规模为n,那么抽样间距k就由下列公式求得:
k(抽样间距)=n(总体规模)n(样本规模)
在最前面的k个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为a),它称做随机的起点。
在抽样框中,自a开始,每隔k个个体抽取一个个体,即所抽取个体的编号分别为a,a+k,a+2k,…,a+(n-1)k。
将这n个个体合起来,就构成了该总体的一个样本。
优点:兼具操作的简便性和统计推断功能,是目前最为广泛运用的一种抽样方法。如果起点是随机确定的,总体中单元排列是随机的,等距抽样的效果近似简单抽样;与简单抽样相比,在一定条件下,样本的分布较好。
缺点:抽样间隔可能遇到总体中某种未知的周期性,导致“差”的样本;未使用可能有用的抽样框辅助信息抽取样本,可能导致统计效率低。
▷ 分层抽样(stratified random sampling)
是把调查总体分为同质的、互不交叉的层(或类型),然后在各层(或类型)中独立抽取样本。例如:调查零售店时,按照其规模大小或库存额大小分层,然后在每层中按简单随机方法抽取大型零售店若干、中型若干、小型若干;调查城市时,按城市总人口或工业生产额分出超大型城市、中型城市、小型城市等,再抽出具体的各类型城市若干。
优点:适用于层间有较大的异质性,而每层内的个体具有同质性的总体,能提高总体估计的精确度,在样本量相同的情况下,其精度高于简单抽样和系统抽样;能保证“层”的代表性,避免抽到“差”的样本;同时,不同层可以依据情况采用不同的抽样框和抽样方法。
缺点:要求有高质量的、能用于分层的辅助信息;由于需要辅助信息,抽样框的创建需要更多的费用,更为复杂;抽样误差估计比简单抽样和系统抽样更复杂。
在实际运用分层抽样的方法时,研究者需要考虑下列两个方面的问题
(1)分层的标准问题。同一个总体可以按照不同的标准进行分层,或者说,根据不同的标准可以将一个总体分成不同的类别或层次。那么,在实际抽样中究竟应该按什么标准来分层呢?通常采用的原则有:
第一,以所要分析和研究的主要变量或相关的变量作为分层的标准。比如,若要研究居民的消费状况和消费趋向,可以以居民家庭人均收入作为分层标准;又如,要了解社会研究中不同职业的人员对社会经济改革的看法,就可以以人们的职业作为分层的标准。
第二,以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。比如在工厂进行,可以以工作性质作为分层标准,将全厂职工分为干部、工人、技术人员、勤杂人员等几类来进行抽样。
第三,以那些已有明显层次区分的变量作为分层变量。比如在社会研究中,性别、年龄(当然是分段以后,如老、中、青)、文化程度、职业等等,就经常被用作分层的标准;其他如学生按年级、专业、学校类型分层,城市按人口规模分层等等。
(2)分层的比例问题。分层抽样中有按比例和不按比例分层两种方法。按比例分层抽样是指按总体中各种类型或层次的比例来抽取子样本的方法。即在单位多的类型或层次中所抽的子样本就大一些,在单位少的类型或层次中所抽的子样本就小一些。比如,某厂有工人600人,按性别分层则有男工500人,女工100人。总体中两类工人人数的比例为5∶1。因此,若要抽60人作样本,那么,按比例的抽法就是根据上述比例,分别从500名男工中随机抽取50人,而从100名女工中随机抽取10人。这样,样本中男女工人之比与总体中男女工人之比完全相同,均为5∶1。可以说,样本的性别结构是总体中性别结构的一种缩影。
采取按比例分层抽样的方法,可以确保得到一个在某种特征上与总体结构完全一样的样本。但是,在有些情况下,又不宜采用这种方法。例如,有时总体中有的类型或层次的单位数目太少,若以按比例分层的方法抽样,则有的层次在样本中个案太少,不便于了解各个层次的情况,这时往往要采取不按比例抽样的方法。比如上例中,样本中女工人数过少,此时我们可以采取不按比例抽样的方法,在500名男工中抽30人,在100名女工中也抽30人。这样,样本就能较好地反映出男女两类工人的一般状况,我们也能很好地对男女两类工人的情况进行比较和分析。
需要但注意的是,我们采用不按比例分层抽样的方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较,但若要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,即通过调整样本中各层的比例,使数据资料恢复到总体中各层实际的比例结构。比如上例中,若要用30个男工、30个女工的收入资料去推断全厂工人的平均收入时,就需要在男工的收入后乘以5/3,而在女工的收入后乘以1/3,再加总平均,否则就会导致推断的偏误。
▷ 整群抽样(cluster sampling)
是先将调查总体分为群,然后从中抽取群,对被抽中群的全部单元进行调查。例如:入户调查,按地块或居委会抽样,以地块或居委会等有地域边界的群体为第一抽样单位,在选出的地块或居委会实施逐户抽样;市场调查中,最后一级抽样时,从居委会中抽取若干户,然后调查抽中户家中所有18岁以上成年人。
优点:适用于群间差异小、群内各个体差异大、可以依据外观的或地域的差异来划分的群体。
缺点:群内单位有趋同性,其精度比简单抽样为低。
▷ 多级抽样(multistage sampling)
也叫多阶段抽样或阶段抽样,以二级抽样为例,二级抽样就是先将总分组,然后在第一级和第二中分别随机地抽取部分一级单位和部分二级单位。例如:以全国性调查为例,当抽样单元为各级行政单位时,按社会发展水平分层后(或按经济发展水平,或按地理位置分层),从每层中先抽几个地区,再从抽中的地区抽市、县、村,最后再抽至户或个人。
优点:具体整体抽样的简单易行的优点,同时,在样本量相同的情况下又整群抽样的精度高。
缺点:计算复杂。
▷ 抽中概率与规模成比例抽样(pps)
是不等概率中最常用的一种方法,指在总体中参照各单位的规模进行抽样,规模大的被抽取的机会大,总体中每个个体被抽中的概率与该个体的规模成正比的抽样。例如:在进行企业调查时,根据pps抽样方法抽取企业,令规模大的企业被抽取机会大。
优点:使用了辅助信息,可以提高抽样方案的统计效率。
缺点:如果研究指标与规模无直接关系时,不合适采取这种方法。
此外,在抽样方法划分上,还有多阶段抽样和两相抽样等,有兴趣的读者可参阅其他相关书籍。
前面谈到抽样方法的一些基本分类和各自特点,需要注意的是,在实际的运用中,一个调查方案常常不是只局限于使用某一种抽样方式,而根据研究时段的不同采用多种抽样方法的组鸽为实现不同的研究目的,有时甚至在同一时段综合运用几种抽样方法。
例如,设计一个全国城市的入户项目,在抽样上可以分为几个不同的步骤,包括:
在项目正式开始前,可以采用判断抽样法选出某一城市先作试点,在问卷设计初期可以采用任意抽样法选出部分人群进行问卷试访。
采用分层随机抽样法,确定全国要分别在多少个超大型市、多少个大型市、多少个中型市、多少个小型市实施(先分出城市的几个层次,再依据研究需要在各层用pps法选取具体城市)
采用简单抽样法或pps抽样法,确定抽出城市中应抽的地块或居委会;
采用整群抽样法,确定抽出地块或居委会应访问的家庭户;
在项目后期,可以采用判断抽样法选取某城市进行深入研究。
抽样方案设计篇十一
概率抽样方法
(1)概率抽样概念
定量市场调查中的概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。在实际应用中,概率抽样方法是最常用的方法之一。
概率抽样包括以下几个方面的优点:
调查者可获得被抽取的不同年龄、不同层次的人们的信息;
能估算出抽样误差;
调查结果可以用来推断总体。例如,在一项使用概率抽样法的调查中,如果有 5 %的被访者给出了某种特定回答,那么,调查者就可以以此百分比再结合抽样误差,推及总体情况。
另一方面,概率抽样也有一些弊病:
在大多数案例中,同样规模的概率抽样的费用要比非概率抽样高;
概率抽样比非概率抽样需要更多时间策划和实施;
必须遵守的抽样计划执行程序会大量增加收集资料的时间。
下面,介绍几种最常采用的概率抽样技术。
(2)简单随机抽样( simple sampling )
简单随机抽样是一种广为使用的概率抽样方法。是最完全的概率抽样。如前面提到的,随机抽样就是总体中每个单位在抽选时有相等的被抽中的机会。
在简单随机抽样条件下,抽样概率公式为:
抽样概率=样本单位数∕总体单位数
例如,如果总体单位数为 10000 ,样本单位数为 400 ,那么抽样概率为 4 %。
简单随机抽样的优点在于,它看起来简单,并且满足概率抽样的一切必要的要求,保证每个总体单位在抽选时都有相等的被抽中的机会。简单随机抽样可以通过电话随机拨号功能完成这个步骤,可以从电脑档案中挑选调查对象。
(3)等距抽样( systematic sampling )
在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。
等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。
样本距离可通过下面公式确定:
样本距离 = 总体单位数∕样本单位数
例如,假设你使用本地电话本并确定样本距离为 100 ,那么 100 个中取 1 个组成样本。这个公式保证了整个列表的完整性。
等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第 5 页开始,在该页上再另选一个数决定从该行开始。假定选择从第 3 行开始,这就决定了实际开始的位置。
等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。
(4)分层抽样( stratified random sampling )
定量调查中的分层抽样是一种卓越的概率抽样方式,在调查中经常被使用。
分层抽样的具体程序是:把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性),从两个或两个以上的组中进行简单随机抽样,样本相互独立。
总体各单位按主要标志加以分组,分组的标志与我们关心的总体特征相关。例如,我们正在进行有关啤酒品牌知名度方面的调查,初步判别,在啤酒方面男性的知识与和女性不相同,那么性别应是划分层次的适当标志。如果不以这种方式进行分层抽样,分层抽样就得不到什么效果,花再多时间、精力和物资也是白费。
分层抽样与简单随机抽样相比,我们往往选择分层抽样,因为它有显著的潜在统计效果。也就是说,如果我们从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
在调查实践中,为提高分层样本的精确度实际上要付出一些代价。通常,我们现实正确的分层抽样一般有三个步骤:
首先,辩明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。例如,研究某种产品的消费率时,按常理认为男性和女性有不同的平均消费比率。为了把性别作为有意义的分层标志,调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。用这种方式可识别出各种不同的显著特征。调查表明,一般来说,识别出 6 个重要的显著特征后,再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。
第二,确定在每个层次上总体的比例(如性别已被确定为一个显著的特征,那么总体中男性占多少比例,女性占多少比例呢?)。利用这个比例,可计算出样本中每组(层)应调查的人数。
最后,调查者必须从每层中抽取独立简单随机样本。
(5)整群抽样( cluster sampling )
以上各种抽样类型全部是按单位抽取的,即按样本单位数,分别一个单位一个单位地抽取。在整群抽样中,样本是一组单位一组单位地抽取。
整群抽样有两个关键步骤:
同质总体被分为相互独立的完全的较小子集。
随机抽选子集构成样本。
如果调查者在抽中的子集中观察全部单位,我们就有了一级整群样本。如果在抽中的子集中再以概率方式抽取部分单位观察,我们就有了二级整群样本。分层和整群抽样都要将总体分为相互独立的完全子集。它们的区别是,分层抽样的样本是从每个子集中抽取,而整群抽样则是抽取部分子集。
地理区域抽样是整群抽样的典型方式。挨门挨户去调查一个特定城市的调查者也许会随机抽选一些区域,较集中地访查一些群体,大量减少访问时间和经费。整群抽样被认为是概率抽样技术,因为它随机抽出群和随机抽出单位。值得注意的是,在整群抽样下,我们假定群中单位与总体一样存在异质性。如果一群中单位的特征非常相似,如果由于共同环境使群内差异小而群与群之间差异大。一般来说,要解决这个问题可以扩大群数,然后从各群中抽取少量单位数,以保证样本的代表性。
非概率抽样方法
(1)非概率抽样的概念
非概率抽样也是市场调查中比较常采用的手段之一,如配额抽样等。非概率抽样是指从总体中非随机地选择特定地要素(单位)。有目的的非随机抽样可能会系统地排除或过分强调总体的某些部分特征。
非概率抽样的缺点恰是概率抽样的优势:
不能估计出抽样误差;
不知道抽中的单位所具有代表性的程度;
非概率抽样的结果不能也不应该推算总体。
在实际操作过程中,非概率抽样经常被市场调研人员使用,其原因与本身固有的优势有关:
非概率抽样比概率抽样费用低。非概率抽样的这一特点对那些精确性要求补不严格的调查有相当大的吸引力。试探性调查就是其中的一例。
一般来讲,非概率抽样实施起来要比概率抽样用的时间少。
由于非概率抽样具有上述的不足,因此,如果合理运用非概率抽样,它能产生极具代表性得合理的抽样结果,是我们经常思考并试图解决的一个重要问题。在实际应用过程中,非概率抽样的结果不能计算其抽样误差,这意味着评估非概率抽样的总体质量有很大的困难,因为我们清楚地知道它们不满足概率抽样所必需的标准,但问题是它们脱离标准有多远?调查设计者事先必须对非概率抽样进行评估,评估应该建立在对非概率抽样方法论仔细评价的基础上。评估需要注意的是,使用的抽样方法是否能够覆盖目标总体的各个部分?或者样本是否无目的地倾向于一些特殊群体?这些都是友邦顾问调查人员在调查设计与抽样评估时必须仔细考虑的问题。
在实际工作中,我们经常使用的非概率抽样方法包括四类:方便抽样、判断抽样、配额抽样和滚雪球抽样。
方便抽样( convenience sampling )
方便抽样是根据调查者的方便性,以无目标、随意的方式进行的抽样调查活动。例如,常见的无限制的街头拦访和随意的入户访问就是方便抽样的常见形式。在某些调查测试中,方便抽样会取得快速有效的结果。在进行探索性调研时,即缺乏经验而又急需真实数据的近似值时,这种方法也很实用。
判断抽样( judgment sampling )
判断抽样适用于调查员或者调查专家基于选择标准或者条件抽取典型样本的情况。一般商业机构进行的市场或产品测试调查基本上都属于判断抽样的范围。在进行探索性调研时,如抽取深度访谈样本的情况下,就可以采用这种方法。
配额抽样( quota sampling )
配额抽样是根据一定标志对总体分层或分类后,从各层或各类中主观地选取一定比例的调查单位的方法。所谓“配额”是指对划分出的总体各类型都分配给一定的数量而组成调查样本。因而,配额抽样较之判断抽样加强了对样本结构与总体结构在“量”的方面的质量控制,能够保证样本有较高的代表性。配额抽样类似于随机抽样中的分层抽样。不过,有两点重要的区别:首先,配额抽样的被调查者不是按随机原则抽出来的,而分层抽样必须遵守随机原则。其次,在分层抽样中,用于分类的标志,应联系研究目标来选择,而配额抽样无此要求。
滚雪球抽样( snowball sampling )
滚雪球抽样是指先对随机选择的一些被调查者实施访问,然后再请他们推荐属于研究目标总体特征的调查对象。这种方法用于低发生率或少见的总体中进行抽样,因为要找到这些少见的个体,代价是很大的,使得调查人员因为费用的原因不得不使用类似滚雪球这样的抽样技巧。
滚雪球抽样调查的优点是调查费用大大减少,然而这种成本的节约是以调查质量的降低为代价的。整个样本很可能出现偏差,因为那些个体的名单来源于那些最初调查过的人,而他们之间可能十分相似,因此,样本可能不能很好地代表整个总体。另外,如果被调查者不愿意提供人员来接受调查,那么这种方法就会受阻。