1、如果你想知道全班同学对新闻、体如果你想知道全班同学对新闻、体育、动画、娱乐、戏曲五类电视节育、动画、娱乐、戏曲五类电视节目的喜爱情况,你会怎样做?目的喜爱情况,你会怎样做?溶溪镇中学:何华教学目标:教学目标:1.知道调查有普查和抽样调查两种方式知道调查有普查和抽样调查两种方式,明明确普查的局限性和抽样调查的必要性确普查的局限性和抽样调查的必要性.2.明确总体、个体和样本的意义及区别,明确总体、个体和样本的意义及区别,并体会选取有代表性的样本对正确估计并体会选取有代表性的样本对正确估计总体的重要性。总体的重要性。3.掌握抽样技术的分类及选择掌握抽样技术的分类及选择要调查下面几个问题,你认为应该作
2、全面调查还是要调查下面几个问题,你认为应该作全面调查还是抽样调查抽样调查.(1 1)要调查市场上某种食品含量是否符号国家标准)要调查市场上某种食品含量是否符号国家标准(2 2)检测某城市的空气质量)检测某城市的空气质量(3 3)调查一个村子所有家庭的收入)调查一个村子所有家庭的收入(4 4)调查人们对保护环境的意识)调查人们对保护环境的意识(5 5)调查一个班级中的学生对建立班级英语角的看法)调查一个班级中的学生对建立班级英语角的看法(6 6)调查人们对电影院放映的电影的热衷程度)调查人们对电影院放映的电影的热衷程度解解(1)抽样调查抽样调查 (2 2)抽样调查抽样调查 (3 3)全面调查全面
3、调查 (4 4)抽样调查抽样调查 (5 5)全面调查全面调查 (6 6)抽样调查抽样调查普普查查:全面调查叫做普查全面调查叫做普查抽样调查抽样调查:抽取一部分进行调查叫抽样调查。抽取一部分进行调查叫抽样调查。例例:下列调查下列调查,哪些是普查哪些是普查,哪些是抽样哪些是抽样调查?并说明该种调查方式是否恰当调查?并说明该种调查方式是否恰当?为了了解为了了解07级工商二班每个学生的视级工商二班每个学生的视力情况,对全班同学进行调查。力情况,对全班同学进行调查。普查普查为了了解参加某运动会的全体运动员为了了解参加某运动会的全体运动员的年龄情况,从中抽取了一代表队的的年龄情况,从中抽取了一代表队的运动
4、员进行了统计。运动员进行了统计。灯泡厂为了了解一批灯泡的使用寿命,灯泡厂为了了解一批灯泡的使用寿命,从中选取了从中选取了10个灯泡进行了试验。个灯泡进行了试验。抽样调查抽样调查抽样调查抽样调查第一节 抽样调查概述1776年,法国经济学家麦桑斯年,法国经济学家麦桑斯在在法国人口论法国人口论一书中,一书中,以部以部分地区的人口清查数来推算全国人口数分地区的人口清查数来推算全国人口数。一、抽样调查的历史与应用1802年,法国数学家拉普拉斯调查了年,法国数学家拉普拉斯调查了30个县的人口数,得出人个县的人口数,得出人口出生率为口出生率为35.27;后来他后来他出版了出版了概率分析理论概率分析理论一书。
5、一书。1895年,在第五届国际统计学会上,挪威统计局局长凯尔提出年,在第五届国际统计学会上,挪威统计局局长凯尔提出了所谓了所谓“代表性调查代表性调查”的抽样方法。的抽样方法。1925年,在第十六次国际统计学会上,鲍莱的年,在第十六次国际统计学会上,鲍莱的抽样精确度的抽样精确度的测定测定和詹森的和詹森的代表性方法和实践代表性方法和实践两个报告,都从理论上两个报告,都从理论上肯定了随机抽样的科学性。此后,抽样调查为各国普遍采用。肯定了随机抽样的科学性。此后,抽样调查为各国普遍采用。第一节第一节 抽样调查概述抽样调查概述我国对抽样调查的应用始于我国对抽样调查的应用始于20世纪三十年代,北京大学许宝世
6、纪三十年代,北京大学许宝騄教授所著的騄教授所著的抽样论抽样论,为开展抽样调查提供了方法依据。,为开展抽样调查提供了方法依据。1943年,在清华大学陈达教授的主持下,我国进行了云南户籍年,在清华大学陈达教授的主持下,我国进行了云南户籍示范人口普查。并用抽样调查方法核对了普查结果。示范人口普查。并用抽样调查方法核对了普查结果。1955年,我国第一次在全国范围内,按统一方案、统一计划进年,我国第一次在全国范围内,按统一方案、统一计划进行了农民家庭进行抽样调查。行了农民家庭进行抽样调查。1981年年9月,国家统计局在月,国家统计局在关于加强和改革统计工作的报告关于加强和改革统计工作的报告中提出:中提出
7、:“凡是适合用抽样调查的,就不用全面报表凡是适合用抽样调查的,就不用全面报表”。1994年,我国确立了以周期性普查为基础,以经常性抽样调查年,我国确立了以周期性普查为基础,以经常性抽样调查为主体,同时辅之以重点调查、科学核算等综合运用的统计调为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系,抽样调查的主体方法地位得以正式确立。查方法体系,抽样调查的主体方法地位得以正式确立。二、抽样调查的概念和特点(一一)抽样调查的概念抽样调查的概念是按照随机原则从调查对象的总体中抽取部分单位进行调查,是按照随机原则从调查对象的总体中抽取部分单位进行调查,并根据这部分单位的调查结果推断总体的数量
8、特征。并根据这部分单位的调查结果推断总体的数量特征。总体总体总体总体样本样本推断推断随机抽取随机抽取第一节第一节 抽样调查概述抽样调查概述需要调查北京市民对交通规则的观点;需要调查北京市民对交通规则的观点;对对象象是所有市民,是所有市民,目的是希望知道市民中对该问题的不同看目的是希望知道市民中对该问题的不同看法各自占有的比例法各自占有的比例显然,不可能去问所有的北京市民,而只显然,不可能去问所有的北京市民,而只能够问一部分;能够问一部分;并且根据这一部分的观点来理解整个北京并且根据这一部分的观点来理解整个北京市民的总体观点。市民的总体观点。总体:所要考察的对象的全体叫做总总体:所要考察的对象的
9、全体叫做总体。体。个体:把组成总体的每一个考察对象个体:把组成总体的每一个考察对象叫做个体。叫做个体。样本:从总体中取出的一部分个体叫样本:从总体中取出的一部分个体叫 做这个总体的一个样本。做这个总体的一个样本。抽样调查的基本概念抽样调查的基本概念(一一)全及总体和抽样总体全及总体和抽样总体(总体和样本总体和样本)全全及总体:所要调查观察的全部事物。及总体:所要调查观察的全部事物。总体单位数用总体单位数用N N表示。表示。抽抽样总体:抽取出来调查观察的单位。样总体:抽取出来调查观察的单位。抽样总体的单位数用抽样总体的单位数用n n表示。表示。n n 30 30 大样本大样本 n 30 n 30
10、 小样本小样本(二二)全及指标和抽样指标全及指标和抽样指标(总体指标和样本指标总体指标和样本指标)全全及指标:全及总体的那些指标。及指标:全及总体的那些指标。抽抽样指标:抽样总体的那些指标。样指标:抽样总体的那些指标。抽抽样框样框 即总体单位的名单,是指对可以选择作为即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以样本的总体单位列出名册或顺序编号,以确定总体的抽样范围和结构。确定总体的抽样范围和结构。样样本个数本个数指从总体中可能抽取的样本的数量。指从总体中可能抽取的样本的数量。样样本容量本容量指一个样本所包括的单位数。指一个样本所包括的单位数。在抽取样本时,如果总体中
11、的每一个体都有同在抽取样本时,如果总体中的每一个体都有同等机会被选到样本中,这种抽样称为等机会被选到样本中,这种抽样称为简单随机简单随机抽样(抽样(simplerandomsampling),),而这样得到的样本则称为而这样得到的样本则称为随机样本(随机样本(randomsample)。)。如果总体是一锅八宝粥,随机样本则是充如果总体是一锅八宝粥,随机样本则是充分搅拌后的八宝粥中的任意一勺分搅拌后的八宝粥中的任意一勺该勺中的八宝粥的成分比例应该和整个一该勺中的八宝粥的成分比例应该和整个一锅粥类似锅粥类似搅拌越充分,样本的代表性也越好搅拌越充分,样本的代表性也越好总体这个企业员工的月平均收入是多
12、少?信息由样本信息作为总体信息估计值从总体中抽取一小部分样本为了了解全校学生的平均身高,小明调查为了了解全校学生的平均身高,小明调查了座位旁边的了座位旁边的3名同学,把他们的身高的平名同学,把他们的身高的平均值作为全校学生平均身高的估计。均值作为全校学生平均身高的估计。、小明的调查是抽样调查吗?、小明的调查是抽样调查吗?、如果是抽样调查,指出调查的总体、如果是抽样调查,指出调查的总体、样本、个体和样本容量。样本、个体和样本容量。、这个调查结果能较好反映总体的情况、这个调查结果能较好反映总体的情况吗?如果不能,请说明理由。吗?如果不能,请说明理由。收集数据时的误差收集数据时的误差抽样推抽样推断误
13、差断误差登记登记误差误差代表性代表性误差误差由人为原因造成的、可以由人为原因造成的、可以避免的误差:避免的误差:非抽样误差非抽样误差非人为原因造成的、无法非人为原因造成的、无法避免的误差:避免的误差:抽样误差抽样误差抽样估计的可能误差抽样估计的可能误差非抽样误差的种非抽样误差的种类及产生的原因:类及产生的原因:设计失误或工具不良;设计失误或工具不良;调查对象选择失误;调查对象选择失误;无回答;无回答;数据处理失误;数据处理失误;调查人员误导;调查人员误导;被调查者说谎。被调查者说谎。抽样误差抽样误差产生的原因:产生的原因:用部分单位来用部分单位来推断总体推断总体抽样估计的可能误差抽样估计的可能
14、误差收集数据时的误差收集数据时的误差一勺八宝粥中的成分比例和整锅不尽相同,一勺八宝粥中的成分比例和整锅不尽相同,可能稍微多些或稍微少些。这是很正常的,可能稍微多些或稍微少些。这是很正常的,因为样本的特征不一定和总体完全一样因为样本的特征不一定和总体完全一样这种差异不是错误,而是必然会出现的这种差异不是错误,而是必然会出现的抽抽样误差(样误差(samplingerror)。)。抽样误差的控制抽样误差的控制抽样误差的控制途径:抽样误差的控制途径:第一,选择合适的抽样方式第一,选择合适的抽样方式第二,控制样本容量第二,控制样本容量分层随机样本可能分层随机样本可能优于简单随机样本优于简单随机样本样本容
15、量越大,则样本容量越大,则样本统计量就越接样本统计量就越接近总体参数。近总体参数。统计工作的操守准则统计工作的操守准则统计操守三部曲统计操守三部曲(一)统(一)统计计理理念念学习理念:勤学敏思、学以致用学习理念:勤学敏思、学以致用服务理念:诚信永远、服务无限服务理念:诚信永远、服务无限效率理念:干而实之、行而快之效率理念:干而实之、行而快之创新理念:做好今天、突破明天创新理念:做好今天、突破明天求实理念:数出有据、真实可信求实理念:数出有据、真实可信竞争理念:争先进位、争创一流竞争理念:争先进位、争创一流(二)统(二)统计计精精神神不为名利无私奉献的美德不为名利无私奉献的美德不受干扰实事求是的
16、品格不受干扰实事求是的品格精雕细刻精益求精的传统精雕细刻精益求精的传统积极主动不甘落后的品德积极主动不甘落后的品德(三)统计职业道德(三)统计职业道德忠诚统计忠诚统计乐于奉献乐于奉献实事求是实事求是不出假数不出假数依法统计依法统计严守秘密严守秘密公正透明公正透明服务社会服务社会例:今年我市共有例:今年我市共有6 6万名初中毕业生参加了万名初中毕业生参加了升学考试升学考试,为了了解这为了了解这6 6万名考生的数学成万名考生的数学成绩。从中抽取了绩。从中抽取了15001500名考生的数学成绩进名考生的数学成绩进行统计分析,以下说法正确的是(行统计分析,以下说法正确的是()A A、6 6万名考生是总
17、体万名考生是总体B B、每名考生的数学成绩是个体。每名考生的数学成绩是个体。C C、15001500名考生是总体的一个样本。名考生是总体的一个样本。B B例:某市为了了解第二季度职工收入的情例:某市为了了解第二季度职工收入的情况况,调查了调查了20002000名各个阶层工作的职工的收名各个阶层工作的职工的收入情况作分析入情况作分析,在这个问题中在这个问题中,总体、个体、总体、个体、样本分别是什么?样本分别是什么?总体:某市第二季度职工收入情况总体:某市第二季度职工收入情况个体:某市每一个职工的收入情况个体:某市每一个职工的收入情况样本:所抽取的样本:所抽取的200200名各阶层职工的名各阶层职
18、工的 收入情况。收入情况。练习:练习:1 1、某地区要了解大三毕业生的身高和体重的、某地区要了解大三毕业生的身高和体重的情况情况,从中抽测了从中抽测了12001200名学生的身高和体重名学生的身高和体重,在这个问题中在这个问题中,总体、个体、样本分别是什总体、个体、样本分别是什么?么?总体:该地区大三毕业生的身高和体重情总体:该地区大三毕业生的身高和体重情况况个体:该地区每一名大三毕业生的身高和个体:该地区每一名大三毕业生的身高和体重情况体重情况样本:所抽取的样本:所抽取的12001200名大三毕业生的身名大三毕业生的身高和体重情况高和体重情况2 2、为了检查一批罐头的重量、为了检查一批罐头的
19、重量,从中抽取决从中抽取决 8080听进行检查听进行检查,在这个问题中的总体、在这个问题中的总体、个体、样本分别是什么?个体、样本分别是什么?总体:这批罐头的重量总体:这批罐头的重量个体:这批罐头中的每一个罐头的重量个体:这批罐头中的每一个罐头的重量样本;所抽取的样本;所抽取的8080听罐头的重量听罐头的重量 随机抽取样本单位。随机抽取样本单位。推断推断总总体数量特征体数量特征。抽抽样调查结样调查结果只有可控性果只有可控性误误差差。随机原则是指,排除人们主观随机原则是指,排除人们主观意愿的干意愿的干扰扰,使得总体中,使得总体中每个单位都有同等被抽中的机会。每个单位都有同等被抽中的机会。抽样调查
20、的中心问题是如何根据已知的(样本)资料来抽样调查的中心问题是如何根据已知的(样本)资料来推断未知的总体情况。推断未知的总体情况。通过各种组织措施来控制抽样误差范围,保证抽样推断通过各种组织措施来控制抽样误差范围,保证抽样推断的结果达到预定可靠程度的要求。的结果达到预定可靠程度的要求。(二二)抽抽样调查样调查的特点的特点 第一节第一节 抽样调查概述抽样调查概述三、抽样调查的应用范围 1.1.用于不可能进行全面调查的现象。用于不可能进行全面调查的现象。2.2.用于进行全面调查就会失去现实意义的现象。用于进行全面调查就会失去现实意义的现象。3.3.用于经济上不允许或精度上不必要进行全面调查的现象。用
21、于经济上不允许或精度上不必要进行全面调查的现象。4.4.用于时效性要求较强的调查。用于时效性要求较强的调查。如调查某地区的矿藏、某城市的空气质量等。如调查某地区的矿藏、某城市的空气质量等。如炮弹射程的测量,电视、灯泡等耐用时数的检验等。如炮弹射程的测量,电视、灯泡等耐用时数的检验等。如某市如某市居民家计居民家计调查,某林区的木材储存量调查等。调查,某林区的木材储存量调查等。如为满足领导机关及时制订政策、安排工作需要而进行的如为满足领导机关及时制订政策、安排工作需要而进行的民意测验,某农产品的产量调查等。民意测验,某农产品的产量调查等。第一节第一节 抽样调查概述抽样调查概述四、抽样调查的作用 1
22、.1.经济性好。经济性好。2.2.准确性高。准确性高。3.3.速度快。速度快。4.4.可以取得比较详细的统计资料。可以取得比较详细的统计资料。抽样调查与全面调查相比,节省人力、物力和财力。抽样调查与全面调查相比,节省人力、物力和财力。抽样调查发生登记性误差的可能性小。抽样调查发生登记性误差的可能性小。抽样调查的工作人员通常专业水平高,因而可以对认识对抽样调查的工作人员通常专业水平高,因而可以对认识对象进行更细致更深入的调查,取得更加详细的统计资料象进行更细致更深入的调查,取得更加详细的统计资料 。5.5.可以对全面调查的资料进行补充和修正。可以对全面调查的资料进行补充和修正。第一节第一节 抽样
23、调查概述抽样调查概述第二节第二节 抽样技术的分类及选择抽样技术的分类及选择一、抽样设计的程序 【专栏】抽样的基本要求抽样的基本要求 我我国国的的高高校校教教师师队队伍伍庞庞大大,20052005年年的的统统计计数数据据表表明明,全全国国普普通通高高校校和和成成人人高高校校教教师师总总数数达达到到105105万万人人。因因此此,当当我我们们要要分分析析高高校校教教师师的的整整体体收收入入水水平平时时,就就只只能能从从105105万万人人中中选选取取一一定定数数量量的教师,以其收入为样本来进行分析,这个过程就是抽样。然后的教师,以其收入为样本来进行分析,这个过程就是抽样。然后,二、抽样技术的分类及
24、其特点根根据据样样本本的的结结果果来来推推断断总总体体的的状状况况,得得出出全全体体高高校校教教师师的的收收入入水水平平。抽抽样样理理论论告告诉诉我我们们,抽抽样样的的样样本本必必须须满满足足随随机机性性和和代代表表性性的的要要求求。随随机机性性指指抽抽样样时时,样样本本必必须须从从总总体体中中随随机机抽抽取取,以以使使得得每每个个个个体体都都有有均均等等的的概概率率进进入入样样本本。有有时时样样本本的的随随机机性性虽虽然然得得到到了了满满足足,但但样样本本并并不不能能很很好好地地吻吻合合总总体体的的分分布布,也也就就很很难难反反映映总总体体的的状状况况,无无法法代代表表总总体体。为为此此,好
25、好的的样样本本也也必必须须是是有有代代表表性性的的样样本本。另另外外,大大数数定定理理告告诉诉我我们们,“大大量量”随随机机现现象象的的平平均均结结果果具具有有稳稳定定性性。因因此此,要要客客观观地地研研究究高高校校教教师师收收入入状状况况,抽抽取取样样本本时时,除除了了要要满满足足随随机机性性、代代表表性性的的要要求求外外,还还必必须须使使样样本本容容量量达达到到一一定规模,这样才能得出总体稳定的规律性来。定规模,这样才能得出总体稳定的规律性来。(资资料料来来源源:李李琴琴,统统计计学学还还您您一一个个真真实实的的高高校校教教师师收收入入,中中国国统统计计,2007.12007.1)第二节第
26、二节抽样技术的分类及选择抽样技术的分类及选择【专栏】一、抽样设计的程序一、抽样设计的程序、确定调查总体。明确调查的全部对象及其范围。、确定调查总体。明确调查的全部对象及其范围。、选择数据收集方式、选择数据收集方式、抽样框、抽样框、选取抽样方法、选取抽样方法、确定样本容量、确定样本容量、制定选择样本单位的操作程序、制定选择样本单位的操作程序、抽样实施、抽样实施、选择数据收集方式选择数据收集方式数据收集方式对抽样过程有重要影响。数据收集方式对抽样过程有重要影响。电话访问方式。电话访问方式。面谈访问方式。面谈访问方式。电子化的电子化的CATT(计算机辅助电话访问)(计算机辅助电话访问)CAPI(计算
27、机辅助个人访问)(计算机辅助个人访问)、抽样框、抽样框抽样框是指代表调研总体对象的样本列表抽样框是指代表调研总体对象的样本列表抽样框定义为总体的数据目录或单位的名单,抽样框定义为总体的数据目录或单位的名单,从中可以抽出样本单位。从中可以抽出样本单位。完整的抽样框中,每个调研对象应该出现一完整的抽样框中,每个调研对象应该出现一次,而且只能出现一次。次,而且只能出现一次。完整的抽样框是存在的完整的抽样框是存在的抽样框的不完整,往往会导致抽样框误差的产抽样框的不完整,往往会导致抽样框误差的产生生理想的情况是,我们有一个完整和准确的名单理想的情况是,我们有一个完整和准确的名单4、选取抽样方法、选取抽样
28、方法重要的抽样方法可以分为两大类:随机抽重要的抽样方法可以分为两大类:随机抽样与非随机抽样。样与非随机抽样。选择哪种抽样方法取决于研究目的、经济实力、选择哪种抽样方法取决于研究目的、经济实力、时间限制、调查问题的性质等。时间限制、调查问题的性质等。抽样设计作为调研设计的有机组成部分,抽样设计作为调研设计的有机组成部分,总是根据调研方法的不同而采取不同的抽总是根据调研方法的不同而采取不同的抽样技术。样技术。5、确定样本容量、确定样本容量抽选多少个调查对象抽选多少个调查对象 如何合理地、经济地确定一个抽样数目,使之如何合理地、经济地确定一个抽样数目,使之既满足抽样误差的要求,又能使抽样调查所需既满
29、足抽样误差的要求,又能使抽样调查所需成本费用尽量最小。成本费用尽量最小。样本容量的确定原则是控制在必要的最低限度。样本容量的确定原则是控制在必要的最低限度。6、制定选择样本单位的操作程序、制定选择样本单位的操作程序7、抽样实施、抽样实施抽样员在实施抽样过程中,要求腿勤、嘴抽样员在实施抽样过程中,要求腿勤、嘴勤、手勤。勤、手勤。尤其是现场抽样,要完全熟悉抽样背景、抽样尤其是现场抽样,要完全熟悉抽样背景、抽样区域后,再进行抽样。还要把抽取的样本的详区域后,再进行抽样。还要把抽取的样本的详细情况清楚地记录下来,保证访问员能方便地细情况清楚地记录下来,保证访问员能方便地找到、联系到。找到、联系到。随机
30、抽样技术的分类、特点及其应用随机抽样技术的分类、特点及其应用一、随机抽样技术的分类及特点一、随机抽样技术的分类及特点、随机抽样技术的含义、随机抽样技术的含义随随机机抽抽样样技技术术又又称称概概率率抽抽样样技技术术,是是对对总总体体中中每每一一个个体体给予平等的抽取机会的抽样技术给予平等的抽取机会的抽样技术。、随机抽样技术的分类、随机抽样技术的分类简单随机抽样技术简单随机抽样技术分层随机抽样技术分层随机抽样技术等距离随机抽样技术等距离随机抽样技术分群随机抽样技术分群随机抽样技术、随机抽样的特点、随机抽样的特点优点优点不足不足多阶段随机抽样技术多阶段随机抽样技术二、随机抽样技术及其应用二、随机抽样
31、技术及其应用、简单随机抽样技术及其应用简单随机抽样技术及其应用(1)含义含义简简单单随随机机抽抽样样技技术术,又又称称单单纯纯随随机机抽抽样样技技术术,是是在在总总体体单单位位中中不不进进行行任任何何有有目目的的的的选选择择,而而是是按按随随机机原原则则,纯纯粹偶然的方法抽取样本。粹偶然的方法抽取样本。抽样概率公式为:抽样概率样本单位数抽样概率公式为:抽样概率样本单位数/总体单位数总体单位数例例:总总体体单单位位数数为为10000,样样本本单单位位为为400,那那么么抽抽样概率为样概率为400/100004%(2)应用程序)应用程序抽签法抽签法乱数表法乱数表法(1)乱数表法乱数表法702917
32、1213403320382656621837359683508775994657227788429545721608150472332714340931169332435027898719应应用用方方法法:首首先先要要把把调调查查总总体体中中的的所所有有单单位位予予以以编编号号,根根据编号的位数确定使用若干位数字,然后查乱数表。据编号的位数确定使用若干位数字,然后查乱数表。以以乱乱数数表表中中任任一一行行或或一一列列的的数数字字作作为为开开始始数数,接接着着可可从从上上而而下下,或或从从左左到到右右,或或一一定定间间隔隔顺顺序序取取数数,凡凡编编号号范围内的数字号码即为被抽取的样本。范围内的数
33、字号码即为被抽取的样本。附:随机数的产生附:随机数的产生大小为大小为N的总体中产生样本量为的总体中产生样本量为n的随机的随机样本的一个常用的方法是利用样本的一个常用的方法是利用随机数随机数(randomnumber)利用随机数步骤为:利用随机数步骤为:(1)把总体的所有个把总体的所有个体编号;体编号;(2)产生产生n个在个在0到到N之间的随机之间的随机数;数;(3)与如此产生的随机数中的数目相与如此产生的随机数中的数目相同的个体则形成了样本量为同的个体则形成了样本量为n的简单随机的简单随机样本。样本。附:随机数的产生附:随机数的产生最原始的办法是掷一种正最原始的办法是掷一种正20面体的均匀材面
34、体的均匀材料制成的骰子,标有两套料制成的骰子,标有两套0到到9的数字。每的数字。每次产生一个次产生一个0到到9的数字。的数字。另一种是查阅随机数表。在一些传统的统另一种是查阅随机数表。在一些传统的统计教科书后可以找到随机数表;也有专门计教科书后可以找到随机数表;也有专门的随机数表的册子的随机数表的册子今天,多用计算机产生的今天,多用计算机产生的伪随机数伪随机数(pseudo-randomnumber)来代替真来代替真正的随机数正的随机数(3)特点)特点优点:优点:很简单,并且保证每个总体单位在抽选时很简单,并且保证每个总体单位在抽选时都有相等的被抽中机会都有相等的被抽中机会。缺点:缺点:访谈费
35、用过高;访谈费用过高;抽样数量多、覆盖面大,数据收集既费时又抽样数量多、覆盖面大,数据收集既费时又费钱;费钱;它并不能保证抽取的样本一定能代表目标它并不能保证抽取的样本一定能代表目标总体,样本中可能过多或过少地包含某一总体,样本中可能过多或过少地包含某一子集的人群。子集的人群。、分层随机抽样技术及其应用分层随机抽样技术及其应用(1)含义含义分分层层随随机机抽抽样样技技术术,又又称称为为分分类类随随机机抽抽样样技技术术,是是把把调调查查总总体体按按其其属属性性不不同同分分为为若若干干层层次次,然然后后在在各各层层中中随随机机抽取样本。抽取样本。(2)应用程序)应用程序把总体各单位分成两个或两个以
36、上的相互独立的组;把总体各单位分成两个或两个以上的相互独立的组;从两个或两个以上的组中简单随机抽样,样本相互独立。从两个或两个以上的组中简单随机抽样,样本相互独立。2、分层随机抽样技术及其应用分层随机抽样技术及其应用()()类型类型等等比比例例分分层层抽抽样样:简简称称PPS,即即按按各各个个层层中中单单位位数数量量占占总体单位数量的比例分配各层的样本数量。总体单位数量的比例分配各层的样本数量。例例:某某地地共共有有居居民民20000户户,按按收收入入高高低低进进行行分分类类,其其中中,高高收收入入居居民民为为4000户户,占占总总体体的的20%;中中等等收收入入为为12000户户,占占总总体
37、体的的60%;低低收收入入居居民民为为4000户户,占占总总体体的的20%。从从中中抽抽取取200户户进进行行购购买买力力调调查查,则则各类型应抽取的样本单位数各为多少?各类型应抽取的样本单位数各为多少?解:高收入的样本数目为:解:高收入的样本数目为:200*20%=40户;户;中等收入的样本数目为:中等收入的样本数目为:200*60%=120户;户;低收入的样本数目为:低收入的样本数目为:200*20%=40户;户;2、分层随机抽样技术及其应用分层随机抽样技术及其应用例例:仍仍以以上上述述居居民民收收入入与与购购买买之之间间的的关关系系为为例例。设设各各层层样样本本标标准准差差高高收收入入为
38、为1000,中中收收入入为为200,低低收收入入为为100。求求:采采用用分分层层最最佳佳抽抽样样法法按按分分层层标标准准差差加加权权,则则各各类类型型应抽取的样本单位数各为多少?应抽取的样本单位数各为多少?分分层层最最佳佳抽抽样样法法:又又称称为为非非比比较较抽抽样样法法,即即不不是是按按层层中中单单位位数数占占总总体体单单位位数数的的比比例例分分配配样样本本单单位位,而而是是根根据据其其他因素他因素(最常用的分层标准差最常用的分层标准差)调整样本单位数。调整样本单位数。解:高收入的样本数目为:解:高收入的样本数目为:200*20%*1000/(20%*1000+60%*200+20%*10
39、0)=117.6;中等收入的样本数目为:中等收入的样本数目为:200*60%*200/(20%*1000+60%*200+20%*100)=70.6;低收入的样本数目为:低收入的样本数目为:200*20%*100/(20%*1000+60%*200+20%*100)=11.8;二、随机抽样技术及其应用二、随机抽样技术及其应用()特点()特点分层时要注意各层之间要有明显的差异,不至产分层时要注意各层之间要有明显的差异,不至产生混淆;生混淆;要知道各层中的单位数目和比例;要知道各层中的单位数目和比例;分层的数目不宜太多,每个层次内每个个体应分层的数目不宜太多,每个层次内每个个体应保持一致性。保持一
40、致性。、等距抽样技术及其应用等距抽样技术及其应用(1)含义含义等等距距离离随随机机抽抽样样技技术术,又又称称系系统统抽抽样样技技术术或或机机械械随随机机抽抽样样技技术术。它它是是在在总总体体中中先先按按一一定定标标志志顺顺序序排排列列,并并根根据据总总体体单单位位数数和和样样本本单单位位数数计计算算抽抽样样距距离离,然然后后按按相相同同的的距离或间隔抽取样本单位。距离或间隔抽取样本单位。(2)应用程序)应用程序按按一一定定标标志志把把总总体体中中的的个个体体顺顺序序排排列列,然然后后根根据据总总体体单单位位数数和和样样本本单单位位数数计计算算出出抽抽样样距距离离(即即相相同同的的间间隔隔),然
41、后按相同的距离或间隔抽选样本单位。然后按相同的距离或间隔抽选样本单位。确定起始抽号数,即抽样起点。确定起始抽号数,即抽样起点。、等距抽样技术及其应用等距抽样技术及其应用()特点()特点等距抽样技术相对于简单随机技术最主要的优势等距抽样技术相对于简单随机技术最主要的优势就是经济性。它比简单随机抽样更为简便,共的就是经济性。它比简单随机抽样更为简便,共的时间更少,并且花费也少。时间更少,并且花费也少。最大的缺点在于总体单位的排列上。最大的缺点在于总体单位的排列上。、整群抽样技术及其应用整群抽样技术及其应用(1)含义含义也也叫叫分分群群抽抽样样技技术术,是是把把调调查查总总体体区区分分为为若若干干群
42、群体体,然然后后用用简简单随机抽样法,从中抽取某些群体进行全面调查。单随机抽样法,从中抽取某些群体进行全面调查。(2)应用程序)应用程序同质总体被分为几个相互独立的完全的较小的子集。同质总体被分为几个相互独立的完全的较小的子集。随机抽选子集构成样本。随机抽选子集构成样本。(3)特点)特点优点:抽取样本比较简单方便,抽中的单位比较集中。优点:抽取样本比较简单方便,抽中的单位比较集中。缺缺点点:由由于于样样本本单单位位集集中中在在某某些些群群体体,而而不不能能均均匀匀分分布布在在总总体体中中,如如果果群群体体之之间间差差异异较较大大或或每每群群中中单单位位的的特特征征非常相似,则抽样误差就会增大。
43、非常相似,则抽样误差就会增大。总体群数总体群数R=16 样本群数样本群数r=4 样本容量样本容量例:例:ABCDEFGHIJKLMNOPLHPD比如在全国调查时,先抽取省,再抽取市地,再抽取比如在全国调查时,先抽取省,再抽取市地,再抽取县区,再抽取乡、村直到户。每一级都可能采取各种县区,再抽取乡、村直到户。每一级都可能采取各种抽样方法。也称为多级混和型抽样。抽样方法。也称为多级混和型抽样。5、多阶段抽样技术及其应用多阶段抽样技术及其应用即把抽样样本单位的过程分为两个或几个阶段来进行。即把抽样样本单位的过程分为两个或几个阶段来进行。(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体(如果一
44、次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲:讲:先抽大单位先抽大单位(可以用类型抽样或机械抽样可以用类型抽样或机械抽样),再在大单再在大单位中抽小单位位中抽小单位(可用整可用整群抽样或简单随机抽样群抽样或简单随机抽样),小单位中再抽更小的小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。单位;而不是一次就直接抽取基层的调查单位。在某省在某省100多万农户抽取多万农户抽取1000户调查农户生户调查农户生产性投资情况。产性投资情况。例:例:第一阶段:从省内部县中抽取第一阶段:从省内部县中抽取5个县个县第二阶段:从抽中的第二阶段:从抽中的5个县中各抽个县中各抽4个乡个乡 第三阶段:
45、从抽中的第三阶段:从抽中的20个乡中各抽个乡中各抽5个村个村 第四阶段:从抽中的第四阶段:从抽中的100个村中各抽个村中各抽10户户样本样本n=10010=1000(户户)非随机抽样技术的分类、特点及其应用非随机抽样技术的分类、特点及其应用非随机抽样是指抽样时不遵循随机原则,非随机抽样是指抽样时不遵循随机原则,而是按照调查人员主观设立的某个标准抽而是按照调查人员主观设立的某个标准抽选样本。在市场调查中,采用非随机抽样选样本。在市场调查中,采用非随机抽样通常是出于以下几个原因:通常是出于以下几个原因:客观条件的限制,无法进行随机抽样客观条件的限制,无法进行随机抽样为了快速获得调查结果,提高调查的
46、时效性为了快速获得调查结果,提高调查的时效性在调查对象不确定,或无法确定的情况下采用,在调查对象不确定,或无法确定的情况下采用,例如:对某一突发(偶然)事件进行现场调查例如:对某一突发(偶然)事件进行现场调查等。等。总体各单位间离散程度不大,且调查人员具有总体各单位间离散程度不大,且调查人员具有丰富的调查经验时。丰富的调查经验时。非随机抽样技术及其应用非随机抽样技术及其应用一、一、非随机抽样技术的含义及特点非随机抽样技术的含义及特点二、非随机抽样技术的分类二、非随机抽样技术的分类1、任意抽样技术及其应用、任意抽样技术及其应用2、判断抽样技术及其应用、判断抽样技术及其应用3、配额抽样技术及其应用
47、、配额抽样技术及其应用4、滚雪球抽样技术及其应用、滚雪球抽样技术及其应用5、因特网抽样、因特网抽样一、一、非随机抽样技术的含义及特点非随机抽样技术的含义及特点、含义、含义又又称称非非概概率率抽抽样样,是是指指根根据据一一定定主主观观标标准准来来抽抽选选样样本本的的抽样技术,总体中每一个个体不具有被平等抽取的机会。抽样技术,总体中每一个个体不具有被平等抽取的机会。2、特点、特点 优点:优点:费用低:应用于精确度要求不是很高的调查;费用低:应用于精确度要求不是很高的调查;所花费的时间要比随机抽样花费的时间短。所花费的时间要比随机抽样花费的时间短。缺点缺点样本代表性不够;样本代表性不够;无法计算抽样
48、误差。无法计算抽样误差。二、非随机抽样技术的分类、任意任意抽样技术及其应用抽样技术及其应用含含义义:又又称称为为偶偶遇遇抽抽样样、便便利利抽抽样样。它它是是指指市市场场调调查查者者把把在在一一定定时时间间、一一定定环环境境中中所所遇遇见见的的人人,作作为为调调查查对对象象选入样本的方法。选入样本的方法。常常见见类类型型:街街头头随随访访或或拦拦截截访访问问、邮邮寄寄调调查查、杂杂志志内内问问卷调查以及网上调查。卷调查以及网上调查。优点:优点:在所有抽样技术中花费最小;在所有抽样技术中花费最小;抽抽样样单单元元是是可可以以接接近近的的、容容易易测测量量的的、并并且且是是合合作的。作的。缺点:许多
49、可能的偏差都会存在。缺点:许多可能的偏差都会存在。2、判断抽样技术及其应用判断抽样技术及其应用含含义义:又又称称主主观观抽抽样样。它它是是市市场场调调查查者者根根据据主主观观意意愿愿、经验判断从总体中选择样本的方法。经验判断从总体中选择样本的方法。常见类型:专家判断法、统计资料判断法。常见类型:专家判断法、统计资料判断法。优点:优点:简便、易行、及时;简便、易行、及时;符合调查目标和特殊样本的已知资料;符合调查目标和特殊样本的已知资料;缺点:易发生主观判断的生的抽样误差;缺点:易发生主观判断的生的抽样误差;无法计算抽样误差和可信程度。无法计算抽样误差和可信程度。被调查者配合较好;被调查者配合较
50、好;资料回收率高等。资料回收率高等。3、配额抽样技术及其应用配额抽样技术及其应用含含义义:又又称称定定额额抽抽样样。是是根根据据一一定定标标志志对对总总体体分分层层或或分分类类后,从各层或各类中主观选取一定比例调查单位的方法。后,从各层或各类中主观选取一定比例调查单位的方法。配额抽样与分层抽样的区别:配额抽样与分层抽样的区别:常见类型:独立控制配额抽样、相互控制配额抽样。常见类型:独立控制配额抽样、相互控制配额抽样。配配额额抽抽样样的的被被调调查查者者不不是是按按随随机机原原则则抽抽出出来来的的,而分层抽样必须遵守随机原则;而分层抽样必须遵守随机原则;在在分分层层抽抽样样中中,用用于于分分类类