抽样估计方法主要有和抽样调查一样吗

(window.slotbydup=window.slotbydup || []).push({
id: '2014386',
container: s,
size: '234,60',
display: 'inlay-fix'
下载本文档需要登录,并付出相应积分。()
(已有0人评价)
下载:0次格式:ppt页数:104贡献者:Wyzyx上传时间: 16:09
0人评价91页
0人评价73页
0人评价54页
0人评价88页
0人评价61页
所需积分:(友情提示:所有文档均可免费预览!下载之前请务必先预览阅读,以免误下载造成积分浪费!)
(多个标签用逗号分隔)
文不对题,内容与标题介绍不符
广告内容或内容过于简单
文档乱码或无法正常显示
若此文档涉嫌侵害了您的权利,请参照说明。当前位置:>>
正确认识“抽样调查”与“大数据”的关系
在人类历史长河中,即使是在日新月异发展的现代社会,人们还主要依赖抽样数据、局部数据和片面数据,甚至在无法获得实证数据的时候纯粹依赖经验、理论、假设和价值观去发现未知领域的规律。因此,人们对世界的认识往往是表面的、肤浅的、简单的、认知程度永无止境。
一、抽样调查。抽样调查是按照随机原则从总体中抽取部分单位进行观察,并根据观察结果推断总体的一种调查方法。其特点从总体中各单位都有一个指定的概率被抽取,坚持随机原则,从数量上推断总体即:以样本的估计值来推断总体有关参数,并可以控制抽样调查误差的大小。抽样调查的优点:经济性、时效性、准确性和灵活性;抽样调查兼有典型调查和普遍调查的作用,其作用表现为一是解决全面调查无法或很难解决的问题;二是补充和订正全面调查的结果;三是应用于生产过程中产品质量的检查和控制;四是用于对总体的某种假设进行检验。
抽样调查在小数据时代的随机采样最少的数据获得最多的信息。当前,居民收支调查、粮食产量、消费价格等采用抽样调查。是在不可收集和分析全部数据的情况下的选择,它本身有许多固有的缺陷。它的成功依赖于采样的绝对随机性,但是实际采样的随机性非常困难,稍有偏见分析结果相差甚远。
统计学家们证明,样本的选择随机性比样本数量更重要。采样分析的精确性随着采样的随机性的增加而大幅度提高,但与样本量数量的增加关系不大。当样本量达到了某个数值后我们从新个体身上得到信息量越来越少,如同经济学中的边际效应递减一样。
二、大数据。如今,一个大规模生产、分享和应用数据的时代正在开启。从硅谷到北京,大数据的话题正在以新的发展能源被传播。大数据不论对产业实践者还是对政府和公众机构都是非常有价值的。大数据就像一个神奇的钻石矿,当它的首要价值被发现后仍能不断给予。大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下。大数据时代的到来,给统计调查带来机遇与挑战。大数据时代的经济学、政治学、社会学和许多科学门类都发生巨大甚至本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。大数据的核心预测分析,即:建立在相关关系分析法基础上的预测。许多数据事后调查统计,信息相对滞后,传统思维追求因果关系。大数据处理时代理念的三大转变,要全体不要抽样,要效率不要绝对精确,要相关不要因果解决“是什么”而不是“为什么”。
三、正确认识抽样调查与大数据差别。抽样调查与大数据差别,数据表达上差别:前者抽样调查,后者全面记录;统计调查具有科学性、准确性、权威性。大数据具有不确定性、复杂性。就像望远镜让我们能够感受宇宙,显微镜观测微生物一样,成为新发明和新服务的源泉。大数据与统计数据相互佐证,差异较大。
举例说明:私人汽车拥有量。城乡住户调查数据:2012年每百户城镇居民拥有家用汽车14.4辆,低收入户3.95辆,高收入户24.1辆;2012年每百户农牧民居民拥有家用汽车4辆,农民2辆,牧民17辆。大数据《赤峰统计年鉴》2012年总户数174.2万户,常住人口431.3万人。全市民用汽车拥有量48.6万辆,私人汽车拥有量45.03万辆,每百户拥有25.8辆,与城镇高收入户每百户拥有量24.1辆接近,抽样调查数据远远低于大数据所给出的拥有量。两者差异较大,调查统计口径存在差异。暂且不予评论。
总之,实践证明,各种数据有着天然的关系,大数据与统计数据相互佐证,特别是当前国家关注民生指标,转移支付数量较大,惠农补贴、社会保障、财政专项资金扶持、城乡居民储蓄存款等总量指标一目了然,尽管受到调查统计口径存在差异。抽样调查人均指标将面临新的挑战。抽样调查与大数据相互验证,采取有效措施,加强与部门统计数据衔接,提高统计调查数据质量,开启获取数据的新途径,充分认识大数据了解大数据,提高开发应用大数据的能力。努力促进统计抽样调查与大数据精准咬合,以创新的勇气拥抱“大数据时代”,释放抽样调查的正能量。
(作者单位:国家统计局赤峰调查队吴中军)抽样调查法_百度百科
抽样调查法
本词条缺少名片图,补充相关内容使词条更完整,还能快速升级,赶紧来吧!
相应解释抽样调查法:指从研究对象的全部单位中抽取一部分单位进行考察和分析,并用这部分单位的数量特征去推断总体的数量特征的一种调查方法。其中,被研究对象的全部单位称为“总体”;从总体中抽取出来,实际进行调查研究的那部分对象所构成的群体称为“样本”。在抽样调查中,样本数的确定是一个关键问题。抽样的方式,有随机抽样和
按规模大小成比例的概率抽样,简称为,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。其抽选样本的方法有汉森·赫维茨方法、拉希里方法等。
抽样是指按,属于中的一种。是指在中,尤其是二阶段抽样中,
抽样调查法流程图
初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
简单随机抽样法
这是一种最简单的一步抽样法,它是从总体中选择出抽样单位,从总体中抽取的每个可能样本均有同等被抽中的。抽样时,处于中的抽样单位被编排成 1~n编码,然后利用随机数码表或专用的计算机程序确定处于1~n间的随机数码,那些在总体中与随机数码吻合的单位便成为随机抽样的样本。
这种简单,误差分析较容易,但是需要较多,适用于各个体之间差异较小的情况。
系统抽样法
这种方法又称顺序抽样法,是从随机点开始在总体中按照一定的间隔(即“每隔第几”的方式)抽取样本。此法的优点是抽样比较好,有好的理论,总体估计值容易计算。
分层抽样法
它是根据某些特定的特征,将总体分为同质、不相互重叠的若干层,再从各层中独立抽取样本,是一种不等。利用分层,各层内应该同质,各层间差异尽可能大。这样的分层抽样能够提高样本的代表性、总体估计值的精度和的效率,抽样的操作、管理比较方便。但是较复杂,费用较高,误差分析也较为复杂。此法适用于母体复杂、个体之间差异较大、数量较多的情况。
整群抽样法
是先将总体单元分群,可以按照自然分群或按照需要分群,在交通调查中可以按
照地理特征进行分群,随机选择群体作为抽样样本,调查样本群中的所有单元。整群抽样样本比较集中,可以降低调查费用。例如,在进行居民出行调查中,可以采用这种方法,以住宅区的不同将住户分群,然后随机选择群体为抽取的样本。此法优点是组织简单,缺点是样本代表性差。
多阶段抽样法
是采取两个或多个连续阶段抽取样本的一种不等概率抽样。对阶段抽样的单元是分级的,每个阶段的抽样单元在结构上也不同,多阶段抽样的集中,能够节省时间和经费。调查的组织复杂,总体估计值的计算复杂。
抽样的特点是总体中含量大的部分被抽中的也大,可以提高样本的代表性。
抽样的主要优点是:( 1)抽样调查可以减少调查的工作量,调查内容可以求多、求全或求专,可以保证调查对象的完整性。 ( 2)可以从数量上以部分推算总体,利用和数理统计原理,以一定的概率保证推算结果的可靠程度,起到全面调查认识总体的功能,可以保证调查的精度。 ( 3)因为抽样调查是针对总体中的一部分单位进行的,抽样调查可以大大减少调查费用,提高调查效率。 ( 4)收集、整理数据、综合样本的速度快,保证调查的时效性。
抽样调查结果和真实值之间存在的差异称为误差。抽样调查理论的中心任务之一,便是研究抽样调查中的误差。在抽样调查中将全部误差分解为和系统误差两部分。随机误差是 由于 样本与总体之间的随机差异导致的, 它存在于所有取样过程中, 是无法避免的, 这种类型的误差不会影响估计参数的均值, 通常所计算的就是这部分随机误差。对随机误差的研究,由于有强有力的理论和方法的支持,其理论已非常成熟,只要能设计出样本,就能给出相应估计量的随机误差公式。但是对抽样调查中的系统误差,由于导致的原因很多,而且多属非随机性因素,主要受主观因素的影响,致使系统性误差的出现是无规律的。
抽样调查法
构成系统误差的因素有多种,大致可归纳为四种类型:
(1) ( Error in Design ) ,是指因在抽样调查方案设计过程中的错误而导致产生的。在的设计中,涉及的编制、目标量和的设计、的确定和抽样方式的选择等,抽样方案的设计还直接关系到在样本的抽取过程中是否严格地遵循随机性原则,若破坏了随机性原则,必然会产生系统性误差。
(2)估计量的偏误 (Bias of Estimator) ,是指所选择的估计量 (实则是估计方法)破坏了估计的优良标准之一——,致使产生统计性误差。
(3)调查误差 ( Error in Survey ) ,是指在取得样本数据资料过程中产生的误差。这部分误差通常与调查者、回答者、资料搜集方式和问卷等因素有关,它们会形成在调查过程中出现无回答和回答出现偏误等情况,进而形成。
(4)编辑误差 ( Processing in Error ) ,是指在取得样本资料之后,在整理、汇总、归类、计算、录入等过程形成的误差。
因此,为了提高调查精度,一方面可以采取完善抽样调查方案、合理选择、提高抽样调查数据的准确性、减少编辑误差和调查误差等手段,即减少系统误差;另一方面要合理确定样本量的大小,即减少。
通过对误差分析可知,如果要提高调查的精度,一个重要方面就是确定合理的样本量。样本量大小的确定是一个平衡问题,如果在数据收集和分析过程采用大的,达到给定研究目标和精度要求的费用就很高。太少的样本则使结果受的影响。
抽样其具体的做法是:
1、首先确定初级抽样单位(PSU),PSU可以是固定的常规单位,确定PSU需要有这些初级抽样单位的具体名录,以及每个初级抽样单位中被调查人员的具体数目,这个数目可以的估计的人数。
2、确定抽取哪些初级抽样单位,如果初级抽样单位比较少,可以全部抽取,如果初级抽样单位太多,则可以随机抽取部分的抽样单位。
3、在选取的初级抽样单位中选择具体的调查对象,如果将第二步中选取的初级抽样单位的组成人员全部作为调查对象,称为二阶段整群抽样,如果只是在初级抽样单位中按人数的多少,来决定在每个抽样单位中抽取多少人,则称为PPS抽样,此时,需要进行一定的计算,详见有关统计书籍。
抽样调查主要应用于以下几个方面:
(1)某些总体本身的性质决定了不能对其进行全面调查而又要全面了解的情况,例如(产品的质量等)。
(2)某些总体理论上虽然可以全面调查,但实际上不可能也不必要的情况,例如调查城市居民出行情况。
(3)某些总体理论上虽然可以全面调查,但是实际上不可能的,例如破坏试验(灯泡寿命、炮弹的杀伤力等)。
(4)某些特殊总体,要求具有相当资格的调查员才能进行,为此只能采用抽样调查,例如对科学技术方面总体的调查。
(5)为了提高时效,要求在短时间内取得关于总体的情况。
(6)利用抽样调查原理还可以对某总体的假设进行检验来判断这种假设的真伪,以决定行动取舍。
抽样调查是,一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。根据抽选样本的方法,抽样调查可以分为和两类。概率抽样是按照和数理统计的原理从调查研究的总体中,根据来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。
统计学(statistics)是应用数学的一个分支,主要通过利用建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
抽样技术练习题及答案
下载积分:885
内容提示:抽样技术练习题及答案,抽样,技术,练习题,及,答案
文档格式:DOC|
浏览次数:24|
上传日期: 23:36:12|
文档星级:
该用户还上传了这些文档
抽样技术练习题及答案
官方公共微信抽样调查 - 概述
概念是根据随机的原则从总体中抽取部分实际数据进行调查,并运用概率估计方法,根据样本数据推算总体相应的数量指标的一种统计分析方法。
特点抽样调查从研究对象的总体中抽取一部分个体作为样本进行调查,据此推断有关总体的数字特征。 经济性好.实效性强.适应面广.准确性高抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。 与其它调查一样,抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:一种是工作误差(也称误差或调查误差),一种是代表性误差(也称抽样误差)。但是,抽样调查可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于调查单位少,代表性强,所需调查人员少,工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。因此,抽样调查的结果是非常可靠的。 抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其它非全面调查所不具备的特点,主要是: (1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。 (2)是以抽取的全部样本单位作为一个“代表团”,用整个“”来代表总体。而不是用随意挑选的个别单位代表总体。 (3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。 (4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。 基于以上特点,抽样调查被公认为是非全面调查方法中用来推算和代表总体的最完善、最有根据的调查方法。
抽样调查 - 步骤
(1)界定总体 (2)制定抽样框 (3)实施抽样调查并推测总体 (4)总体 (5)决定样本规模 (6)决定抽样方式 (7)确定调查的信度和效度
抽样调查 - 适用范围
第一、不能进行全面调查的事物。有些事物在测量或试验时有破坏性,不可能进行全面调查。如,的抗震能力试验,灯泡的耐用时间试验等。 第二、有些总体从理论上讲可以进行全面调查,但实际上不能进行全面调查的事物。如,了解某个森林有多少棵树,职工家庭生活状况如何等。 第三、抽样调查方法可以用于工业生产过程中的质量控制。 第四、利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍。
抽样调查 - 分类
概率抽样1.随机抽样——简单随机抽样法这是一种最简单的一步抽样法,它是从总体中选择出抽样单位,从总体中抽取的每个可能样本均有同等被抽中的概率。抽样时,处于抽样总体中的抽样单位被编排成&1~n编码,然后利用随机数码表或专用的计算机程序确定处于1~n间的随机,那些在总体中与随机数码吻合的单位便成为随机抽样的样本。 这种抽样方法简单,误差分析较容易,但是需要样本容量较多,适用于各个体之间差异较小的情况。 2.随机抽样——系统抽样法 这种方法又称顺序抽样法,是从随机点开始在总体中按照一定的(即“每隔第几”的方式)抽取样本。此法的优点是抽样样本分布比较好,有好的理论,总体估计值容易计算。 3.随机抽样——分层抽样法它是根据某些特定的特征,将总体分为同质、不相互重叠的若干层,再从各层中独立抽取样本,是一种不等概率抽样。分层抽样利用辅助信息分层,各层内应该同质,各层间差异尽可能大。这样的分层抽样能够提高样本的代表性、总体估计值的精度和抽样方案的效率,抽样的操作、管理比较方便。但是抽样框较复杂,费用较高,误差分析也较为复杂。此法适用于母体复杂、个体之间差异较大、数量较多的情况。 4.随机抽样——整群抽样法整群抽样是先将总体单元分群,可以按照自然分群或按照需要分群,在交通调查中可以按照地理特征进行分群,随机选择群体作为抽样样本,调查样本群中的所有单元。整群抽样样本比较集中,可以降低调查费用。例如,在进行居民出行调查中,可以采用这种方法,以住宅区的不同将住户分群,然后随机选择群体为抽取的样本。此法优点是组织简单,缺点是样本代表性差。 5.随机抽样——多阶段抽样法 多阶段抽样是采取两个或多个连续阶段抽取样本的一种不等概率抽样。对阶段抽样的单元是分级的,每个阶段的抽样单元在结构上也不同,多阶段抽样的样本分布集中,能够节省时间和经费。调查的组织复杂,总体估计值的计算复杂。 6.随机抽样——等距抽样 等距抽样也称为系统抽样、或机械抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。 根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。 按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。 等距抽样的最主要优点是简便易行,且当对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。 7.随机抽样—— 双重抽样,又称二重抽样、复式抽样,是指在抽样时分两次抽取样本的一种抽样方式,其具体为:首先抽取一个初步样本,并搜取一些简单项目以获得有关总体的信息;然后,在此基础上再进行深入抽样。在实际运用中,双重抽样可以推广为多重抽样。 8.随机抽样——按规模大小成比例的概率抽样 按规模大小成比例的概率抽样,简称为PPS抽样,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。 PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。 9.随机抽样—— 随意抽取调查单位进行调查(与随机抽样不同,不保证每个单位相等的入选机会)如:柜台调查,街头路边拦人调查。 10.非随机抽样——重点抽样 只对总体中为数不多但影响颇大(标志值在总体中所占比重颇大)的重点单位调查。 11.非随机抽样——典型抽样 挑选若干有代表性的单位进行研究。 12.非随机抽样——配额抽样 对总体作若干分类和样本容量既定情况下,按照配额从总体各部分进行抽取调查单位。
非概率抽样非概率抽样就是调查者根据自己的方便或主观判断抽取样本的方法。 它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。
抽样调查 - 常用名词
在抽样调查中,常用的名词主要有: 1、总体 总体是指所要研究对象的全体。它是根据一定研究目的而规定的所要调查对象的全体所组成的集合,组成总体的各研究对象称之为总体单位。 2、个体 个体是指总体中的每一个考察对象。 3、样本 样本是总体的一部分,它是由从总体中按一定程序抽选出来的那部分总体单位所组成的集合。 4、样本的容量 样本中个体的数量叫做样本的容量。 5、抽样框 抽样框是指用以代表总体,并从中抽选样本的一个框架,其具体表现形式主要有包括总体全部单位的名册、地图等。 抽样框在抽样调查中处于基础地位,是抽样调查必不可少的部分,其对于推断总体具有相当大的影响。 6、抽样比 抽样比是指在抽选样本时,所抽取的样本单位数与总体单位数之比。 对于抽样调查来说,样本的代表性如何,抽样调查最终推算的估计值真实性如何,首先取决于抽样框的质量。 7、置信度 置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。 8、抽样误差 在抽样调查中,通常以样本作出估计值对总体的某个特征进行估计,当二者不一致时,就会产生误差。因为由样本作出的估计值是随着抽选的样本不同而变化,即使观察完全正确,它和总体指标之间也往往存在差异,这种差异纯粹是抽样引起的,故称之为抽样误差。 9、偏差 所谓偏差,也称为偏误,通常是指在抽样调查中除抽样误差以外,由于各种原因而引起的一些偏差。 10、均方差 在抽样调查估计总体的某个指标时,需要采用一定的抽样方式和选择合适的估计量,当抽样方式与估计量确定后,所有可能样本的估计值与总体指标之间离差平方的均值即为均方差。
显示方式: |
共有2个词条
万方数据期刊论文
- 中华结核和呼吸杂志 -
万方数据期刊论文
- 中国防痨杂志 -
万方数据期刊论文
- 农业工程学报 -
为本词条添加和相关影像
互动百科的词条(含所附图片)系由网友上传,如果涉嫌侵权,请与客服联系,我们将按照法律之相关规定及时进行处理。未经许可,禁止商业网站等复制、抓取本站内容;合理使用者,请注明来源于。
登录后使用互动百科的服务,将会得到个性化的提示和帮助,还有机会和专业认证智愿者沟通。
您也可以使用以下网站账号登录:
此词条还可添加&
编辑次数:
参与编辑人数:
最近更新时间: 10:29:26
贡献光荣榜
扫描二维码用手机浏览词条
保存二维码可印刷到宣传品
扫描二维码用手机浏览词条
保存二维码可印刷到宣传品

我要回帖

更多关于 差额估计抽样 的文章

 

随机推荐