对建筑物沉降观测方法个体进行分类的方法有那几种

公修课专业技术人员心理健康与压力管理答案_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
公修课专业技术人员心理健康与压力管理答案
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩22页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢几种重要的随机抽样方法
几种重要的随机抽样方法
根据总体的不同特点和不同的调查研究目的,在实际调查研究中常常应用不同方式的随机抽样,最主要的抽样方法有简单随机抽样、分层抽样、等距抽样等。本节介绍最主要的几种,同时,为了比较各种抽样方法的精确度,分别给出每种抽样方法中平均数或比率的标准误公式。
一、简单随机抽样
(一)方法
一般所说的随机抽样,就是指简单随机抽样(simple random
sampling),它是最基本的抽样方法,适用范围广,最能体现随机化原则,原理简单。抽取时,总体中每个个体应有独立的、等概率被抽取的可能。常用的具体抽取方式有抽签法和随机数字法。抽签法(drawing
是把总体中的每个体都编上号码并做成签,充分混合后从中随机抽取-部分,这部分签所对应的个体就组成一个样本。随机数字表(Radom
number table)
是由一些任意的数字毫无规律地排列而成的数字表。附表19就是由1万个数字无规则排列组成的一个随机数字表。使用随机数字表进行抽样时,先给总体编号,然后从表中任意一个数字开始由依次往下数,并把最后几位数字小于总体编号数字的选出,按研究要求组成一个样本。例如,从50个人中随机抽取10人,先将50人从1至50编上号,假如选定04与05—09交叉处的99896开始,纵向往下数并规定凡是最后两位敢字小于50的均可入样本,则23、41、26、25、18、9、28、1、26、
36十个编号的人可组成一个样本。
(二)标准误
前面说过,在图14-1中,d值是抽样结果精确度的一个指标,而d 值实际上受标准误的影响,标准误越大,则d
值也大,这时意味着抽样结果的精确度越小。因此从各种抽样方法的标准误大小,能够直接评价抽样的精确度。
在讨论标准误的公式之前,应该注意区分有限总体与无限总体这两个概念。如果总体中包含个体的数量是有限的,该总体就叫有限总体,也就是说无论N有多大,只要不是无穷大,就是有限总体。如果总体中所含个体的数量是无限的,即N&∞,则该总体叫做无限总体。例如,某运动员投篮10次,命中8次,命中率为80%。这10次投篮,相当于一个n=
10的样本,而总体N(即总的投篮次数)
从理论上讲是无限的,因此可以说这个样本是从无限总体抽取的(有时N虽然有限,但样本容量n与N相比很小,即n≤N,则也可近似视为无限总体)。在介绍参数估计和假设检验时,都假设是无限总体的情况,介绍的各个公式也都是在“无限总体中抽样”这一前提之下给出的。在实际研究中,如果总体是有限的,而且不宜假设为无限总体时,则应该注意其区别。
1.平均数的标准误
在简单随机抽样中,平均数的标准误公式如下(由于在实际中总体标准差一般很少事先知道,因此本章的公式均以样本标准差代替总体标准差):
当样本所属单体是无限总体时:
2 比率的标准误
简单随机抽样中当样本容量n较大时比率的标准误为:
从理论上说,简单随机抽样是最符合随机原则的,而且分析抽样误差比较简明。但是这种方法在实践中受到一些限制,存在一些不足。例如,简单随机抽样需要把总体中每一个体编上号码,如果总体很大,这种编号几乎是不可能的。再者,这种抽样方法常常忽略总体已有的信息,降低了样本的代表性。例如,对某一地区的学生进行抽样,测试该地区学生的智力水平,重点学校与一般学校的学生是有差异的,如果不考虑这个因子,则所抽取的样本很可能抽到重点学校的学生多些,或根本没有重点学校的学生。这样,样本的代表性是不理想的,若充分考虑并利用重点与一般存在差异这一已有信息,可以设计出更好的抽样方法(见后面的分层随机抽样)。另外,在大规模的抽样研究时,用抽签法是不可能的,而用随机数字表一个一个地抽,又太费时费力。这时就得采用和简单随机抽样相似,但实施简便的等距抽样方法。
二、等距抽样
等距抽样(Interval sampling) 也叫机械抽样或系统抽样(
systematic sampling)。在实施时,将己编好号码的个体排成顺序,然后每隔若干个抽取一个,例如调查某大学一个系(
N=200)学生的兴趣爱好,采用等距抽样,n=50,则每隔4个人抽一个,如1号、5号、9号…,或2号、6号、10号…。
一般来说,这种抽样方法比简单随机抽样简便易行,
而且它比较均匀地抽到总体中各个部分的个体,样本的代表性比简单随机抽样好。至于究竟间隔多远抽一个,视总体大小和样本所需容量而定,但是,如果总体具有某一种周期性变化,则等距抽样的代表性远不如简单随机抽样。例如,前面举的从大学抽样调查兴趣爱好的例子中,假如正好男女生的编号分别为奇盘或偶数则隔4个抽一个很可能全抽到男生或全抽到女生,由于兴趣爱好在男、女生之间可能有明显差别,这时只用男生(或女生)的样本不能代理全体,另外,等距抽样同简单随机抽样一样也容易忽略已有信息,例如,从某个区县抽样调查高三学生智力水平,已知该区县有两所重点学校(高三学生分别为150人和100人),根据总体及样本容量的要求,决定每隔200人抽一个,设一所重点学校学生的编号是509
至609. 另一所重点学校学生的编号是1250
至1400,进行等距抽样时若从第10号开始抽,则抽到的学生为10、210、410、610、81
0、、1410...,这样,重点中学的学生一个没抽到,显然是不合适的.
三、分层随机抽样
分层随机抽样简称分层抽样(stratified sampling 或hierarchical
sampling)。具体做法是按照总体已有的某些特征,将总体分成几个不同的部分(每一部分叫一个层),再分别在每一部分中随机抽样。它充分利用了总体的已有信息,因而是一种非常实用的抽样方法。
对于一个总体究竟应该如何分层,分几层,要视具体情况而定。总的一个原则是,各层内的变异要小,而层与层之间的变异越大越好,否则将失去了分层的意义。例如,从某综合大学抽样调查学生逻辑推理能力,根据以往的研究结果,文科与理科学生的逻辑推理能力有显著盖异。因而进行分层抽样时就按文、理科分为两层,或分成文、理、交叉学科三个层次。
有些复杂问题,常常还需要按两个或两个以上的分层标准进行分层。例如,以儿童为对象,进行心理实验研究时,要考虑到遗传、环境、年龄、性别等对儿童有影响的各种因子,在选取样本时,应该按照这些因子进行多个分层标准的分层抽样。美国心理学家韦克斯勒(Wechsler)1966年编制的幼儿智力量表(WPPSI),抽样时曾考虑到6个分层标准:①年龄(4岁-6岁半,每半岁为一组);@性别;③种族(白人与非白人);④地区(东北部、中北部、西部、南部);⑤家长职业(8种职业):⑥城市与农村。这样,先按年龄分成6个年龄组,每组又按性别分为男女各半,然后再考虑种族、地区、家长职业、城乡等继续分层。
日本1967年修订WPPSI时,认为日本国情与美国不同,因此只按年龄、性别、地区三个标准进行分层。可见分层标准并不是一成不变的,即使是同一个研究课题,在不同的条件下,用什么标准进行分层以及对于每一个分层标准应当分为几层均需视具体情况而决定。
既然各个层之间的差异较大,那么各层的人数分配也不应一律等同,设总体为N,所需样本容量为n,则如何合理地将n分配在各层,是分层抽样的一个重要问题。具体施行过程中有两种方式:
1 按每层人数比例分配
这是在各层内的标准差不知道的情况下常用的分配方式,基本思想是人数多的层多分配,人数少的层少分配。设各层的人数分别为N1、N2、N3、...、Nk,则每层应分配的人数为n1、n2、n3、…、nk,则:
N=N1+N2+N3+…+Nk
N=n1+n2+n3+…+nk
如果按人数比例分配,则:
2 最佳分配
这种分配不但根据各层人数比例,还考虑到了各层标准差。如果各层内的标准量已知,就应该考虑到标准差大的层要多分配,标准差小的层要少分配。这样不但根据各层人数比例,还考虑到各层标准差的分配叫最佳分配。这时,任意一层应分配的人数ni为:
(二)标准误
为了简化公式,先引人统计量Wi,令Wi=Ni/N
1、平均数的标准误
某大学为了调查新生推理能力,以分层抽样的方式从1500名新生中抽取200名进行瑞文推理测验。已知新生中文科500名、理科800名、边缘学科200名,根据历年同类调查的资料,新生瑞文推理测验成绩的标准差文科是S1
= 10,理科是S2=7,边缘学科S3 = 12,试问这次调查时这200名被试如何在文、理、边缘学科中分配?样本平均数(n
=200)分布的标准误为多少?
因此.200人的样本应包括77名文科生,86名理科生,37名边缘学科学生,样本平均敛( n =200)分布的标准误为:
2 比率的标准误(样本容量n 较大时)
无限总体:
式中pi为某一层内的比率;qi=l-pi;Wi、Ni、ni的意义同前。
分层抽样由于充分利用了总体已知的信息,其样本的代表性及推论的精确性一般优于简单随机抽样。比较两种抽样方式的标准误,能够说明这种分层的效果。
如前所述,一般总体方差并不易得到,常以样本方差来估计,因而这里S代表总体的差异。在分层抽样中,总体变异实际上来源于层与层之间和各层内部,即层间与层内两部分。
从上可知,分层抽样时平均数的标准误为:
这表明,对于同一个总体,分层抽样与简单随机抽样在样本容量相同时,前者的抽样误差小于后者的抽样误差。
此外,从上述分析中还可以看到,当层间变异增大时,层内变异减小(相对于同一总体),使SE减小。也就是前面曾提到的,分层抽样中层与层之间变异越大,则分层的效果越好。
四、两阶段随机抽样
当总体容量很大时,直接以总体中的所有个体为对象,从中进行抽样,在实际调查或研究中存在很大困难。例如调查全国某一年龄组城市儿童的认知能力,若直接从该年龄组的儿童中简单随机抽样,首先遇到的困难是将全国各城市该年龄的儿童编号过程;其次所抽到的个体在全国范围分布得很散,使研究人员很难进行实际的调查。如果进行分层抽样,它只是把总体按某种特性分成不同的几个部分(层),在每一层中均须抽样,总的来说还是在原总体范围内抽取个体,当总体很大时仍然存在校大的人力、财力方面的困难。
在实际研究中,对于这类大范围的调查研究一般采取阶段抽样方法,像上面那样的调查,若第一阶段先以城市为抽取单位,从全国所有城市中随机抽取一部分城市(这样等于用这部分城市代表所有城市),第二阶段再从所选取的城市中随机抽取调查对象(个体),这就是两阶段随机抽样(
two-stage random sampling)。
一般而言,进行两阶段抽样时,首先将总体分成M个部分,每一部分叫做一“集团”(或“群”),第一步从M个集团中随机抽取m个作为第一阶段样本,第二步是分别从所选取的m个“集团”中抽取个体(ni)构成第二阶段样本,可见第一阶段样本中的单位,相对于第二阶段来说又是总体(分总体)。
设总体容量为N,某一“集团”的容量Ni,所需样本容量为n,从某一“集团”所抽个体数为ni,则:
N =∑Ni , n =∑ni
若各个“集团”的容量Ni均相同,记为,则各个ni应相同(),这时:
N = M&, n = M&
学习者应注意两阶段抽样与分层抽样的根本区别。从形式上看,似乎部分成两步,第一步将总体分成若干部分,第二步再分别从部分中抽取个体。但二者在第一步中有着根本区别。
在分层抽样中,对于每一个部分总体(即“层”)均需从中抽取个体,因而没有第一阶段样本的问题,而在两阶段抽样中,将总体分成若干个“集团”后,并不是对每一个集团都再进行第二阶段抽样,而是从所有的“集团”中先抽取部分“集团”,这里实际上进行了第一阶段的抽样,构成了第一阶段样本,然后再对所选“集团”作第二阶段抽样。
(二)标准误
在进行两阶段抽样时,大部分情况是有限总体,这里给出有限总体情况下的抽样标准误。
1.平均数的标准误
①一般情况下(各不相等):
③如果各“集团”大小(Ni)相同,则进行第二阶段抽样时,ni也应相同。这时各“集团”的大小记作,从中抽取的个体数记为;
(为某一集团的抽样平均数,为整个样本的平均数)
2 比率的标准误(样本较大时)
一般而言,两阶段抽样相对于简单随机抽样,标准误要大些〈即抽样误差大些),这主要是由于存在第一阶段的抽样,使得第二阶段抽样时已经不是从全总体中抽取,而是从全总体的部分代表(第一阶段样本)中抽取。但是,两阶段抽样简便易行,节省经费,因而它是大规模调查研究中常被使用的抽样方法。
抽样方法还有一种分类是根据每次抽取的样本是否在下次抽样前放回总体中,分为有放回抽样和无放回抽样。有放回抽样(sampling with
replacement)
是指每次从总体中抽取一个个体,观测后放回总体中,再抽下一个,对这n个个体总体变量值作观测,所得到的样本(理论值)被称为“简单样本”
(simple sample),或“i.i.d样本”(independent identically
distributed)。与此对应的是无放回抽样(Sampling without
replacement),即每次从总体中抽一个个体,观测后不放回总体中,再抽下一个,或者等价地,从总体中一下子取出n个个体进行观测。在无放回抽样下得到的样本,从理论上讲就不再是简单样本了,但是当总体中个体的数目很多(与样本大小比较)时,从总体中抽掉一些个体没有太大的区别。在这种情况下,即使是无放回抽样也可以近似地看成是有放回抽样,即简单样本。
不管采用什么类型的抽样方法,为保证样本代表性,在抽样时必须遵循随机化原则,即在抽样时,总体中每一个体按照概率原理被抽取的可能性是相等的,否则,样本研究就不会具备代表性。各种随机抽样方法为保证这一环节的成功起着非常重要的作用。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。查看: 13|回复: 0
华师16秋《教育信息处理》在线作业答案
发表于 昨天&11:02
一、(共 7 道试题,共 14 分。)
V 1.&&目前应用最广的项目反应模型是二级评分的 。
. 单维线性模型
. 单维非线性模型
. 多维线性模型
. 多维非线性模型
& & 标准答案:
2.&&如果信源中某一消息发生的不确定性越大,一旦它发生,并为收信者收到后,消除的不确定性就越大,获得的信息也就 。
& & 标准答案:
3.&&区分度与难度的关系是 。
. 试题的难度影响试题的区分度
. 试题的难度不影响试题的区分度
. 试题的区分度影响试题的难度
. 试题的区分度不影响试题的难度
& & 标准答案:
4.&&考试过程可以看作信息传输过程,试卷为信息源,考生的思维为信道,考生的答卷为接收到的信息。因此,可用 作为评分标准。
& & 标准答案:
5.&&20世纪70年代,日本学者佐藤隆博运用熵的概念,给出了各选项有效性评价的一个量化指标是 。
. 等价选项个数
. 题目反应分布
& & 标准答案:
6.&&根据教材分析所采取的方法的不同,可以将教材分为 。
. 基于教育目标分类体系为代表的目标分析和基于教材内容的教材分析
. 内容结构化为目的的方法和以序列化为目的的方法
. 基于矩阵的表现方法和基于图形的表现方法
. 基于教师的主观认识和教材内容的演绎的分析方法和基于学习者数据所进行的归纳的教材分析方法
& & 标准答案:
7.&&信源是 。
. 信息本身
. 信息的来源
. 信息的获取
& & 标准答案:
二、多选题(共 24 道试题,共 48 分。)
V 1.&&模式识别系统一般由 部分组成。
. 信息的采集与转换
. 信息的预处理与分析
. 特征参量的提取
. 信息的分类与识别
& & 标准答案:
2.&&用于教材分析的基本思想是:
. 教材是一种系统
. 教材中要素间的逻辑关系在实现教材中各要素的系统化而构成教材的过程中,要素间的逻辑关系甚为重要
. 决定教材分析的教材观
. 影响教师的教学效果
& & 标准答案:
3.&&根据测量的精确程度,史蒂文斯(Stvns,S.S.)将量表从低级到高级分成:
. 类别量表
. 等级量表
. 等距量表
. 等比量表
& & 标准答案:
4.&&ISM方法是一种宏观性要素模型法,主要揭示系统各要素间的 等定性关系。
. 因果关系
. 并列关系
. 前提关系
. 从属关系
& & 标准答案:
5.&&从史氏对测量下的定义可以看出,测量包括三个要素:
. 事物的属性
& & 标准答案:
6.&&这两个指标反映了题目质量的两个重要方面。
& & 标准答案:
7.&&考察一个测验有效程度的途径主要有三个,相应地也就把测验的效度分为三个类型:
. 数量效度
. 内容效度
. 结构效度
. 效标关联效度
& & 标准答案:
8.&&估计威布尔分布各参数的常用方法是 。
. 概率纸法
. 极大似然法
& & 标准答案:
9.&&对于多项选择题来说, 综合评价指标是对题目各选项的有效性做出评价的方法。
. 题目反应分布模式分析方法
& & 标准答案:
10.&&信息熵有哪几种物理含义?
. 信息熵H(X)是表示信源输出后,每个消息(或符号)所提供的平均信息量。
. 信息熵H(X)是表示信源输出前,信源的平均不确定性。
. 用信息熵H(X)来表征变量X的随机性。
. 信息熵是信源的平均不确定的描述。
& & 标准答案:
11.&&在IRT理论中,项目的参数有 。
. 猜测系数
& & 标准答案:
12.&&一般统计资料可能有三种误差:
. 抽样误差
. 随机误差
. 行为误差
. 系统误差
& & 标准答案:
13.&&误差的来源有哪几个方面?
. 测验自身引起的误差
. 施测过程引起的误差
. 被试本身引起的误差研究者计算出现的误差
& & 标准答案:
14.&&在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:
. 简化系统结构,探讨系统内核。
. 构造预测模型,进行预报控制。
. 进行数值分类,构造分类模式。
. 综合研究对象,分析系统分布。
& & 标准答案:
15.&&决定学习所需要的时间的三个因素是 。
. 能力倾向
. 理解教学能力
. 教学效率
. 教学质量
& & 标准答案:
16.&&应答分析系统的教育特性主要表现在:
. 课堂教学中,与学生举手回答问题,或教师指定学生回答问题不同,学生使用应答器回答问题是独立地完成的,与其他学生间不产生任何影响。这种影响不仅是认知的,也包括情感的。
. 系统不仅能知道某一位学生,在某一时刻对某一问题的应答结果,还能知道全班学生在规定时间内的累积。
. 可对每一位学生的应答数据进行实时记录。这种记录包括应答结果和应答时间特性等诸项内容。应答时间是一种应答过程的时间特性,它包括个别应答的时间特性和累积应答的时间特性。
. 课堂教学中,可以激发学生勤学好问的主动学习的态度和积极性。
& & 标准答案:
17.&&估计信度常用的方法有:
. 再测信度
. 复本信度
. 分半信度
& & 标准答案:
18.&&教育信息源有哪三种?
. 广义的教育信息源
. 狭义的教育信息源
. 中义的教育信息源
. 实态教育信息源
& & 标准答案:
19.&&概念图的类型有 。
. 关联树表
& & 标准答案:
20.&&常用的评价领域(分类标准)可从以下几个方面确定:
. 内容领域
. 目标领域
. 内容领域与目标领域的结合
. 内容序列
& & 标准答案:
21.&&根据信道的用户多少,可以分为 。
. 两端(单用户)信道
. 多端(多用户)信道
. 无反馈信道
. 反馈信道
& & 标准答案:
22.&&属于教育信息传输子系统的是 。
. 录像设备
& & 标准答案:
23.&&影响信度的主要原因有:
. 题目越多,试题的取样越适当
. 题目越少,试题的取样越适当
. 题目越多,测验分数受猜测因素的影响越小
. 题目越多,测验分数受猜测因素的影响越大
& & 标准答案:
24.&&类别量表具有 和 两种功能。
& & 标准答案:
三、(共 19 道试题,共 38 分。)
V 1.&&1963年,美国教育心理学家约翰·卡罗尔(John .rroll)以时间概念为中心,提出了学校学习模型。
& & 标准答案:
2.&&在一般情况下获得的信息量是两熵之差,并不是信息熵本身。
& & 标准答案:
3.&&任何两次测量所产生的误差相互独立。
& & 标准答案:
4.&&由于信息的大小与信源的不确定性有关,因此,研究信息的度量就变成了研究信源的不确定性的度量。
& & 标准答案:
5.&&多元统计分析一般不对数据作统计模型假设,而直接从实际出发,考察和分析大量数据的结构和特征,从中提取主要而准确的信息。
& & 标准答案:
6.&&S—P表是由日本庆应义塾大学藤田广一教授于1969年提出的一种将学生(Stunt) 和学生对每一问题(Prolm)的得分情况依据一定的法则排成的学生—问题得分二维表。
& & 标准答案:
7.&&S--P--T表的制作时,时间矩阵二值化(只用0、1表示)这一步中,首先为每个问题确定时间阈值(可以求平均获得,也可由教师给定),应答时间大于时间阈值的,二值化数据取0,小于或等于时间阈值的,二值化数据取1。
& & 标准答案:
8.&&信源在单位时间内输出的熵(或平均信息量)称为信源的熵速率,信源熵速率也叫信息速率。
& & 标准答案:
9.&&误差是指一个量的观测值或计算值与其真值之差,它反映某客观现象的一个量在测量、计算或观察过程中由于某些错误或通常由于某些可以控制的因素的影响而造成的变化偏离标准值或规定值的数量。
& & 标准答案:
10.&&定量分析主要是对题目的难度和区分度进行分析。
& & 标准答案:
11.&&计算机辅助测验系统也可以看作是一种教育信息传输子系统。
& & 标准答案:
12.&&信息就是消息或者信号。
& & 标准答案:
13.&&卡罗尔模型涉及五个因素,能力倾向、理解教学的能力和毅力属于外部因素。
& & 标准答案:
14.&&误差就是测量中产生的错误。
& & 标准答案:
15.&&因子分析就是通过寻找众多变量的公共因素来简化变量中存在的复杂关系的一种方法。它将多个变量综合起来,探寻原始变量之间的相互关系。
& & 标准答案:
16.&&形成性测验(练习习题测验、学习诊断等)得到的信息是可以对学生进行正确的诊断的。
& & 标准答案:
17.&&概念图,即指以图解的方式,直观地、结构化地描述两个或多个概念之间关系的各种图表。这里所指的“关系”,不包括心理层级关系。
& & 标准答案:
18.&&与效标关联效度相比,内容效度是次要的,是缺乏科学依据的。
& & 标准答案:
19.&&接受学习既可以是机械的,也可以是有意义的。
& & 标准答案:
本帖子中包含更多资源
才可以下载或查看,没有帐号?
站长推荐 /1
【谋学网】各专业职称论文发表,奥鹏毕业论文,奥鹏作业代写,统考复习资料提供等,具体联系客服。
400-627-0688
Powered by

我要回帖

更多关于 个体户行业分类 的文章

 

随机推荐