原子总数怎么算34完成20、这个完成率怎么算?

当前位置: >>
管理数量方法第一章 数据的整理和描述 第一节 数据的类型一、根据描述事物所采用的不同度量尺度: (一)分类型数据(品质数据) 描述事物的品质特征。分类型数据的分类必须是清楚唯一的,比如产品分为合格品和不合格品两种,那么一个产 品不可能同时既是合格品又是不合格品; (二)数量型数据 说明事物的数量特征。数量型数据是用数值的形式来进行表示的,比如企业某批次产品的合格率为 95%,企业的 员工总数为 500 等; 二、按照被描述对象与时间的关系: (1)截面数据(横向数据):描述事物在某一时间的特征; (2)时间序列数据(纵向数据):描述事物在某一时间范围内的变化情况; (3)平行数据:截面数据与时间序列数据的组合; 三、变量: 在统计中,我们把对事物现象特征的描述称为变量。根据对象又分为分类型变量和数量型变量,由于大多数情况 下讨论的都是数量型变量,因此常把数量型变量简称为变量。注意:变量不同于变量的值。第二节一、数据的分组与频率直方图数据的整理与图表显示统计分组是数据整理的一项初步工作,其目的是根据实际需要,按数据的某种特征或标准将数据分成不同的组 别,对数据的分组需要按照数据的特征来进行,因此,对分类型数据和变量型数据分组的方法有一些差异。 1.对于分类型数据: 频数分布: 频数分布是一列表明几个不重叠组中的每一组项目的频数(或数目)的数据集的表格汇总。 将数据分组后,计算每一组(类别)中的数据出现次数(频数),形成频数分布表。全部数据在各组内的分布状 况称为数据的频数分布;分配在各组内的数据个数称为频数;频数与总体个数之比称为频率。 例 1:某超市 50 次顾客购买的饮料品牌的样本数据如下 脉动 统一 百事可乐 统一 脉动 脉动 汇源 雪碧 脉动 统一 脉动 统一 脉动 雪碧 百事可乐 脉动 脉动 脉动 百事可乐 汇源 脉动 百事可乐 百事可乐 百事可乐 脉动 汇源 百事可乐 雪碧 脉动 脉动 百事可乐 脉动 雪碧 汇源 百事可乐 汇源 雪碧 脉动 统一 脉动 脉动 脉动 管理数量方法统一 百事可乐百事可乐 脉动统一百事可乐统一百事可乐饮料购买次数的频数(率)分布 品牌 脉动 统一 汇源 百事可乐 雪碧 总计 频数 19 8 5 13 5 50 频率(%) 38 16 10 26 10 100 累积频率(%) 38 54 64 90 100例 2:某班级“数量方法”考试成绩如下,统计补考、及格、良、优各类考生的情况。 55 71 85 56 70.5 76 70 65 97 91 55.5 67 66 62 66.5 88 78.5 87 73 73 80 65 76 77.5 63 85 73 71 72.5 64注:该数据集本身不是分类型数据集,但其中的数据可以按成绩标准进行分类。 (1)确定分组标准 补考:成绩<60;及格:60<=成绩<75;良:75<=成绩<90;优:成绩>=90 注意:要谨防某些临界点的数据被重复统计或遗漏。 (2)确定各组频数 (3)计算各组频率及累积频率 2.对于数量型数据 数量型数据除了可以按上述方法统计频数分布情况外,还有更多的分组和整理方式,这里我们只介绍两种方法。 A、单变量值分组法 数据较少或数据分布比较集中时,把每一个变量值作为一个组。如,将一颗骰子连掷 200 次,记录每一次骰子的 点数。但在数据较多且取值比较分散的情况下,会形成太多分组,不便于观察数据的分布特征和规律。 如:将一颗骰子连掷 200 次,记录每一次骰子的点数。 骰子点数 1 2 出现次数(频数) 32 37 频率 16.0% 18.5% 管理数量方法3 4 5 6 合计 B、组距分组法30 34 32 35 20015.0% 17.0% 16.0% 17.5% 100.0%当变量值较多时(特别是对于连续型随机变量),单变量值分组法不适用,此时一般采用组距分组法。 分组的方法与步骤: (1)将全部数据按大小顺序排列,找出最大值和最小值; (2)确定组数及组距;(根据数据的数量,一般使用 5-20 个组,组距不一定要相等,但在一般情况下选择相等最大数据值a-最小数据值 b 组数 的组距)近似组距=(3)计算每组的分组界限、组中值、频数、频率等,形成频率分布表及频率直方图。 例:考虑对如下数据进行分组统计 8.9 6.8 解: (1)排序后找出最大及最小值 6 11.2 6.8 11.5 7.5 11.5 7.8 11.5 8.9 12.2 9.5 12.2 10 13.5 10 14.1 10 14.9 10.2 15.8 10.2 9.5 11.5 11.5 7.8 11.2 10 14.9 12.2 7.5 13.5 10 14.1 6 10 15.8 12.2 11.5(2)确定组数及组距: 由于 n=20,考虑分为 5 组;15.8-6 5 近似组距= =1.96 ? 2(3)计算每组界限: [6,8)、[8,10)、[10,12)、[12,14)、[14,16] 计算并形成频率分布表 组号 1 2 3 4 5 还可考虑形成频率直方图: 分组界限 [6,8) [8,10) [10,12) [12,14) [14,16] 频数 vi 4 2 8 3 3 频率 fi(%) 20 10 40 15 15 组中值 7 9 11 13 15 管理数量方法在横轴上以每个分组区间为底边,画出以频率为高的矩形。4030Percent20100 7 9 11 13 15C1二、数据的图形显示 除了前面所说的频率直方图之外,还有许多数据的图形显示方法。下面,我们简单介绍一下饼形图、条形图、柱 形图、散点图、折线图、曲线图和茎叶图几类图形表示法,及其主要的用途。 (1)饼形图 饼形图的成分不宜太多,过多的细小部分可以合并为“其它”;扇形的面积所占图形的比率即是对应组的频率;各组数据比例[14,16] 15%[6,8) 20%(2)条形图和柱形图[12,14) [8,10) 15% 条形图是用来对各项信息进行比较的,一般来说,纵坐标没有尺度,只用来标注各项信息的名称; 10%柱形图除了可具备条形图的功能外,常用于表示同一事物在不同时间点(或区间)的对比性度量,这时用横坐标 表示时间,纵坐标表示数据的大小。 [10,12) 40%(3)折线图 折线图常用来表示事物随时间的变化趋势,相当于将柱形图各顶点间用直线连接起来而形成。 管理数量方法2.2 2.1 2 1.9 1.8 1.7 1.6由于商务和金融领域中的许多事物的变化是渐进连续的,折线图无法显示出这一特性,因此采用光滑的曲线连接 各点,形成一条整体光滑的曲线,就形成了曲线图。但我们会发现两点之间可以有无数条不同的连接曲线,因此要形 成恰当的曲线图,要求数据点要尽可能的多且较密集。 时间(5)散点图 主要用来显示两个变量之间的相互关系及数据的变化趋势(集中或离散)。两个变量的任何一对取值代表坐标系 中的一个点。 例:某音响店的商业广告数与销售额的相关数据如下表 周 1 2 3 4 5 6 7 8 9 10 广告数 x 2 5 1 3 4 1 5 3 4 2 销售额 y(百美元) 50 57 41 54 54 38 63 48 59 4620 02 年 20 12 03 月 20 年4 0 20 3年 月 03 8 年 月 20 12 04 月 20 年4 0 20 4年 月 04 8 年 月 20 12 05 月 20 年4 0 20 5年 月 05 8 年 月 12 月(4)曲线图每股净资产(元) 管理数量方法对应散点图如下70 60 50销售额y(6)茎叶图40 30 2010 把每一数据分解成两部分,左边为“茎”,右边为“叶”。 0 0 2 例 1:原始数据如下4 广告数x 1026114 127 13299 119 106131 115 125124 98 122117 104 118106 151144 118由于数据包括两位和三位,所以选择百位和十位为“茎”,个位为“叶”。 9 10 11 12 13 14 15 9 8 2 6 4 6 4 7 9 5 8 8 4 7 5 2 1 2 4 1例 2:原始数据如下 11.3 9.3 9.6 8.1 10.4 7.7 7.5 7.5 8.3 8.4 10.5 6.3 10 8.8由于数据包一位小数位,所以选择整数位为“茎”,小数位为“叶”。 6. 7. 8. 9. 10. 11. 3 5 7 5 3 1 4 8 6 3 4 5 0 3 管理数量方法第三节 数据集中趋势的度量用来度量数据位置特征的各种统计量中,最常用的就是平均数、中位数、众数、极差、四分位数及变异系数等, 前三者用于度量数据的集中趋势;后三者用于度量数据的离散趋势。 一、平均数x?x1 ? x2 ? ? ? xn 1 n ? ? xi n n i ?1平均数在度量数据的集中趋势是易受个别极端值的影响。 二、中位数 将数据按大小顺序(升序或降序)排列,位于数列正中间的数值为该数据集的中位数。 当数据集中存在极端值时,中位数更能描述数据的集中趋势。 注:(1)重复的数据不可删除;x n?1(2)若数列个数 n 为奇数,则2为中位数;?1xn ? xn2 2(3)若数列个数 n 为偶数,则2为中位数;例 1:计算数据集 46、54、42、46、32 的中位数。 按由小到大的顺序排列: x1 32 x2 42 x3 46 x4 46 x5 54由于 n=5 为奇数,(n+1)/2=3,所以x3 =46 为中位数例 2:计算数据集 46、54、42、37、46、32 的中位数。 按由小到大的顺序排列: x1 32 x2 37 x3 42 x4 46 x5 46 x6 54由于 n=6 为偶数,n/2=3,n/2+1=4 所以( 三、众数 数据集中出现次数最多的数值。x3 + x4 )/2=44 为中位数注意:有点数据集中可能没有众数或有多个众数。 例:在下列数据集中 22 44 58 40 24 46 50 29 29 31 52 37 57 32 31 44 41 29 30 4929 的频数为 3,31 和 44 的频数为 2,其余数据频数为 1,因此 29 为该数据集的众数。 众数在分类型数据的分析中具有特别的意义,比如国家的个人所得税的征收政策的制定,房地产商房屋格局的规 划等。 管理数量方法四、平均数、中位数和众数的关系 对于单峰对称直方图,三数相同; 对于峰值偏向左边的单峰非对称直方图,五、分组数据的平均数(加权平均) 当缺少原始数据,仅有数据的频率分布表信息时,采用加权平均的方法近似地计算平均数。(频数 ? 组中值)之和 i ?1 = m 频数的和平均数=?v yimi?vi ?1i其中 m 为组数;vi 为第 i 组的频数;yi 为第 i 组的组中值。 例:已知数据如下,求工程平均完工时间。 工程时间(天) 10--14 15--19 20--24 25--29 30--34 解:组中值=(上限+下限)/2,得 工程时间(天) 10--14 15--19 20--24 25--29 30--34 合计 平均完工时间 x =380/20=19 天 当采用单变量值分组法时,vi 恰为 yi 出现的次数,这时常把 vi 称为 yi 的权重,此时所计算的平均值则为精确平 均值。 频数 vi 4 8 5 2 1 20 组中值 yi 12 17 22 27 32 vi.yi 48 136 110 54 32 380 频数 vi 4 8 5 2 1 管理数量方法第四节数据离散趋势的度量观察以下两个图形,我们发现这两个数据集有着相同的平均数、中位数和众数,但二者却有着明显的不同,如何 来描述二者间的差异呢?由此可以看出,一个数据集中各数据的分散情况,或者离散程度应该是数据集的另外一个重要特征,为此,我们 引入度量数据离散程度的几中方法。 一、极差(全距) 即数据集中最大值与最小值之差,其大小可在一定程度上说明数据集的离散或集中程度。但易受极端值的影响。 如某班级学生考试分数 55 71 85 56 70.5 76 此时的极差为 97-55=42 若该班级中的 55 分变为 20 分的话,极差将变为 72,但通过散点图,我们会发现数据的集中程度并没太大的变 化。 二、四分位点(数)和四分位极差 四分位点就是把数据集四等分的那些数值(不一定是数据集中的数据)。四分位点共有三个,分别记为 Q1(第一 四分位点,也是第 25 百分位点)、Q2、Q3。 四分位点的计算: (1)将数据按大小顺序排列; (2)计算 Q1 的位置:i=n/4;其中 n 为数据的总数; (3)根据 i 计算四分位点: 若 i 不是整数,则取大于 i 的最小整数,xi 即为 Q1; 若 i 是整数,则(Xi+Xi+1)/2 为 Q1; (4)同理,用 i=2n/4、i=3n/4 可计算 Q2 和 Q3。 另外还有一种方法,那就是先求出数据集的中位数,也就是 Q2,然后再在 Q2 的两侧同样用求中位数的方法求出 Q1 和 Q3。 70 65 97 91 55.5 67 66 62 66.5 88 78.5 87 73 73 80 65 76 77.5 63 85 73 71 72.5 64 管理数量方法四分位极差=Q3-Q1 例 1:计算下列数据集的四分位点和四分位极差 22 44 解:排序后得: x1 22 x11 40 n=20 计算 Q1 的位置: i=20/4=5,i 为整数,所以 Q1=(X5+X6)/2=(29+30)/2=29.5 同理,可得 Q2=38.5、Q3=47.5 四分位极差=Q3-Q1=18 例 2:计算下列数据集的四分位点和四分位极差 22 44 解:排序后得: x1 22 x11 41 n=19 计算 Q1 的位置: i=19/4=4.75,i 为小数,所以 Q1=X5=29 同理,可得 Q2=X10=40、Q3=X15=49 四分位极差=Q3-Q1=20 三、方差和标准差 方差(variance) 利用所有数据的值计算而来的衡量总体变异程度的量度。它是基于各数据值与平均值之间的差异而来的。 x2 24 x12 44 x3 29 x13 44 x4 29 x14 46 x5 30 x15 49 x6 31 x16 50 x7 31 x17 52 x8 32 x18 57 x9 37 x19 58 x10 40 58 40 24 46 50 29 29 31 52 37 57 32 31 44 41 49 30 x2 24 x12 41 x3 29 x13 44 x4 29 x14 44 x5 29 x15 46 x6 30 x16 49 x7 31 x17 50 x8 31 x18 52 x9 32 x19 57 x10 37 x20 58 58 40 24 46 50 29 29 31 52 37 57 32 31 44 41 29 30 49? =2? ( xi ? ? ) 2i ?1N总体方差N??xi ?1N2 i? Nx;N 管理数量方法n 1? n ? ? ( xi ? x) ? xi ? n ? ? x i ? ? xi2 ? nx 2 i ?1 ? i ?1 ? ? i ?1 s 2 ? i ?1 ? n ?1 n ?1 n ?1 样本方差 n n 2 2 2标准差(standard deviation) 总体标准差: ?2 ? ?样本标准差: s ?s2例 1:某班级学生考试分数如下,计算成绩的方差和标准差。 55 71 85 56 70.5 76 70 65 97 91 55.5 67 66 62 66.5 88 78.5 87 73 73 80 65 76 77.5 63 85 73 71 72.5 64解:由于数据集中包含了班级所有考生的成绩,因此这是一个总体。? ? 72.67N=30? 2= i ?1? (xNi? ?)2={(55-72.67) +(70-72.67) +?+(64-72.67) }/30=107.442 2 2N? ? 10.37或者? =2?xi ?1N2 i? Nx={(55 +70 +?+64 )-30×72.67 }/30=106.952 2 2 2N? ? 10.34例 2:《数量方法》为自学考试统考课程,某学期共有 2832 名考生参加了该门课程的考试,现随机抽取其中 30 名 考生的成绩如下,估计此次考试成绩的方差和标准差。 55 71 85 56 70.5 76 70 65 97 91 55.5 67 66 62 66.5 88 78.5 87 73 73 80 65 76 77.5 63 85 73 71 72.5 64解:由于 30 名考生的成绩是从 2832 名考生总体中抽取的,所以是一个样本。x =72.67n=30 管理数量方法s=2?xi ?1n2 i? nx={(55 +70 +?+64 )-30×72.67 }/29=110.642 2 2 2n ?1s ? 10.52变异系数 用来对具有不同属性的多组数据的离散程度进行对比衡量的量度,表示数据相对于其平均数的分散程度。 变异系数=标准差/平均值×100% 例:有两个厂家生产的化妆品,A 厂标明产品净重 50 克,B 厂标明产品净重 75 克,以下是对两厂随机抽取的 10 组产品的实际净重,试比较两厂产品净重的离散程度。 厂家 A 厂家 B 49 73 48 742 Ai 2 ? nx A50 7653 7648 7549 7352 7451 7550 7651 74解: x A ? 50.1s2 A?x ?2 Bin ?1? 2.77s A ? 1.66VA ?1.66 ? 3.32% 50.1x B ? 74.6s2 B?x ?2 ? nx Bn ?1? 1.38s B ? 1.17VB ?1.17 ? 1.57% 74.6第二章 随机事件及其概率 第一节 随机试验与随机事件1.随机试验 广义地讲,凡是一个行动或过程会导致一系列可能结果之一,但具体发生别一结果则是不确定的,这种行动或过 程统称为随机试验。 满足以下几个条件的实验称为随机试验: (1)可以在相同的条件下重复进行; (2)每次试验的可能结果可能不止一个,但是试验的所有可能结果在试验之前确切知道; (3)试验结束之前,不能确定该次试验的确切结果; 注:(1)这里所指的“试验”,不局限于科学实验或工程方面为了探索某种规律或生产某种新产品的试验,而是 一种更广的概念;(2)在实践中,尤其在社会经济及商务管理中不可能在完全相同的条件下重复进行,因而这里所说 的重复进行在实际应用中是相对的。 2.随机事件 随机试验产生的结果称为随机事件,又称不确定事件,简称事件。事件又分为基本事件和复合事件。不能再分解 为其他事件组合的最简单的事件就是基本事件。 任何随机事件都可以分解成基本事件的组合。 在一定条件下,一定发生的事件称为必然事件,用符号 ? 表示;一定不发生的事件称为不可能事件,用符号 ? 表 示。 一个试验中所有基本事件的全体所组成的集合称为样本空间,或者说,随机试验的所有可能结果所组成的全体称 管理数量方法为样本空间。样本空间也用符号 ? 表示。样本空间中的每一个基本事件称为一个样本点。 3.样本空间与随机事件的表示方法 常用的样本空间和随机事件的表示方法有两种:列举法和描述法。 例 1:同时掷两枚骰子,出现点数之和等于 5 描述法:“出现点数之和等于 5” 列举法: ? ={(1,4),(2,3)} 例 2:连续掷两枚骰子(或将一枚骰子掷两次),出现点数之和等于 5 描述法:“出现点数之和等于 5” 列举法: ? ={(1,4),(2,3),(4,1),(3,2)}第二节 事件间的关系与运算事件是由基本事件或样本点组成的集合,因而事件间的关系与运算规律符合集合论中关于集合之间的关系与运算 法则。因此我们常用一个矩形区域表示样本空间,这个区域子区域表示某个事件,也就是集合论中常用的文氏图。 1.包含关系 如果事件 A 中所有的样本点在事件 B 中都能找到,则称事件 B 包含事件 A 或事件 A 包含于事件 B。即若事件 B 发生, 则事件 A 必然发生。记作 B ? A 或 A ? B 2.事件的并事件 A 和事件 B 至少有一个发生的事件。记作 A+B 或 A ? B,n 个事件的并常记作 i ?1 3.事件的交?Ani? A1 ? A2 ? ? An事件 A 和事件 B 同时发生的事件。记作 AB 或 A ? B,n 个事件的交常记作 i ?1 4.互斥事件 事件 A 和事件 B 中有且只有一个发生的事件。 5.对立事件?Ani? A1 A2 ? An事件 A 和事件 B 互斥,且 A+B= ? ,则称两事件为对立事件。(类似于集合中补集的概念,常记作 A 或 B ) 6.事件的差 事件 A 发生,但事件 B 不发生的事件,称为事件 A 与事件 B 的差,由属于 A 但不属于 B 的那些样本点所构成。记 作 A-B。显然 A-B= AB 7.用文氏图表示上述六种关系 管理数量方法B ?AAB 或 A ? BA+B 或 A ? BA-B= AB8.事件的运算 (1)交换律A ? B ? B ? A 即 AB=BA(2)结合律A? B ? B? AA ? ( B ? C ) ? ( A ? B) ? C(3)分配律A(BC)=(AB)CA ? ( BC) ? ( A ? B)( A ? C )(4)摩根律A( B ? C ) ? ( AB) ? ( BC)AB ? A ? BA? B ? A ? B例 1:从一批产品中,每次取出一个产品(取后不放回),抽取三次,用 Ai(i=1,2,3)表示事件“第 i 次取到的 是合格品”。试用文字叙述下列事件下列事件: (1)A1 A2 ? A2 A3 ? A1 A3三次中至少两次抽到合格品; (2)A1 A2 A3三次全抽到次品; 管理数量方法(3)A1 2 ? A2 A3 ? A1 A3三次中至少一次抽到合格品; (4) A1 A2 A3 ? A1 A2 A ? A1 A2 A3 三次中合好有一次抽到合格品; 例 2:从一批产品中,连续取出四个产品,用 Ai(i=1,2,3,4)表示事件“第 i 次取到的是合格品”。试用 Ai 表 示下列事件: (1)抽到的产品全部是合格品; A1A2A3A4 (2)抽到的产品中只有一个次品;A1 A2 A3 A4 ? A1 A2 A3 A4 ? A1 A2 A3 A4 ? A1 A2 A3 A4(3)抽到的产品中至少有一个合格品; A1+A2+A3+A41 ? A1 A2 A3 A4(4)抽到的产品中最多有一个次品;A1 A2 A3 ? A1 A2 A4 ? A1 A3 A4 ? A2 A3 A4第三节 事件的概率与古典概型一个随机事件在一次试验中可能发生,也可能不发生,我们希望知道这些事件在一次试验中发生的可能性大小, 因此,引入了概率这一度量。 1.事件的概率 当试验重复的次数非常大时,我们会发现每一事件(结果)出现的频率趋于一常数值,我们把该常数值称为该事 件的概率。记作 P(A)=p 0 ? p ? 1。 例如,历史上有不少个做过“抛硬币”的试验,德摩根抛了 2048 次,正面出现了 1061 次,频率为 0.518;蒲丰抛 了 4040 次,正面出现了 2048 次,频率为 0.507;卡皮尔逊抛了 24000 次,正面出现了 12012 次,频率为 0.501。由此 可看出,随着试验次数的不断增大,正面出现的频率值越来越接近 0.5 这一数值,因此,0.5 就被视为硬币正面出现的 概率。 2.概率的性质: (1)0 ? P(A) ? 1 (2) P(?) ? 1P(? ) ? 0(3)对于互斥事件 A 和 B,P(AB)=0,P(A+B)=P(A)+P(B),进而,对于 n 个互斥事件, (4)若 A ? B,则 P(B-A)=P(B)-P(A) (5) P( A) ? 1 ? P( A) (6)P(A+B)=P(A)+P(B)-P(AB) P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC). 3.古典概型P(? Ai ) ? ? P( Ai )古典概型即是古典概率模型,它是一种特殊的、简单的试验模型。古典概型试验要求满足下例两个条件: 管理数量方法(1)试验的样本空间只包含有限个样本点; (2)每个样本点的发生是等可能的。P( A) ?NA N4.古典概率计算的两个基本原理 (1)加法原理:完成一件事有两种途径,第一种途径中有 n1 种方法,第二种途径中有 n2 种方法,那完成这件事 共有 n1+n2 种不同的方法。 (2)乘法原理:完成一件事要分两个步骤,第一步中有 n1 种不同的方法,第二步中有 n2 种不同的方法,那么完 成这件事共有 n1×n2 种不同的方法。 排列数:从 n 个不同的元素中取出 m(m&=n)个元素,按照一定的顺序排成一列,称为从 n 个不同元素中取 m 个元 素的一个排列。记作Pnm ?n! (n ? m)!组合数:从 n 个不同的元素中取出 m(m&=n)个元素形成一组,称为从 n 个不同元素中取 m 个元素的一个组合。记m Cn ?作n! m!(n ? m)!例 1:把 3 封信投到 5 个邮筒中,(a)有多少种投法?(b)某一指定的邮筒中恰有 3 封信的概率是多少?(c) 恰有一个邮筒中有 3 封信的概率是多少? 解:(a)分 3 步走,先投 1 封信,有 5 种投法,再投第 2 封,也有 5 种投法,然后投第 3 封,也有 5 种投法,根 据乘法原理,共有 5×5×5=125 种投法。 (b)N=125,某一指定的邮筒中恰有 3 封信只有 1 种可能,所以其概率 P=1/125 (c) N=125,5 个邮筒中任一邮筒恰有 3 封信均只有 1 种可能,根据加法原理,“恰有一个邮筒中有 3 封信”共有 1+1+1+1+1=5 种可能,所以其概率为 P=5/125=1/25 例 2:某一环型结构的酒店共有 2 层客房,每层 15 个房间,现要安排两对夫妇入住,(a)共有多少种安置方式? (b)两对客人恰好住在相邻房间的概率为多少?(假设客房目前均无人入住) 解:(a)酒店共有 n=30 个房间,从中任取两间安排,m=2,由于没有顺序关系,因此这是一个组合问题。共有m 2 C n ? C 30 ?30 ? 29 =435 2 ?1 种安置方法。1 2(b)两对客人恰好相邻,必然要求客人在同一层,可以考虑先把两对客人当作一个整体,即将两个相邻的房间看 作一个整体,然后再考虑两对客人房间的顺序问题。则每一层有 C14 ? P2 ? 14 ? 2=28种安置方法,两层共有 28+28 =56 种安置方法。因此“两对客人恰好住在相邻房间的概率”为 56/435。 思考练习:将数字 0―9 排成两排,(1)数字 5 和 6 恰在同一排的概率为多少?(2)数字 5 和 6 恰在同一排且 5 在 6 右侧的概率为多少? 提 示:“ 将数字 0― 9 排 成两排 ”可 以看作 是“ 将数字 0― 9 排成 一排 后再从 中分 为前后 排” ,因此有N ? P10 ? 2= ! 2 种排列方法。把 5 和 6 看成是一个数,这样就是 9 个数排两排,一排 5 个数,另一排 4 个数。 10 ? 10第四节 条件概率与事件的独立性1.条件概率 在事件 B 已经发生的条件下(P(B)&0),则事件 A 发生的概率称为事件 A 在给定事件 B 下的条件概率,记作 管理数量方法例 1:某制造商从甲、乙两个供应商处购进数量、规格、型号均相同的零件混在一起,已知甲、乙两供应商提供 的零件的次品率分别为 2%和 3%,现众该批零件中取出一个,发现它为正品,试判断该零件为甲供应商所提供的概 率。 解:设事件 A 为“取出一零件为正品”,可知 P(A)=0.975; 事件 B 为“取出一个甲供应商供应的零件”,可知 P(B)=0.5; “取出一个由甲供应商供应的正品零件”的概率为 P(AB)=0.49; 所求问题即求 P(B|A) P(B|A)=P(AB)/P(A)=0.5026 例 2:某烤鸭店经调查得知,顾客中有 75%的吃烤鸭时喜欢用葱,80%的顾客喜欢用黄瓜,65%的顾客喜欢用葱也喜 欢用黄瓜。已知某顾客喜欢用黄瓜葱,那么他喜欢用葱的概率有多大? 解:设事件 A 为“顾客喜欢用葱”,可知 P(A)=0.75; 事件 B 为“顾客喜欢用黄瓜”,可知 P(B)=0.80; “顾客既喜欢用葱也喜欢用黄瓜”的概率为 P(AB)=0.65; 所求问题即求 P(A|B) P(A|B)=P(AB)/P(B)=0.65/0.80=0.8125 2.概率的乘法公式: P(AB)=P(A)P(B|A)=P(B)P(A|B)例:甲、乙、丙三人只有一张电影票,他们决定抓阉决定给谁,甲第一个抓,乙第二,丙第三。求每个人获得电 影票的概率。 解:设 A、B、C 分别代表为甲、乙、丙抽中电影票。则甲能抽中的概率 P(A)=1/3。 乙抽中的前提必然是甲没抽中(只剩两个签),此时乙抽中,所以根据概率的乘法公式可知乙抽中的概率为同理,丙抽中的前提必然是甲乙都未抽中(只剩一个签,必中),所以丙抽中的概率为3.事件的独立性 如果事件 A 的概率不会因为事件 B 的存在与否而改变,则称事件 A 与事件 B 独立。 推论: (1)若 A 与 B 独立,则 A 与 、 与 B、 与 也相互独立;(2)若 A 与 B 独立,则 P(A|B)=P(A)、P(B|A)=P(B); (3)若 P( + , ,?? 相互独立,则 )=1??+??+独立事件的乘法公式:例:设病人对某药品注射过敏的概率为 0.20,有三个病人注射了该药品,求(1)三人都过敏的概率;(2)至少 有一人不过敏的概率。 解:设 A、B、C 分别代表为第一个、第二个、第三个病人对该药品过敏。 管理数量方法(1)所求的概率即 P(ABC)。由于一个病人对该药品过敏与否与其他病人过敏与否无关,因此,A、B、C 相互独 立。所以有: P(ABC)=P(A)P(B)P(C)=0.2*0.2*0.2=0.008 (2) D 代表三个病人对该药品都过敏,E 代表三人中到少有一人不过敏,则 D 和 E 互为对立事件,即 D+E=Ω , 令 P(D)+P(E)=1。所以有: P(E)=1-P(D)=1-P(ABC)=1-0.008=0.992 4.贝叶斯(Bayes)公式与全概率公式 若事件 则对于任意事件 B,有 两两互斥,且 ,我们称该事件组为一个完备事件组,若 P(Ai)&0,我们称之为全概率公式。 进一步地,如果 P(B)&0,则有我们称之为贝叶斯公式。在贝叶斯定理中,我们称 P(Ai)为事件 Ai 的先验概率,称 P(Ai|B)为事件 A 在事件 B 条 件下的后验概率。 例 1:有两只完全一样的壶,里面均装满了红、黑两色球。其中一壶中 (设其为甲壶) 中红球占 2/3,另一壶中 (设 其为乙壶)红球占 1/3。现任取一壶,从中取 9999 个球,发现红球有 5003 只,黑球有 4996 只,试问该壶为甲壶还是 乙壶? 解:设事件 a 为“该壶为甲壶”,事件 b 为“该壶为乙壶”,事件 x 为“取 9999 球,红球有 5003 只,黑球有 4996 只”。则有: 先验概率:P(a)=P(b)=1/2P{x|a}= 后验概率:P{x|b}=P{a|x}=P{b|x}= 两式相除得:P{a|x}/ P{b|x}=2 :1 例 2:一个人做了一件(1)只有好人会干的好事,(2)好人坏人都会做的好事,(3)好人一定做,坏人不一定 做的好事;此人为好人的概率是多少? 解:设 GP 为好人,BP 为坏人,GT 为好事; 先验概率:GP=BP:1/2 P(GT)=P(GT|GP)P(GP)+P(GT|BP)P(BP) 某人做了一件好事,判断他为好人的后验概率为: P(GP|GT)=P(GT|GP)P(GP)/P(GT)。7 管理数量方法(1)只有好人会做,即 P(GT|GP)=1;P(GT|BP)=0 (2)好人坏人都会做,P(GT|GP)=P(GT|BP)=1P(GP|GT)=1。 P(GP|GT)=1/2。(3)好人一定做,坏人不一定,P(GT|GP)=1;P(GT|BP)=1/2 P(GP|GT)=2/3。第三章 随机变量及其分布 第一节 随机变量随机变量是一次试验的结果的数值性描述,或者说随机变量是取值会随机会而定的变量。实际上,随机变量代表 每一个可能出现的试验结果的数值,随机变量的特定值取决于试验结果。随机变量根据所代表的数值可定义为离散的 或连续的。 1.概率分布 概率分布(Probability distribution)是对概率如何在随机变量的可能取值间分配的一种描述。 2.概率函数 表示离散型随机变量的取值与其概率间的对应关系的函数,以 f(x)或 之间,且? f (x) =1 或 ? pP( X ? xi ) ? pi 表示,其取值一定在 0―1i=1。第二节 离散型随机变量离散型随机变量可取有限个值或可列个值。P( X ? xi ) ? pi离散型概率分布可以用公式、表格或图形来表示。 例:掷两枚骰子,可能出现的各种点数及其概率分布。 Xi pi Xi pi 点数恰好为双数的概率为: P(X=2)+P(X=4)+P(X=6)+P(X=8)+P(X=10)+P(X=12)=18/36 点数不超过 6 的概率为: P(X&=6)=P(X=2)+P(X=3)+P(X=4)+P(X=5)+P(X=6)=15/36 1.期望值与方差 期望值(Expected value):衡量随机变量平均取值的量度。 2 1/36 8 5/36 3 2/36 9 4/36 4 3/36 10 3/36 5 4/36 11 2/36 6 5/36 12 1/36 7 6/36E (x) = ? = ? xpi注:常数的期望值就是其本身。如 果 X 为 一离 散型 随 机变 量 ,其 概 率分 布为 E[g(X)]=? g( x ) piP( X ? xi ) ? pi , 则 以 X 为 自变 量的 函数 g(X) 的 期望 值为i 管理数量方法方差(Variance):衡量随机变量变异性或分散程度的量度。 D(X)= E[(x ? ? ) ] =2?(x ? ?)2pi=?x2pi ? 2 -D(a+bX)=b2D(X),常数的方差为 0。 例 1:如上例,两骰子出现点数的期望值为: E(X)=2×1/36+3×2/36+3×3/36+?12×1/36=7 方差为:D(X)=22×1/36+32×2/36+32×3/36+?122×1/36-72=35/6 标准差为:D(X ) =2.4152例 2:某推销员在替某商场推销一种型号的电视,一天内销售量的概率分布如下表,若该电视的销售价为 5000 元/ 台,推销员第天的报酬为 150 元,试求该商场此型号电视机销售净收入的数学期望和标准差。 Xi pi 0 0.18 1 0.39 2 0.24 3 0.14 4 0.04 5 0.01解:设电视销售量为 X,商场净收入为 R,则有 R= E(X)=1.5 E(R)=E()=5000×E(X)-150 =5000×(0×0.18+1×0.39+2×0.24+3×0.14+4×0.04+5×0.01)-150 =7350(元) D(R)=D()=50002×D(X) =50002×[(02×0.18+12×0.39+22×0.24+32×0.14+42×0.04+52×0.01)-1.52] =3125000D(R) =5590.17(元)2.常用离散型随机变量分布 (1)两点分布(或称 0―1 分布) 随机变量 X 只可能取 0 或 1 两个值,P(X=k)=pk(1-p)1-k,k=0,1, (0&p&1) ,称为 X 服从参数为 p 的 0―1 分布, 记作 X~B(1,p),E(X)=p,D(X)=p(1-p)。 (2)二项分布 二项试验(贝努里试验):具有以下三个属性的概率试验 1)试验由一个含有 n 次相同试验的序列所组成; 2)每次试验有两种可能结果(称为成功与失败); 3)每次试验都是独立的; 二项概率分布:表明二项试验的 n 次试验中有 k 次成功的概率。 二项概率函数: P( X ? k ) ? Cn p (1 ? p)k k n ?k称为 X 服从参数为 n,p 的二项分布,记作 X~B(n,p),E(X)=np,D(X)=np(1-p) 当 n=1 时,二项分布退化为 0―1 分布。 例:《美国职业与薪金年鉴》报道说,25%的会计专业毕业生被会计师事务所雇佣。假设这一百分比可应用于一 组包含 15 个刚进入会计行业的大学毕业生。至少有三个毕业生会被会计师事务所雇佣的概率是多少? 解: 管理数量方法P(X&=3)=1-P(X=0)-P(X=1)-P(X=2) =1 ? C15 0.25 0 ? 0.75 15 ? C15 0.25 1 ? 0.75 14 ? C15 0.25 2 ? 0.75130 1 2=1-0.8-0.9 (3)泊松概率分布 表示特定时间或空间中某事件发生 k 次的概率。P( X ? k ) ?? k e ??k!称为 X 服从参数为 k 的泊松分布,记作 X~P(k),E(X)=k,D(X)=k 例:在一个大型国际机场旅客们随机而独立的经过旅客监视器。平均到达速率为每分钟 10 名旅客。 a、1 分钟期间没有人经过的概率是多少? b、1 分钟期间有 3 个或更少人经过的概率是多少? c、15 秒钟期间没有人经过的概率是多少? d、15 秒钟期间至少有 1 人经过的概率是多少? 解:X~P(k) A、E(X)=10 X=0 P(X=0)=100×e-10/0! ? 0 B、E(X)=10 X=0,1,2,3 P(X=k)=100×e-10/0!=0 P(X=1)=101×e-10/1!=0.0005 P(X=2)=102×e-10/2!=0.0023 P(X=3)=103×e-10/3!=0.0076 P{X&=3}=0+0.3+0.4 C、E(X)= 10/4=2.5 X=0 P(X=0) =2.50×e-2.5/0!=0.0821 D、E(X)= 10/4=2.5 X&=1 P(X&=1)=1-P(X=0)=1-0.9 (4)超几何概率分布 用于计算各次试验非独立情形下 n 次试验有 x 次成功的概率。n C rx C N? xr ? n f (x) = C N0? x?r第三节 连续型随机变量连续型随机变量可在一个或若干个区间内任意取值。 注意:对于连续型随机变量而言,取任一特定值或有限个特定值组合的概率为 0。 管理数量方法例:某化妆品采用自动化设备进行灌装,合格品净重为 50±1g,任取其中一合格品,则该合格品的净重可能是 49~51g 之间任一数值(有无穷多个可能值)。而净重恰为某一具体数值(如刚好 50g)的概率则为 0。 1.概率密度函数和分布函数 由于连续型随机变量的取值不能被一一列举出来,而且其取任何一个特定值的概率都是零,因此无法用离散型随 机变量的方式来理解连续型随机变量的概率。对于连续型随机变量,我们感兴趣的问题是:随机变量 X 的取值落在某 指定区间内的概率:P(x1≤X≤x2)。 P(x1≤X≤x2)=P(X≤x2)-P(X≤x1) 分布函数:对于随机变量 X,函数 F(x)=P(X≤x)称为随机变量 X 的分布函数。 概率密度函数:定义连续型随机变量的概率分布的函数,它满足“非负”和“全积分等于 1”两个性质。??f (x) &=0???f ( x)dx=1F ( x) ???? f ( x)dxxF(x0)f(x)X0例:假设一座桥长 1 公里,考虑一辆汽车在桥上发生故障。令 X 表示汽车在桥上行驶过的距离(从上桥到发生故 障停下的地方),并假设汽车坏在桥上的任何一点的概率都一样,则 X 的分布函数为? 0,  x ? 0 ? F ( x) ? ? x,   x ? 1 0? ? 1,  x ? 1 ?,此时,我们说 X 服从(0,1)区间上的均匀分布,其图形如下:f(x)x 0 1由 X 的分布函数,我们可以算出汽车故障发生在前 0.5 公里的概率为 P(X≤0.5)=F(0.5)=0.5 汽车故障发生在第 2 个 1/4 公里内的概率为 P(1/4≤X≤1/2)=F(1/2)-F(1/4)=1/2-1/4=1/4 管理数量方法2.连续型随机变量的数学期望和方差(1)连续型随机变量的均值即是其数学期望,? ? E ( X ) ? ? xf ( x)dx?? ????(2)方差:? 2 ? D( X ) ? E[(x ? ? ) 2 ] ? E( X 2 ) ? ? 2 ? ? x 2 f ( x)dx??-?2(3)标准差: ? ??2(4) E (a ? bX ) ? a ? bE( X ) ? a ? b? (5) D(a ? bX ) ? b D( X ) ? b2 2?2X ??(6)随机变量 3.均匀概率分布 随机变量在等长区间上取值的概率相等的一种连续概率分布。?的均值为 0,方差为 1(称为标准正态分布)? 1 ? ....... ? x ? b a f ( x) ? ? b ? a ? 0..........其他 . ?xdx ? xf ( x)dx ? ? ? ?x b?a ? ? E (X ) ? ? b?a 21 1????b12 b a| ?a1 1 a?b ? ? (b 2 ? a 2 ) ? b?a 2 2? 2 ? D( X ) ? E[(x ? ? ) 2 ] ? E( X 2 ) ? ? 2 ? ? x 2 f ( x)dx ? ? 2 ??????b?a xab12dx ? ? 2 ?1 1 3 b ? ? x |a ? b?a 3(a ? b 2 (b ? a ) ) ? 2 122例 1:某航空公司对其从厦门到北京的航班宣称期飞行时间为 1 小时 40 分钟。假定我们认为实际飞行时间服从 1 小时 35 分到 1 小时 50 分之间的均匀分布。A、画出飞行时间的概率密度函数图;B、飞行晚点时间不超过 5 分钟的概 率是多少?C、飞行时间的期望值和方差各为多少? 解:A、此时 a=95 分,b=110 分,b-a=15 分 f(x) 1/1595 B、P(100&X≤105)=(105-100)×1/15=1/3 C、E(X)=(a+b)/2=(95+110)/2=102.5 分 D(X)=(b-a)2/12=(110-95)2/12=18.75 分 2110X例 2:在 EXCEL 中,RAND 函数可用于产生 0 到 1 间的随机数。如果我们让 x 代表产生的随机数,那么 x 是具有下 列概率密度函数的随机变量。 管理数量方法?1.......0 ? x ? 1 ? ... f (x) = ?0.......... 其他则:A、产生一个 0.25 到 0.75 之间的随机数的概率是多少?B、产生一个小于 0.30 的随机数的概率是多少?C、 产生一个等于 0.60 的随机数的概率是多少? 解:A、P(0.25&X&0.75)=(0.75-0.25)×1=0.5 B、P(X&0.30)=P(X&0)+P(0≤X&0.30)=0+0.30=0.30 C、P(X=0.60)=0 4.指数概率分布 一种连续概率分布,在计算一个事件两次发生之间的时间或空间的概率时有用。e?x / ?f (x) = ?E(X)= ?1=??xe?x?02? &0D(X)= ?? x0 / ?P(x&=x0)=1- e例:一洗车处平均两辆汽车到达的时间间隔为 0.1 小时/辆,试问 A、两辆汽车到达时间间隔不超过 6 分钟的概 率;B、两辆汽车到达时间间隔不超过 18 分钟的概率; 解:两辆汽车到达时间间隔服从指数分布,其中 E(X)= ? =0.1 小时=6 分钟。对应的概率密度函数为 f (x) =1 ? x10 ?x e 10 10 ,P(x&=x0)=1- eA、 P( X ? 6) ? 1 ? e?6 / 15? 0.3297 ? 0.6988B、 P( X ? 18) ? 1 ? e 5.指数分布的无记忆性:?18 / 15P( x ? x1 ? x0 , x ? x0 ) P( x ? x1 ? x0 ) e ? ( x1 ? x0 ) / ? ? ? ? ? x1 / ? P( x ? x1 ? x0 | x ? x0 ) ? P( x ? x0 ) P( x ? x 0 ) e ? P( x ? x1 ) e ? x0 / ?P( x ? x0 ) ? 1 ? e ? x0 / ?6.指数分布与泊松分布的关系 泊松分布给出了每一间隔中事件发生次数的适当描述;指数分布给出事件两次发生之间间隔长度的描述。 对于上述例子,由于平均两辆汽车到达的时间间隔为 0.1 小时/辆,则平均每小时到达洗车处的汽车数为 1/0.1= 10 辆,于是有每小时有 x 辆汽车到达的概率的泊松概率函数:P( x) ?10x e ?10 x!7.正态概率分布 正态概率分布(Normal probability distribution),概率密度曲线成钟形的、以均值 ? 和标准差 ? 确定的连续 概率分布。记作 X~ N (?,? )21?( x?? )2 2? 2? (x) = 2? ?E(X)= ?e? ? &x& ? ?2D(X)= ? 管理数量方法特点: (1) ? (x) 的图形是关于 x ? ? 对称的钟形曲线,当 x ? ? 时, ? (x) 达到峰值; (2)方差 ? 越小,曲线峰值越大,曲线越瘦长;方差 ? 越大,曲线峰值越小,曲线越矮胖;2 2(3)曲线下与 y=0 间的面积恒为 1;8.标准正态概率分布 标准正态概率分布(Standard normal probability distribution),概率密度曲线成钟形的、以均值 ? =0 和标 准差 ? =1 确定的连续概率分布。记作 X~N(0,1) 在标准正态分布的情况下,对于给定的 x 值,我们可以利用附表 1 快速查出 例:在标准正态分布下,求 x&2、x&=2.23、x&2.23、x&-2.01 的概率。 z 0.0 ? 2.0 2.1 2.2 2.3 2.4 2.5 0.00 0.5000 ? 0.1 0.3 0.8 解:P(x&2)= 0.01 0.5040 ? 0.6 0.6 0.0 0.02 0.5080 ? 0.0 0.8 0.1 0.03 0.5120 ? 0.4 0.1 0.3 0.04 0.5160 ? 0.8 0.4 0.5 ? ? ? ? ? ? ? ? ?? 0 ( x) 的值。0.090.535 ?0.9810.9850.9890.9910.9930.995? 0 (2) =0.9772 ? 0 (2.23) =0.9871 ? 0 (2.23) =1-0.9 ? 0 (2.01) =1-0.2P(x&=2.23)=P(x&2.23)=1-P(x&=2.23)=1P(x&-2.01)=1-P(x&2.01)=1-9.一般正态分布与标准正态分布的关系:? ( x) ?概率密度函数:1??0 (x???) 管理数量方法分布函数:? ( x) ? ? 0 (x????)即:当 X~ N (?,? ) 时,2X ??~ N (0, 1)例:某轮胎公司开发了一种新轮胎,在实际道路测试中已估计出轮胎的可行驶里程服从均值为 36500 英里,标准 差为 5000 的正态分布,那么轮胎预期使用超过 40000 英里的概率是多少?该公司正在设计一项担保:若初始的轮胎没 有超过担保中设定的里程,公司将半价更换轮胎。如果该公司希望符合半价担保的轮胎不超过 10%,则担保里程就为 多少?, 解:(1)X~ N ( )2x=40000X ???=()/P(X&x)=1-? 0 (0.70) =1-0.758=0.242(2)设担保里程数为 x 英里,即要求 P(X&x)&=0.10 查表可知? 0 (1.28) =0.即? 0 (?1.28) =0.10X ??所以:?=(x-36500)/5000=-1.28得:x=30100因此,该公司的担保里程不应超过 30100 英里。 10.α 分位点 设 Z~N(0,1),对于给定的α (0<α <1), 我们称满足条件 P(Z>zα )=α ,(即φ 0(zα )=1-α )的点 zα 为标准正态分布上的α 分位点。 由图形可看出,当α &1/2 时,zα &0,当当α &1/2 时,zα &0,且有 zα =-z1-α 11.连续修正因子 以正态分布来近似二项分布时,从 x 值加或减的半个单位值(0.5)。 例:B(25,0.5) 即 n=25,p=0.5 的二项分布 E(x)=np=12.5? 2 =npq=6.25? =2.5P(8&=x&=10)=P(7.5&x&10.5) ?P(7.5 ? 12.5 10.5 ? 12.5 ?z? ) 2.5 2.5 =P(-2&z&-0.8)=0.1=0.1891第四节 二元随机变量1.二元离散型随机变量 所谓二元随机变量就是由两个随机变量组合后形成的新的随机变量。 设 X 和 Y 为两个离散型随机变量,X 取值 xi 同时 Y 取值 yi 的概率 随机变量(X,Y)的联合分布。pij ? P{X ? xi , Y ? y j }, i, j, ? 1,2...称为二元性质:1.pij ? 02.?? pi jij?1例:一家啤酒厂生产三种啤酒:淡啤、普啤、黑啤。在市场研究中想知性别与啤酒偏好的相关性,因此随机抽取 管理数量方法了 150 人做调查,结果如下: X 淡啤 Y 男 女 合计 则(X,Y)的联合分布为 X 淡啤 Y 男 女 合计 2.边缘分布与独立 0.13 0.2 0.33 0.27 0.2 0.47 0.13 0.07 0.2 0.53 0.47 1 普啤 黑啤 合计 20 30 50 40 30 70 20 10 30 80 70 150 普啤 黑啤 合计对于二元离散型随机变量(X,Y),我们将 布,同理可得 Y 的边缘分布。P{X ? xi } ? ? P{X ? xi , Y ? y j } ? ? pijj j称为随机变量 X 的边缘分如前例表中的最后一行即为啤酒类别 X 的边缘分布;最后一列即为性别 Y 的边缘分布。 如果 X 与 Y 的边缘分布的乘积等于 X 与 Y 的联合分布,即对于所有的 i,j=1,2?有P{X ? xi , Y ? y j } ? P{X ? xi }P{Y ? yi }如前同时抛硬币和骰子的例子。 X 1 Y 正面 0 反面 1 合计 1/12 1/12 1/6 1/12 1/12 1/6 2,则称随机变量 X 与 Y 独立。3 1/12 1/12 1/64 1/12 1/12 1/65 1/12 1/12 1/66 1/12 1/12 1/6 1/2 1/2 1合计3.协方差和相关系数i j 设(X,Y)为具有联合分布 ij 量(X,Y)的函数,则随机变量 g(X,Y)的数学期望为:p ? P{X ? x , Y ? y }, i, j, ? 1,2...的二元离散型随机变量,g(X,Y)是二元随机变E[ g ( X , Y )] ? ?? g ( X , Y ) piji j。协方差和相关系数都是用来度量两个随机变量 X 和 Y 的线性相关程度的。类似于方差的计算,我们考虑 X-E(X)与 Y-E(Y)的乘积,如果 X 值的变化方向与 Y 值的变化方向相同,则乘积一般为正值,如果二者变化方向相反,则为负 值。因此引入协方差的概念:Cov( X , Y ) ? E[( X ? EX )(Y ? EY )] ? ?? ( xi ? EX )( y j ? EY ) pij ? EXY ? EX ? EYi j若 Cov( X , Y ) ? 0 则说明 X 和 Y 之间存在一定的正相关关系; 管理数量方法若 Cov( X , Y ) ? 0 则说明 X 和 Y 之间不相关; 若 Cov( X , Y ) ? 0 则说明 X 和 Y 之间存在一定的负相关关系; 如果 X 与 Y 独立,则二者不相关;但如果 X 与 Y 不相关,并不能说二者独立。 由于协方差计算结果的大小与 X 和 Y 的取值单位有直接的关系,因此计算结果的大小并不能直接说明 X 与 Y 相关程度 的大小,为了准确反映 X 与 Y 的相关程度,我们使用相关系数来衡量。rX ,Y ?Cov( X , Y ) DX ? DY? 1 ? rX ,Y ? 1例 1:考虑前面同时抛一枚硬币和一个骰子的例子 X 1 Y 正面 0 反面 1 合计 1/12 1/12 1/6 1/12 1/12 1/6 1/12 1/12 1/6 1/12 1/12 1/6 1/12 1/12 1/6 1/12 1/12 1/6 1/2 1/2 1 2 3 4 5 6 合计EX=1×1/6+2×1/6+2×1/6+3×1/6+4×1/6+5×1/6+6×1/6=3.5 EY=0×1/2+1×1/2=0.5 EXY=1×0×1/12+1×1×1/12+2×0×1/12+?+6×1×1/12=1.75Cov( X , Y ) ? EXY-EXEY=1.75-3.5×0.5=0rX ,Y ?Cov( X , Y ) DX ? DY =0说明二者不相关。 例 2:考虑前面啤酒的例子,分别设三种啤酒取值为 1,2,3;性别取值为 1,2 X 淡啤 1 Y 男 女 合计 1 2 0.13 0.2 0.33 0.27 0.2 0.47 0.13 0.07 0.2 0.53 0.47 1 普啤 2 黑啤 3 合计EX=1×0.33+2×0.47+3×0.2=1.87 EY=1×0.53+2×0.47=1.47 EXY=1×1×0.13+1×2×0.2+?.+3×2×0.07=2.68 DX=E(X2)-(EX)2=12×0.33+22×0.47+32×0.2-1.872=0.5131 DY=E(Y2)-(EY)2=12×0.53+22×0.47-1.472=0.2491Cov( X , Y ) ? EXY-EXEY=2.68-1.87×1.47=-0.0689rX ,Y ?Cov( X , Y )? 0.0689DX ? DY = 0.1 =-0.1927 管理数量方法说明啤酒种类 X 与性别 Y 存在一定的负相关关系,但这种相关关系不是很强。 若随机变量 X 和 Y 为两个连续型随机变量,则随机变量(X,Y)为二元连续型随机变量。其联合分布函数为F ( X , Y ) ? P( X ? x, Y ? y),..? ? ? x, y ? ? ,X 的分布函数 FX ( x) ? P{X ? x},?? ? x ? ? 称为 X 的边缘分布;Y 的分布函数 FY ( y) ? P{Y ? y},?? ? y ? ? 称为 Y 的边缘分布。二元连续型随机变量的协方差和相关系数的概念与二元离散型随机变量相同。 4.随机变量的线性组合 若 X 和 Y 为两个随机变量(不论其是否为连续型随机变量),a 和 b 为常数,则线性组合 aX+bY 也是随机变量,且 有: (1)E(aX+bY)=aE(X)+bE(Y) (2)D(aX+bY)=a2D(X)+2abCov(X,Y)+b2D(Y) 第三章第五节第五节 决策准则与决策树所谓决策,指的就是为了解决问题或实现目标,从若干个可供选择的备选方案中,依据一定的准则,选出最满意 方案的一个综合分析、判断的过程。现代化管理是一个决策过程,它从提出问题确定目标开始,然后寻找可供选择的 各种方案,比较评价这些方案,进行最优方案的选择并做出决定。 决策的类型: 按决策在企业经营中所处的地位分:战略性决策与战术性决策。 按决策者的管理层次:高层决策、中层决策和基层决策。 按问题出现的重复程度:程序性决策与非程序性决策。 按决策目标与所用的方法:计量决策与非计量决策。 按决策问题所处的条件:确定型决策、风险型决策与非确定型决策。 1.确定型决策方法(盈亏平衡分析,又称量本利分析) 原理:确定收支相等时的销售收入或销售量(保本点),超过则盈利。 保本点的产量 Q:Q? P ? F ? Q?CQ?即:F P?C其中,P 为产品单价,F 为固定成本,C 为单位变动成本S?保本收入为:F ?P F ? P ? C 1? C / P例:某公司年运输周转量 300 万吨公里,平均每万吨公司的单价是 6000 元,燃油、运输工具折旧等成本平均为 2000 元/万吨公里,固定成本 100 万元,求其保本点周转量及保本收入。Q?S?F 100 ? ? 250 P ? C 0.6 ? 0.2 万吨公里F ?P F 100 ? ? ? 150 P ? C 1 ? C / P 1 ? 0.2 / 0.6 万元 管理数量方法收入线 150 E 100 A 总成本线0 2.完全不确定型决策方法250当面对多种自然状态,而人们又没有掌握其概率知识的情况下所使用。 (1)乐观准则 收益值大中求大准则(或损失值小中求小) (2)悲观准则 收益值小中求大准则(极大极小原则)或损失值大中求小准则 例 1:某物流公司计划与某建设单位签订合同,包运从甲地到乙地的货物,但车辆从乙地返回甲地时的货运量难 以保证,估计返程的利用率可能有 80%、70%、60%、50%四种情况,但每种情况可能出现的概率未知。企业现有运力已 饱和,增加运力的方案有 4 个:A1 购置新车;A2 购置旧车;A3 外包;A4 租用车辆。各方案的收益值如下: 行程利用率 80% A1 A2 A3 A4 60 80 35 40 70% 40 35 22 25 60% -15 -30 5 9 50% -35 -70 -10 -5 乐观法 最大值 60 (80) 35 40 悲观法 最小值 -35 -70 -10 (-5)例 2:某食品厂拟投产一种新早餐食品,每件产品的成本为 0.6 元,出厂价格为每件 0.9 元。若当天产品销路不 畅,则须削价出售才能全部售完,这样每件产品要蚀本 0.2 元。根据市场调查,该产品需求量可能是 0、、 、5000 件,该厂最大生产能力是 4000 件/天,问该产品的是产量应定为多少,才能使厂方盈利最大? 单位:千件,元 日需求 量 日产量 0 1 2 3 4 (3)乐观系数法 取一系数(0-1 之间),在最大收益与最小收益间进行折中,如上例中将乐观系统取为 0.5,则有: 0 -200 -400 -600 -800 0 300 100 -100 -300 0 300 600 400 200 0 300 600 900 700 0 300 600 900
600 900 (1200) (0) -200 -400 -600 -800 0 1 2 3 4或5 乐观准则 悲观准则 管理数量方法行程利用率 80% A1 A2 A3 A4 60 80 35 40 70% 40 35 22 25 60% -15 -30 5 9 50% -35 -70 -10 -5 最大值 60 80 35 40 最小值 -35 -70 -10 -5 折中值 12.5 5 12.5 (17.5 )(4)最小后悔值法 每一确定状态下最佳方案收益与各方案收益之差,即为后悔值,然后再选出每一方案的最大后悔值,从中挑选最 小后悔值所对应的方案。 80% A1 A2 A3 A4 最优值 60 80 35 40 80 70% 40 35 22 25 40 60% -15 -30 5 9 9 50% -35 -70 -10 -5 -5行程利用率 80 % A1 A2 A3 A4 最优值 20 0 45 40 80 0 5 18 15 40 24 39 4 0 9 30 65 5 0 -5 (30) 65 45 40 70% 60% 50% 最大后悔值3.风险型决策方法 决策中可能存在有两个以上的自然状态,自然状态的出现决策者无法确切掌握,但可以估计其出现的概率。 条件:有明确的目标;可供选择的多个方案;每个方案的收益/损失情况;自然状态的概率 (1)期望值准则(最大期望收益原则) 例 1:假设上例中早餐食品各种市场需求量的概率分别为 0.1、0.2、0.3、0.2、0.1、0.1 日需求量 日产量 0 (0.1) 1 (0.2) 2 (0.3) 3 (0.2) 4或5 期望收益 (0.2) 管理数量方法0 1 2 3 40 -200 -400 -600 -8000 300 100 -100 -3000 300 600 400 2000 300 600 900 7000 300 600 900 12000 250 (400) (400) 300因此,最佳决策是选择日产量为 2000 或 3000 件例 2:某物流企业对现有市场进行了广泛的调查和预测,预计在未来 10 年物流行业呈增长趋势,决定建一个物流 中心,投资决策期 10 年,有关资料如下。高增长中等增长 对应概率低增长 投资额(万元) 0.2 -5 0 10 140 80 300.3 建大型中心 建中型中心 建小型中心 50 30 100.5 20 15 10 期望收益表高增长中等增长 对应概率低增长 期望收益值 0.2 -5 0 10 (50*0.3+20*0.5-5*0.2)*10-140=100 (30*0.3+15*0.5+0)*10-80=85 (10*0.3+10*0.5+10*0.2)*10-30=700.3 建大型中心 建中型中心 建小型中心 50 30 100.5 20 15 10(2)最小期望机会损失原则(后悔值准则) 例:续上例 日需求量 日产量 0 1 2 3 4 0 (0.1) 0 -200 -400 -600 -800 1 (0.2) 0 300 100 -100 -300 2 (0.3) 0 300 600 400 200 3 (0.2) 0 300 600 900 700 4或5 (0.2) 0 300 600 900 1200则各种方案(日产量)的机会损失分别为: 日需求量 0 1 2 3 4或5 管理数量方法日产量 0 1 2 3 4(0.1) 0 200 400 600 800(0.2) 300 0 200 400 600(0.3) 600 300 0 200 400(0.2) 900 600 300 0 200(0.2)
300 0各种方案(日产量)的加权机会损失为别为: 日需求量 日产量 0 1 2 3 4 0 (0.1) 0 200 400 600 800 1 (0.2) 300 0 200 400 600 2 (0.3) 600 300 0 200 400 3 (0.2) 900 600 300 0 200 4或5 (0.2)
300 0 加权机会 损失 660 410 (260) (260) 360因此,最佳决策是选择日产量为 2000 或 3000 件 (3)使用决策树进行决策 所谓决策树,是用树形结构将决策中的各种备择方案及各种可能的结果形象地体现出来。树中方形结点后的分枝 代表备择方案,圆形结点后的分枝代表各种可能出现的状况。 决策树的结构包括: 决策结点,起点,一般用□表示; 状态结点,表示一个自然状态,用○表示; 结局结点,一个方案在一个自然状态下的结局,用△表示(或省略); 方案分支,由决策结点引出的分支,表示一个方案; 概率分支,由状态结点引出的分支,表示一种自然状态及其发生的概率例 1:某物流企业对现有市场进行了广泛的调查和预测,预计在未来 10 年物流行业呈增长趋势,决定建一个物流 中心,投资决策期 10 年,有关资料如下。 高增长 中等增长 对应概率 0.3 建大型中心 建中型中心 建小型中心 期望收益的计算: 1:建大型中心 50 30 10 0.5 20 15 10 0.2 -5 0 10 140 80 30 低增长 投资额(万元) 管理数量方法(50*0.3+20*0.5-5*0.2)*10-140=100 2:建中型中心 (30*0.3+15*0.5+0)*10-80=85 3:建小型中心 (10*0.3+10*0.5+10*0.2)*10-30=70 100 1 投资 140 万 85 投资 80 万 I 2 0.3 0.5 0.2 0.3 0.5 0.2 50 20 -5 30 150投资 30 万70 30.3 0.5 0.210 10 10例 2:某公司为促销其产品,拟筹办一个产品展销会。如果利用公司的一处空地露天展销,可免花场地费;但若 展销时遇到雨天,则要损失 10 万元。如果租用展馆在室内展销,须付租金 7 万元。此外不论在何处展销均需要会务费 3 万元,若展销期间有雨的概率为 0.6,问公司如何决策? S1(0.6)2-13 -3 -10 -10a1 1 a2S2(0.4) S1(0.6)3S2(0.4)这里我们采用最大期望收益原则进行决策: 期望收益=(-13)×0.6+(-3)×0.4=-9 S1(0.6) 不租展馆 a1 1 a2 租展馆3 2-13 -3 -10 -10S2(0.4) S1(0.6)S2(0.4)期望收益= (-10)×0.6+ (-10) ×0.4=-10 因此,应选择不租用展馆。 管理数量方法4.敏感性分析 对于各种不确定因素的估计会在多大程度上影响最终决策的分析。常用的一种方法就是选择一种不确定因素,在 假定其他因素不变的情况下,考察它在多大范围内变化时不会影响最终决策。 参考上例,假定其他条件不变,但下雨的可能性未知,现在考察下雨的概率小于多少时不需要租用展馆。 期望收益? a1 =(-13)×p+(-3)×(1-p)=-3-10pS1(p) -13 -3 -10 -10不租展馆 a1 1 a2 租展馆2S2(1-p) S1(p)3S2(1-p)期望收益? a 2 =(-10)×p+(-10)×(1-p)=-10若不影响原来的决策结果,则应有:? a1 & ? a 2即:-3-10p&-10得 p&0.7也就是说,当下雨的概率小于 0.7 时,不租用展馆可获得最大期望收益。第四章 抽样方法及抽样分布 第一节 抽样的作用与抽样方法一、基本概念 1.抽样推断 从研究对象的全部单元中抽取一部分单元进行观察研究取得数据,并从这些数据中获取信息,以此来推断全体。 2.总体 指研究对象的全体,是具有某种共同性质的许多个体的集合,这些个体称为总体单元或元素。总体是一个随机变 量。 总体的划分需要根据研究的目的来定义。 根据总体单位的数目可将总体分为有限总体和无限总体两种。这种划分的目的是为了判别在抽样过程中逐个抽取 个体时,每次抽取是否独立。 3.样本 按照某种抽样规则从总体中抽选出一部分总体单元加以观察研究并用来推断总体的那部分单元的集合。样本中包 括的总体单元数目称为样本量或样本容量。 根据抽选的原则不同可分为主观选择的代表性样本和随机样本两类。 4.随机抽样 又称概率抽样,在抽取样本的过程中排除主观上有意识地选择样本单元,而是按照一定的设计原则,使每个总体 单元都有一个已知的概率被抽中的抽样方法。 管理数量方法二、抽样的作用 1.因检验具有破坏性而选择抽样的方法; 2.对于大规模的调查,在实践上难以对所有单位进行调查而选择抽样的方法; 3.从经济的角度出发,为了节约费用而选择抽样的方法; 4.因时效性的制约而选择抽样的方法; 5.为减少非抽样误差,提高调查质量而选择抽样的方法。 三、概率抽样方法 1.简单随机抽样 又称纯随机抽样,是指总体有 N 个单元,从中抽取 n 个单元作样本,使得所有可能的样本都有同样的机会被抽中 的抽样方法。又分为有放回(重复)和无放回(不重复)抽样两种。一般情况下是指不重复抽样。 有放回抽样的可能样本数:Nnn CN ?无放回抽样的可能样本数:N! n!( N ? n)!例 1:编号为 1、2、3 的三个产品,任取两个进行检验。 有放回抽样: 可能的样本数为 N2=32=9,分别为(1,1)、(1,2)、(1,3)、(2,1)、(2,2)、(2,3)、(3,1)、 (3,2)、(3,3)。 无放回抽样: 可能的样本数为2 C3 ? 3 ,分别为(1,2)、(1,3)、(2,3)。例 2:三个人(编号为 1、2、3)为只有一张电影票,采用抓阄的方式进很分配,1 先抓,2 号其次,3 号最后抓, 试问各人抓到的概率。 解:设 A、B、C 分别为 1、2、3 抓中。对于1: p1 ? P( A) ? 1 / 3 ...对于2:p2 ? P( A B) ? P( A) P( B | A) ? 2 / 3 ?1/ 2 ? 1/3 ...对于3:p3 ? P( A B C) ? P( A)P(B | A)P(C | A B ) ? 2 / 3 ?1/ 2 ?1 1/ 3 ... =由此我们可以看出,不论是有放回抽样还是无放回抽样,每个单元被抽中的概率是相等的。这也是随机抽样的基 本要求。 在进行简单随机抽样时,我们常利用随机数表来抽选样本。 2.系统抽样 又称等距抽样或机械抽样,是将总体单元在抽样之前按某种顺序排列,并按照设计的规则确定一个随机起点,然 后每隔一定的间隔逐个抽取样本单元的抽样方法。 特点:(1)简便易行;(2)由于系统抽样的样本一般在总体中分布比较均匀,因此估计的误差通常较小;(3) 若总体单元的标志值具有周期性波动,而抽样间隔恰与该周期相同,则估计的误差较大; 3.分层抽样 又称分类抽样或类型抽样,是在抽样之前将总体划分为互不交叉重叠的若干层(类),每个总体单元被划在某一 层内,然后在各层中独立地抽取一定数量的单元作样本的抽样方法。如果样本单元占总体单元的比例在各层中相等, 称作等比例分层抽样,否则称为不等比例分层抽样。 优点:(1)除获得总体的估计值外,还可获得各层子总体的估计值;(2)抽样的组织实施比较方便;(3)样本 分布在各个层内使样本的分布在总体内比较均匀;(4)适当地分配各层样本可以较大地提高抽样的精度。 管理数量方法4.整群抽样 抽样之前把总体的单元按自然形成的或人为地分成的群作为抽样单位,在包括全部总体单元的群中随机地抽取若 干群作为样本的抽样方法。 优点:(1)不需要总体单元的具体名单,只需要群的名单,较易得到;(2)由于群内单元比较集中,对样本进 行调查比较方便、经济; 局限性:若群与群之间的差异较大,则抽样误差会大于简单随机抽样。第二节 抽样中经常遇到的几个问题一、抽样框问题 抽样框 为了实施抽样把总体单元划分成抽样单元,抽样单元可以是组成总体单元,也可以是把若干元素组合在一起的 群,把抽样单位编制成名册、清单或地图,这种名册、清单或地图就称作抽样框。T arget.. population? Sampled population ..抽样框造成的误差多种多样,最常见的是抽样框中丢失目标总体单元和包含非目标总体单元。一个好的抽样框就 包括全部总体单元,既不重复也不遗漏。 例:某城市有 5 万户职工家庭,共有 10 万个职工,按每个家庭的职工人数分组及分组的人均收入如下: 职工户 家庭职工人数 户数 1 2 3 4
所占比例% 40 30 20 10 人数
所占比例% 20 30 30 20 入 600 800
职工人数 每户人均收(1)以户为总体单元的抽样框采用等概率抽样方式,样本户的构成与职工户的构成相似,以此计算得全市职工户 的人均收入为:x户=600? 40 %+ ? 30 800 %+ 1000? 20 %+ 1200?10 %= 800(2)以职工人数的名单作抽样框,则抽中的样本户构成与职工人数的构成相似,因此全市职工户的人均收入为:x职工=600? 20 %+ ? 30 800 %+ 1000? 30 %+ 1200? 20 %= 900由此可看出由于抽样框的选择不同,因此计算出的人均收入有明显的不同。 二、无回答问题 无回答 指抽样调查中的样本,由于各种原因未能获得调查数据。 无回答问题也是抽样中造成估计推断偏误的一个重要来源。 1.由于无回答使有效的样本量减少,从而使抽样误差增大,调查精度下降。 2.由于无回答而带来的估计量的偏误,不会由于样本量的增大而减少。 无回答偏误的产生主要来自于回答的人与无回答的人之间的态度或标志值的差异,因此偏误的大小取决于回答者 和无回答者之间标志值的差别和无回答的问卷在总问卷中的比例。 (以调查月收入水平为例,高收入或低收入者不愿回答,若二者所占比例很小,则影响不大) 管理数量方法处理方法: 1.注意调查问卷的设计和加强调查员的培训。 2.进行多次访问。 3.替换无回答的样本单元。 4.对存在无回答的结果进行调整。 三、抽样调查中的误差 1.抽样误差和抽样标准误差 抽样误差 通过样本的估计值 ? 来推断总体的相应值 ? 时,这时假定各个样本单元的数值是正确取得的,但由于样本是随机?? 抽取的,由样本对总体代表性引起的误差( ? - ? )称作抽样误差,这是一种随机误差。随着样本量的增大,抽样误差 将不断缩小。 ? 由于在实际抽样中,总体的 ? 值是未知的,因此实际的抽样误差( ? - ? )也无法知道,此时可根据抽样的原理计算出所有可能样本估计值与总体参数之间的平均离差程度,这就是抽样标准误差,定义为 差越小说明该抽样方案的精度越高。 2.非抽样误差与偏差 非抽样误差 是抽样调查的估计推断中除了抽样误差以外其他所有误差的总称。可能是数据出错引起的,也可能是抽样框不当 引起的,等等。 非抽样误差往往有系统性-根据不同情况会偏向某一个方向。而且不会因为样本容量的增大而缩小。 偏差 又称偏误,是一种系统性的误差,定义为样本估计量的数学期望与待估的总体真实参数之间的离差。即 E( ? )- ? 一个同时考察抽样误差和偏差大小的度量称为均方误。? E (? ? ? ) 2。抽样标准误?第三节 抽样中的三种分布及中心极限定理2样本平均值 x 、样本方差 s 、样本比率等都是随机变量,被称为统计量。 总体平均值 ? 、总体方差 ? 、总体比率等都是常量,被称为参数2统计推断即是要用样本统计量来估计或检验总体参数,为此,需要知道样本统计量的概率分布,即抽样分布。 1.总体分布 指研究对象这一总体中各个单元标志值所形成的分布。总体分布的一些特征往往是抽样推断中待估的参数。 2.样本分布 又称子样分布或经验分布,是指从总体中抽取的样本单元标志值所形成的分布。可以用样本分布均值和方差来估 计总体的均值和方差。 由于能力、时间、经济等诸多方面的限制,完备的总体信息一般是难以获得的,因此我们一般都是利用样本信息X?对总体信息进行估计。在多数情况下,我们只需要估计总体的一些特征,因此我们常用样本均值 总体均值 ? ,用样本方差1 n ? Xi n i ?1 来估计S2 ?1 n ? (X i ? X )2 2 n ? 1 i ?1 来估计总体方差 ? 。 管理数量方法3.抽样分布 指样本估计量的分布。样本估计量是样本的一个函数,称为统计量(不包含任何未知参数的样本的函数),所以 抽样分布即指统计量的分布。样本平均值 X 、样本方差 S 、样本比率等都是统计量,一般用大写英文字母表示。对 于样本的任何一组观测值可计算出对应统计量的观测值,这些观测值不再是统计量,一般用小写英文字母表示。如:2x?1 n 1 n xi s 2 ? ? ( xi ? x ) 2 ? 2 n ? 1 i ?1 n i ?1 , 分别为样本平均值 X 、样本方差 S 的观测值。n CN ?统计量的分布称作抽样分布。如,从总体单元数为 N,抽取样本容量为 n,则有N! N!( N ? n)! 个可能的样x?本,每一样本的指标(观测值),比如说 布就称作抽样分布。1 n ? xi n n i ?1 ,均可作为总体指标 ? 的一个估计值,而这 C N 个 x 所组成的分例:假设一个总体包括 8 个单元,其标志值分别为 复),并计算样本均值 X , X 的抽样分布如下:xi ? 0,1,2,3,4,5,7,8 。现从中抽取 n=2 的简单随机样本(不重X0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.5P(X )1/28 1/28 1/14 1/14 3/28 1/14 3/28 3/28 3/28 1/14 1/14 1/14 1/28 1/28 管理数量方法4.中心极限定理 一个具有任意分布形式的总体,从中抽取容量为 n 的样本,随着样本容量的增大,样本平均数 x 逐渐趋近于正态 分布。第四节 一些常用的抽样分布1.样本均值 X 的抽样分布 要确定一个分布需要讨论两方面内容:(1)它的概率分布形式;(2)这一分布的一些主要特征(值)。总体分布形式样本容量 大样本样本均值的抽样分布 正态分布 正态分布 正态分布 非正态分布正态分布 小样本 大样本 非正态分布 小样本 管理数量方法总体均值方差抽样方式 重复抽样X的数学期望 X的方差? ? ? ?有限总体( ,? ) ?2?2 /n( N ?n ?2 ) N ?1 n不重复抽样 重复抽样无限总体( ,? ) ?2?2 /n ?2 /n不重复抽样x 的抽样分布有限总体:无放回抽样修正:?x ?N ?n ? N ?n N ? 1 n (有限总体修正因子 N ? 1 )有放回抽样或 n&0.05N 的无放回抽样不修正:?x ??n无限总体:有放回或无放回抽样?x ?不修正:?n例:假设总体由 5 个数据{6,9,12,15,18}组成,由于 5 个数据各不相同,总体概率分布分配给每个值的概率 相等,即 1/5。因此有:? ? (6 ? 9 ? 12 ? 15 ? 18) ? 121 5? 2 ? (6 2 ? 9 2 ? ... ? 18 2 ) ? 12 2 ? 181 5(1)现(不放回)抽取容量为 3 的简单随机样本。样本个数为 10。 样本 1 2 3 4 5 样本值 6,9,12 6,9,15 6,9,18 6,12,15 6,12,18 X9 10 11 11 12 样本 6 7 8 9 10 样本值 6,15,18 9,12,15 9,12,18 9,15,18 12,15,18 X13 12 13 14 15X P9 0.110 0.111 0.212 0.213 0.214 0.115 0.1? X ? ? XP( X ) ? 9 ? 0.1 ? 10? 0.1 ? 11? 0.2 ? ... ? 15? 0.1 ? 12X 管理数量方法2 ? X ? ? X 2 P( X ) ? ? X ? 9 2 ? 0.1 ? 102 ? 0.1 ? 112 ? 0.2 ? ... ? 152 ? 0.1 ? 122 ? 3 2 X有限总体的无放回抽样:?X ?2?2 N ?nn ? N ?1?18 5 ? 3 ? ?3 3 5 ?1(2)现采用有放回抽样,抽取 n=2 的样本。样本个数为 25。 样本值 6,6 6,9 6,12 6,15 6,18 9,6 9,9 X 6 7.5 9 10.5 12 7.5 9 样本 8 9 10 11 12 13 14 样本值 9,12 9,15 9,18 12,6 12,9 12,12 12,15 X 10.5 12 13.5 9 10.5 12 13.5 样本 15 16 17 18 19 20 21 样本值 12,18 15,6 15,9 15,12 15,15 15,18 18,6 X 15 10.5 12 13.5 15 16.5 12 样本 22 23 24 25 样本值 18,9 18,12 18,15 18,18样本1132131641567X6 .579 0.51 2 4 /25 /51 3.5 1 /251 5 4 /251 6.5 3 /251 8 2 /251P /251 /252 /2531? X ? ? XP( X ) ? 6 ?1 / 25 ? 7.5 ? 2 / 25 ? ... ? 18?1 / 25 ? 12X2 ? X 2 ? ? X 2 P( X ) ? ? X ? 6 2 ?1/ 25 ? 7.52 ? 2 / 25 ? ... ? 182 ?1/ 25 ? 122 ? 9 X有限总体的有放回抽样:?X2 ??2n?18 ?9 2样本均值与总体均值间的关系:? X ? E( X ) ? E(1 n 1 n 1 X i ) ? ?[ E ( X i )] ? n? ? ? ? n i ?1 n i ?1 n样本方差与总体方差之间的关系:有限总体的有放回抽样:?X ?2?2n有限总体的无放回抽样: 2.样本比例的抽样分布?X ?2?2 N ?nn ? N ?1比例问题就要适用于研究属性变量,我们把总体单位中具有某种特征的单位用 1 表示,否则用 0 表示。因此总体 管理数量方法N ,样本比例为 比例为 机变量,随着样本容量 n 的增大,二项分布逼近于正态分布,因此 P 也近似于正态分布:E(P)=p,D(P)=p(1-p)/n,P~N(p,p(1-p)/n)。p??xi ?1NiP??Xi ?1nin具有某种特征 ?1..... ,X ?? ?0.不具有某种特征,不难看出, ? X i 是一个服从二项分布的随如果总体为有限总体,采用不重复抽样,当样本抽样比 n/N&0.05 时,P 的抽样分布的方差应乘以有限总体不重复P ~ N ( p,抽样的修正系数(N-n)/(N-1),即:p(1 ? p ) N ? n ) n N ?1例:设 5 件产品中有 3 件合格品和 2 件不合格品,今在其中有放回地抽取 2 件,考虑抽到的合格品的比率。 总体的合格品比率:p=0.6 样本个数=25将产品进行编号,设 1、2、3 号为合格品,4、5 号为不合格品。 样本 44,45,54,55 14,15,24,25,34,35,41,42,43,51,52,53 11,12,13,21,22,23,31,32,33 合格品率 0 0.5 1 概率 4/25 12/25 9/25? p ? E( p) ? 0 ? 4 / 25 ? 0.5 ?12 / 25 ? 1? 9 / 25 ? 0.6 ? p2 ? p ? 02 ? 4 / 25 ? 0.52 ?12/ 25 ? 12 ? 9 / 25 ? 0.62 ? 0.12?0.6 ? 0.4 p(1 ? p ) = 2 n样本 45 14,15,24,25,34,35 12,13,23 合格品率 0 0.5 1 概率 1/10 3/5 3/10续上例,将“有放回抽样”改为“无放回抽样”。? p ? E( p) ? 0 ? 0.1 ? 0.5 ? 0.6 ? 1? 0.3 ? 0.6 ? p2 ? p ? 02 ? 0.1 ? 0.52 ? 0.6 ? 12 ? 0.3 ? 0.62 ? 0.09?5 ? 2 0.6 ? 0.4 N ? n p(1 ? p) ? = ? 5 ?1 2 N ?1 n3.总结:? p(1 ? p) ? ? 2 n p的方差? P ? ? N ? n p(1 ? p) ? ? ? N ?1 n ?无限总体;有限总体重 置抽样; 有限总体不重置 ? 0.05N n 有限总体不重置抽样且 ? 0.05N n 管理数量方法第五节 几个重要的小样本抽样分布在前面我们曾说过,在大样本(样本容量大,一般 n≥30)的情况下,不论总体分布如何,样本均值 X 均服从正 态分布。但如果总体分布未知,且样本容量有限时,如何正确地利用抽样数据对总体参数进行估计呢?下面我们就介 绍几个常用的小样本抽样分布。 1. ? 分布2是 一 种 小 样 本 的 抽 样 分 布 。 设 随 机 变 量 X ~ N (? , ? ) , 从 中 随 机 抽 取 容 量 为 n 的 样 本 , 则 统 计 量2?2 ?? (xi ?1ni? x)2服从自由度为(n-1)的 ? 分布。可记作 ? ~2 2?2? 2 (n ? 1) 。性质: (1) ? 分布的变量值始终为正;2(2) ? 分布分布的形状取决于其自由度的大小,通常为不对称的正偏分布,但随自由度的增大逐渐趋向对称;2(3)E[ ? (n)]=n2D[ ? (n)]=2n;2 2 2 2 2(4)若 X、Y 为两个独立的 ? 分布随机变量,X~ ? (n),Y~ ? (m),则随机变量(X+Y)~ ? (n+m); (5) ? 分布通常用于总体方差的估计和非参数检验;2f.(x) d.f.= 2 d.f.= 5d.f.= 102.t 分布 又 称 学 生 分 布 。 设 随 机 变 量 X ~ N (? , ? ) , 从 中 随 机 抽 取 容 量 为 n 的 样 本 , 则 统 计 量2t?x?? (其中s ? s n( xi ? x ) 2 ? n ?1 ) i ?1n服从自由度为(n-1)的 t 分布。可记作 t ~ t (n ? 1) 。 管理数量方法性质: (1)若 X~N(0,1),Y~ ? (n),且 X、Y 相互独立,则2t?X Y / n ~t(n);(2)t 分布为对称分布,但一般情况下较标准正态分布平坦和分散,当自由度增大时,趋向于正态分布。t-分布 尾部比标准正态分布的尾部有着更大的概率。D (t ) ?(3)E(t)=0,n ..(n ? 2) n?2(4)t 分布通常应用于正态总体方差未知且小样本时对总体均值的估计和检验; 3.F-分布 也 称 方 差 比 分 布 。 设 X 和 Y 是 相 互 独 立 的 χ 2- 分 布 随 机 变 量 , 自 由 度 分 别 为 m 和 n , 则 称 统 计 量F?X /m X m ? ? Y /n Y n 服从自由度为(m, n)的 F-分布,通常写为 F ~ F(m, n)。F 分布通常用于方差分析、回归分析和协方差分析。 管理数量方法f(x;m,n)x F-分布的密度函数曲线第五章 参数估计 第一节 参数估计的一般问题1.参数估计 参数从狭义讲是指决定某一理论分布的函数中一个或若干个数值,它决定了随机变量的分布状况。从广义上讲是 反映总体特征和决定有关模型的数值。可以说,参数是总体本身所固有的属性值,是一系列客观存在的数值。但在现 实生活中,总体的参数值往往是难以获得的,因此我们常用抽样所得的样本数据通过计算得出相应的数值来近似地代 表总体参数,这就是参数估计。 2.估计量和估计值 估计量是根据样本来估计总体参数的一个规则,它通常表示为样本数值的一个函数即统计量。它不包含总体的任 何未知参数。由于它是随着样本数值的变动而变动的,因此估计量是一个随机变量。 估计值是估计量在某一次抽样中的具体取值。 3.估计的类型 点估计 指从抽到的具体样本数据计算出单个估计值作为待估总体参数的估计值。 区间估计 它是在点估计的基础上给出一个估计的范围,推断总体参数有多大的概率被涵盖在这一范围内。因此区间估计是 包含总体参数的一个值域,在估计的结论中指出上下限和结论的可靠性。 4.估计量的评价标准 (1)无偏性:指估计量抽样分布的数学期望要等于总体参数的真值。 (2)有效性:指估计量离总体参数摆动比较小的一个性质,通常以估计量抽样分布的方差来表示摆动的大小。 (3)一致性:又称相合性,指随着样本容量的增大,估计值会越来越接近总体参数的真值。 管理数量方法5.样本的数字特征与总体参数的点估计 在抽样调查中通常以样本的估计值对总体的特征进行估计,最常用的是样本均值、样本方差和样本标准差。X ?样本均值 是一个常数。1 n ?2 2 Xi D( X ) ? ? X ? ? n i ?1 n (大样本或重复抽样) 是总体均值 ? 的无偏估计量,样本均值的方差1 S2 ? ? 2= i ?1 ?( X i ? X )2 n ? 1 i ?1 样本方差 是总体方差机变量。n? (xNi? ?)2 ??xi ?1N2 i? Nx的一个无偏估计量,它是一个随NNS?样本标准差 偏估计量。1 n ? (X i ? X )2 n ? 1 i ?1也是用来反映样本数据离散程度的随机变量,但它不是总体标准差 ? 的无第二节 总体均值的区间估计区间估计是根据样本的估计值计算出一个数值范围,推断总体参数位于这一数值范围内的概率。这一数值范围称 作置信区间,其边界称为置信限,位于这一数值范围内的概率称作置信水平。 如何构造一个区间 回顾:抽样平均误差=样本均值的标准差?x ??n区间是由: x ? ? ,即: x ? ?,x ? ? 构成 若???为1个抽样标准差 , 即? ? ? x 概率为0.6873 ?为2个抽样标准差 , 即? ? 2? x 概率为0.9545由于 x 与 ? 的距离是对称的,如果某个样本的平均值落在 ? 的两个标准差范围之内,反过来, ? 也被包括在以x 为中心左右两个标准误差的范围之内。就一次具体的抽样而言,我们可以预期总体均值 ? 落在该样本均值 x 所构造的区间的可能性为 95%,而不在这一 区间的可能性仅为 5% 总体均值不在这一区间的概率成为显著性水平,用α 表示,而总体均值在这一区间的概率,即 1-α ,称为置信水 平或置信概率。 所以,只要给出一个显著性水平α ,就可以根据样本构造总体均值 ? 在 1-α 置信水平下的一个置信区间。 x=u x=xi 管理数量方法1.总体服从正态分布,且方差已知,样本不限X ~ N (? ,样本均值?2) n ,标准化后形成的随机变量服从标准正态分布,即:Z?X ???/ n~ N (0,1)总体均值 ? 的置信区间公式为? X ?? ? ? ? ? ? P? ? Z ? / 2 ? ? 1 ? ? ? P? X ? Z ? / 2 ? ? ? X ? Z? / 2 ? ? 1?? ? ? ??/ n ? n n? ? ? ?? 的 100(1-α )%置信区间为:X ? Z? / 2?n? ? ? X ? Z? / 2?nZ? / 2注:(1)??n 称为边际误差(估计误差), n??称为抽样平均误差;(2)若是有限总体的不重复抽样用 n&=0.05N,则需进行修正, ? 的 100(1-α )%置信区间为:X ? Z? / 2?n?N ?n ? N ?n ? ? ? X ? Z? / 2 ? N ?1 N ?1 n例:某厂成批生产某种金属棒,其长度服从正态分布,标准差为 0.06 厘米,对一个由 25 根棒组成的随机样本进 行了测量,平均长度为 7.48 厘米,试求这批金属棒平均长度μ 的置信度为 95%的置信区间 解:因为总体服从正态分布,且方差已知,置信度 1-α =0.95,α =0.05。查表可知:Z? / 2 ? Z 0.025 ? 1.96 =1.96。所以μ 的 95%的置信区间为:x ? z 0.025?n? 7.48 ? 1.96 ?0.0625 ? 7.48 ? 0.024 ? 7.456 ? 7.48 ? 1.96 ? 0.06 25 ? 7.48 ? 0.024 ? 7.504x ? z 0.025?n即有 95%的把握估计金属棒平均长度在 7.456~7.504 厘米之间 2.总体不是正态分布,方差未知,但是大样本由于是大样本,用样本方差 S 代替总体方差 ? ,所以样本均值 标准正态分布,即:2 2X ~ N (? ,S2 ) n ,标准化后形成的随机变量服从Z?X ?? S/ n~ N (0,1)总体均值 ? 的置信区间公式为? X ?? ? ? S S ? P? ? Z ? / 2 ? ? 1 ? ? ? P? X ? Z ? / 2 ? ? ? X ? Z? / 2 ? ? 1?? ? ? ? S/ n ? n n? ? ? ?? 的 100(1-α )%置信区间为: 管理数量方法X ? Z? / 2S n? ? ? X ? Z? / 2S n若是有限总体的不重复抽样用 n&=0.05N,则需进行修正, ? 的 100(1-α )%置信区间为:X ? Z? / 2S n?N ?n S N ?n ? ? ? X ? Z? / 2 ? N ?1 N ?1 n例 1:某汽车租赁公司欲估计全年每个租赁汽车的顾客每次租赁平均行驶里程。由于全年汽车租赁量很大,随机 抽取了 200 年顾客,根据记录计算平均行驶里程为 325 公里,标准差为 60 公里。试估计全年所有租赁汽车每次平均行 驶里程的置信区间。置信水平分别为(1)0.90,(2)0.95。 解:总体是否服从正态分布未知,总体方差也未知。但由于样本量 n=200 为大样本,因此可以用样本方差代替总 体方差。 (1)α =0.10,查表可知Z ? / 2 ? Z 0.05 ? 1.645所以μ 的 95%的置信区间为:X ? Z? / 2S n? 325 ? 1.645?60 200? 325 ? 6.98公里(2)α =0.05,查表可知Z? / 2 ? Z 0.025 ? 1.96所以μ 的 95%的置信区间为:X ? Z? / 2S n? 325 ? 1.96 ?60 200? 325 ? 8.32公里例 2:某厂负责人想估计 6000 包某种材料的平均重量,随机抽取 350 包组成一个样本,样本均值和标准差分别为 32 公斤和 7 公斤。试求总体均值μ 的置信度为 95%的置信区间。 解:我们不知道总体是否服从正态分布,方差σ 2 也未知,且由于抽样比 n/N=350/6000&5%,校正系数不能忽略, 故μ 的 95%的置信区间为:X ? Z 0.025 X+Z 0.025S n S nN ?n 7
? 32 ? 1.96 ? ? =31.29 N ?1
? 32+ .96 ? 1 ? =32.71 N ?1 也即有 95%的把握估计平均重量在 31.29~32.71 公斤之间。 3.正态总体,方差未知,小样本 当总体为正态分布时,小样本的样本均值 X 标准化后形成的随机变量仍然服从标准正态分布,即:X ~ N (? ,?2n ,)Z?X ???/ n2~ N (0,1)X ?? ~ t (n ? 1) 但当总体方差未知而用样本方差 S 代替总体方差 ? 时,则随机变量 S ,即:2t?X ?? ~ t (n ? 1) SP{t? / 2) (n ? 1) ?X ?? ? t? / 2 (n ? 1)} ? 1 ? ? S总体均值 ? 在 1-α 置信水平下的置信区间为: 管理数量方法X ? t? / 2 (n ? 1)注:S n(1)总体必须是正态分布; (2)查 t 分布表时要用自由度 n-1; (3) 在总体是正态分布的情况下,如果 ? 已知,则求置信区间的公式与大样本时的公式相同,μ 的 100 (1-α ) %X ? t? / 2置信区间为:S n;例 1:某时装专卖店的管理人员想估计其顾客的平均年龄,随机抽取了解 16 位顾客进行了调查,得到样本均值为 32 岁,样本标准差为 8 岁,假定顾客的年龄近似服从正态分布,试求该店全部顾客平均年龄置信度为 95%的置信区 间。 解:因为总体近似服从正态分布,且方差未知,置信度 1-α =0.95,α =0.05。自由度为 n-1=16-1=15。查表可 知:t 0.025 (15) ? 2.1315。所以μ 的 95%的置信区间为:X ? t 0.025 (15) X+t 0.025 (15)S n S n? 32 ? 2.1315? ? 32+2.1315?8 16 8 16=27.737=36.263即有 95%的把握估计全部顾客平均年龄在 27.737~36.263 岁之间。 例 2:某灯泡厂要估计一种新型灯泡的平均使用寿命,在生产线上随机抽取 9 个灯泡进行测试,取得了下列使用时 间数据(单位:小时):,,,,4940。假设灯泡的使用寿命服从正态 分布,以 95%的置信度,说明这种灯泡平均使用寿命的置信区间。 解:因为总体服从正态分布,但方差未知,同时由于样本量 n=9 属于小样本,因此需要使用 t 分布来估计。置信 度 1-α =0.95,α =0.05,自由度为 n-1=9-1=8,查表可知:t 0.025 (8) ? 2.306。由题中数据可算出:x ? 5200,  s ? 156 .5所以μ 的 95%的置信区间为:X ? t 0.025 (8)S n? ?156.5 =小时 9即有 95%的把握估计灯泡平均使用寿命在 20.3 小时之间。 4.非正态总体,小样本 因为来正非正态总体的小样本的样本均值不再服从正态分布,因此以上三种样本均值置信区间的估计方法均不适 用,此时可用切比雪夫不等式进行估计(若总体方差未知时,可用样本方差代替)。P( X ? ? ? K P( X ? K?n) ? 1?1 ? 1?? K2即:?n??? X ?K?n) ? 1?1 ? 1?? K2例:如上例,假设顾客的平均年龄不服从正态分布。1?由1 ? 1 ? ? ? 0.95 K2 得 K=4.472,所以 管理数量方法X ?K X+K?n? 32 ? 4.472? ? 32+4.472?8 16 8 16=23.056?n=40.944即有 95%的把握估计全部顾客平均年龄在 23.056~40.944 岁之间。 5.总结 大样本(n≥30)且 ? 已知? x?? ? ? ? ? ? P? ? Z ? / 2 ? ? 1 ? ? ? P? x ? Z ? / 2 ? ? ? x ? Z? / 2 ? ? 1?? ? ? ??/ n ? n n? ? ? ?1-α 置信系数? 的 100(1-α )%置信区间为:大样本(n≥30)且 ? 未知x ? Z? / 2?n? ? ? x ? Z? / 2?n? 的 100(1-α )%置信区间为:t 分布x ? Z? / 2s n? ? ? x ? Z? / 2s n (以 s 代替 ? )必须假定总体服从正态分布、 ? 是服从于自由度 n-1 的 t 分布 小样本(n&30)且 ? 未知 1、总体必须是正态分布 2、查 t 分布表时要用自由度 n-1 3、在总体是正态分布的情况下,如果 ? 已知,则求置信区间的公式与大样本时的公式相同? 的 100(1-α )%置信区间为:x ? t? / 2s n第三节 总体比例的区间估计总体比例是指总体单元中具有某种特征的单元数所占的比例,它是也是总体的一个重要参数。样本比例是总体比 例的一个无偏估计量,与总体均值的区间估计类似,在对总体比例进行区间估计时,由于样本大小不同及抽样方式不 同等原因,需要针对不同的情况区别对待。 1.大样本重复抽样 当样本容量很大时,样本比例趋近于正态分布(条件 np&5 且 n(1-p)&5),其方差为 pq/n,均值为 p,这里的 p 为 总体比例,由于样本容量很大,因此样本比例 P≈总体比例 p,所以有:? P? p ? P ? Z ? / 2 ? ?? pq ? ? ? 1 ? ? ? P? P ? Z ? / 2 ? ? n ? ?pq ? p ? P ? Z? / 2 npq ? ? ? 1?? n ? ?? PQ PQ ? ? ? 1?? P? P ? Z ? / 2 ? p ? P ? Z? / 2 ? n n ? ? ? 即:总体比例区间估计的界限为: 管理数量方法P ? Z? / 2P(1 ? P) n例:一所大学的保健医生想了解学生戴眼镜的成数,随机抽选 100 名学生,其中戴眼镜者有 31 名。试求全校学生 戴眼镜成数的置信度为 90 的置信区间。 解:P=31/100=0.31 (1-α )=90% nP=31&5 n(1-P)=69&5α =0.1P ? Z? / 2P+Z ? / 2P(1 ? P) 0.31? 0.69 ? 0.31? Z 0.05 ? =0.31- 1.645? 0. = n 100P(1 ? P) 0.31? 0.69 ? 0.31 Z 0.05 ? + =0.31 1.645? 0. + = n 100也即有 90%的把握估计全校学生戴眼镜的成数在 23 .4%~38.6%之间。 2.大样本不重复抽样(条件 np&5 且 n(1-p)&5) 当采用不重复抽样,若 n/N≥0.05 时,利用样本比例对总体比例进行区间估计时,须使用修正系数,总体比例区 间估计的界限为:P ? Z? / 2P(1 ? P) N ? n n N ?1例:一所中学的保健医生想了解本校学生戴眼镜的成数,从该校的 1200 名学生中随机抽选 100 名学生,其中戴眼 镜者有 31 名。试求全校学生戴眼镜成数的置信度为 90 的置信区间。 解:P=31/100=0.31 (1-α )=90% nP=31&5 n(1-P)=69&5α =0.1n/N=1/12&0.05,因此,须使用修正系数。P ? Z? / 2 P ? Z? / 2P(1 ? P) N ? n 0.31? 0.0 ? 0.31 ? Z 0.05 ? =0.2371 n N ?1 100 1200? 1 P(1 ? P) N ? n 0.31? 0.0 ? 0.31 ? Z 0.05 ? =0.3829 n N ?1 100 1200? 1也即有 90%的把握估计全校学生戴眼镜的成数在 23.71%~38.29%之间。 3.比例置信区间的一些特殊情况 (1)稀有事件的小比例估计问题。 当 p 很小或者(1-p)很小时,即使 n 很大,np&=5 或 n(1-p)&=5,此时应当使用泊松分布来求置信区间。 (2)样本比例的抽样分布近似正态分布时需要的样本容量 P 0.5 0.4-0.6 0.3-0.7 0.2-0.8 0.1-0.9 近似正态分布要求样本量 30 50 80 200 600 管理数量方法第四节 两个均值或两个比例之差的区间估计一、两个总体均值之差的估计:独立样本 1.两个总体为正态分布或大样本 设两总体的均值分别为 ?1 、 ? 2 ,方差分别为 ? 1 、 ? 2 ,从两总体中独立抽取的样本容量分别为 n1 、 n2 ,得到2 2的样本均值分别为 X 1 、 X 2 ,因为两样本独立,所以 X 1 ? X 2 为总体均值 ?1-? 2 的无偏估计量, E ( X 1 ? X 2 ) =E ( X 1 ) ? E ( X 2 ) = ?1-? 2由于 X 1 、 X 2 分别服从正态分布,所以 X 1 ? X 2 也服从正态分布,其方差为D( X 1 ? X 2 ) ?? 12n1?2 ?2n2 ,即:? 12X 1 ? X 2 ~N( ?1-? 2 , n1?2 ?2n2 )?1-? 2 的 100(1-α )%置信区间为:(X 1-X 2) Z ? / 2 ?? 122 + 2 (当? 12 和? 2已知) n1 n2?2(X 1-X 2) Z ? / 2 ?2 S12 S 2 2 + (当? 12 和? 2 未知) n1 n2例:某洗衣机从两个供应商购进马达,从供应商 A 抽取 40 台马达作测试,得平均使用寿命 X A ? 4500小时,2 2 S A

我要回帖

更多关于 效率app 总数 的文章

 

随机推荐