第一章引言和绪论一样吗计量经济学究竟是一门什么样的学科

第一章绪论;(一)基本知识类题型;1-1.什么是计量经济学?;1-2.简述当代计量经济学发展的动向;1-3.计量经济学方法与一般经济数学方法有什么区;1-4.为什么说计量经济学是经济理论、数学和经济;1-7.试结合一个具体经济问题说明建立与应用计量;1-9.计量经济学模型主要有哪些应用领域?各自的;1-10.试分别举出五个时间序列数据和横截面数据;1-11.
第一章 绪论
(一)基本知识类题型
1-1. 什么是计量经济学?
1-2. 简述当代计量经济学发展的动向。
1-3. 计量经济学方法与一般经济数学方法有什么区别?
1-4.为什么说计量经济学是经济理论、数学和经济统计学的结合?试述三者之关系。 1-5.为什么说计量经济学是一门经济学科?它在经济学科体系中的作用和地位是什么? 1-6.计量经济学的研究的对象和内容是什么?计量经济学模型研究的经济关系有哪两个基本特征?
1-7.试结合一个具体经济问题说明建立与应用计量经济学模型的主要步骤。 1-8.建立计量经济学模型的基本思想是什么?
1-9.计量经济学模型主要有哪些应用领域?各自的原理是什么?
1-10.试分别举出五个时间序列数据和横截面数据,并说明时间序列数据和横截面数据有和异同?
1-11.试解释单方程模型和联立方程模型的概念,并举例说明两者之间的联系与区别。 1-12.模型的检验包括几个方面?其具体含义是什么?
1-13.常用的样本数据有哪些?
1-14.计量经济模型中为何要包括随机误差项?简述随机误差项形成的原因。 1-15.估计量和估计值有何区别?哪些类型的关系式不存在估计问题?
1-16.经济数据在计量经济分析中的作用是什么?
1-17.下列假想模型是否属于揭示因果关系的计量经济学模型?为什么?
⑴ St?112.0?0.12Rt
其中St为第t年农村居民储蓄增加额(亿元)、Rt为第t年城镇
居民可支配收入总额(亿元)。
⑵ St?1?.30Rt
其中St?1为第(t?1)年底农村居民储蓄余额(亿元)、Rt为第t年农村居民纯收入总额(亿元)。
1-18.指出下列假想模型中的错误,并说明理由:
(1)RSt?.24RIt?112.IVt
其中,RSt为第t年社会消费品零售总额(亿元),RIt为第t年居民收入总额(亿元)(城镇
居民可支配收入总额与农村居民纯收入总额之和),IVt为第t年全社会固定资产投资总额
(亿元)。
(2)Ct?180?1.2Yt
其中,C 、Y分别是城镇居民消费支出和可支配收入。
(3)lnYt?1.15?1.62lnKt?0.28lnLt
其中,Y、K、L分别是工业总产值、工业生产资金和职工人数。
1-19.下列假想的计量经济模型是否合理,为什么?
(1)GDP?????iGDPi??
其中,GDPi(i?1,2,3)是第i产业的国内生产总值。
(2)S1????S2??
其中,S1 、S2分别为农村居民和城镇居民年末储蓄存款余额。
(3)Yt????1It??2Lt??
其中,Y、I、L分别为建筑业产值、建筑业固定资产投资和职工人数。
(4)Yt????Pt??
其中,Y、P分别为居民耐用消费品支出和耐用消费品物价指数。
(5)财政收入
(6)煤炭产量?f(财政支出)??
?f(L,K,X1,X2)??
其中,L、K分别为煤炭工业职工人数和固定资产原值,X1、X2分别为发电量和钢铁产
1-20.模型参数对模型有什么意义?
习题参考答案
1-1.答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。
1-2.答:计量经济学自20年代末、30年代初形成以来,无论在技术方法还是在应用方面发展都十分迅速,尤其是经过50年代的发展阶段和60年代的扩张阶段,使其在经济学科占据重要的地位,主要表现在:①在西方大多数大学和学院中,计量经济学的讲授已成为经济学课程表中有权威的一部分;②从年诺贝尔经济学奖的XX位获奖者中有XX位是与研究和应用计量经济学有关;著名经济学家、诺贝尔经济学奖获得者萨缪尔森甚至说:“第二次世界大战后的经济学是计量经济学的时代”。③计量经济学方法与其他经济数学方法结合应用得到发展;④计量经济学方法从主要用于经济预测转向经济理论假设和政策假设的检验;⑤计量经济学模型的应用从传统的领域转向新的领域,如货币、工资、就业、福利、国际贸易等;⑥计量经济学模型的规模不再是水平高低的衡量标准,人们更喜欢建立一些简单的模型,从总量上、趋势上说明经济现象。
1-3.答:计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。
1-5.答:从计量经济学的定义看,它是定量化的经济学;其次,从计量经济学在西方国家经济学科中居于最重要的地位看,也是如此,尤其是从诺贝尔经济学奖设立之日起,已有多人因直接或间接对计量经济学的创立和发展作出贡献而获得诺贝尔经济学奖;计量经济学与数理统计学有严格的区别,它仅限于经济领域;从建立与应用计量经济学模型的全过程看,不论是理论模型的设定还是样本数据的收集,都必须以对经济理论、对所研究的经济现象有透彻的认识为基础。综上所述,计量经济学确实是一门经济学科。
1-6.答:计量经济学的研究对象是经济现象,是研究经济现象中的具体数量规律(或者说,计量经济学是利用数学方法,根据统计测定的经济数据,对反映经济现象本质的经济数量关系进行研究)。计量经济学的内容大致包括两个方面:一是方法论,即计量经济学方法或理论计量经济学;二是应用,即应用计量经济学;无论是理论计量经济学还是应用计量经济学,
都包括理论、方法和数据三种要素。
计量经济学模型研究的经济关系有两个基本特征:一是随机关系;二是因果关系。 1-7.答:
1-8.答:计量经济学方法,就是定量分析经济现象中各因素之间的因果关系。所以,第一步,要根据经济理论分析所研究的经济现象,找出经济现象之间的因果关系及相互间的联系,把问题作为被解释变量,把影响问题的主要因素作为解释变量,把非主要因素归入随机项;第二步,要按照它们之间的行为关系选择适当的数学形式描述这些变量之间的关系,一般是用一组数学上彼此独立、互不矛盾、完整有解的方程组表示。在建立理论模型的时,要求理论模型在参数估计、模型检验的过程中不断得到修正,以便得到一个较好的、能够解释过去的、反映客观经济规律的数学模型。此外,还可以通过散电图或模拟的方法,选择一个拟合效果较好的数学模型。
1-9.答:计量经济学模型主要有以下几个方面的用途:①结构分析,即研究一个或几个经济变量发生变化及结构参数的变动对其他变量以至整个经济系统产生何种的影响;其原理是弹性分析、乘数分析与比较静力分析。②经济预测,即用其进行中短期经济的因果预测;其原理是模拟历史,从已经发生的经济活动中找出变化规律;③政策评价,即利用计量经济模型定量分析政策变量变化对经济系统运行的影响,是对不同政策执行情况的“模拟仿真”。④检验与发展经济理论,即利用计量经济模型和实际统计资料实证分析某个理论假说的正确与否;其原理是如果按照某种经济理论建立的计量经济模型可以很好地拟合实际观察数据,则意味着该理论是符合客观事实的,否则则表明该理论不能说明客观事实。
1-10.答:时间序列数据的例子如:改革开放以来25年中的GDP、居民人均消费支出、人均可支配收入、零售物价指数、固定资产投资等;横截面数据的例子如:2003年各省的GDP、该年各工业部门的销售额、该年不同收入的城镇居民消费支出、该年不同城镇居民的可支配收入、该年各省的固定资产投资等。这两类数据都是反映经济规律的经济现象的数量信息,不同点:时间序列数据是含义、口径相同的同一指标按时间先后排列的统计数据列;而横截面数据是一批发生在同一时间截面上不同统计单元的相同统计指标组成的数据列。
1-11.答:如果模型系统只包含一个方程,即只研究单一的经济活动过程,揭示其因素之间的单向因果关系,则称该模型为单方程模型;如果模型系统涉及到多个经济关系而需要构造一个方程组,则称该模型为联立方程模型。二者之间有着密切联系,如:单方程模型是联立方程模型的组成元素,而联立方程模型又是由若干个单方程模型有机组合而成。二者又有区别,如:单方程模型都是随机方程,而联立方程模型中既有随机方程也又恒等方程。
1-12.答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;模型的预测检验主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。
1-13.答:常用的样本数据包括:时间序列数据、横截面数据、虚变量数据和面板数据。 1-14.答:由于客观经济现象的复杂性,以至于人们目前仍难以完全地透彻地了解它的全貌。对于某一种经济现象而言,往往受到很多因素的影响,而人们在认识这种经济现象的时候,只能从影响它的很多因素中选择一种或若干种来说明。这样就会有许多因素未被选上,这些未被选上的因素必然也会影响所研究的经济现象。因此,由被选因素构成的数学模型与由全部因素构成的数学模型去描述同一经济现象,必然会有出入。为使模型更加确切地说明客观经济现象,所以有必要引入随机误差项。随机误差项形成的原因:①在解释变量中被忽略的因素;②变量观测值的观测误差;③模型的关系误差或设定误差;④其他随机因素的影响。 1-15.答:
1-16.答:经济数据是通过对经济变量进行观测和统计得到的,它们反映经济活动相关方面的水平和情况。从计量经济学的角度看,经济数据是计量经济分析的材料,或者说发现经济规律的信息载体,对经济规律的实证研究起十分关键的作用。为此,要求经济数据须具备完整性、准确性、可比性和一致性。
经典单方程计量经济学模型:一元线性回归模型
一、内容提要
本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归
三亿文库包含各类专业文献、文学作品欣赏、生活休闲娱乐、各类资格考试、外语学习资料、应用写作文书、中学教育、专业论文、计量经济学习题 含答案15等内容。 
 计量经济学练习册答案(第二版)完整版_经济学_高等教育_教育专区。第一章 导论...当然,此时,应当考虑做包 含多余变量、遗漏变量等方面的模型设定检验。 6. 答:...  计量经济学习题及全部答案_工学_高等教育_教育专区。科学出版社,计量经济学,相关习题以及答案。计量经济学》习题(一 《计量经济学》习题 一) 一、判断正误 1.在...  计量经济学题库(超完整版)及答案_经济学_高等教育_教育专区。四、简答题(每...(2)解释回归系数的含 义。 (2)如果希望 1997 年国民收入达到 15,那么应该把...  计量经济学期末考试题库(完整版)及答案_其它考试_资格考试/认证_教育专区。看完期末考试保证不挂科 计量经济学题库 1、计量经济学是以 经济理论 为指导,以数据...  计量经济学试卷汇总_(含答案)_经济学_高等教育_教育专区。文档贡献者 moresidom...10套计量经济学试卷(附答... 10页 免费
计量经济学题库(超完整版... 46...  计量经济学复习题及答案(超完整版)_经济/市场_经管营销_专业资料。计量经济学...(2)解释回归系数的含 义。 (2)如果希望 1997 年国民收入达到 15,那么应该把...  计量经济学题库(超完整版)及答案_经济学_高等教育_教育专区。计量经济学题库 ...(2)解释回归系数的含 义。 (2)如果希望 1997 年国民收入达到 15,那么应该把...  计量经济学题库(超完整版)及答案_经济学_高等教育_教育专区。计量经济学题库 ...(2)解释回归系数的含 义。 (2)如果希望 1997 年国民收入达到 15,那么应该把...  计量经济学习题及答案_经济学_高等教育_教育专区。学习练习,复习用 期中练习题 1、回归分析中使用的距离是点到直线的垂直坐标距离。最小二乘准则是指( A.使 )...计量经济学知识要点-共享资料网
计量经济学知识要点
《计量经济学》《Econometrics》 第一章绪论0.1 关于绪论 0.2 课程教学大纲(§1.1 计量经济学§1.2 经典计量经济学模型的建模步骤§1.3 计量经济学模型的应用) 0 .1 关于绪论 ○绪论是课程的纲。 ○学好绪论,可以说学好了课程的一半。参观一个城市,先站在最高处俯瞰,然后走街串巷;了解一座建筑,先看模型, 后走进每一个房间。各起一半作用。 ○绪论课的目的:了解课程的性质和在课程体系中的地位;了解课程完整的内容体系和将要讲授的内容;了解课程的重 点和难点;了解课程的学习方法;介绍课程中不讲的但是必须了解的课程内容。 ○不必全懂,只需似懂非懂。 0.2 《计量经济学》教学大纲 ⒈ 课程:计量经济学 总学时:72 学分:3.5 课程性质:教育部规定核心课程 ⒊ 课程说明 ⑴ 教学目的 经济学是一门科学,实证的方法,尤其是数量分析方法是经济学研究的基本方法论。通过该门课程教学,使学生掌 握计量经济学的基本理论与方法,并能够建立实用的计量经济学应用模型。 ⑵ 先修课程 微观经济学、宏观经济学、经济统计学、微积分、线性代数、概率论与数理统计 ⑶ 教材及参考书 教材: 李子奈,潘文卿。 《计量经济学》(第二版),高等教育出版社,2000 年 7 月 参考书: ①林少宫译, 《计量经济学》 , (Gujarati D., Basic Econometrics 第 3 版) ,中国人民大学出版社,2000。 ②钱小军等译, 《计量经济模型与经济预测》 , (R S Pindyck and D L Rubinfeld, Econometric models and economic forecasts , McGraw-Hill Companies Inc..) ,机械工业出版社,1999.11。 ③李子奈, 《计量经济学―方法与应用》 ,清华大学出版社,1992 年 ⑷ 课堂资料下载 内容:教材电子版、补充资料、课件、习题集、教学基本要求、教学大纲、复习要点等。 路径:ftp://211.85.1.200 →经管院→马成林 ⑸ 课程成绩 综合练习一:10 分 综合练习二:10 分 课堂表现: 10 分 期末考核: 70 分 ⒋ 关于学习方法的说明 ⑴ 理论与应用并重。既要重视理论方法,也要重视应用模型和应用中实际问题的解决; ⑵ 以教材中的经典理论方法为主,也要理解适当引入的、教材中没有的非经典理论方法; ⑶ 对于理论方法,重点是思路而不是数学过程; ⑷ 对于应用模型,重点不是每种模型本身,而是它们演变与发展的方法论; ⑸ 必须十分重视综合练习; ⑹ 必须掌握一种应用软件,注意课堂的软件应用演示,“师傅领进门,修行在个人”,多练。§1.1 计量经济学一、计量经济学 四、计量经济学是一门经济学科 一、计量经济学 △ 经济学的一个分支学科 二、计量经济学模型 三、计量经济学的内容体系 五、计量经济学在经济学科中的地位○1926 年挪威经济学家 R.Frish 提出 Econometrics ○ 20 世纪 40、50 年代的大发展和 60 年代的扩张 ○ 1930 年成立世界计量经济学会 ○ 20 世纪 70 年代以来非经典 (现代) 计量经济学的发展 ○ 1933 年创刊《Econometrica》 △ 定义 “用数学方法探讨经济学可以从好几个方面着手, 但任何一个方面都不能和计量经济学混为一谈。 计量经济学与经济统 计学绝非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分具有一定的数量特征;计量经济学也不应 视为数学应用于经济学的同义语。经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来 说,都是必要的,但本身并非是充分条件。三者结合起来,就是力量,这种结合便构成了计量经济学。” △ 在经济学科中占据极重要的地位 克莱因(R.Klein) :“计量经济学已经在经济学科中居于最重要的地位”,“在大多数大学和学院中,计量经济学的讲 授已经成为经济学课程表中最有权威的一部分”。 萨缪尔森(P.Samuelson) :“第二次大战后的经济学是计量经济学的时代”。 二、计量经济学模型 △ 模型 △ 经济数学模型 △ 数学模型 △ 计量经济学模型 △ 经济理论分析(行为分析)→数理分析 →数量分析 只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -1- 三、计量经济学的内容体系 △ 广义计量经济学和狭义计量经济学 △ 初、中、高级计量经济学 △ 理论计量经济学和应用计量经济学 入产出分析方法、时间序列分析方法等。△ 经典计量经济学和非经典计量经济学 △ 微观计量经济学和宏观计量经济学 △广义计量经济学和狭义计量经济学?广义计量经济学是利用经济理论、数学以及统计学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投 ?狭义计量经济学,也就是我们通常所说的计量经济学,以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。?本课程中的计量经济学模型,就是狭义计量经济学意义上的经济数学模型。△ 初、中、高级计量经济学?初级以计量经济学的数理统计学基础知识和经典的线性单方程模型理论与方法为主要内容; ?中级以用矩阵描述的经典的线性单方程模型理论与方法、经典的线性联立方程模型理论与方法,以及传统的应用模型为主要内容;?高级以非经典的、现代的计量经济学模型理论、方法与应用为主要内容。 ?本课程定位于初级水平上,适当引入中、高级的内容。△ 理论计量经济学和应用计量经济学?理论计量经济学是以介绍、研究计量经济学的理论与方法为主要内容,侧重于理论与方法的数学证明与推导,与数理统计联系极为密切。除了介绍计量经济模型的数学理论基础、普遍应用的计量经济模型的参数估计方法与检验方法外, 还研究特殊模型的估计方法与检验方法,应用了广泛的数学知识。?应用计量经济学则以建立与应用计量经济学模型为主要内容,强调应用模型的经济学和经济统计学基础,侧重于建立与应用模型过程中实际问题的处理。?本课程是二者的结合。△ 经典计量经济学和非经典计量经济学?经典计量经济学(Classical Econometrics)一般指 20 世纪 70 年代以前发展并广泛应用的计量经济学。R.Frish 创立 T.Haavelmo 建立了它的概率论基础 L.R.Klein 成为其理论与应用的集大成者?经典计量经济学在理论方法方面特征是:⑴ ⑶ ⑷ ⑸ 模型类型―随机模型; ⑵ 模型导向―理论导向; 模型结构―线性或者可以化为线性,因果分析,解释变量具有同等地位,模型具有明确的形式和参数; 数据类型―以时间序列数据或者截面数据为样本,被解释变量为服从正态分布的连续随机变量; 估计方法―仅利用样本信息,采用最小二乘方法或者最大似然方法估计模型。?经典计量经济学在应用方面的特征是:⑴ 应用模型方法论基础―实证分析、经验分析、归纳; ⑵ 应用模型的功能―结构分析、政策评价、经济预测、理论检验与发展; ⑶ 应用模型的领域―传统的应用领域,例如生产、需求、消费、投资、货币需求,以及宏观经济等。?非经典计量经济学一般指 20 世纪 70 年代以来发展的计量经济学理论、方法及应用模型,也称为现代计量经济学。 ?非经典计量经济学主要包括:微观计量经济学、非参数计量经济学、时间序列计量经济学和动态计量经济学等。 ?非经典计量经济学的内容体系:模型类型非经典的计量经济学问题、模型导向非经典的计量经济学问题、模型结构非经典的计量经济学问题、数据类型非经典的计量经济学问题和估计方法非经典的计量经济学问题。?本课程以经典计量经济学为主,适当引入一些简单的、应用较多的现代计量经济学理论方法。理由:一方面,从理论方法角度,经典计量经济学理论方法是非经典计量经济学理论方法的基础; 另一方面,从应用的角度,经典计量经济学模型仍然是目前应用最为普遍的计量经济学模型。 △ 微观计量经济学和宏观计量经济学?微观计量经济学 于 2000 年诺贝尔经济学奖公报中正式提出。 ?微观计量经济学的内容集中于“对个人和家庭的经济行为进行经验分析”; ?“微观计量经济学的原材料是微观数据”,微观数据表现为截面数据和平行(penal)数据。 ?赫克曼(J.Heckman)和麦克法登(D.McFaddan) 对微观计量经济学作出原创性贡献。 ?微观计量经济学教科书和课程有:“Microeconometrics” “Advanced Microeconometrics”“Applied Microeconometrics” “Topics in Microeconometrics”“Methods in Microeconometrics”?微观计量经济学的主要内容包括:平行(penal)数据模型的理论方法 离散选择模型的理论方法 选择性样本模型的理论方法 只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -1- ?宏观计量经济学名称由来已久,但是它的主要内容和研究方向发生了变化。 ?经典宏观计量经济学:利用计量经济学理论方法,建立宏观经济模型,对宏观经济进行分析、评价和预测。 ?现代宏观计量经济学的主要研究方向:单位根检验、协整理论以及动态计量经济学。四、计量经济学是一门经济学科 △ 从计量经济学的定义看 △ 从计量经济学在西方国家经济学科中的地位看 △ 从计量经济学与数理统计学的区别看 △ 从建立与应用计量经济学模型的全过程看 △ 从诺贝尔经济学奖看 △诺贝尔经济学奖与计量经济学?53 位获奖者中 10 位直接因为对计量经济学发展的贡献而获奖1969 R. Frish J. Tinbergen 1973 W. Leotief 1980 L. R. Klein 1984 R. Stone 1989 T. Haavelmo 2000 J. J. Heckman D. L. McFadden 2003 R. F. EngleC. W. J. Granger ?近 20 位担任过世界计量经济学会会长?30 余位左右在获奖成果中应用了计量经济学五、计量经 济学在经济学科中的地位 △ 从现代西方经济学的特征看 △ 从西方经济学的发展历史看 △ 从世界一流大学经济学课程表看 △ 从国际经济学刊物论文看 △ 从经济学的“世界先进水平”看§1.2 计量经济学经典(传统)方法论―― 一门科学计量经济学经典方法论的主要内容为回归分析。 一般而言,经典计量经济学方法论仍支配着经济学的实证或应用,以及其它的社会科学和行为科学。 广义看,经典计量经济方法论包括以下几个方面: 1、陈述经济学理论或感兴趣的假设; 2、设定表述经济学理论的数理经济学模型; 3、设定相应的计量经济学模型(或统计模型) ; 4、采集数据; 5、估计计量经济模型的参数; 6、基于所估计的模型进行假设检验; 7、预测; 8、仿真以提出政策建议。 例子:以凯恩斯消费理论为例来说明上述方法论。 3、 设定相应的计量经济模型。?以上的模型为确定型模型,或者说变量收入和消费之间的确定型关系。如果我们收集到 100个家庭的收入与消费数据, 显然并不是每一个家庭的数据都满足上述模型,这是因为每一个家庭的规模(人口)不一定相同,消费的习惯也不尽相 同等,并且除收入外,还有其它因素影响消费支出,因此对上述数理经济模型修改为计量经济模型: Y= b1+b2X+u b2<1 (2)?模型(2)也称为线性回归模型. 例子:以凯恩斯消费理论为例来说明上述方法论 4、数据。要估计模型(2) ,或者说,要求 b1 和 b2 的数值,就需要数据。若我们采集到数据如表 1.1 ,如图所示,就可 估计模型(2) 。 5 、估计模型(2) 。运用回归技术和数据,即可对模型进行估计。?其估计的模型(2)为Y= -184.08+0.7064X+e (3)?其中 e 代表观测值(或样本点)U 的估计,b1 和 b2 的估计分别为-180.08 和 0.7064 ,即 MPC=0.7064 ,其意为,样本期,实际收入增加 1 美元,导致消费平均增加 0.71 美分。 6、假设检验。基于估计的模型(3) ,能否检验我们感兴趣的假设?随着本课程的学习,我们将会理解,以上估计所用的 数据称为样本,而-184.08+0.7064X 称为估计的总体,计量经济学即是通过样本推断总体,因此,我们可以对总体作 出感兴趣的假设,如?b2=0.7 或 b2<1 等,对类似的假设进行统计推断或检验,即为假设检验。我们要注意的是,假设检验对指对这样的假设进行统计检验而不是简单比较大小。 例子:以凯恩斯消费理论为例来说明上述方法论 7、预测。 只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -1- 以上的估计所使用的样本是 ,如果给定 1997 年的收入如 X,根据(3) ,我们可以预测 Y1997 : Y1997 =-184.08+0. 这即是预测,进一步,这样所得到的预测为样本外预测。为评估模型的预测能力,还可以作样本内预测。 例子:以凯恩斯消费理论为例来说明上述方法论 8、仿真与政策模拟。 如消费支出达到 4900 亿,如要使失业率维持在现有水平(如 4.2%) ,对应的收入应控制在何种 水平? 由 4900=-184.08+0.7064X 解出 X=7197,?由此可以评估现行的政策以及相应的调整。这仅是一个简单的例子,所说明的是,一个估计的模型,可以用于控制和政策仿真。但我们必须说明,现代计量经济学已大大改变了上述计量经济学的研究程序。§1.3 计量经济学模型的应用一、结构分析一、结构分析二、经济预测三、政策评价四、理论检验与发展?经济学中的结构分析是对经济现象中变量之间相互关系的研究。 ?结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。 ?计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数等。 ?应用举例二、经济预测?计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。 ?计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。 ?对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能失效。 ?模型理论方法的发展以适应预测的需要。三、政策评价?政策评价的重要性。 ?经济政策的不可试验性。四、理论检验与发展?计量经济学模型的“经济政策实验室”功能。?实践是检验真理的唯一标准。 ?任何经济学理论,只有当它成功地解释了过去,才能为人们所接受。 ?计量经济学模型提供了一种检验经济理论的好方法。 ?对理论假设的检验可以发现和发展理论。单方程计量经济学模型理论与方法 Theory and Methodology of Single-Equation Econometric Model 第二章 经典单方程计量经济学模型:一元线性回归模型?回归分析概述 ?一元线性回归模型的参数估计 ?一元线性回归模型检验?一元线性回归模型预测 ?实例单方程计量经济学模型 理论与方法 Theory and Methodology of Single-Equation Econometric Model §2.1 回归分析概述 一、变量间的关系及回归分析的基本概念 1、变量间的关系 经济变量之间的关系,大体可分为两类: (1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。 (2)统计依赖或相关关系:研究的是非确定现象随机变量间的关系。 例如: 2 函数关系: 圆面积 ? f ? , 半径 ? ? ? 半径 统计依赖关系/统计相关关系:农作物产量 ? f 气温, 降雨量, 阳光, 施肥量 对变量间统计依赖关系的考察主要是通过相关分析(correlation analysis)或回归分析(regression analysis)来完成的:????只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获-1- 正 线 统 计 依 性 不 赖相关 系 有 无 数 因 因 : 回 果 相 果 归 关 关 关 分 系 分 系 析 析相 相 相 关 关 关负 关 正 不 性 负? 1系 ? ? XY 相 关? 1相 相 相 相 关 关 关 关非线▲注意: ①不线性相关并不意味着不相关; ②有相关关系并不意味着一定有因果关系; ③回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。 ④相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即 区分应变量(被解释变量)和自变量(解释变量) :前者是随机变量,后者不是。 2、回归分析的基本概念 回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。 其用意:在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。 这里:前一个变量被称为被解释变量(Explained Variable)或应变量(Dependent Variable) ,后一个(些)变量 被称为解释变量(Explanatory Variable)或自变量(Independent Variable) 。 回归分析构成计量经济学的方法论基础,其主要内容包括: (1)根据样本观察值对经济计量模型参数进行估计,求得 回归方程; (2)对回归方程、参数估计值进行显著性检验; (3)利用回归方程进行分析、评价及预测。 二、总体回归函数 由于变量间关系的随机性,回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变 量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。 例 2.1:一个假想的社区有 100 户家庭组成,要研究该社区每月家庭消费支出 Y 与每月家庭可支配收入 X 的关系。 即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。 为达到此目的,将该 100 户家庭划分为组内收入差不多的 10 组,以分析每一收入组的家庭消费支出。表 2 800 每 月 家 庭 消 费 支 出 Y (元) 561 594 627 638 1 638 748 814 847 935 968 某社区家庭每月收入与消费支出统计表 . 1 . 1 每 1
924 979 78 1 1 1 0
1 54 1 1 1 30
4 1 74 6 5 3 16 4 6 1 家 X(元) 庭
可 2900 支 3200 配 3500 收 入共计24204950169
8 21 4 9 30 5 4 29 01 72 86 25
44 9 40 8 10 70 2 1 1 2 02 9 4 9 2 5 4 3 3 2 5 0 8 52 5 7 01 2 0 24 11 5 5 250 855 1分析: (1)由于不确定因素的影响,对同一收入水平 X,不同家庭的消费支出不完全相同; (2)但由于调查的完备性,给定收入水平 X 的消费支出 Y 的分布是确定的,即以 X 的给定值为条件的 Y 的条件 分布(Conditional distribution)是已知的, 如: P(Y=561|X=800)=1/4。 因此,给定收入 X 的值 Xi,可得消费支出 Y 的条件均值(conditional mean)或条件期望(conditional expectation) : E(Y|X=Xi) 该例中:E(Y | X=800)=605 描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且 Y 的条件均值均落在一根正斜率的直线上。这条直线 称为总体回归线。 概念: 在给定解释变量 Xi 条件下被解释变量 Yi 的期望轨迹称为总体回归线(population regression line) ,或更一般地称为总体 回 归 曲 线 ( population regression curve ) 。只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获-1- 350 0 300 每 0 250 月 0 消 200 费 0 150 支 0 出 100 0 Y 50 (元) 00 50 0 00
每月可支配收入X(元) 350 0 4000相应的函数:E (Y | X i ) ? f ( X i )称为(双变量)总体回归函数(population regression function, PRF) 。 ? 含义:回归函数(PRF)说明被解释变量 Y 的平均状态(总体条件期望)随解释变量 X 变化的规律。 ? 函数形式:可以是线性或非线性的。 例 2.1 中,将居民消费支出看成是其可支配收入的线性函数时:E (Y | X i ) ? ? 0 ? ? 1 X i为一线性函数。其中,?0,?1 是未知参数,称为回归系数(regression coefficients) 。 三、随机扰动项 总体回归函数说明在给定的收入水平 Xi 下,该社区家庭平均的消费支出水平。 但对某一个别的家庭,其消费支出可能与该平均水平有偏差。i i i 记 称 ?i 为观察值 Yi 围绕它的期望值 E(Y|Xi)的离差 (deviation) , 是一个不可观测的随机变量, 又称为随机干扰项 (stochastic disturbance)或随机误差项(stochastic error) 。 例 2.1 中,个别家庭的消费支出为:? ? Y ? E (Y | X )即,给定收入水平 Xi ,个别家庭的支出可表示为两部分之和: (1)该收入水平下所有家庭的平均消费支出 E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。 (2)其他随机或非确定性(nonsystematic)部分 ?i。 (*)式称为总体回归函数(方程)PRF 的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他 因素的随机性影响。 由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。 随机误差项主要包括下列因素的影响: 产生并设计随机误差项的主要原因: 1)在解释变量中被忽略的因素的影响; 1)理论的含糊性; 2)变量观测值的观测误差的影响; 2)数据的欠缺; 3)模型关系的设定误差的影响; 3)节省原则。 4)其它随机因素的影响。 四、样本回归函数(SRF) 总体的信息往往无法掌握,现实的情况只能是在一次观测中得到总体的一个样本。 问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息? 例 2.2:在例 2.1 的总体中有如下一个样本, 问:能否从该样本估计总体回归函数 PRF?表 2.1.3 家庭消费支出与可支配收入的一个随机样本 Y X 800 594 0 55 00 69 00 30-1-只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 回答:能 核样本的散点图(scatter diagram):样本散点图近似于一条直线,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。 该线称为样本回归线(sample regression lines) 。i 0 1 记样本回归线的函数形式为: i 称为样本回归函数(sample regression function,SRF) 。 注意: 这里将样本回归线看成总体回归线的近似替代? ?? ? X ? ? f (X ) ? ? Y i则 样本回归函数的随机形式/样本回归模型: 同样地,样本回归函数也有如下的随机形式:? ?? ? X ?e ? ?? ?i ? ? Yi ? Y i 0 1 i i式中, ei 称为 (样本)残差 (或剩余)项 ( residual) ,代表?i 。 ? i 的估计量 ? 了其他影响Yi 的随机因素的集合,可看成是由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sample regression model) 。 回归分析的主要目的:根据样本回归函数 SRF,估计总体回归函数 PRF。 即,根据? ?? ? X ?e ? ?e ? ? Yi ? Y i i 0 1 i i估计Yi ? E (Y | X i ) ? ? i ? ? 0 ? ?1 X i ? ? i注意:这里 PRF 可能永远无法知道。 §2.2 一元线性回归模型的参数估计 一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计(OLS) 只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获-1- 三、参数估计的最大或然法(ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干扰项方差的估计 单方程计量经济学模型分为两大类: 线性模型和非线性模型 ? 线性模型中,变量之间的关系呈线性关系 一元线性回归模型:只有一个解释变量?非线性模型中,变量之间的关系呈非线性关系i=1,2,…,n Y 为被解释变量,X 为解释变量,? 0 与 ?1 为待估参数, ? 为随机干扰项 回归分析的主要目的是要通过样本回归函数(模型)SRF 尽可能准确地估计总体回归函数(模型)PRF。 估计方法有多种,其种最广泛使用的是普通最小二乘法(ordinary least squares, OLS) 。 为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。 注:实际这些假设与所采用的估计方法紧密相关。 一、线性回归模型的基本假设 假设 1、解释变量 X 是确定性变量,不是随机变量; 假设 2、随机误差项 ? 具有零均值、同方差和不序列相关性: E(?i)=0 i=1,2, …,n Var (?i)=??2 i=1,2, …,n Cov(?i, ?j)=0 i≠j i,j= 1,2, …,n 假设 3、随机误差项 ? 与解释变量 X 之间不相关: Cov(Xi, ?i)=0 i=1,2, …,n 假设 4、? 服从零均值、同方差、零协方差的正态分布 ?i~N(0, ??2 ) i=1,2, …,n 注意: 1、如果假设 1、2 满足,则假设 3 也满足; 2、如果假设 4 满足,则假设 2 也满足。 以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模 型(Classical Linear Regression Model, CLRM ) 。 另外,在进行模型回归时,还有两个暗含的假设: 假设 5:随着样本容量的无限增加,解释变量 X 的样本方差趋于一有限常数。即 2 iYi ? ? 0 ? ? 1 X i ? ? i?(X? X ) / n ?Q,n??假设 6:回归模型是正确设定的 假设 5 旨在排除时间序列数据出现持续上升或下降的变量作为解释变量, 因为这类数据不仅使大样本统计推断变得无效, 而且往往产生所谓的伪回归问题(spurious regression problem) 。 假设 6 也被称为模型没有设定偏误(specification error) 二、参数的普通最小二乘估计(OLS) 给定一组样本观测值(Xi, Yi) (i=1,2,…n)要求样本回归函数尽可能好地拟合这组值. 普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:二者之差的平方和? ?? ? X )) 2 ? ) 2 ? ? (Y ? ( ? Q ? ? (Yi ? Y i i 0 1 i1 1nn最小。方程组(*)称为正规方程组(normal equations) 。 记?x2 i? ? (X i ? X ) 2 ? ? X i2 ?1 ?? X i ?2 n? x y ? ?(Xi ii? X )(Yi ? Y ) ? ? X i Yi ?1 ? X i ?Yi n-2-只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 上述参数估计量可以写成:?x i y i ? ? ? ?1 ? ? x i2 ? ?? ? ? ? 0 ? Y ? ?1 X称为 OLS 估计量的离差形式(deviation form) 。 由于参数的估计结果是通过最小二乘法得到的,故称为普通最小二乘估计量( ordinary least squares estimators) 。 顺便指出 ,记? ?Y ?i ? Y y i则有? ?? ? X ) ? (? ? ?? ? X ? e) ?i ? (? y 0 1 i 0 1 ? (X ? X ) ? 1 e ?? 1 i n? i可得 (**) (**)式也称为样本回归函数的离差形式。 注意: 在计量经济学中,往往以小写字母表示对均值的离差。 三、参数估计的最大或然法(ML) 最大或然法(Maximum Likelihood,简称 ML),也称最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大 或然原理出发发展起来的其它估计方法的基础。 基本原理: 对于最大或然法,当从模型总体随机抽取 n 组样本观测值后,最合理的参数估计量应该使得从模型中抽取该 n 组 样本观测值的概率最大。 在满足基本假设条件下,对一元线性回归模型:?x ?i ? ? y 1 iYi ? ? 0 ? ? 1 X i ? ? i随机抽取 n 组样本观测值(Xi, Yi) (i=1,2,…n) 。 假如模型的参数估计量已经求得,为 那么 Yi 服从如下的正态分布:? ?? ? X ,? 2 ) Yi ~ N ( ? 0 1 i于是,Y 的概率函数为P (Yi ) ?1?1 2? 2? 2?e? ?? ? X )2 (Yi ? ? 0 1 i(i=1,2,…n)因为 Yi 是相互独立的,所以的所有样本观测值的联合概率,也即或然函数(likelihood function)为:? ,? ? , ? 2 ) ? P (Y , Y ,? ? ?, Y ) L( ? 0 1 1 2 n?1 (2? ) 2 ? nn?1 2? 2e? ?? ? X )2 ? (Yi ? ? 0 1 i将该或然函数极大化,即可求得到模型参数的极大或然估计量。 由于或然函数的极大化与或然函数的对数的极大化是等价的,所以,取对数或然函数如下: *L ? ln( L )? ? n ln( 2? ? ) ?1 2? 2? ?? ? X )2 ? (Yi ? ? 0 1 i只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获-1- ?? ?X i2 ?Yi ? ?X i ?Yi X i ? ? ? 0 ? n?X i2 ? (?X i ) 2 ? ? ? n?Yi X i ? ?Yi ?X i ? ? 1 ? n?X i2 ? (?X i ) 2 解得模型的参数估计量为: ?可见,在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。 例 2.2.1: 在上述家庭可支配收入-消费支出例中, 对于所抽出的一组样本数, 参数估计的计算可通过下面的表 2.2.1 进行。表 2.2.1参数估计的计算表XiYixiyixi y ix i2y i2X i2Yi 21 800 594 -0 638 -0
-150 6 0 7 0 8 0 9 50 10 50 求和
-445 500 2 500 9
0 48? ? ? 1?x y ?xi 2 ii?5769300 ? 0.777 7425000因此,由该样本估计的回归方程为: 四、最小二乘估计量的性质 当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。 一个用于考察总体的估计量,可从如下几个方面考察其优劣性: (1)线性性,即它是否是另一随机变量的线性函数; (2)无偏性,即它的均值或期望值是否等于总体的真实值; (3)有效性,即它是否在所有线性无偏估计量中具有最小方差。 这三个准则也称作估计量的小样本性质。 拥有这类性质的估计量称为最佳线性无偏估计量(best liner unbiased estimator, BLUE) 。 当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质: (4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值; (5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值; (6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。 高斯―马尔可夫定理(Gauss-Markov theorem) 在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。? x y ? 5769300 ? 0.777 ? x 7425000 ? Yi ? ?103.172 ? 0.777 X i? ? ? 1i i 2 i只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获-2- ? 的均值(期望)等于总体回归 ? 、? ? 2、无偏性 ,即估计量 0 1参数真值 ?0 与 ?1证:? ? k Y ? k (? ? ? X ? ? ) ? ? ? ? ii ? i 0 1 i i 1 0 ? ki ? ?1 ? ki X i ? ? ki ? i易知?k故i??x ?xi2 i?0?k Xii?1? ?? ? k? ? ? i i 1 1? ) ? E (? ? k ? ) ? ? ? k E (? ) ? ? E(? ? i i 1 ? i i 1 1 1同样地,容易得出 ? ) ? E (? ? w ? ) ? E (? ) ? w E (? ) ? ? E(? ? i i ? i i 0 0 0 03、有效性(最小方差性) , 即在所有线性无偏估计量? ? 、? 1 具有最小方差。 中,最小二乘估计量 ? 0? 与? ? 的方差 (1)先求 ? 0 1? ) ? var( k Y ) ? k 2 var( ? ? ? X ? ? ) ? k 2 var( ? ) var( ? ? ii ? i ? i 1 0 1 i i i? x ? ?2 ? ?? i 2 ? ? 2 ? ??x ? ? xi2 i ? ? ? ) ? var( w Y ) ? w 2 var( ? ? ? X ? ? ) ? (1 / n ? Xk ) 2 ? 2 var( ? ? ii ? i ? 0 0 1 i i i?1 2 ?? 1 ? 2 ? ? x 1 ? ? ?? ? ? 2 Xk i ? X 2 k i2 ?? 2 ? ? ? X ? ki ? X 2 ? ? i 2 ? ??x n n n n ? ?? ? ? i ? ? ? ? ?1 x 2 ? nX 2 2 ? X i2 2 X2 ? ?? 2 ? ? i ?? ? ? ? ? ? n ? x2 ? n ? x i2 n ? x i2 i ? ? (2)证明最小方差性 ? ? ? ?22? ?? 2 ? ? ??* ? c Y ? * 是其他估计方法得到的关于? 的线性无偏估计量: ? 假设 ? ? ii 1 1 1 其中,ci=ki+di,di 为不全为零的常数则容易证明? * ) ? var( ? ? ) var( ? 1 1? 具有最的小方差 同理,可证明?0 的最小二乘估计量 ? 0普通最小二乘估计量 (ordinary least Squares Estimators) 称为最佳线性无偏估计量 (best linear unbiased estimator, BLUE) 由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本特性。? ) ? P lim( ? ? k ? ) ? P lim( ? ) ? P lim( P lim( ? ? i i 1 1 1 ? ?1 ?? ?1 ?P lim( ? xi ? i / n) P lim( ? xi2 / n)?x ? ?xi 2 ii)Cov ( X , ? ) 0 ? ?1 ? ? ?1 Q Q 五、参数估计量的概率分布及随机干扰项方差的估计? 的概率分布 ? 和? 1、参数估计量? 1 0只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -3- ?2 ? ?1 ~ N ( ?1 , ) 2 x ? i? ~ N (? , ? 0 0?X n? x2 i 2 i? 2)? ?? ? ? 2 / ? x i21? ?? ?0? 2 ? X i2n ? xi22、随机误差项 ? 的方差 ?2 的估计由于随机项 ?i 不可观测,只能从 ?i 的估计――残差 ei 出发,对总体方差进行估计。可以证明,?2 的最小二乘估计量为 在最大或然估计法中,?2 ? ??e2 in?2,它是关于 ?2 的无偏估计量。因此, ?2 的最大或然估计量不具无偏性,但却具有一致性。? 在随机误差项?的方差?2 估计出后,参数 ? 0? 的方差 和标准差 的估计量分别是: 和? 1? 的样本方差: ? 12 ?2 S? ? ??1?x?x2 i2 i? ? ? ? ?? 1 的样本标准差: S ?1? ? 0 的样本方差:2 ? 2 ? X i2 n ? x i2 S? ? ? ?0? ? ? ? ?? 0 的样本标准差: S ?0?X2 in ? x i2§2.3一元线性回归模型的统计检验一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间 ? 回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。 ? 尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体的参数真值, 但在一次抽样中,估计值不一定就等于该真值。 ? 那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。 ? 主要包括拟合优度检验、变量的显著性检验及参数的区间估计。 只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -4- 一、拟合优度检验 拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。 度量拟合优度的指标:判定系数(可决系数)R2 问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度? 1、总离差平方和的分解 已知由一组样本观测值(Xi,Yi) ,i=1,2…,n 得到如下样本回归直线? ?? ? X ? ?? Y i 0 1 i? ) ? (Y ? ?Y ) ? e ? y ?i y i ? Yi ? Y ? (Yi ? Y i i i如果 Yi=?i 即实际观测值落在样本回归“线”上,则拟合最好。 可认为,“离差”全部来自回归线,而与“残差”无关。 对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明:记TSS ? ? yi2 ? ? (Yi ? Y ) 2 总体平方和(TotalSum of Squares)? ? Y )2 ?i2 ? ? (Y ESS ? ? y i ? )2 RSS ? ? ei2 ? ? (Yi ? Y i回归平方和(Explained Sum of Squares)残差平方和(Residual Sum of Squares )残差平方和(Residual Sum of Squares ) Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来 自随机势力(RSS)。 在给定样本中,TSS 不变, 如果实际观测点离样本回归线越近,则 ESS 在 TSS 中占的比重越大,因此拟合优度:回归平 方和 ESS/Y 的总离差 TSS2、可决系数R 统计量 ESS RSS 记 R2 ? ? 1? TSS TSS称 R2 为(样本)可决系数/判定系数(coefficient of determination)。 可决系数的取值范围:[0,1] R2 越接近 1,说明实际观测点离样本线越近,拟合优度越高。2在例 2.1.1 的收入-消费支出例中,? ? ? 已经估计出后: 2 在实际计算可决系数时,在 ? ? 2 ? ? xi ? 1 R ?? 1 22?2 R ?? 12?x ?y??y ? i ? ?2 i 2 i?(0.777) 2 ? 7425000 ? 0.只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -5- 注:可决系数是一个非负的统计量。它也是随着抽样的不同而不同。为此,对可决系数的统计可靠性也应进行检验,这 将在第 3 章中进行。二、变量的显著性检验回归分析是要判断解释变量 X 是否是被解释变量 Y 的一个显著性的影响因素。 在一元线性模型中,就是要判断 X 是否对 Y 具有显著的线性性影响。这就需要进行变量的显著性检验。 变量的显著性检验所应用的方法是数理统计学中的假设检验。 计量经计学中,主要是针对变量的参数真值是否为零来进行显著性检验的。 1、假设检验 ? 所谓假设检验, 就是事先对总体参数或总体分布形式作出一个假设, 然后利用样本信息来判断原假设是否合理, 即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。 ? 假设检验采用的逻辑推理方法是反证法。 先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。 ? 判断结果合理与否,是基于“小概率事件不易发生”这一原理的 2、变量的显著性检验? ~ N (? , ? 1 1?x?22 i)t?? ?? ? 1 1 ?2 ??x2 i?? ?? ? 1 1 S ??1~ t (n ? 2)检验步骤: (1)对总体参数提出假设 H0: ? 1=0, H1:?1?0 (2)以原假设 H0 构造 t 统计量,并由样本计算其值 (3)给定显著性水平 ?,查 t 分布表,得临界值 t ?/2(n-2) (4) 比较,判断 若 |t|& t ?/2(n-2),则拒绝 H0 ,接受 H1 ; 若 |t|? t ?/2(n-2),则拒绝 H1 ,接受 H0 ; t? 对于一元线性回归方程中的 ?0,可构造如下 t 统计量进行显著性检验: 在上述收入-消费支出例中,首先计算 ?2 的估计值 ?2 ? ?? 2 ? X i2 n? xi2 ?? ?? ? 0 0?? ? 0 S ??0~ t (n ? 2)? ei2n?2?? 2 x2 ? yi2 ? ? 1 ? i n?24590020 ? 0.777 2 ? 7425000 ? ? 13402 10 ? 2t 统计量的计算结果分别为:? S ? ? 0.777 0.0425 ? 18.29 t1 ? ? 1 ?1?2 S ?? ? ?1?x2 i? 13402 / 7425000 ? 0.0018 ? 0.0425? 2 ? X i2 n? xi2 ? 13402 ?
/ 10 ? 7425000 ? 98.41 S ?? ? ?0? S ? ? ? 103.17 98.41 ? ?1.048 t0 ? ? 0 ?0给定显著性水平 ?=0.05,查 t 分布表得临界值 t 0.05/2(8)=2.306 |t1|&2.306,说明家庭可支配收入在 95%的置信度下显著,即是消费支出的主要解释变量; |t2|&2.306,表明在 95%的置信度下,无法拒绝截距项为零的假设。三、参数的置信区间假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零) ,但它并没有指出在一次抽样中样 本参数值到底离总体参数的真值有多“近”。 要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的 估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间 估计。如果存在这样一个区间,称之为置信区间( confidence interval ) ; 1-? 称为置信系数(置信度) ( confidence coefficient) , ? 称为显著性水平(level of significance) ;置信区间的端点称为置信限(confidence limit)或 临界值(critical values) 。 只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -6- 一元线性模型中,? i (i=1,2)的置信区间: ? ?? ? i 在变量的显著性检验中已经知道: t? i ~ t (n ? 2) s ?? 意味着, 如果给定置信度 (1-?) , 从分布表中查得自由度为 (n-2)的临界值, 那么 t 值处在(-t?/2, t?/2)的概率是(1-? )。 i 表示为: P( ? t ? ? t ? t ? ) ? 1 ? ? 2 2 即 ? ?? ? ? ?? ? t? 于是得到:(1-?)的置信度下, ?i 的置信区间是 ( ? i 在上述收入-消费支出例中,如果给定 ? =0.01,查表得:22 2 iP( ?t ? ?iis??? t? ) ? 1? ?P( ?i ? t ? ? s?? ? ?i ? ?i ? t ? ? s?? ) ? 1 ? ?2 i 2 i? ? t? ? s ) ? s?? , ? ? i ?i 2 it ? (n ? 2) ? t 0.005 (8) ? 3.3552?0 ? ? 由于 1 于是,? 1、?0 的置信区间分别为: (0.5) (-433.32,226.98) 由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。 要缩小置信区间,需 (1)增大样本容量 n,因为在同样的置信水平下,n 越大,t 分布表中的临界值越小;同时,增大样本容量,还可使 样本参数估计量的标准差减小; (2)提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应 越小。S? 0.042S ? ? 98.41§2.4 一元线性回归分析的应用:预测问题一、?0 是条件均值 E(Y|X=X0)或个值 Y0 的一个无偏估计 对于一元线性回归模型 二、总体条件均值与个值预测值的置信区间? ?? ?X ? ?? Y i 0 1 i给定样本以外的解释变量的观测值 X0,可以得到被解释变量的预测值 ?0 ,可以此作为其条件均值 E(Y|X=X0)或个别值 Y0 的一个近似估计。 注意: 严格地说,这只是被解释变量的预测值的估计值,而不是预测值。 原因:(1)参数估计量不确定; (2)随机项的影响 一、?0 是条件均值 E(Y|X=X0)或个值 Y0 的一个无偏估计 对总体回归函数 E(Y|X=X0)=?0+?1X,X=X0 时 E(Y|X=X0)=?0+?1X0 于是? ?? ? X ) ? E(? ? ) ? X E(? ? )?? ?? X ? ) ? E(? E (Y 0 0 1 0 0 0 1 0 1 0? ?? ?X ? ?? Y 0 0 1 0可见,?0 是条件均值 E(Y|X=X0)的无偏估计。 对总体回归模型 Y=? 0+?1X+?,当 X=X0 时 于是Y0 ? ? 0 ? ? 1 X 0 ? ?E (Y0 ) ? E ( ? 0 ? ? 1 X 0 ? ? ) ? ? 0 ? ? 1 X 0 ? E ( ? ) ? ? 0 ? ? 1 X 0? ?? ? X ) ? E(? ? ) ? X E(? ? )?? ?? X ? ) ? E(? E (Y 0 0 1 0 0 0 1 0 1 0二、总体条件均值与个值预测值的置信区间1、总体均值预测值的置信区间 由于? ?? ? X ? ?? Y 0 0 1 0于是2 ? ~ N (? , ? ) ? 1 1 ? xi2? ~ N (? , ? X i ? 2 ) ? 0 0 n ? xi22? ) ? X E(? ? )?? ?? X ? ) ? E(? E (Y 0 0 0 1 0 1 0可以证明 ? ,? ? ) ? ?? 2 X / x 2 Cov ( ? ? i 0 1 因此? ) ? 2 X Cov ( ? ? ,? ? ) ? X 2Var ( ? ? ) ? ) ? Var ( ? Var (Y 0 0 0 0 1 0 1? )? Var (Y 0? 2 ? X i2n? xi2?2 X 0 X? 2 X 02? 2 ? X 2 ? nX 2 ?2 ? ? ?? i ? X 2 ? 2 X 0 X ? X 02 ? 2 2 ? 2 ? ? ? xi ? xi ? xi ? n ?只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -7- ?故2 ? 2 ? xi ( ? ( X 0 ? X ) 2 ) ? ? 2 (1 ? (X 0 ? X )2 ) 2 n x n ? i ? xi22 ? ~ N ( ? ? ? X , ? 2 ( 1 ? ( X 0 ? X ) )) Y 0 0 1 0 n ? xi2其中 于是,在 1-? 的置信度下,总体均值 E(Y|X0)的置信区间为0? ? (? ? ? X ) Y 0 1 0 t? 0 ~ t (n ? 2) S Y?1 ( X ? X )2 ? 2( ? 0 2 ) S Y? ? ? 0 n ? xi? ? t ? ? S ? ? E (Y | X ) ? Y ? ? t? ? S ? Y 0 0 0 Y Y2 0 202、总体个值预测值的预测区间 由 Y0=? 0+?1X0+? 知:Y0 ~ N ( ? 0 ? ? 1 X 0 , ? 2 )于是2 ? ? Y ~ N ( 0 , ? 2 (1 ? 1 ? ( X 0 ? X ) )) Y 0 0 2 n ? xi式中 : 从而在 1-? 的置信度下, Y0 的置信区间为0 0? ?Y Y 0 t? 0 ~ t (n ? 2) S Y? ?Y0S Y? ?Y001 ( X 0 ? X )2 ? (1 ? ? ? ? ) 2 n x ? i2? ? t? ? S ? ? ? t? ? S ? Y ? Y0 ? Y 0 0 Y ?Y Y ?Y20200在上述收入-消费支出例中,得到的样本回归函数为? ? ?103.172 ? 0.777 X Y i i则在 X0=1000 处, ?0 = C103.172+0.777× 而2 ? ) ? 13402 ? 1 ? (1000 ? 2150) ? ? 3727.29 Var (Y 0 ? ? 7425000 ? ?10? ) ? 61.05 S (Y 0或(533.05, 814.62) 或 (372.03, 975.65)因此,总体均值 E(Y|X=1000)的 95%的置信区间为: 673.84-2.306?61.05& E(Y|X=1000) &673.84+2.306?61.05 同样地,对于 Y 在 X=1000 的个体值,其 95%的置信区间为: 673.84 - 2.306?61.05&Yx= + 2.306?61.05 ? 总体回归函数的置信带(域) (confidence band) ? 个体的置信带(域)对于 Y 的总体均值 E(Y|X)与个体值的预测区间(置信区间): (1)样本容量 n 越大,预测精度越高,反之预测精度越低; (2)样本容量一定时,置信带的宽度当在 X 均值处最小,其附近进行预测(插值预测)精度越大;X 越远离其均值,置 信带越宽,预测可信度下降。§2.5 实例:时间序列问题一、中国居民人均消费模型 二、时间序列问题 -8-只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 一、中国居民人均消费模型 例 2.5.1 考察中国居民收入与消费支出的关系。 GDPP: 人均国内生产总值(1990 年不变价) CONSP:人均居民消费(以居民消费价格指数()缩减) 。表 2.5.1 年份 80 83 86 89 人均居民消费 CONSP 395.8 437.0 464.1 501.9 533.5 572.8 635.6 716.0 746.5 788.3 836.4 779.7 中国居民人均消费支出与人均 GDP(元 /人) 人均 GDP GDPP 675.1 716.9 763.7 792.4 851.1 931.4 5.2 3.6 5.9 年份 92 95 98
人均居民消费 CONSP 797.1 861.4 966.6 8.7 2.8 0.6 0.8 人均 GDP GDPP 7.2 7.9 3.7 1.9 9.3 3789.7该两组数据是
年的时间序列数据(time series data) ; 前述收入-消费支出例中的数据是截面数据(cross-sectional data) 。 1、建立模型 拟建立如下一元回归模型表 2.5.2CONSP ? C ? ? GDPP ? ? 采用 Eviews 软件进行回归分析的结果见下表中国居民人均消费支出对人均 GDP 的回归( ) LS // Dependent Variable is CONSP Sample:
Included observations: 23 Variable C GDPP1 Coefficient 201.187 Std. Error 14.222 t-Statistic 13.82 Prob. 0.0 905.8 7..9.235 0.000000R-squared 0.992709 Adjusted R-squared 0.992362 S.E. of regression 33.26711 Sum squared resid 23240.71 Log likelihood -112.1945 Durbin-Watson stat 0.550288 一般可写出如下回归分析结果:Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)(13.51) (53.47) R2=0.9927 F=2859.23 DW=0.5503 2、模型检验 R2=0.992 T 值:C:13.51,GDPP:53.47 临界值: t0.05/2(21)=2.08 斜率项:0&0.3862&1,符合绝对收入假说 3、预测 2001 年:GDPP=4033.1(元) (90 年不变价) 点估计:CONSP + 0. = 1758.7(元) 2001 年实测的 CONSP(1990 年价):1782.2 元, 相对误差: -1.32%。 2001 年 人 均 居 民 消 费 的 预 测 区 间 人 均 GDP 的 样 本 均 值 与 样 本 方 差 : E(GDPP)=1823.5 Var(GDPP)=982.042= 在 95%的置信度下,E(CONSP2001)的预测区间为:1758.7 ? 2.306 ?
?( ? ) 23 ? 2 23 (23 ? 1) ?
=.13或:(8.8)同样地,在 95%的置信度下,CONSP2001 的预测区间为1758.7 ? 2.306 ?
? (1 ? ? ) 23 ? 2 23 (23 ? 1) ?
=.57或(45.3)二、时间序列问题上述实例表明,时间序列完全可以进行类似于截面数据的回归分析。 然而,在时间序列回归分析中,有两个需注意的问题: 只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 -9- 第一,关于抽样分布的理解问题。 能把表 2.5.1 中的数据理解为是从某个总体中抽出的一个样本吗? 第二,关于“伪回归问题”(spurious regression problem) 。 可决系数 R2,考察被解释变量 Y 的变化中可由解释变量 X 的变化“解释”的部分。 这里“解释”能否换为“引起”? 在现实经济问题中,对时间序列数据作回归,即使两个变量间没有任何的实际联系,也往往会得到较高的可决系数,尤 其对于具有相同变化趋势(同时上升或下降)的变量,更是如此。 这种现象被称为“伪回归”或“虚假回归”。第三章? ?经典单方程计量经济学模型:多元线性回归模型多元线性回归模型的参数估计 回归模型的其他形式 多元线性回归模型的统计检验 回归模型的参数约束多元线性回归模型 多元线性回归模型的预测§3.1 多元线性回归模型一、多元线性回归模型 二、多元线性回归模型的基本假定 一、多元线性回归模型 多元线性回归模型:表现在线性回归模型中的解释变量有多个。 一般表现形式:i=1,2…,n 其中:k 为解释变量的数目,?j 称为回归参数(regression coefficient) 。 习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取 1。这样: 模型中解释变量的数目为(k+1)Yi ? ? 0 ? ? 1 X 1i ? ? 2 X 2 i ? ? ? ? ? ? k X ki ? ? iYi ? ? 0 ? ? 1 X 1i ? ? 2 X 2 i ? ? ? ? ? ? k X ki ? ? i也被称为总体回归函数的随机表达形式。它 的非随机表达式为: E (Y | X , X ,? X ) ? ? ? ? X ? ? X ? ? ? ? ? ? X i 1i 2i ki 0 1 1i 2 2i k ki 方程表示:各变量 X 值固定时 Y 的平均响应。 ?j 也被称为偏回归系数,表示在其他解释变量保持不变的情况下,Xj 每变化 1 个单位时,Y 的均值 E(Y)的变化; 或者说 ?j 给出了 Xj 的单位变化对 Y 均值的“直接”或“净”(不含其他变量)影响。 总体回归模型 n 个随机方程的矩阵表达式为Y ? X β? μ其中?1 ?1 X ? ? ?? ? ?1X 11 X 12 ? X 1nX 21 X 22 ? X 2n? ? ?X k1 ? X k2 ? ? ? ? ? X kn ? n ? ( k ? 1 )样本回归函数:用来估计总体回归函数? ?1 ? ?? 0 ? ?? ? ?? ? ? 1? μ? ? 2 ? β? ? ? 2 ? ? ? ? ? ? ? ? ? ? ? ? ?? k ? ? ( k ?1)?1 ? ? n ? n ?1 ? ?? ? X ?? ? X ??? ? ? X ? ?? Y i 0 1 1i 2 2i ki ki0 1 1i 2 2i ki ki i 其随机表示式: i ei 称为残差或剩余项(residuals),可看成是总体回归函数中随机扰动项 ?i 的近似替代。? ?? ? X ?? ? X ??? ? ? X ?e Y ??样本回归函数的矩阵表达:? ? ?? ? 0? ? ? ? ? ? 1? β ? ? ? ? ? ?? ? 其中: ? ? k ?? ? Xβ ? Y? 或 Y ? Xβ? e? e1 ? ? ? ?e ? e?? 2? ? ? ? ?e ? ? n?二、多元线性回归模型的基本假定假设 1,解释变量是非随机的或固定的,且各 X 之间互不相关(无多重共线性) 。 假设 2,随机误差项具有零均值、同方差及不序列相关性 E ( ? i ) ? 0 Var ( ? i ) ? E ( ? i2 ) ? ? 2 i ? j i, j ? 1,2,?, n Cov ( ? i , ? j ) ? E ( ? i ? j ) ? 0 假设 3,解释变量与随机项不相关Cov ( X ji , ? i ) ? 0j ? 1,2?, k? ~ N ( 0, ? 2 ) 假设 4,随机项满足正态分布 i 上述假设的矩阵符号表示 式: 假设 1,n?(k+1)矩阵 X 是非随机的,且 X 的秩 ?=k+1,即 X 满秩。假设 2,? ?1 ? ? E ( ?1 ) ? ? ? ? ? E (μ) ? E ? ? ? ? ? ? ? ? 0 ? ? ? ? E (? ) ? n ? ? n? ?只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获- 10 - 假设假设 4,向量 ? 有一多维正态分布,即 μ~ N (0, ? I ) 同一元回归一样,多元回归还具有如下两个重要假设: 假设 5,样本容量趋于无穷时,各解释变量的方差趋于有界常数,即 n?∞时,21 1 ? x 2ji ? n ? ( X ji ? X j ) 2 ? Q j 或 n? ? ? ? 1 ? ? ?? 1 ? ? n ? ? ? E ? ? ?? ? ? ? n 1 ? ? ? ? ? i ? ? ? E (? i ) ? ? ? ? 3,E(X’?)=0,即 ? ? ? X 1i ? i ? ? ? X 1i E ( ? i ) ? E? ? ? ? ??0 ? ? ? ? ? ? ? ? X ? ? ? ? X E (? ) ? Ki i ? Ki i ? ? ?? ? ?1 ? ?? ? ? ) ? E? ? ? ? E (μμ ?? ? ? ?? n ?2??1 ? n ? ? var( ? ) ? cov( ? , ? ) ? ? ? 2 ? 0 ? ? ? 1 1 n ? ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ? ? ? 2I 2 ? ? ? ? 2? ? n ? ? cov( ? n , ?1 ) ? var( ? n ) ? ? 0 ? ? ?1 x ?x ? Q n其中:Q 为一非奇异固定矩阵,矩阵 x 是由各解释变量的离差为元素组成的 n?k 阶矩阵? x11 ? x k 1 ? ? ? x?? ? ? ? ? ?x ? ? 1n ? x kn ?假设 6,回归模型的设定是正确的。 §3.2 多元线性回归模型的估计估计方法:OLS、ML 或者 MM 一、普通最小二乘估计 *二、最大或然估计 四、参数估计量的性质 五、样本容量问题 一、普通最小二乘估计 对于随机抽取的 n 组观测值 i ji 如果样本函数的参数估计值已经得到,则有:? ?? ? X ?? ? X ??? ? ? X ? ?? Y i 0 1 1i 2 2i ki Ki i=1,2…n*三、矩估计 六、估计实例(Y , X ), i ? 1,2, ? , n, j ? 0,1,2, ? k根据最小二乘原理,参数估计值应该是下列方程组的解? ? Q?0 ? ?? ? ? 0 ? ? Q?0 ? ?? ? ? 1 ? ? ? ? Q?0 ? ?? 2 ? ? ? ? Q?0 ? ?? ? ? ki ?1 i ?1 其中 于是得到关于待估参数估计值的正规方程组: ? ?? ? X ?? ? X ??? ? ? X ) ? ?Y ? ?( ? 0 1 1i 2 2i k ki i ? ? ? X ?? ? X ??? ? ? X ) X ? ?Y X ? ( ? ? ? 0 1 1i 2 2i k ki 1i i 1i ? ? ? ? X ?? ? X ??? ? ? X ) X ? ?Y X ?? ( ? 0 ? ? 1 1i 2i 2i k ki 2i i 2i ? ? ? ? ? ? ? ? ? ? ( ? 0 ? ? 1 X 1i ? ? 2 X 2 i ? ? ? ? k X ki ) X ki ? ?Yi X kii ?12 ? )2 n Q ? ? ei2 ? ? (Yi ? Y ? ?? ? X ?? ? X ??? ? ? X )) i ? ? (Yi ? ( ? 0 1 1i 2 2i k kinn解该( k+1)个方程组成的线性代数方程组,即可得到 (k+1)个待估参数的估计值 ??j , j ? 0,1,2,? , k 。正规方程组的矩阵形式? n ? ? ? X 1i ? ? ? ?? X ki ??X ?X?1i 2 1i? ? ? ??X ?X Xki? X ki X 1i? ? ? 1 ?? ? ?? 0 ? ? ? ? X 11 1i ki ?? ? 1 ? ?? ? ? ? ? ? ?? ? ? ? 2 ?? ? ? ? ? ? X ki ?? k ? ? X k 11 X 12 ? X k21 ?? Y1 ? ?? ? X 1 n ?? Y 2 ? ? ? ?? ? ? ?? ? ? ? ? X kn ? ?? Y n ? ? ?即 (X X)β???X?Y只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 - 11 - ?1 ? 由于 X’X 满秩,故有 β? ( X ?X ) X ?Y 将上述过程用矩阵表示如下:? ? ) ?( Y ? Xβ ?)?0 ( Y ? Xβ ? ? β 即求解方程组:? ? ? X?Y ? Y ?Xβ ? ?β ? ? X?Xβ ?)?0 (Y ?Y ? β ? ?β? ? ?β ? ? X?Xβ ?) ? 0 (Y ?Y ? 2Y ?Xβ ? ?β? ? ( X ?X ) ?1 X ?Y ? ? 0 得到: X?Y ? X?Xβ ? 于是:β ? X ?Y ? X ?Xβ 例 3.2.1:在例 2.1.1 的家庭收入-消费支出例中,? 1 X1 ? ? ? 1 ? 1 ?? 1 X 2 ? ? n 21500 ? ? 1 ? 10 ? Xi ? ??? ? ( X ' X) ? ? ?? 2 ? ? 00 ? ? ?X ? ? ? ? X X X ? X ? ? 2 n ? ? ? 1 ? ? ?? i ? i ? ? ?1 X ? n ? ? ? Y1 ? ? ? 1 ? 1 ?? Y2 ? ? ? Yi ? ? 15674 ? ? 1 ? ? X ?Y ? ? ?
? ? ?X X ? X ? ?? ? ? ? X Y ? ? ? ? i i ? 2 n ? ? ? ? ? 1 ? ? ? ?Y ? ? n? ? 0.0003 ? ? 0.7226 ( X ?X) ?1 ? ? ? ? 0. E ? 07 ? ? ? ? 可求得? ? ? 0.7226 ? 0.0003 ?? 15674 ? ? ? 103.172 ? ? ? ? ?1 ? ? ? ? ? β ?? ?
? ??? ? 0.7770 ? ? ?? ? ? ? ? 0 . 0003 1 . 35 E ? 07 ?? ? ? ? ? 2? ? 于是? 正规方程组 的另一种写法? 对于正规方程组 X?Y ? X?Xβ? ? X ?e ? X ?Xβ ? X ?Xβ于是 X ?e ? 0 (*) 或 (*)或(**)是多元线性回归模型正规方程组的另一种写法 ? 样本回归函数的离差形式? 其矩阵形式为 y ? xβ? e其中 在离差形式下,参数的最小二乘估计结果为? ?Y ?? ? X ??? ? ? X ? ? (x?x) ?1 x?Y ? β 0 1 1 k k? 随机误差项 ? 的方差 ? 的无偏估计 可以证明,随机误差项 ? 的方差的无偏估计量为?2 ? ?n ? k ?1?e2 i?e ?e n ? k ?1*二、最大或然估计对于多元线性回归模型只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获- 12 - 对数或然函数为L* ? Ln( L ) ? ? nLn( 2? ? ) ? 1 ? ) ( Y ? Xβ ?) ( Y ? Xβ 2? 2? ) ?( Y ? Xβ ?) 对对数或然函数求极大值,也就是对 (Y ? Xβ 求极小值。? ? ? 因此,参数的最大或然估计为 β? ( X X ) X Y 结果与参数的普通最小二乘估计相同?1*三、矩估计(Moment Method, MM)OLS 估计是通过得到一个关于参数估计值的正规方程组? ? X?Y (X?X)β 并对它进行求解而完成的。该正规方程组 可以从另外一种思路来导:)?0 ) ? 0 E(X?(Y ? Xβ 求期望 : E(X?(Y ? Xβ 称为原总体回归方程的一组矩条件,表明了原总体回归方程所具有的内在特征。Y ? X β? μX ?Y ? X ?Xβ? X ?μX?(Y ? Xβ ) ? X?μ1 ?)?0 X ?(Y ? Xβ n 由此得到正规方程组? ? X' Y X' Xβ解此正规方程组即得参数的 MM 估计量。 易知 MM 估计量与 OLS、ML 估计量等价。 矩方法是工具变量方法(Instrumental Variables,IV)和广义矩估计方法(Generalized Moment Method, GMM)的基础 ? 在矩方法中关键是利用了 E(X’?)=0 ? 如果某个解释变量与随机项相关, 只要能找到 1 个工具变量, 仍然可以构成一组矩条件。 这就是 IV。 ? 如果存在>k+1 个变量与随机项不相关,可以构成一组包含>k+1 方程的矩条件。这就是 GMM。四、参数估计量的性质在满足基本假设的情况下,其结构参数 ? 的普通最小二乘估计、最大或然估计及矩估计仍具有: 线性性、无偏性、有效性。 同时,随着样本容量增加,参数估计量具有:渐近无偏性、渐近有效性、一致性。?1 ? 1、线性性 β? ( X ?X ) X ?Y ? CY 其中,C=(X’X)-1 X’ 为一仅与固定的 X 有关的行向量 2、无偏性? ) ? E (( X ?X ) ?1 X ?Y ) E (β ? E (( X ?X ) ?1 X ?( Xβ ? μ )) ? β ? ( X ?X ) ?1 E ( X ?μ ) ?β这里利用了假设: E(X’?)=03、有效性(最小方差性)只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获- 13 - 其中利用了五、样本容量问题⒈ 最小样本容量 所谓“最小样本容量”, 即从最小二乘原理和最大或然原理出发, 欲得到参数估计量, 不管其质量如何, 所要求的样本容量的下限。 样本最小容量必须不少于模型中解释变量的数目(包括常数项),即 n ? k+1 因为,无多重共线性要求:秩(X)=k+1 2、满足基本要求的样本容量 从统计检验的角度:n?30 时,Z 检验才能应用;n-k?8 时, t 分布较为稳定 一般经验认为:当 n?30 或者至少 n?3(k+1)时,才能说满足模型估计的基本要求。 模型的良好性质只有在大样本下才能得到理论上的证明六、多元线性回归模型的参数估计实例例 3.2.2 在例 2.5.1 中,已建立了中国居民人均消费一元线性模型。这里我们再考虑建立多元线性模 型。 解释变量:人均 GDP:GDPP 前期消费:CONSP(-1) 估计区间: 年 Eviews 软件估计结果LS // Dependent Variable is CONS Sample(adjusted):
Included observations: 22 after adjusting endpoints Variable C GDPP CONSP(-1) Coefficient 120.327 0.....02 -101.500 Std. Error 36.969 0.170308 t-Statistic 3...651125 Prob. 0.8 0.6 372.995 6.7.271 0.000000R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson statMean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)§3.3一、拟合优度检验 三、变量的显著性检验(t 检验)一、拟合优度检验 1、可决系数与调整的可决系数 总离差平方和的分解多元线性回归模型的统计检验二、方程的显著性检验(F 检验) 四、参数的置信区间TSS ? ? (Yi ? Y ) 2 ? ) ? (Y ? ? Y )) 2 ? ? ((Yi ? Y i i ? ) 2 ? 2? (Y ? Y ? )(Y ? ? Y ) ? ? (Y ? ? Y )2 ? ? ( Y ? Y i i i i i i 则由于 ?? ? ? ? )(Y ? ? Y ) ? ? e (Y ? ?Y ) ? ? (Yi ? Y 0 ? ei ? ? 1 ? ei X 1i ? ? ? ? k ? ei X ki ? Y ? ei i i i? ) 2 ? ? (Y ? ? Y ) ? RSS ? ESS TSS ? ? (Yi ? Y i i2=0所以有: 注意:一个有趣的现象只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获- 14 - ?Y ? Y ? ? ?Y ? Y? ? ? ?Y? ? Y ? ?Y ? Y ? ? ?Y ? Y? ? ? ?Y? ? Y ? ? ?Y ? Y ? ? ? ?Y ? Y? ? ? ? ?Y? ? Y ?i i i i i 2 2 2 i i i 2 2 i i i i2可决系数 ESS RSS R2 ? ? 1? TSS TSS 该统计量越接近于 1,模型的拟合优度越高。 问题: 在应用过程中发现,如果在模型中增加一个解释变量, R2 往往增大(Why?) 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。 但是,现实情况往往是,由增加解释变量个数引起的 R2 的增大与拟合好坏无关,R2 需调整。 调整的可决系数(adjusted coefficient of determination) 在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总 离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:R 2 ? 1?RSS /( n ? k ? 1) TSS /( n ? 1)R 2 ? 1 ? (1 ? R 2 ) n ?1 n ? k ?1其中:n-k-1 为残差平方和的自由度,n-1 为总体平方和的自由度。*2、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) e?e k e ?e 2( k ? 1) AC ? ln ? ln n AIC ? ln ? n n n n 施瓦茨准则(Schwarz criterion,SC) 这两准则均要求仅当所增加的解释变量能够减少 AIC 值或 AC 值时才在原模型中增加该解释变量。 Eviews 的估计结果显示: 中国居民消费二元例中:AIC=6.68 AC=6.83 中国居民消费一元例中:AIC=7.09 AC=7.19 从这点看,可以说前期人均居民消费 CONSP(-1)应包括在模型中。二、方程的显著性检验(F 检验)方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出 推断。 1、方程显著性的 F 检验 即检验模型 Yi=?0+?1X1i+?2X2i+ ? +?kXki+?i i=1,2, ?,n 中的参数 ?j 是否显著不为 0。 可提出如下原假设与备择假设: H0: ?0=?1=?2= ? =?k=0 H1: ?j 不全为 0 F 检验的思想来自于总离差平方和的分解式: TSS=ESS+RSS? i2 是解释变量 X 的联合体对被解 由于回归平方和 ESS ? ? y释变量 Y 的线性作用的结果,考虑比值ESS / RSS ? ? ?e ?y2 i 2 i如果这个比值较大,则 X 的联合体对 Y 的解释程度高,可认为总体存在线性关系,反之总体上可能不存 在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。 根据数理统计学中的知识,在原假设 H0 成立的条件下,统计量F?ESS / k RSS /( n ? k ? 1)服从自由度为(k , n-k-1)的 F 分布 给定显著性水平 ?,可得到临界值 F?(k,n-k-1),由样本求出统计量 F 的数值,通过只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 - 15 - F? F?(k,n-k-1) 或 F?F?(k,n-k-1) 来拒绝或接受原假设 H0,以判定原方程总体上的线性关系是否显著成立。 对于中国居民人均消费支出的例子:一元模型:F=285.92 二元模型:F=2057.3 给定显著性水平 ? =0.05,查分布表,得到临界值: 一元例:F?(1,21)=4.32 二元例: F?(2,19)=3.52 显然有 F? F?(k,n-k-1) 即二个模型的线性关系在 95%的水平下显著成立。 2、关于拟合优度检验与方程显著性检验关系的讨论 由 可推出: 2 n ? 1 R /k F? R 2 ? 1? 2 ( 1 ? R ) /( n ? k ? 1) n ? k ? 1 ? kF 或?在中国居民人均收入-消费一元模型中,在中国居民人均收入-消费二元模型中,三、变量的显著性检验(t 检验)方程的总体线性关系显著?每个解释变量对被解释变量的影响都是显著的 因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。 这一检验是由对变量的 t 检验完成的。 1、t 统计量 ? ) ? ? 2 ( X ?X ) ?1 Cov (β 由于 以 cii 表示矩阵(X’X)-1 主对角线上的第 i 个元素,于是参数估计量的方差为: ? ) ? ? 2c Var ( ?i ii其中 ?2 为随机误差项的方差,在实际计算时,用它的估计量代替:?2 ? ?t ?n ? k ?1S? ??e2 i?e ?e n ? k ?1~ t ( n ? k ? 1)? ~ N (? ,? 2 c ) ? i i ii因此,可构造如下 t 统计量? ?? ? i ii? ?? ? i i c ii e ?e n ? k ?12、t 检验 设计原假设与备择假设: H0:?i=0 (i=1,2…k) H1:?i?0 给定显著性水平 ?,可得到临界值 t?/2(n-k-1),由样本求出统计量 t 的数值,通过 |t|? t?/2(n-k-1) 或 |t|?t?/2(n-k-1) 来拒绝或接受原假设 H0,从而判定对应的解释变量是否应包括在模型中。 注意:一元线性回归中,t 检验与 F 检验一致 一方面,t 检验与 F 检验都是对相同的原假设 H0:?1=0 进行检验; 另一方面,两个统计量之间有如下关系: ? 2 x2 ?2 ? i2 ? ? ?y 1 ? i 1F??e2 i( n ? 2) ? ? 1??e2 i( n ? 2)2??e2 i 2 i( n ? 2)? x i22? ?? ? ? ??e2 i? ? ? ? ?? ? ? ? 1 ( n ? 2)? x i2 ? ? ??e1 ? ? ? t2 ? n ? 2 ? x i2 ? ?在中国居民人均收入-消费支出二元模型例中,由应用软件计算出参数的 t 值:只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 - 16 - t 0 ? 3.306t1 ? 3.630t 2 ? 2.651给定显著性水平 ?=0.05,查得相应临界值: t0.025(19) =2.093。 可见,计算的所有 t 值都大于该临界值,所以拒绝原假设。即: 包括常数项在内的 3 个解释变量都在 95%的水平下显著,都通过了变量显著性检验。四、参数的置信区间参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。 在变量的显著性检验中已经知道:t?? ?? ? i i S ??i? ?? ? i i ~ t ( n ? k ? 1) e ?e c ii n ? k ?1? ? t? ? s ,? ? ? t? ? s ) (? ? ? i i ? ? i i 2 2 容易推出:在(1-?)的置信水平下 ?i 的置信区间是 其中,t?/2 为显著性水平为 ? 、自由度为 n-k-1 的临界值。 在中国居民人均收入-消费支出二元模型例中,给定 ?=0.05,查表得临界值:t0.025(19)=2.093 从回归计算中已得到: ? ? 0 ? 120.70 s ?? ? 36.510? ? 0.2213 ? 1 ? ? 0.4515 ? 2s ?? ? 0.0611s ?? ? 0.1702计算得参数的置信区间: ?0 :(44.284, 197.116) ?1 : (0.9 ) ? 2 :(0.0) 如何才能缩小置信区间? ? 增大样本容量 n,因为在同样的样本容量下,n 越大,t 分布表中的临界值越小,同时,增大样 本容量,还可使样本参数估计量的标准差减小; ? 提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残 差平方和应越小。 ? 提高样本观测值的分散度,一般情况下,样本观测值越分散,(X’X)-1 的分母的|X’X|的值越大, 致使区间缩小。§3.4多元线性回归模型的预测一、E(Y0)的置信区间 二、Y0 的置信区间 ? ? 对于模型 Y ? Xβ 给定样本以外的解释变量的观测值 X0=(1,X10,X20,…,Xk0),可以得到被解释变量的预测值: 它可以是总体均值 E(Y0)或个值 Y0 的预测。 但严格地说,这只是被解释变量的预测值的估计值,而不是预测值。 为了进行科学预测,还需求出预测值的置信区间,包括 E(Y0)和 Y0 的置信区间。 一、E(Y0)的置信区间 易知 ? ) ? E (X β ? ? ) ? X 0β? E (Y0 ) ? ) ? E (X β ? ? ? β)X 0 (β ? ? β)) E (Y Var (Y ) 2 ? E ( X 0 (β 0 0 ) ? X 0 E (β 0 0 ? X 0β? ?Xβ ? Y 0 0? ) ? E ( X (β ? ? β)(β ? ? β)?X ?0 ) Var (Y 0 0 ? ? β)(β ? ? β)?X ?0 ? X 0 E (β ? ? 2 X 0 ( X ?X ) ?1 X ?0 ? ~ N (X β Y , ? 2 X (X ?X) ?1 X ? )0 0 0 0容易证明? ? E(Y ) Y 0 0 ? X 0 (X ?X) ?1 X ? ? 0~ t ( n ? k ? 1)于是,得到(1-?)的置信水平下 E(Y0)的置信区只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 - 17 - ? ? t? ?? ? ? X 0 ( X ?X) ?1 X ? ? X 0 ( X ?X) ?1 X ? Y 0 0 ? E (Y0 ) ? Y0 ? t ? ? ? 02 2其中,t?/2 为(1-?)的置信水平下的临界值。 二、Y0 的置信区间 如果已经知道实际的预测值 Y0,那么预测误差为: 容易证明?) E (e 0 ) ? E ( X 0β? ? 0 ? X 0β ? ? β)) ? E ( ? 0 ? X 0 (β ? E ( ? 0 ? X 0 ( X ?X ) ?0?1? e0 ? Y0 ? Y 02 Var (e0 ) ? E (e0 )X ?μ )? E ( ? 0 ? X 0 ( X ?X ) ?1 X ?μ) 2 ? ? 2 (1 ? X 0 ( X ?X ) ?1 X ?0 )e0 服从正态分布,即e0 ~ N (0, ? 2 (1 ? X 0 ( X ?X) ?1 X ?0 ))构造 t 统计量 ? ?Y Y 0 t ? 0 ~ t ( n ? k ? 1) ?e ?0可得给定(1-?)的置信水平下 Y0 的置信区间:? ? t? ?? ? ? ?1 ? ? 1 ? X 0 ( X ?X) ?1 X ? ? Y 0 0 ? Y0 ? Y0 ? t ? ? ? 1 ? X 0 ( X X ) X 02 2中国居民人均收入-消费支出二元模型例中:2001 年人均 GDP:4033.1 元, 于是人均居民消费的预测值为 ?+0..1+0..8=1776.8(元) 实测值(90 年价)=1782.2 元,相对误差:-0.31% 预测的置信区间 :( X ?X )?1? 1.88952 ? ? ? 0.00285 ? ? 0.00828 ?0.01 ? 0.00001? 0.00828 ? ? ? 0.00001 ? 0.00004 ? ?X ?0 (X ?X) ?1 X 0 ? 0.3938于是 E(?2001)的 95%的置信区间为:1776.8 ? 2.093 ?705.5 ?0.3938 或(11.7)同样,易得 ?2001 的 95%的置信区间为1776.8 ? 2.093 ? 705.5 ? 1.3938 或(42.4) 拉格朗日统计量 LM 本身是一个关于拉格朗日乘数的复杂的函数, 在各约束条件为真的情况下, 服 从一自由度恰为约束条件个数的渐近 ?2 分布。 同样地,如果为线性约束,LM 服从一精确的 ?2 分布: (*) n 为样本容量,R2 为如下被称为辅助回归(auxiliary regression)的可决系数: ? R ? ??0 ? ??1 X 1 ? ??2 X 2 ? ? ? ??k X k e 如果约束是非线性的,辅助回归方程的估计比较复杂,但仍可按(*)式计算 LM 统计量的值。 最后,一般地有:LM?LR?WLM ? nR 2第四章约束回归与模型结构的稳定性第一节 非线性回归 第二节 受约束回归 第三节 模型结构的稳定性 第一节 非线性回归 一、模型的类型与变换 二、对回归模型增加或减少解释变量 在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。 如著名的恩格尔曲线(Engle curves)表现为幂函数曲线形式、 宏观经济学中的菲利普斯曲线 (Pillips cuves) 表现为双曲线形式等。只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获 - 18 - 但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以 运用线性回归的方法进行计量经济学方面的处理。 一、 模型的类型与变换 1、倒数模型、多项式模型与变量的直接置换法 例如,描述税收与税率关系的拉弗曲线:抛物线 s = a + b r + c r2 c&0 s:税收; r:税率 设 X1 = r,X2 = r2, 则原方程变换为 s = a + b X1 + c X2 c&0 2、幂函数模型、指数函数模型与对数变换法 例如,Cobb-Dauglas 生产函数:幂函数 Q = AK?L? Q:产出量,K:投入的资本;L:投入的劳动 方程两边取对数:ln Q = ln A + ? ln K + ? ln L 3、复杂函数模型与级数展开法 例如,常替代弹性 CES 生产函数Q ? A(? 1 K ? ? ? ? 2 L? ? ) ? e ? (?1+?2=1) Q:产出量,K:资本投入,L:劳动投入 ?:替代参数, ?1、?2:分配参数 1 LnQ ? LnA ? ? Ln (? 1 K ? ? ? ? 2 L? ? ) ? ? 方程两边取对数后,得到: 将式中 ln(?1K-? + ?2L- ?)在 ?=0 处展开台劳级数,取关于 ? 的线性项,即得到一个线性近似式。如取 0 阶、1 阶、2 阶项,可得? ? K ?? 1 ln Y ? ln A ? ? 1 m ln K ? ? 2 m ln L ? ? m? 1? 2 ? ? ln ? L ? ? ? 2 ? ? ?? 并非所有的函数形式都可以线性化2?1无法线性化模型的一般形式为:Y ? f ( X 1 , X 2 ,? , X k ) ? ?? ?其中,f(x1,x2,…,Xk)为非线性函数。如: Q ? AK L ? ? 二、非线性回归实例 例 3.5.1 建立中国城镇居民食品消费需求函数模型。 根据需求理论,居民对食品的消费需求函数大致为 (*) Q:居民对食品的需求量,X:消费者的消费支出总额 P1:食品价格指数,P0:居民消费价格总指数。 零阶齐次性,当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变 (*) 为了进行比较,将同时估计(*)式与(**)式。 首先,确定具体的函数形式 根据恩格尔定律,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系: 对数变换: 考虑到零阶齐次性时 ln(Q ) ? ? 0 ? ? 1 ln( X / P0 ) ? ? 2 ln( P1 / P0 ) ? ? (****)? 2 ?3 Q ? AX ?1 P 1 P 0 ln(Q ) ? ? 0 ? ? 1 ln X ? ? 2 ln P1 ? ? 3 ln P0 ? ?Q ? f ( X , P1 , P0 )Q ? f ( X / P0 , P1 / P0 )(***)2 3 (****)式也可看成是对(***)式施加如下约束而得 1 因此,对(****)式进行回归,就意味着原需求函数满足零阶齐次性条件。? ?? ?? ?0只有坚持别人不能坚持的坚持,才能收获别人不能收获的收获- 19 - 表 3.5.1X 83 86 89 92 95 98 01 456.8 471.0 505.9 559.4 673.2 799.0 884.4 1.0 3.8 0.8 7.6 5.6 5.9 9.0 X1 420.4 432.1 464.0 514.3 351.4 418.9 472.9 567.0 660.0 693.8 782.5 884.8 2.5 4.7 6.9 8.3 2014.0 GP中国城镇居民消费支出(元)及价格指数FP 102.7 102.1 103.7 104.0 116.5 107.2 112.0 125.2 114.4 98.8 105.4 110.7 116.5 134.2 123.6 107.9 100.1 96.9 95.7 97.6 100.7 XC (1990年价 ) 646.1 659.1 672.2 690.4 772.6 826.6 899.4 2.5 4.1 4.7 4.3 5.5 3.0 4.0 Q (1990年价 ) 318.3 325.0 337.0 350.5 408.4 437.8 490.3 613.8 702.2 693.8 731.3 809.5 943.1 4.3 9.6 6.8 9.9 P0 (.7 71.5 75.3 81.0 87.1 96.7 98.3 101.7 95.9 100.0 108.2 114.5 124.6 134.6 143.0 145.6 150.8 157.0 169.5 182.1 192.1 P1 (2.1 132.9 137.7 146.7 86.1 95.7 96.5 92.4 94.0 100.0 107.0 109.3 112.2 112.4 112.9 112.8 115.0 117.7 123.3 128.1 130.8(当年价 ) (当年价 ) (上年 =100) (上年 =100) 102.5 102.0 102.0 102.7 111.9 107.0 108.8 120.7 116.3 101.3 105.1 108.6 116.1 125.0 116.8 108.8 103.1 99.4 98.7 100.8 100.7X:人均消费 X1:人均食品消费 GP:居民消费价格指数 FP:居民食品消费价格指数 XC:人均消费(90 年价)Q:人均食品消费(90 年价)P0:居民消费价格缩减指数()P: 居民食品消费价格缩减指数( 中 国 城 镇 居 民 人 均 食 品 消 费00 0 600 400 200 82 84 86 88 90 92 94 96 98

我要回帖

更多关于 药理学第一章 绪论 的文章

 

随机推荐