C.R只能大于零 D.R可能为负值三、名词解释
偏回归系数;回归变差、剩余变差;多重决定系数、调整后的决定系数、偏相关系数 名词解释答案 1.偏回归系数:
2.回归变差:简称ESS,表示由回归直线(即解释变量)所解释的部分,表示x对y的线性影响。
3.剩余变差:简称RSS,是未被回归直线解释的部分,是由解释变量以外的因素造成的影响。 4.多重决定系数:在多元线性回归模型中,回归平方和与总离差平方和的比值,也就是在被解释变量的总变差中能由解释变量所解释的那部分变差的比重,我们称之为多重决定系数,
2
仍用R表示。
5.调整后的决定系数:又称修正后的决定系数,记为R,是为了克服多重决定系数会随着解释变量的增加而增大的缺陷提出来的, 其公式为:R2222222222e/(nk1)。 1(yy)/(n1)2tt6.偏相关系数:在Y、X1、X2三个变量中,当X1 既定时(即不受X1的影响),表示Y与X2之间相关关系的指标,称为偏相关系数,记做RY2.1。 四、简答
1.给定二元回归模型:
ytb0b1x1tb2x2tut,请叙述模型的古典假定。
解答:(1)随机误差项的期望为零,即E(ut)0。(2)不同的随机误差项之间相互,即cov(ut,us)E[(utE(ut))(usE(us)]E(utus)0。(3)随机误差项的方差与t无关,为一个常数,即var(ut)。即同方差假设。(4)随机误差项与解释变量不相关,即
2cov(xjt,ut)0(j1,2,...,k。通常假定)(5)随机xjt为非随机变量,这个假设自动成立。
误差项ut为服从正态分布的随机变量,即utN(0,2)。(6)解释变量之间不存在多重共
线性,即假定各解释变量之间不存在线性关系,即不存在多重共线性。
2.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度?
解答:因为人们发现随着模型中解释变量的增多,多重决定系数R的值往往会变大,从而增加了模型的解释功能。这样就使得人们认为要使模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确
2度、引起多重共线性等等。为此用修正的决定系数来估计模型对样本观测值的拟合优度。 3.修正的决定系数R及其作用。 解答:R22e/nk1,其作用有:
(1)用自由度调整后,可以消除拟合优度1(yy)/n12t2t评价中解释变量多少对决定系数计算的影响;(2)对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较。
4.常见的非线性回归模型有几种情况? 解答:常见的非线性回归模型主要有: (1) 对数模型lnytb0b1lnxtut
(2) 半对数模型ytb0b1lnxtut或lnytb0b1xtut
111u或b0b1u xyx2k(4) 多项式模型yb0b1xb2x...bkxu
(3) 倒数模型yb0b1(5) 成长曲线模型包括逻辑成长曲线模型ytK和Gompertz成长曲线模型
1b0eb1tyteKb0b1t
5.观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。
3①ytb0b1xtut ②ytb0b1logxtut
③ logytb0b1logxtut ④ytb0/(b1xt)ut
解答:①系数呈线性,变量非线性;②系数呈线性,变量非呈线性;③系数和变量均为非线性;④系数和变量均为非线性。
6. 观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。 ①ytb0b1logxtut ②ytb0b1(b2xt)ut ③ ytb0/(b1xt)ut ④yt1b0(1xt1)ut
解答:①系数呈线性,变量非呈线性;②系数非线性,变量呈线性③系数和变量均为非线性;④系数和变量均为非线性。 五、计算和分析题
1.根据某地1961—1999年共39年的总产出Y、劳动投入L和资本投入K的年度数据,运用普通最小二乘法估计得出了下列回归方程:
(0.237) (0.083) (0.048) ,DW=0.858
式下括号中的数字为相应估计量的标准误。 (1)解释回归系数的经济含义;
(2)系数的符号符合你的预期吗?为什么? 解答:(1)这是一个对数化以后表现为线性关系的模型,lnL的系数为1.451意味着资本投入K保持不变时劳动—产出弹性为1.451 ;lnK的系数为0.384意味着劳动投入L保持不变时资本—产出弹性为0.384.
(2)系数符号符合预期,作为弹性,都是正值。
2.某计量经济学家曾用1921~1941年与1945~1950年(1942~1944年战争期间略去)美国国内消费C和工资收入W、非工资-非农业收入P、农业收入A的时间序列资料,利用普通最小二乘法估计得出了以下回归方程:
b式下括号中的数字为相应参数估计量的标准误。试对该模型进行评析,指出其中存在的问题。 解答:该消费模型的判定系数R0.95,F统计量的值F107.37,均很高,表明模型的整体拟合程度很高。
2计算各回归系数估计量的t统计量值得:t08.1338.920.91,
t11.0590.176.10
t20.4520.660.69,t30.1211.090.11。除t1外,其余T值均很小。工资收入
W的系数t检验值虽然显着,但该系数的估计值却过大,该值为工资收入对消费的边际效应,它的值为1.059意味着工资收入每增加一美元,消费支出增长将超过一美元,这与经济理论和生活常识都不符。另外,尽管从理论上讲,非工资—非农业收入与农业收入也是消费行为的重要解释变量,但二者各自的t检验却显示出它们的效应与0无明显差异。这些迹象均表明模型中存在严重的多重共线性,不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。
3.计算下面三个自由度调整后的决定系数。这里,R为决定系数,n为样本数目,k为解释变量个数。
(1)R0.75nk2 (2)R0.35nk3 (3)R0.95nk5 解答: (1)R1(2)R1222222n181(1R2)1(10.75)0.65
nk182191(10.35)0.04
9313112(3)R1(10.95)0.94
3151ytb0b1x1tb2x2tut4.设有模型
,试在下列条件下:
①b1b21 ②b1b2。分别求出b1,b2的最小二乘估计量。
解答:当b1b21时,模型变为ytx2tb0b1(x1tx2t)ut,可作为一元回归模型来对待b1n(x1tx2t)(ytx2t)(x1tx2t)(ytx2t)n(x1tx2t)2((x1tx2t))2
当b1b2时,模型变为ytb0b1(x1tx2t)ut,同样可作为一元回归模型来对待
b1n(x1tx2t)yt(x1tx2t)ytn(x1tx2t)2((x1tx2t))2
5.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:
ˆ125.015.0X1.0X1.5X R0.75 方程A:Y1232ˆ123.014.0X5.5X3.7X R0.73 方程B:Y124其中:Y——某天慢跑者的人数
X1——该天降雨的英寸数 X2——该天日照的小时数
X3——该天的最高温度(按华氏温度) X4——第二天需交学期论文的班级数
2请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?
(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
解答:(1)第2个方程更合理一些,,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。
(2)出现不同符号的原因很可能是由于X2与X3高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。
6.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出变量分别代表着哪一项!下面是回归结果(括号内为标准差): (2.6) (6.3) (0.61) (5.9) R0.63 n35 要求:(1)试判定每项结果对应着哪一个变量?
(2)对你的判定结论做出说 解答:(1)x1i是盒饭价格,x2i是气温,x3i是学校当日的学生数量,x4i是附近餐厅的盒饭价格。
(2)在四个解释变量中,附近餐厅的盒饭价格同校园内食堂每天卖出的盒饭数量应该是负相关关系,其符号应该为负,应为x4i;学校当日的学生数量每变化一个单位,盒饭相应的变化数量不会是28.4或者12.7,应该是小于1的,应为x3i;至于其余两个变量,从一般
2x2i经验来看,被解释变量对价格的反应会比对气温的反应更灵敏一些,所以x1i是盒饭价格,
是气温。