文档库 最新最全的文档下载
当前位置:文档库 › 《统计学》 第七章 相关分析与回归分析(补充例题)

《统计学》 第七章 相关分析与回归分析(补充例题)

《统计学》 第七章 相关分析与回归分析(补充例题)
《统计学》 第七章 相关分析与回归分析(补充例题)

第七章 相关分析与回归分析

(3)当固定资产改变200万元时,总产值平均改变多少?(4)当固定资产为1300万元时,总产值为多少?

(1)协方差——用以说明两指标之间的相关方向。

2

2))((n y

x xy n n

y y x x xy ∑∑∑∑-=--=

σ035.126400100

9801

6525765915610>=?-?=

计算得到的协方差为正数,说明固定资产和总产值之间存在正相关关系。 (2)相关系数用以说明两指标之间的相关方向和相关的密切程度。

∑∑∑∑∑∑∑---=

]

)(][)([2222y y n x x n y

x xy n r

95.0)

98011086657710()6525566853910(9801

65257659156102

2

=-??-??-?=

计算得到的相关系数为0.95,表示两指标为高度正相关。

(3)

2

226525

5668539109801

6525765915610)(-??-?=--=

∑∑∑∑∑x x n y x xy n b 90.014109765

12640035

42575625566853906395152576591560==--=

85.39210

6525

9.0109801=?-=

-=x b y a 回归直线方程为: x y 9.085.392?+= (4)当固定资产改变200万元时,总产值平均改变多少?

x y ?=?9.0,1802009.0|200=?=?=?x y 万元

当固定资产改变200万元时,总产值平均增加180万元。

(5)当固定资产为1300万元时,总产值为多少?

85.156213009.085.392|1300=?+==x y 万元

当固定资产为1300万元时,总产值为1562.85万元。

例2、试根据下列资产总值和平均每昼夜原料加工量资料计算相关系数。

解:【分析】本题中“企业数”应看成资产总值和平均每昼夜原料加工量两变量的次数,在计算相关系数的过程,要进行“加权”。

相关系数

∑∑∑∑∑∑∑∑∑∑---=

]

)(][)([2

2

2

2

f y f y f f x f x f yf

xf xyf f r 84.0)

331.2842()216001174000042(33

2160017960422

2

=-??-??-?=

要求:(1)编制直线回归方程;(2)由此计算出学习时数与学习成绩之间的相关系数。 解:先列出计算表: 解:(1)bx a y c +=

2.54037053104027405)(2

22=-??-?=--=∑∑∑∑∑x x n y x xy n b

4.205

40

2.55310=?-=

-=x b y a 回归直线方程为:

x y c 2.54.20+=

(2)

∑∑∑∑∑∑∑---=

]

)(][)([2222y y n x x n y

x xy n r 956.002

.8681.151300

)

310207005()403705(310402740522=?=

-??-??-?=

计算得到的相关系数为0.95,表示两指标为高度正相关。

956.09135.02===r r

说明学习时数x 与成绩得分y 之间有高度的相关关系。 例3、检查5位同学统计学的学习时间与成绩分数如下表:

要求:(1)编制直线回归方程;(2)计算估计标准误差;(3)对学习成绩的方差进行分解分析,指出总误差平方和中有多少比重可由回归方程来解释;(4)由此计算出学习时数与学习成绩之间的相关系数。

解:(1)bx a y c +=

2.54037053104027405)(2

22=-??-?=--=∑∑∑∑∑x x n y x xy n b

4.205

40

2.55310=?-=

-=x b y a 回归直线方程为:

x y c 2.54.20+=

(2)53.63

2740

2.53104.202070022

=?-?-=---=

∑∑∑n xy b y a y

S yx

(3)总误差分解列表如下:

635

==

y ∑∑∑-+-=-222

)()()(y y

y y y y c

c

1480=128+1352

9135.01480

1352

)

()(2

2

2

==

--=∑∑

y y y y r

c

计算总误差平方和中有91.35%可以由回归方程来解释,学习时数x 与成绩得分y 之间有高度的相关。如果用理论分数c y 来估计实际分数y ,平均将发生6.53分的误差,这个数字与平均成绩62分对比约占10.5%。 (4)956.09135.02===r r

说明学习时数x 与成绩得分y 之间有高度的相关关系。

26、回归分析测试题及答案

中级经济师基础知识 第 1题:单选题(本题1分) 某公司产品当产量为1000单位时,其总成本为4000元;当产量为2000单位时,其总成本为5000,则设产量为x,总成本为y,正确的一元回归方程表达式应该是( )。 A、y = 3000 + x B、y = 4000 + 4x C、y = 4000 + x D、y = 3000 + 4x 【正确答案】:A 【答案解析】: 本题可列方程组:设该方程为y = a + bx,则由题意可得:4000 = a + 1000b5000 = a + 2000b 解该方程,得b=1,a=3000,所以方程为y = 3000 + x 第 2题:单选题(本题1分) 在回归分析中,估计回归系数的最小二乘法的原理是( )。 A、使得因变量观测值与均值之间的离差平方和最小 B、使得因变量估计值与均值之间的离差平方和最小 C、使得观测值与估计值之间的乘积和最小 D、使得因变量观测值与估计值之间的离差平方和最小 【正确答案】:D 【答案解析】: 较偏较难的一道题目。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数的一种方法 第 3题:多选题(本题2分) 关于相关分析和回归分析的说法,正确的的有() A、相关分析可以从一个变量的变化来推测另一个变量的变化 B、相关分析研究变量间相关的方向和相关的程度 C、相关分析中需要明确自变量和因变量 D、回归分析研究变量间相互关系的具体形式 E、相关分析和回归分析在研究方法和研究目的有明显区别 【正确答案】:BDE 【答案解析】: 相关分析与回归分析在研究目的和方法上具有明显的区别。 (1)、相关分析研究变量之间相关的方向和相关的程度,无法从一个变量的变化来推测另一变量的变化情况。 (2)、回归分析是研究变量之间相关关系的具体形式

概率与数理统计典型例题

《概率与数理统计》 第一章 随机事件与概率 典型例题 一、利用概率的性质、事件间的关系和运算律进行求解 1.设,,A B C 为三个事件,且()0.9,()0.97P A B P A B C ==U U U ,则()________.P AB C -= 2.设,A B 为两个任意事件,证明:1|()()()|.4 P AB P A P B -≤ 二、古典概型与几何概型的概率计算 1.袋中有a 个红球,b 个白球,现从袋中每次任取一球,取后不放回,试求第k 次 取到红球的概率.(a a b +) 2.从数字1,2,,9L 中可重复地任取n 次,试求所取的n 个数的乘积能被10整除的 概率.(58419n n n n +--) 3.50只铆钉随机地取来用在10个部件上,其中有3个铆钉强度太弱,每个部件用3只铆钉,若将3只强度太弱的铆钉都装在一个部件上,则这个部件强度就太 弱,从而成为不合格品,试求10个部件都是合格品的概率.(19591960 ) 4.掷n 颗骰子,求出现最大的点数为5的概率. 5.(配对问题)某人写了n 封信给不同的n 个人,并在n 个信封上写好了各人的地址,现在每个信封里随意地塞进一封信,试求至少有一封信放对了信封的概率. (01(1)! n k k k =-∑)

6.在线段AD上任取两点,B C,在,B C处折断而得三条线段,求“这三条线段能构成三角形”的概率.(0.25) 7.从(0,1)中任取两个数,试求这两个数之和小于1,且其积小于 3 16 的概率. (13 ln3 416 +) 三、事件独立性 1.设事件A与B独立,且两个事件仅发生一个的概率都是 3 16 ,试求() P A. 2.甲、乙两人轮流投篮,甲先投,且甲每轮只投一次,而乙每轮可投两次,先投 中者为胜.已知甲、乙每次投篮的命中率分别为p和1 3 .(1)求甲取胜的概率; (2)p求何值时,甲、乙两人的胜负概率相同?( 95 ; 5414 p p p = + ) 四、条件概率与积事件概率的计算 1.已知10件产品中有2件次品,现从中取产品两次,每次取一件,去后不放回,求下列事件的概率:(1)两次均取到正品;(2)在第一次取到正品的条件下第二次取到正品;(3)第二次取到正品;(4)两次中恰有一次取到正品;(5)两次中 至少有一次取到正品.(28741644 ;;;; 45954545 ) 2.某人忘记了电话号码的最后一个数字,因而他随意地拨号,假设拨过了的数字不再重复,试求下列事件的概率:(1)拨号不超过3次而接通电话;(2)第3次拨号才接通电话.(0.3;0.1) 五、全概率公式和贝叶斯公式概型 1.假设有两箱同种零件:第一箱内装50件,其中10件为一等品;第二箱内装30件,其中18件为一等品,现从两箱中随意挑选出一箱,然后从该箱中先后随机取出两个零件(取出的零件均不放回),试求:(1)先取出的零件是一等品的概率;(2)在先取出的零件是一等品的条件下,第二次取出的零件仍然是一等品 的概率.(2690 ; 51421 ) 2.有100个零件,其中90个一等品,10个二等品,随机地取2个,安装在一台设备上,若2个零件中有i个(0,1,2 i=)二等品,则该设备的使用寿命服从参

应用回归分析,第8章课后习题参考答案

第8章 非线性回归 思考与练习参考答案 8.1 在非线性回归线性化时,对因变量作变换应注意什么问题? 答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。如: (1) 乘性误差项,模型形式为 e y AK L αβε =, (2) 加性误差项,模型形式为y AK L αβ ε = + 对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。 一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。 8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。 表8.15 生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%) 5.2 6.5 6.8 8.1 10.2 10.3 13.0 解:先画出散点图如下图: 5000.00 4000.003000.002000.001000.00x 12.00 10.00 8.006.00 y

从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。 (1)二次曲线 SPSS 输出结果如下: Model Summ ary .981 .962 .942 .651 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x. ANOVA 42.571221.28650.160.001 1.6974.424 44.269 6 Regression Residual Total Sum of Squares df Mean Square F Sig.The independent variable is x. Coe fficients -.001.001-.449-.891.4234.47E -007.000 1.417 2.812.0485.843 1.324 4.414.012 x x ** 2 (Constant) B Std. E rror Unstandardized Coefficients Beta Standardized Coefficients t Sig. 从上表可以得到回归方程为:72? 5.8430.087 4.4710y x x -=-+? 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。 由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。 (2)指数曲线 Model Summ ary .970 .941 .929 .085 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x.

数理统计复习题第五章

第五章 大数定律与中心极限定理 一、 典型题解 例1设随机变量X 的数学期望()(){}2,3E X u D X X u σσ==-≥方差,求P 的大小区间。 解 令3εσ=,则有切比雪夫不等式有: ()() ()22 221 ,339D X P X E X P X E X σεσεσ????-≥≤ -≥≤=????有 例2在n 次独立试验中,设事件A 在第i 次试验中发生的概率为()1,2,....i p i n = 试证明:A 发生的频率稳定于概率的平均值。 证 设X 表示n 次试验中A 发生的次数,引入新的随机变量0i A X A ?=??1,发生? ,不发生 ()12,...i n =, ,则X 服从()01-分布,故 ()()(),1i i i i i i i E X p D X p p p q ==-=, 又因为 () ()2 2 4140i i i i i i i i p q p q p q p q -=+-=-≥, 所以 ()()1 1,2, (4) i i i D X p q i n =≤ = 由切比雪夫大数定理,对,o ε?>有()11lim 1n i i n i p X E X n ε→∞ =?? -<=???????? ∑ 即 11lim 1n i n i X p p n n ε→∞ =?? -<=???? ∑ 例 3 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学 生无家长,1名家长、2名家长来参加会议的概率分别为。若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布。(1)求参加会议的家长数X 超过450的概率;(2)求有1名家长来参加会议的学生数不多于340的概率。 解(1)以()400,,2,1 =k X k 记第k 个学生来参加会议的家长数,则k X 的分布律为 k X 0 1 2 k P 0.05 0.8 0.15

回归分析练习试题和参考答案解析

1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 α=)。 (5)检验回归方程线性关系的显著性(0.05 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1)

可能存在线性关系。 (2)相关系数: 系数a 模型非标准化系数标准系数 t Sig. 相关性 B标准误差试用版零阶偏部分 1(常量).003 人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平 有很强的线性关系。 (3)回归方程:734.6930.309 y x =+ 系数a 模型非标准化系数标准系数t Sig.相关性

回归系数的含义:人均GDP没增加1元,人均消费增加元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 系数(a) 模型非标准化系数标准化系数 t显著性B标准误Beta 1(常量) 人均GDP(元) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1.998a.996.996 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 模型摘要 模型R R 方调整的 R 方估计的标准差

数理统计复习题第八章

第七章 假设检验 三、典型题解 例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.当机器正常时, 其均值为0.5千克, 标准差为0.015千克.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): 0.498 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 解: 根据样本值判断5.05.0≠=μμ还是.提出两个对立假设 0100:5.0:μμμμ≠==H H 和 选择统计量:)1,0(~/0 N n X Z σμ-= 取定0.05a =,则/20.025 1.96,z z a ==又已知 9, 0.015, n s ==由样本计算得0.511x =, 2.2 1.96=>,于是拒绝假设 0H , 认为包装机工作不正常. 例2:某工厂生产的固体燃料推进器的燃烧率服从正态分布),(2 σμN , s cm s cm /2,/40==σμ,现用新方法生产了一批推进器,从中随机取25n =只,测得燃 烧率的样本均值为s cm x /25.41=.设在新方法下总体均方差仍为s cm /2,问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?(取显著性水平05.0=α) 解:根据题意需要检验假设 00 :40H m m ?(即假设新方法没有提高了燃烧率), 10 :H m m >(即假设新方法提高了燃烧率), 这是右边检验问题,拒绝域为 0.05 1.645x z z = ?,由 3.125 1.645 x z = =>可得z 值落到拒绝域中故在显著性水平0.05 a =下拒绝0 H . 即认为这批推进器的燃烧率较以往有显著提高. 例3:某切割机在正常工作时, 切割每段金属棒的平均长度为10.5cm, 标准差是0.15cm, 今

多元线性回归模型习题及答案

多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为( D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B ) A. i C (消费)=500+i I (收入) B. d i Q (商品需求)=10+i I (收入)+i P (价格) C. s i Q (商品供给)=20+i P (价格) D. i Y (产出量)=0.6i L (劳动)0.4i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显著性水平上对 1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。 A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 、B 、C 都不对 9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n ≥k+1 B n

回归分析练习题(有答案)

1.1回归分析的基本思想及其初步应用 一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平 均值为2,数据 y 的平均值为3,则 ( ) A .回归直线必过点(2,3) B .回归直线一定不过点(2,3) C .点(2,3)在回归直线上方 D .点(2,3)在回归直线下方 2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A . y x 1=+ B . y x 2=+ C . y 2x 1=+ D. y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ) ,1,2i =,…,n ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4. 下列说法中正确的是( ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 5. 给出下列结论: (1)在回归分析中,可用指数系数2 R 的值判断模型的拟合效果,2 R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个. A .1 B .2 C .3 D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D. y 平均减少2个单位 7. 下面的各图中,散点图与相关系数r 不符合的是( )

数理统计典型例题分析

典型例题分析 例1.分别从方差为20和35的正态总抽取容量为8和10的两个样本,求第一个样本方差是第二个样本方差两倍的概率的范围。 解 以21 S 和22 S 分别表示两个(修正)样本方差。由22 22 12σσy x S S F =知统计量 22 2 1222175.13520S S S S F == 服从F 分布,自由度为(7,9)。 1) 事件{}2 2 212S S =的概率 {}{}05.32035235 20222221222122 2 1 ===??? ????==??????===F P S S P S S P S S P 因为F 是连续型随机变量,而任何连续型随机变量取任一给定值的概率都等于0。 2) 现在我们求事件{}二样本方差两倍第一样本方差不小于第=A 的概率: {} {}5.322 221≥=≥=F P S S P p 。 由附表可见,自由度9,721==f f 的F 分布水平α上侧分位数),(21f f F α有如下数值: )9,7(20.45.329.3)9,7(025.005.0F F =<<=。 由此可见,事件A 的概率p 介于0.025与0.05之间;05.0025.0<

解 由随机变量2χ分布知,随机变量σ/12S n )(-服从2χ分布,自由度 1-=n v ,于是,有 {}{}95.0)1(5.1)1(5.1)1(2,05.0222 2=≤≥-≤=? ?????-≤-=v v v P n P n S n P χχχσ 其中2v χ表示自由度1-=n v 的2χ分布随机变量,2 ,05.0v χ是自由度为1-=n v 的水 平05.0=α的2χ分布上侧分位数(见附表)。我们欲求满足 2,05.015.1v n χ≥-)( 的最小1+=v n 值,由附表可见 2 26,05.0885.3839)127(5.1χ=>=-, 22505.0652.375.401265.1,)(χ=<=-。 于是,所求27=n 。 例3.假设随机变量X 在区间[]1,+θθ上有均匀分布,其中θ未知: )(1n X X ,, 是来自X 的简单随机样本,X 是样本的均值,{} n X X X ,,min 1)1( =是最小观察值。证明 21?1-=X θ 和 11?12+-=n X ) (θ 都是θ的无偏估计量。 解 由X 在[]1,+θθ上均匀分布,知2/)12(+==θEX EX i 。 1) 由 θθθθ=-+=-+=-=∑∑==2 121212221211?111n i n i i n EX n E , 可见1?θ是θ的无偏估计量。 2) 为证明2?θ是θ的无偏估计。我们先求统计量)1(X 的概率分布。

回归分析练习题及参考答案

1 下面是7个地区2000年的人均国生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元 北京上海 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(0.05 α=)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1) 可能存在线性关系。 (2)相关系数:

(3)回归方程:734.6930.309 y x =+ 回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 系数(a) 模型非标准化系数标准化系数 t 显著性B 标准误Beta 1 (常量)734.693 .540 5.265 0.003 人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1 .998a.996 .996 247.303 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 模型摘要 模型R R 方调整的 R 方估计的标准差 1 .998(a) 0.996 0.996 247.303 a. 预测变量:(常量), 人均GDP(元)。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

回归分析练习题与参考答案

求:(1)人均GDP 乍自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系 形态。 (2) 计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3) 求出估计的回归方程,并解释回归系数的实际意义。 (4) 计算判定系数,并解释其意义。 (5) 检验回归方程线性关系的显著性 ( 0.05)。 (6) 如果某地区的人均 GDP 为5000元,预测其人均消费水平。 (7) 求人均GDP 为5000元时,人均消费水平 95%的置信区间与预测区间。 解: (1) 可能存在线性关系。 12000- 1DOOQ - 6000- 6000- 4QD0- 2000- 0- D 10000 20000 人均GDP 30000 4MOO

(2) 相关系数:

a.因变量人均消费水平 有很强的线性关系。 (3)回归方程: y 734.693 0.309x a.因变量人均消费水平 回归系数的含义:人均 GDP 没增加1元,人均消费增加 0.309元。 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 系数(a ) a.因变量人均消费水平(元) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 a.预测变量常量),人均GDP 人均GDP 寸人均消费的影响达到 99.6%。 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 a.预测变量:(常量人均GDP (元)。 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

应用回归分析,第4章课后习题参考答案.

第4章违背基本假设的情况 思考与练习参考答案 4.1 试举例说明产生异方差的原因。 答:例4.1:截面资料下研究居民家庭的储蓄行为 Y i=β0+β1X i+εi 其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。 由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。 例4.2:以某一行业的企业为样本建立企业生产函数模型 Y i=A iβ1K iβ2L iβ3eεi 被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。 4.2 异方差带来的后果有哪些? 答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果: 1、参数估计量非有效 2、变量的显著性检验失去意义 3、回归方程的应用效果极不理想 总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。 4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。 答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差

的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。 加权最小二乘法的方法: 4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。 答:运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数i w ,以调整各项在平方和中的作用,加权最小二乘的离差平方和为: ∑=----=n i ip p i i i p w x x y w Q 1211010)( ),,,(ββββββ (2) 加权最小二乘估计就是寻找参数p βββ,,,10 的估计值pw w w βββ?,,?,?10 使式(2)的离差平方和w Q 达极小。所得加权最小二乘经验回归方程记做 22011 1 ???()()N N w i i i i i i i i Q w y y w y x ββ===-=--∑∑22 __ 1 _ 2 _ _ 02 222 ()() ?()?1 11 1 ,i i N w i i i w i w i w w w w w kx i i i i m i i i m i w x x y y x x y x w kx x kx w x σβββσσ==---=-= = ===∑∑1N i =1 1表示=或

数理统计例题(1)

例题解析(1) 例1设随机变量X 和Y 相互独立,),(~),,(~2 22211σμσμN Y N X 。 1621,,,X X X 是X 的一个样本,1021,,,Y Y Y 是Y 的一个样本,测得数据 ∑∑∑∑========10 1 2 10 1 16 1 2 16 1 72,18,563,84i i i i i i i i y y x x (1)分别求21,μμ的矩估计量;(2)分别求2 221σσ,的极大似然估计值; (3)在显著水平05.0=α下检验假设 2 2210σσ≤:H ,22211σσ>:H 。 解 (1)用样本一阶原点矩估计总体一阶矩,即得1μ和2μ的矩估计值: 8.1101?,25.5161?10 1 21611=====∑∑==i i i i y x x μμ 。 (2)正态总体),(~2σμN X 的参数2σ的极大似然估计量为 ∑=-==n i i X X n 1 22 )(1?σ 。因此2 221σσ和的极大似然估计值为 625.716161)(161?1611222 21 =?? ? ??-=-=∑∑==i n i i i x x x x σ 96.316101)(101?1011222 22 =?? ? ??-=-==∑∑==i n i i i y y y y σ (3)是21,μμ未知,双总体方差的假设检验。待检假设2 2210σσ≤:H ; 2 2 211σσ>:H ,是在05.0=α下的单侧检验。 因为4.4)(91,31.8)(1511 21221221 =-==-=∑∑==n i n i i y y S x x S 。所以F 同机量得 值 847.14.415 .822 21===S S F 查F 分布表,得01.391505.0=),(F .经比较知,01.3)9,15(847.105.0=<=F F ,故接 受0H ,认为2 221σσ不比大。

概率论与数理统计经典考试题型

概率论经典考试题型 一,选择题 1 设A 、B 为互不相容的事件,且()0,()0,P A P B >>下面四个结论中, 正确的是( ) (A)(|)0P B A > (B)(|)0P A B = (C)(|)()P A B P A =(D)()()()P AB P A P B = 如果A 、B 为互不相容的事件,且 ()0,()0,P A P B >>则上述不正确的是( ) 2 总体),(~2 σμN X ,n X X X ,,,21 是来自总体的样本, ∑==n k k X n X 1 1,则n X /σμ- ~ ( ) (A) ),(2σμN (B) )1,0(N (C) )(n t (D) )1(-n t 3. 已知相互独立的随机变量 ~(1,16), Y ~(2,9), (2)X N N D X Y -=则

。 4. 设3.0)(=A P , 6.0)(=B P , 且事件A 与B 互不相容, ()P A B ?=则 。 5. 已知随机变量X 的概率密度为 2,0,()0,0.x ae x f x x -?>=?≤? 则a = . 6. 设随机变量X 满足2(),()E X D X μσ==, 则由切比雪夫不等式,有{||3}P X μσ-≥≤ 。 7.设总体),(~2σμN X ,2,σμ未知, n X X X ,,,21 是来自总体 X 的样本, 则 μ的矩估计量是 ,2σ最大似然估 计量 。

8 电路由电池A 、B 及两个并联的电池C 、D 串联而成, 设电池A, B, C, D 损坏与否是 相互独立的, 且它们损坏的概率依次为0.3, 0.2, 0.2, 0.5, 求这个电路发生间断的概率. 9 已知(,)X Y 的联合分布率如下: 求(1)边缘分布率; (2))(),(X D X E ; (3) Z X Y =+的分布率。

应用回归分析-第9章课后习题答案

第9章 含定性变量的回归模型 思考与练习参考答案 9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。出现这种情况的原因是什么? 答:假如这个含有季节定性自变量的回归模型为: t t t t kt k t t D D D X X Y μαααβββ++++++=332211110 其中含有k 个定量变量,记为x i 。对春夏秋冬四个季节引入4个0-1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为: ????? ? ?? ?? ? ?=00011001011000101001 0010100011 )(6 165154143 132121 11k k k k k k X X X X X X X X X X X X D X, 显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。 当某自变量x j 对其余p-1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型。称Tol j =1-2 j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0.0001。也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。 ??? ??? ? ??=k βββ 10β??? ??? ? ??=4321ααααα

数理统计学试题 答案

第一学期成人本科 数理统计学试题 一、选择题(每题1分,共30分) 1、样本是总体中:(D) A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指:(C) A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是:(E) A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是:(B) A、观察单位 B、数值变量 C、名义变量D.等级变量E.研究个体 5、疗效是:(D) A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、抽签的方法属于(D) A、分层抽样 B、系统抽样 C、整群抽样 D、单纯随机抽样 E、二级抽样 7、统计工作的步骤正确的是(C) A、收集资料、设计、整理资料、分析资料 B、收集资料、整理资料、设计、统计推断 C、设计、收集资料、整理资料、分析资料 D、收集资料、整理资料、核对、分析资料 E、搜集资料、整理资料、分析资料、进行推断 8、实验设计中要求严格遵守四个基本原则,其目的是为了:(D) A、便于统计处理 B、严格控制随机误差的影响 C、便于进行试验 D、减少和抵消非实验因素的干扰 E、以上都不对 9、对照组不给予任何处理,属(E) A、相互对照 B、标准对照 C、实验对照 D、自身对照 E、空白对照 10、统计学常将P≤0.05或P≤0.01的事件称(D) A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件 11、医学统计的研究内容是(E) A、研究样本 B、研究个体 C、研究变量之间的相关关系 D、研究总体 E、研究资料或信息的收集.整理和分析 12、统计中所说的总体是指:(A) A、根据研究目的确定的同质的研究对象的全体 B、随意想象的研究对象的全体 C、根据地区划分的研究对象的全体 D、根据时间划分的研究对象的全体 E、根据人群划分的研究对象的全体 13、概率P=0,则表示(B) A、某事件必然发生 B、某事件必然不发生 C、某事件发生的可能性很小 D、某事件发生的可能性很大 E、以上均不对 14、总体应该由(D) A、研究对象组成 B、研究变量组成 C、研究目的而定 D、同质个体组成 E、个体组成 15、在统计学中,参数的含义是(D)

一元线性回归模型习题及答案.doc

一元线性回归模型 一、单项选择题 1、变量之间的关系可以分为两大类__________。A A 函数关系与相关关系 B 线性相关关系和非线性相关关系 C 正相关关系和负相关关系 D 简单相关关系和复杂相关关系 2、相关关系是指__________。D A 变量间的非独立关系 B 变量间的因果关系 C 变量间的函数关系 D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。A A 都是随机变量 B 都不是随机变量 C 一个是随机变量,一个不是随机变量 D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。C A 01???t t Y X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+ 5、参数β的估计量?β 具备有效性是指__________。B A ?var ()=0β B ?var ()β为最小 C ?()0β β-= D ?()ββ-为最小 6、对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示回归值,则__________。B A i i ??0Y Y 0σ∑ =时,(-)= B 2 i i ??0Y Y σ∑=时,(-)=0 C i i ??0Y Y σ∑=时,(-)为最小 D 2 i i ??0Y Y σ∑=时,(-)为最小 7、设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是__________。D A ()()()i i 1 2 i X X Y -Y ?X X β--∑∑= B ()i i i i 1 2 2 i i n X Y -X Y ?n X -X β∑∑∑∑∑= C i i 1 2 2 i X Y -nXY ?X -nX β∑∑ = D i i i i 1 2 x n X Y -X Y ?βσ ∑∑∑= 8、对于i 01i i ??Y =X +e ββ+,以 ?σ表示估计标准误差,r 表示相关系数,则有__________。D A ?0r=1σ =时, B ?0r=-1σ =时, C ?0r=0σ =时, D ?0r=1r=-1σ =时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?Y 356 1.5X -=,这说明__________。D

概率论与数理统计重点总结及例题解析

概率论与数理统计重点总结及例题解析 一:全概率公式和贝叶斯公式 例:某厂由甲、乙、丙三个车间生产同一种产品,它们的产量之比为3:2:1,各车间产品的不合格率依次为8%,9%, 12% 。现从该厂产品中任意抽取一件,求:(1)取到不合格产品的概率;(2)若取到的是不合格品,求它是由甲车间生产的概率。(同步45页三、1) 解:设A1,A2,A3分别表示产品由甲、乙、丙车间生产,B表示产品不合格,则A1,A2,A3为一个完备事件组。P(A1)=1/2, P(A2)=1/3, P(A3)=1/6, P(B| A1)=0.08,P(B| A2)=0.09,P(B| A3)=0.12。 由全概率公式P(B) = P(A1)P(B|A1)+ P(A2)P(B| A2)+ P(A3)P(B| A3) = 0.09 由贝叶斯公式:P(A1| B)=P(A1B)/P(B) = 4/9 练习:市场上出售的某种商品由三个厂家同时供货,其供应量第一厂家为第二厂家的2倍,第二、三两厂家相等,而且第一、二、三厂家的次品率依次为2%,2%,4%。若在市场上随机购买一件商品为次品,问该件商品是第一厂家生产的概率是多少?(同步49页三、1)【0.4 】

练习:设两箱内装有同种零件,第一箱装50件,有10件一等品,第二箱装30件,有18件一等品,先从两箱中任挑一箱,再从此箱中前后不放回地任取2个零件,求:(同步29页三、5) (1)取出的零件是一等品的概率; (2)在先取的是一等品的条件下,后取的仍是一等品的条件概率。 解:设事件i A ={从第i 箱取的零件},i B ={第i 次取的零件是一 等品} (1)P(1 B )=P(1 A )P(1 B |1 A )+P(2 A )P(1 B |2 A )=5 230 182150 10 21= + (2)P(1 B 2 B )= 194 .02121230 2 182 50 2 10=+ C C C C ,则P(2 B |1 B )= ) ()(121B P B B P = 0.485 二、连续型随机变量的综合题 例:设随机变量X 的概率密度函数为 ?? ?<<=others x x x f 02 0)(λ 求:(1)常数λ;(2)EX ;(3)P{1

相关文档
相关文档 最新文档