第十二章相关与回归分析
一、填空
1.如果两变量的相关系数为0,说明这两变量之间_____________。
2.相关关系按方向不同,可分为__________和__________。
3.相关关系按相关变量的多少,分为______和复相关。4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
6.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。
7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值
c
Y是
服从();(2)分布中围绕每个可能的
c
Y值的()是相同的。
7.已知:工资(元)倚劳动生产率(千元)的回归方程为
x
y
c
80
10+
=,因此,当劳动生产率每增长1千元,工资就平
均增加80 元。
8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。这种分析方法,通常又称为(回归分析)。
9.积差系数r是(协方差)与X和Y的标准差的乘积之比。
二、单项选择
1.欲以图形显示两变量X和Y的关系,最好创建(D )。A 直方图 B 圆形图 C 柱形图 D 散点图2.在相关分析中,对两个变量的要求是(A )。
A 都是随机变量
B 都不是随机变量
C 其中一个是随机变量,一个是常数
D 都是常数
3. 相关关系的种类按其涉及变量多少可分为( )。
A. 正相关和负相关
B. 单相关和复相关
C. 线性相关和非线性相关
D. 不相关、不完全相关、完全相关4.关于相关系数,下面不正确的描述是(B )。
A当0≤
≤r1时,表示两变量不完全相关;B当r=0时,表示两变量间无相关;
C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。
5. 当变量X按一定数量变化时,变量Y也随之近似地以固定的数量发生变化,这说明X与Y之间存在( )。
A. 正相关关系
B. 负相关关系
C. 直线相关关系
D. 曲线相关关系
6.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在(A )关系。
A 直线正相关
B 直线负相关
C 曲线正相关
D 曲线负相关
7.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示( C )。
A 无相关
B 低度相关
C 中等相关
D 高度相关
8.两变量的相关系数为0.8,说明( )
A.两变量不相关
B.两变量负相关
C.两变量不完全相关
D.两变量完全正相关
9.两变量的线性相关系数为0,表明两变量之间(D )。
A 完全相关
B 无关系
C 不完全相关
D 不存在线性相关
10.兄弟两人的身高之间的关系是( )A.函数关系 B.因果关系 C.互为因果关系 D.共变关系
11.身高和体重之间的关系是(C )。A 函数关系 B 无关系 C 共变关系 D 严格的依存关系12.下列关系中,属于正相关关系得是(A )。
A 身高与体重
B 产品与单位成本
C 正常商品的价格和需求量
D 商品的零售额和流通费率
13如果变量x和变量y之间的皮尔逊相关系数为-1,说明这两个变量之间是()
A.低度相关
B.完全相关
C.高度相关
D.完全不相关
28.定类变量的相关分析可以使用()A. λ系数 B. ρ系数 C. r系数 D. τα系数14.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有(D )。
A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。
15. 一元一次回归方程Y=a+bx中的a表示( )。 A. 斜率B. 最小平均法C. 回归直线D. 截距
16.当所有的观察值y都落在直线bx
a
y
c
+
=
上时,则x与y之间的相关系数为(B)。
A、r=0
B、r=1
C、-1 D、0 17.回归直线方程XC=c+dY,其中Y为自变量,则( ) A.可以根据Y值推断X B.可以根据X值推断Y C.可以互相推断 D.不能进行推断 18.对于有线性相关关系的两变量建立的直线回归方城Y=a+bx中,回归系数b (B )。 A.肯定是正数B.显著不为0 C.可能为0 D.肯定为负数 19.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均() A.增加70元 B.减少70元 C.增加80元 D.减少80元 20产量X(千件)与单位成本Y(元)之间的回归方程为Y=77-3X,这表示产量每提高1000件,单位成本平均( ) A.增加3元 B.减少3000元 C.增加3000元 D.减少3元 21.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为(C )。A 0.50 B 0.80 C 0.64 D 0.90 22.在完成了构造与评价一个回归模型后,我们可以( D )。 A 估计未来所需样本的容量 B 计算相关系数和判定系数 C 以给定的因变量的值估计自变量的值 D 以给定的自变量的值估计因变量的值 23.对相关系数的显著性检验,通常采用的是(①)① T检验② F检验③ Z 检验 24.回归估计标准误差的计量单位与( ) A.自变量相同 B.因变量相同 C.相关系数相同 D.自变量、因变量及相关系数均不同 25.在回归分析中,两个变量(D )。 A 都是随机变量 B 都不是随机变量 C 自变量是随机变量 D 因变量是随机变量 26.已知变量X和Y之间的关系如图所示,则变量X和Y的相关系数为(D )。 A、0.29 B、-0.86 C、1.04 D、0.91 27.一元线性回归模型和多元线性回归模型的区别在于只有一个(B )。 A 因变量 B 自变量 C 相关系数 D 判定系数 28.以下指标恒为正的是(D )。A 相关系数r B 截距a C 斜率b D 复相关系数 29.对两变量进行回归分析时,( ) A.前提是两变量之间存在较高的相关关系 B.其中任一变量都可以成为自变量或因(依)变量 C.两变量都是随机变量 D.一变量是随机变量,另一变量是非随机变量 E.一变量是自变量,另一变量是因(依)变量 三、多项选择 1.判定现象之间有无相关系数的方法是(ABC )。 A、对客观现象作定性分析 B、编制相关表 C、绘制相关图 D、计算相关系数 E、计算估计标准误 2.回归分析和相关分析的关系是(ABE )。 A 回归分析可用于估计和预测 B 相关分析是研究变量之间的相互依存关系的密切程度 C 回归分析中自变量和因变量可以互相推导并进行预测 D 相关分析需区分自变量和因变量 E 相关分析是回归分析的基础 3.关于积差系数,下面正确的说法是(ABCD )。 A 积差系数是线性相关系数 B 在积差系数的计算公式中,变量X 和Y 是对等关系 C 积差系数具有PRE 性质 D 在积差系数的计算公式中,变量X 和Y 都是随机的 4.关于皮尔逊相关系数,下面正确的说法是(ACE )。 A 皮尔逊相关系数是线性相关系数 B 积差系数能够解释两变量间的因果关系 C r 公式中的两个变量都是随机的 D r 的取值在1和0之间 E 皮尔逊相关系数具有PRE 性质,但这要通过r 2加以反映 5.简单线性回归分析的特点是( ABE )。 A 两个变量之间不是对等关系 B 回归系数有正负号 C 两个变量都是随机的 D 利用一个回归方程,两个变量可以互相推算 E 有可能求出两个回归方程 6.反映某一线性回归方程y=a+bx 好坏的指标有(ABD )。 A 相关系数 B 判定系数 C b 的大小 D 估计标准误 E a 的大小 7.模拟回归方程进行分析适用于(ACDE )。 A 变量之间存在一定程度的相关系数 B 不存在任何关系的几个变量之间 C 变量之间存在线性相关 D 变量之间存在曲线相关 E 时间序列变量和时间之间 8.判定系数r 2=80%和含义如下(ABC )。 A 自变量和因变量之间的相关关系的密切程度 B 因变量y 的总变化中有80%可以由回归直线来解释和说明 C 总偏差中有80%可以由回归偏差来解释 D 相关系数一定为0.64 E 判定系数和相关系数无关 9.以下指标恒为正的是(BC )。 A 相关系数 B 判定系数 C 复相关系数 D 偏相关系数 E 回归方程的斜率 10.一元线性回归分析中的回归系数b 可以表示为(BC )。 A 两个变量之间相关关系的密切程度 B 两个变量之间相关关系的方向 C 当自变量增减一个单位时,因变量平均增减的量 D 当因变量增减一个单位时,自变量平均增减的量 E 回归模型的拟合优度 11.关于回归系数b ,下面正确的说法是(AE )。 A b 也可以反映X 和Y 之间的关系强度。; B 回归系数不解释两变量间的因果关系; C b 公式中的两个变量都是随机的; D b 的取值在1和-1之间; E b 也有正负之分。 12、如果两个变量之间有一定的相关性,则以下结论中正确的是 ( ①②③ ) ①、回归系数b 的绝对值大于零 ②、判定系数2 R 大于零 ③、相关系数r 的绝对值大于0.3 13、当所有的观察值都落在回归直线x y ββ)))10+=上时,下述备选答案成立的有(②③ ) ①r=0 ② ∣r ∣= 1 ③s y =0 五、判断题 1.相关关系和函数关系都属于完全确定性的依存关系。( ) 2.不管相关关系表现形式如何,当r =1时,变量X 和变量Y 都是完全相关。(√ ) 3.不管相关关系表现形式如何,当r =0时,变量X 和变量Y 都是完全不相关。(× ) 4.若x 与y 之间的相关系数r=-0.9,表示二者“不相关”。( ) 5.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y 的相对频数条件分布相同,且和它的相对频数边际分布相同。 (× ) 6.如果众数频数集中在条件频数分布列联表的同一行中,λ系数便会等于0,从而无法显示两变量之间的相关性。 ( √ ) 7.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。 ( √ ) 8.不论是相关分析还是回归分析,都必须确定自变量和因变量。( ) 9.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。 (× ) 10、 在回归分析中,通常假定N ~ε (0, σ2)。( √ ) 11.只有当两个变量之间存在较高程度的相关关系时,回归分析才有意义。( ) 六、计算题 1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。 解:①相对频数的联合分布列联表 ②转化为相对频数的条件分布列联表 ③民族音乐的态度与被调查者的年岁有关系 2.已知直线回归方程bx a y c +=中,b =17.5;又知n =30,∑=13500y ,12=x ,则可知a = 。答案:240 解:根据正规方程组中的一个方程: ∑∑+=x b na y 两边同除以n 并移项后得