文档库 最新最全的文档下载
当前位置:文档库 › 大学统计学复习资料8相关

大学统计学复习资料8相关

大学统计学复习资料8相关
大学统计学复习资料8相关

一.填空题

1. 若全部观察值都落在直线上,则相关系数等于(±1)

2. 按相关的方向分,相关关系可分为(正相关)和(负相关)。

3. 相关系数为“-1”时,表示(完全负相关 )相关。

4. 相关系数是在(线性) 相关条件下用来说明两个变量相关(关系 )的统计分析指标。

5. 估计标准误差是用来说明(回归方程)代表性大小的统计分析指标。

6. 相关系数是在(线性)相关条件下,用来说明两个变量相关(强度)的统计分析。

7. 现象之间的相关关系按相关的程度分有 相关 、 相关和_____ 相关;按相关的方向分有 相关和 相关 ;按相关的形式分有____ 相关和 相关;按影响因素的多少分有 相关和 相关。

完全相关、不完全相关、不相关;正相关、负相关;线性相关、非线性相关;单相关、复相关

8. 完全相关即是 相关,其相关系数为 。函数、±1

9. 相关系数是在 相关条件下用来说明两变相关 的统计分析指标。 线性、密切程度

10. 当变量X 值增加,变量Y 值也增加,这是 相关关系;当变量X 值减少,变量Y

值也减少,这是 相关关系。正、正

11. 在回归分析中,两变量不是对等的关系,其中因变量是 变量,自变量是

( )量 。随机、可控制的

13. 用来说明回归方程代表性大小的统计分析指标是 指标。估计标准误;

14. 当变量X 按一定数额变动时,变量Y 也按一定的数额变动,这时变量X 与变量Y 存在着

关系。直线相关

15. 一个回归方程只能作一种推算,即给出 的数值,估计 的可能性。

自变量、因变量

16. 已知X 变量的标准差为2,因变量的标准差为5,两变量的相关系数为0.8,则回归系数为

( )2

17. 已知直线回归方程Yc = a +bx 中,b= 17.5;又知n=30 ∑=13500 ,X =12 ,则可

知a = 。240 二.简答题

1. 说明相关系数的取值范围及其判断标准。

(1).相关系数的数值范围是在-1 和+1之间,即-1 ≤ R ≤1 ,R >0为正相关,R <0为负相关。

(2).判断标准:|R|<0.3 为微弱相关,0。3<|R|<0。5为低度相关 ;

0.5<|R|<0。8这显著相关,0。8 <|R|<1为高度相关; |R| =0时,不相关,|R|=1时完全相关。

2. 相关关系与函数关系有什么区别?

函数关系是现象之间的一种确定性的关系,相关关系是现象之间的一种不 确定性的关系,函数关系一般表现为相关关系 3. 什么是相关系数及其计算公式?

相关系数是在直线相关条件下,说明两个现象之间相关关系密切程度的统计分析指标。

y

x xy r σσσ=

4. 相关关系的主要特征是什么?

①二现象之间存在一定的依存关系。②但它们不是确定的和严格依存的。

5.相关系数具有什么特点?

(1)两个变量是对称的,不分自变量与因变量,因此,相关系数只有一个。

(2)相关系数有正负号之分,反映正相关与负相关。3若以抽样调查取得资料,则两个变量都应是相同的随机变量。

6.简述估计标准误差

2

)

(2

-

-

=

n

y

y

yx

c

S

的作用。

(1)说明回归估计值的准确程度,

yx

S

值愈小,说明估计值与实际值平均误差愈小,估计

的准确程度愈高,反之,估计的准确程度低。

(2)说明回归直线的代表性大小。

(3)说明x与y的相关密切程度。

(4)在抽样条件下,它是回归抽样误差的一个估计值。

7. 相关关系的主要特征是什么?

①二现象之间存在一定的依存关系。②但它们不是确定的和严格依存的。

三.判断题

1.利用一个回归方程,两个变量可以互相推算。×

2. 计算相关系数的两个变量都是随机变量。√

3. 根据结果标志对因素标志的不同反映,可以把现象总体数量上的依存关系分为函数关

系和相关关系。()√

4. 正相关指的就是因素标志和结果标志的数量变动方向都是上升的。()×

5.相关系数是测定变量之间相关密切程度的唯一方法。()×

6. 只有当相关系数接近于+1时,才能说明两变量之间存在的高度相关关系。若变量X的

值减少时变量Y的值也减少,说明变量X与Y之间存在正的相关关系。()×

7. 若变量X的值减少时变量Y的值也减少,说明变量X与Y之间存在正的相关关系。()×

8. 回归系数和相关系数都可以用来判断现象之间相关的密切程度。()√

9. 若直线回归方程Yc=170-2.5x,则变量度和之间存在负的相关关系。×

10. 按直线回归方程Yc = a +bx配合的直线,是一休具有平均意义的直线。()√

11. 回归分析中,对于没有明显关系的两个变量,可以建立倚变动和倚变动的两个回归方程。()√

12. 由变量 Y变量X回归和由变量X倚变量Y回归所得到的回归方程之所以不同,主要是因为方程中参数表示的意义不同。()√

13. 估计标准误指的就是实际值 y与估计值yc 的平均误差程度。()√

14. 在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。()×

15. 研究发现,花在看电视上的小时数与阅读测验得分之间是负相关,因而可以认为看电视是使阅读能力降低的原因。×

16.根据航班正点率(%)与旅客投诉率(次/万名)建立的回归方程为:

y?= 6.02-0.07x,

其中回归系数为-0.07,表示旅客投诉率与航班正点率之间是低度相关。√

四.单项选择题

1. 产品产量与单位成本之间的简单相关系数为-0.92 ,并通过检验,这说明二者之间存在着( A )。

A 、高度相关

B 、中度相关

C 、低度相关

D 、极弱相关

2. 当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()

A相关关系

B函数关系

C回归关系

D随机关系

B

3. 现象之间的相互关系可以归纳为两种类型,即()

A相关关系和函数关系

B相关关系和因果关系

C相关关系和随机关系

D函数关系和因果关系

A

4.相关系数的取值范围是()

A、0≤R≤1

B、-1<R<1

C、-1≤R≤1

D、 -1≤R≤0

A

5. 变量之间的相关程度越低,则相关系数的数值()

A越小

B越接近于0

C越接近于-1

D越接近于1

B

6. 在价格不变的条件下,商品销售额和销售量之间存在着()

A不完全的依存关系

B不完全的随机关系

C完全的随机关系

D完全的依存关系

B

7. 下例哪两个变量之间的相关程度高()

A商品的销售额与商品销售量的相关系数是0.9;

B商品销售额与商业利润率的相关系数是0.84;

C平均流通费用率与商业利润率的相关系数是-0.94;

D商品销售价格与销售量的相关系数是-0.91

D

8. 回归分析中的两个变量()

A都是随机变量

B关系是对等的

C都是给定的量

D一个是自变量,一个是因变量

C

9. 每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为:Yc=56+8X

这意味着()

A废品率每增加1%,成本每吨增加64元

B废品率每增加1%,成本每吨增加8%

C废品率每增加1%,成本每吨增加8元

D如果废品率增加1%,则每吨成本为56元

C

10. 某校对学生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的

直线回归方程为:Yc=180-5X,该方程明显有错,错误在于()

A、a值的计算有误,b值是对的

B、b值的计算有误,a值是对的

C、a值和b值的计算都有误

D、自变和因变量的关系搞错了

C

11. 配合回归方程对资料的要求是()

A因变量是给定的数值,自变量是随机的

B自变量是给定的数值,因变量是随机的

C自变量和因变量都是随机的

D自变量和因变量都是不随机的

B

12. 估计标准误说明回归直线的代表性,因此()

A估计标准误数值越大,说明回归直线的代表性越小;

B估计标准误数值越大,说明回归直线的代表性越小;

C估计标准误数值越小,说明回归直线的代表性越小;

D估计标准误数值越小,说明回归直线的实用价值小。

B

13.相关系数的值总是()

A.≥0 B.≤1 C.在0和1之间

D.在-1和1之间 E.等于1

14. 对于一给定的数据集合,发现变量X和Y之间的相关系数r =-0.9。这说明()

A.在X和Y之间不存在线性关系 B.X随Y的减少而增加

C.在X和Y之间存在因果关系 D.这个计算是错误的

E.X随Y的减少而减少

15.研究发现工人的性别与收入之间的相关系数r =-0.61,那么()

A.平均来看女性收入高于男性

B.平均来看女性收入低于男性

C.计算错误,这个r值不可能存在

D.这是没有意义的,因为r在这里无意义

E.这里相关系数-0.61没有太大意义,因为性别和收入之间的相关系数可能是非线性的16.如果体重和收入之间的相关系数很高并且是正的,那么说明()

A.高收入使人们吃更多的食物

B.低收入使人们吃更少的食物

C.一般来看,高收入人群花费在食物上的收入比例大于低收入人群

D.一般来看,高收入人群比低收入人群重

E.高收入使人的体重增加

17.一数据集合的散点图如下:观察到的图形是()

A.非线性的并且含有几个异常值

B.非线性的并且至少含有一个有影响的观测值

C.近似线性并且有正的斜率

D.近似线性但有几个异常值

E.近似线性并且有负的斜率

18. 20世纪50年代美国失业率的散点图如下,下列陈述中正确的是:()

A.在此期间失业率是常数

B.在此期间失业率随时间减少

C.失业率和时间之间存在适度正相关

D.A和C都正确

E.B和C都正确

19. 当水流过农田时,一些土壤会随之流走,从而导致侵蚀。做实验研究水流速度对土壤流

失量的影响,水流用升/秒度量,而被侵蚀的土壤用千克来度量。数据如下表:

在流速和被侵蚀的土壤量之间的关系是:()

A.正的B.负的

C.即不是正的也不是负的 D.无法确定

20. 相关系数度量()

A.两个变量之间是否存在关系 B.散点图是否显示有意义的模型

C.两个变量之间是否存在因果关系D.两个变量之间直线关系的强度

21. 欲确定身高(厘米)和体重(千克)之间的相关系数,对两个21岁的男性的测量结果

如下:

身高 178 191

体重 60 75

二者之间的相关系数是()

A . 1.0 B.正的且在0.25和0.75之间

C.近似于0,但可能是正的也可能是负的 D.0

22. 一位同学想知道约会的男女之间身高是否相似。她测量了自己,她的室友和相邻房间

的女性的身高;然后又测量了每位女性下一位约会男性的身高。数据如下:

女 168 163 168 165 178 165

男 183 173 178 173 188 175

下列陈述中正确的是()

A.测量的变量是类别型的

B.男女之间的身高存在强正相关,因为女性总是比她们所约会的男性矮

C.男女之间的身高存在正相关

D.相关系数在这里没有意义,因为性别是类别型的

23. 下列陈述中正确的是()

A.相关系数等于两个变量落在同一条直线上的次数的比例

B.只有当所有数据都在一条完全水平的直线上时,相关系数才是+1.0

C.相关系数测量出现在散点图上的异常点的部分

D.相关系数是一个无单位的数,并且总是在[-1.0,+1.0]内

24. 下列陈述中正确的是()

A.改变x或y的度量单位,不会改变相关系数的值

B.负的相关系数说明数据是强无关的

C.相关系数总是和x变量有相同的单位,而不是和y变量一样

D.相关系数总是和y变量有相同的单位,而不是和x变量一样

25. 关于下面的变量X和Y散点图的结论正确的是()

A.因为二者之间几乎是完全相关的,所以X和Y之间的相关系数必接近于1

B.因为二者之间几乎是完全相关的,所以X和Y之间的相关系数必接近于-1

C.X和Y之间的相关系数接近于0

D.X和Y之间的相关可能在-1和+1之间的任何数值。在不知道实际值的情况下我们无法做出具体判断

26. 下面关于相关系数r的陈述正确的是()

A.它是相关的强测度

B.-1≤r≤1

C.如果r是X和Y之间的相关系数,那么-r是Y和X之间的相关系数

D.以上都正确

27. 下面哪一个数据集合中X和Y的相关系数r等于1?()

A.X:-1 0 1 B.X:1 2 3 C.X:1 2 3 D.X:-2 0 2 Y: 3 4 5 Y:-1 -2 -3 Y:1 -2 1 Y:6 0 6

28. 对某班级的调查发现学社身高和他所带的硬币数之间的相关系数为r =-0.30,据此可

出结论()

A.矮个子的人倾向于花更多的钱

B.这是错的,因为-0.30的相关系数没有意义

C.带着硬币抑制身高

D.这是错的,因为身高和硬币之间的相关系数无法计算

E.高个子的人倾向于有更少的钱。

29. 相关系数给出了()

A.一个变量变化导致的另一个变量变化的测量。

B.两个类别型变量之间的线性联系强度的测量。

C.两个类别型变量之间的联系强度的测量。

D.两个定量变量之间的线性联系强度的测量。

E.一个定量变量和一个类别型变量之间线性联系强度的测量。

30. 两个奥运会的运动员在每个运动项目上打平,比分总是相同的。但不同项目的实际分数

不同。这两个运动员的分数之间的相关系数是()

A.1.0 B.0.0 C.-1.0 D.无法确定 E.0.5

31. 相关系数是两个定量变量之间的线性关系的强度和方向的一个测度。由变量x和y所表

示的一组数据点之间的相关系数r =0.95,这说明()

A.x值越大,对应的y值越小。

B.在x和y之间存在强线性关系,x值越大,对应的y值越大。

C.不能证明x和y之间有线性关系。

D.x和y之间存在强线性关系,x值越大,对应的y值越小。

E.所有数据点都在同一条直线上。

32. 如果两个变量的联系方式是非线性的,相关系数:()

A.总是负的 B.可以计算,但不能解释关系的本质

C.在-1和+1之间 D.总是正的 E.无法计算

33. 根据观测数据发现房子的出售价格和房子中卧室的数量之间是正相关的。所以有

()

A.较多的卧室使得房子的价格更贵

B.高价格使得房子中有更多的卧室

C.有三间卧室的房子总是比有两间卧室的房子贵

D.房子的售价越高,房子中卧室的数量越多

E.房子的售价越高,房子中卧室的数量越少

34. 为了研究高血压和心血管疾病之间的联系,对一组年龄在35到64岁之间的男性进行了为

期5年的跟踪调查,得出下表中的数据:

根据这些数据,下列陈述中正确的是( )

A .这些数据表明血压和由心血管疾病造成的死亡之间有联系

B .高血压男性的死亡率是低血压男性的死亡率的5倍

C .这些数据可能低估了高血压和由心血管疾病造成的死亡之间联系,因为男性倾向于

低报他们的真实血压 D .以上都对

35. 已知变量x 和y 之间的相关系数为0.83,那么新的变量x* =x/10和y* =5y 之间的相关系数

为( )

A .0.083

B .0.83

C .0.415

D .无法确定 36. 若回归直线方程中的回归系数b = 0时,则相关系数( ) ① r = 1 ② r = -1 ③r = 0 ④ r 无法确定 37. 下列属于相关现象的是( )

① 利息与利率 ② 居民收入与储蓄存款

③ 电视机产量与鸡蛋产量 ④ 某种商品的销售额与销售价格 38. 当γ= 0.8时,下列说法正确的是( )

① 80%的点都密集在一条直线的周围 ② 80%的点高度相关 ③ 其线性程度是γ= 0.4的两倍 ④ 两变量高度正线性相关

39. 在直线回归方程y ?= a +b x 中,回归系数b 表示( )

① 当x = 0时y 的平均值 ②x 变动一个单位时y 的变动总量 ③ y 变动一个单位时x 的平均变动量 ④x 变动一个单位时y 的平均变动量 40. 回归估计标准差

e

s 的值越小,判定系数γ2

的值越大,则回归直线( )

① 拟合程度越低 ② 拟合程度越高

③ 拟合程度有可能高有可能低 ④ 用回归方程进行预测越不准确 41. 如果相关系数γ为负,说明( )

①y 一般小于x ②x 一般小于y

③ 随着一个变量增加,另一个变量减少 ④ 随着一个变量减少,另一个变量也减少

42.已知x与y之间存在负相关关系,指出下列哪一个回归方程肯定是错误的()

y?=-20-0.82x②y?= 300-1.82x③y?=-150+0.75x④y?= 87-0.32x

43. 若协方差

)

)(

(y

y

x

x-

-

∑大于0,则两变量之间的相关关系是()

①正相关②负相关③高度相关④低度相关

44. 由同一资料计算的相关系数

γ与回归系数b之间的关系是()

γ大b也大②γ小b也小③γ与b同值④γ与b同符号

45. 居民收入与储蓄额之间的相关系数可能是()

①-0.9247 ② 0.9247 ③-1.5362 ④ 1.5362

46. 下列关系中属于负相关的有()

①总成本与原材料消耗量②合理范围内的施肥量与农产量

③居民收入与消费支出④产量与单位产品成本

47. 某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为0.6,则()

①体重越重,运动员平均能举起的重量越多

②平均来说,运动员能举起其体重60%的重量

③如果运动员体重增加10公斤,则可多举6公斤的重量

④举重能力的60%归因于其体重

48. 具有因果关系的现象()

①必然具有函数关系②必然具有相关关系

③必然具有线性相关关系④必然具有非线性相关关系

49. 对具有因果关系的现象进行回归分析时()

①只能将原因作为自变量②只能将结果作为自变量

③二者均可作为自变量④没有必要区分自变量

50. 对于有线性相关关系的两变量建立的直线回归方程

y?= a+b x中,回归系数b ()

①可以小于0 ②只能是正数③可以为0 ④只能是负数

51. 大样本条件下,回归估计置信区间的上下限()

①是对称地落在回归直线两侧的两条喇叭型曲线

②是对称地落在回归直线两侧的两条直线

③是区间越来越宽的两条直线④是区间越来越宽的两条曲线

五.多项选择题

1.测定现象之间有无相关关系的方法是()

A编制相关表

B绘制相关图

C对客观现象做定性分析

D计算估计标准误

E配合回归方程

ABC

2. 直线回归分析中()

A自变量是可控制量,因变量是随机的

B两个变量不是对等的关系

C利用一个回归方程,两个变量可以互相推算

D根据回归系数可判定相关的方向

E对于没有系数可判定的两变量可求得两个回归方程

ABDE

3. 下例属于相关现象的是()

A家庭收入越多,其消费支出也越多;

B某产品产量随工人劳动生产率的提高而增加;

C流通费用率随商品销售额的增加而减少;

D生产单位产品所耗工时随劳动生产率的提高而减少

E 产品产量随生产用固定资产价值的减少而减少。

ABE

4. 直线回归方程Yc =a +bx中的称为回归函数,回归系数的作用是()

A可确定两变量之间因果的数量关系

B可确定两变量的相关方向

C可确定两变量的实际值与估计值的变异程度

D可确定因变量的实际值与估计值的变异程度

E可确定当自变量增加一个单位时,因变量的平均增加值

ABE

5. 计算相关系数时()

A相关的两个变量都是随机的

B相关的两个变量是对等的

C相关的两个变量一个是随机的,一个是可控制的量

D相关系数有正负号,可判断相关的方向

E可以计算出自变量和因变量两个相关系数

ABD

6. 可用来判断现象之间相关方向的指标有()

A估计标准误

B相关系数

C回归系数

D两个变量的协方差

E 两个变量的标准差

ABD

7. 工人的工资(元)依劳动生产率(千元)的回归方程为 Yc 10+70x,这意味着()

A 如果劳动生产率等1000元,则工人工资为70元;

B 如果劳动生产率每增加1000元,则工人的工资平均提高70元;

C 如果劳动生产率等于1000元,则工人工资增加80元;

D 如果劳动生产率等1000元,则工人工资为80元;

E 如果劳动生产率每下降1000元,则工人工资平均减少70元。 BCD

8. 在回归分析中,就两个相关变量x 与y 而言,变量y 倚变量x 的回归和变量x 倚变量y 的回归所得的两个回归方程是不同的,这种不同表现在()

A 方程中参数估计的方法不同

B 方程中参数的数值不同

C 参数表示的实际意义不同

D 估计标准误的计算方法不同

E 估计标准误的数值不同 BDE

9.估计标准误是反映()

A 回归值与实际值平均误差程度的指标

B 估计值与实际值平均误差程度的指标

C 自变量与因变量离差程度的指标

D 因变量估计值的可靠程度的指标

E 回归方程实用价值大小的指标 BCE

10. 一个由100人组成的25-64岁男子的样本,测得其身高与体重的相关系数γ为0.4671,则下列选项正确的有( )

① 较高的男子趋于较重 ② 身高与体重存在显著正相关 ③ 体重较重的男子趋于较高 ④ 身高与体重存在低度正相关 ⑤ 46%的较高的男子趋于较重

11. 回归估计标准差说明( )

① 自变量与因变量的平均离差 ② 自变量之间的平均离差 ③ 回归估计的精确度 ④ 回归方程的代表性大小 ⑤ 自变量各实际值与其估计值之间的平均差异

12. 收入水平与受教育程度之间的相关系数γ为0.6314,这种相关属于( )

① 单相关 ② 复相关 ③ 高度相关 ④ 正相关 ⑤ 显著相关 13. 如果两个变量之间完全相关,则以下结论中正确的是( )

① 相关系数γ的绝对值等于1 ② 判定系数γ2

等于1

③ 回归系数b 大于0 ④ 回归估计标准差e

s 等于1

⑤ 回归估计标准差

e

s 等于0

y?= 920 14. 根据某样本资料得产量(万件)与单位产品成本(百元)之间的回归方程为

-8x,这意味着()

①产量与单位成本之间是负相关②产量与单位成本之间是正相关

③产量为1万件时,单位成本平均为912百元

④产量每增加1万件,单位成本平均增加8百元

⑤产量每增加1万件,单位成本平均减少8百元

15. 指出下列表述哪些肯定是错误的()

y?= 80+5xγ= 0.6128 ②y?=-30+5xγ= 0.8746

y?= 80-5xγ= 0.6521 ④y?=-30+5xγ=-0.8746 ③

y?= -100-2xγ=-1.2011

16. 机床的使用年限与维修费用之间的相关系数是0.7213,合理范围内施肥量与粮食亩产量之间的相关系数为0.8521,商品价格与需求量之间的相关系数为-0.9345;则()

①商品价格与需求量之间的线性相关性最低

②商品价格与需求量之间的线性相关性最高

③施肥量与粮食亩产量之间的线性相关性最高

④施肥量与粮食亩产量之间的线性相关性最低

⑤机床的使用年限与维修费用之间的线性相关性最低

17. 理想的回归直线,应满足()

①实际值与其平均值的离差和为0②实际值与其平均值的离差平方和最小

③实际值与其估计值的离差和为0 ④实际值与其估计值的离差平方和最小

⑤平均值与其估计值的离差平方和最小

18. 下列现象具有相关关系的有()

①降雨量与农作物产量②单位产品成本与劳动生产率

③人口自然增长率与农业贷款④存款利率与存款期限

⑤利息收入与存款利率

19. 在直线回归方程中,回归系数的数值(②⑤)

①表明两变量之间的相关程度②表明两变量之间的变动比例

③表明两变量之间的密切程度④表明两变量之间的计算单位

⑤在数学上称为斜率

六.计算题

1. 某地区1991-1995年个人消费支出和收入资料如下:

要求:(1)计算个人收入与消费支出之间的相关系数 (2)配合消费支出对个人收入的直线回归方程

x y

x b y a L L b y n

y x n x y x n xy r c xx

xy 169.1998.20?998.20169

.198

.0)

)(1

)()(1(1

2222+-=-=-====---

=∑∑∑∑∑∑∑

2.某企业某种产品产量和单位成本资料如下:

(1)建立直线回归方程,指出产量每增加1000件时,单位成本如何变化?

(2)如果产量为6000件时,单位成本为多少? (3)单位成本为70

元时,产量为多少? 解:(1)建立方程:

设产量为x ,单位成本为y ,可得

千件

产量为元时当单位成本为回归直线方程为建立产量倚单位成本的预测产量元预测单位成本元单位成本下降件时表明产量每增加95.3,704545.077.35?:

)3(44.66)2(21.8,100082.136.77?y x

x y

-=-=

3.有某种水果200克,放在一定温度的容器中,每隔30分钟测量维生素c 的含量,得到如下数据:

(2)求单位时间(30分钟为一个单位)维生素减少的数量; 检验回归方程的效果。

1

-==

xx

xy L L b

4.9=-=x b y a x y

-=4.9? 根据b 的几何含义,单位时间减少一个单位的维生素含量。

4.检查

根据资料:

(1)计算相关系数,并判断相关程度

(2)建立回归方程,说明回归系数的含义

经计算得:

2740,20700,370,310,402

2=∑=∑=∑=∑=∑xy y X y X (1)

2

22

2223102070054037053104027405)()(-?-??-?=

∑-∑∑-∑∑∑-∑=

y y n x x n y x xy n γ

9558

.07400

2501300=?=

(2)设y c =a +bx

2

.52501300

)(22==∑-∑∑∑-∑=

x x n y x xy n b

4.20540

2.55310=?-=∑-∑=

-=n x b n y x b y a

x

y c 2.54.20+=∴

5.某企业某种产品产量和单位成本资料如下:

(1)建立直线回归方程,指出产量每增加1000件时,单位成本如何变化?

(2)如果产量为6000件时,单位成本为多少? (3)单位成本为70元时,产量为多少? 解:(1)建立方程:

设产量为x ,单位成本为y ,可得

千件

产量为元时当单位成本为回归直线方程为建立产量倚单位成本的预测产量元预测单位成本元单位成本下降件时表明产量每增加95.3,704545.077.35?:

)3(44.66)2(21.8,100082.136.77?y x

x y

-=-=

6.某地区1991-1995年个人消费支出和收入资料如下:

要求:(1)计算个人收入与消费支出之间的相关系数 (2)配合消费支出对个人收入的直线回归方程

x y

x b y a x x n y x xy n b y y n x x n y x xy n r n y x xy y x c 169.1013.21?013.21169.12340

2735)(987

.0328023402735

)

)()()((5

244613011327112345385

2

2

2

2

2

2

2

2

+-=-=-===--==?=---=======∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑ (1) 建立直线回归方程,指出产量每增加1000件时,单位成本如何变动?

(2) 如果产量为6000件时,单位成本为多少元?

单位成本为70元时,产量应为多少元?

()

千件。

元时,产量应为当单位成本为回归直线方程为建立产量依单位成本的预测产量:

元预测单位成本:元。件时,单位成本下降表明产量每增加95.3704545.077.35?44.6682.1100082.136.7736.7782

.12

2

y x x

y x b y a x x n y x xy n b bx a y x c -=-==-=-=--=

+=∑∑∑∑∑

8.有10个同类企业的生产性固定资产年平均价值和工业增加值资料如下:

依据资料:(1)计算相关系数,说明两变量相关的方向和程度 (2)编制直线回归方程,指出方程参数的经济意义

(3)估计生产性固定资产(自变量)为1100万元时,工业增加值的可能值。

()()()

(

)

高度正相关95

.02

2

2

2

=---=

∑∑∑∑∑∑∑y y n x x

n y

x xy n r

()

万元时,

当11008958.059.39559.3958958

.02

2

=+==-==--=

+=∑∑∑∑∑x x y x b y a x x n y x xy n b bx a y x c

9

.138011008958.059.395=?+=c y

9. 在十组母女中,测得他们的身长如下表

试求y 对x 的回归直线方程与x 对y 的回归直线方程。 为简化计算,作变换如下:

X=x-160 Y=y-160

计算如下:

7806

4723712

37810481

9

5618651

647414621

12222...L L L L b L L ,L L ,L L ,d ..)Y )(X (n

XY L ..)Y (n Y L ..)x (n X L XX XY xx

xy XY xy YY yy XX xx XY YY XX ====

=====-=-==-=-==-=-

=∑∑∑∑∑∑∑及常数项:所以可计算出回归系数故有由于变换中

10. 某市调查十个同类生产企业,其生产性固定资产平均价值与工业总产值的资料如下:

(1)计算相关系数;

(2)求出直线回归方程,如果企业的固定资产为12百万元,试估计其总产值为多少?

百万元

其总产值为百万元时当企业的固定资产为根据直线方程6883.14,12,0299

.48882

.08882.00299.4?947

.0)(1

)(1

1

2222=-===

+==-

-

-

=

∑∑∑∑∑∑∑x a y a L L b x y y n

y x n

x y x n

xy r xx

xy

y

x x x

y x y y b x a x b y a Y y X x L L L L b c c YY

X Y yy

xy 65.04.55为线归y 对78.02.35线为归对4.551.159*65.08.1582.358.158*78.01.1591

.1591608.15816065

.09

.562

.3722112+=+==-=-==-=-==+==+===

=

=

:方程直的回:直的回于是,

11. 有某种水果200克,放在一定温度的容器中,每隔30分钟测量维生素c 的含量,得到如下数据:

(1) 求y 对x 的回归直线;

(2)求单位时间(30分钟为一个单位)维生素减少的数量

1

-==

xx

xy L L b 4.9=-=x b y a

x y

-=4.9?根据b 的几何含义,单位时间减少一个单位的维生素含量。 340.某企业某种产品产量和单位成本资料如下:

(1)建立直线回归方程,指出产量每增加1000件时,单位成本如何变化? (2)如果产量为6000件时,单位成本为多少? (3)单位成本为70元时,产量为多少? 建立方程:

设产量为x ,单位成本为y ,可得

千件

产量为元时当单位成本为回归直线方程为建立产量倚单位成本的预测产量元预测单位成本元单位成本下降件时表明产量每增加95.3,704545.077.35?:

)3(44.66)2(21.8,100082.136.77?y x

x y

-=-=

12. 某高校的一项调查,得到五名同学的统计学考试成绩与其学习时间的对应

资料如下表所示:

要求:(1)建立考试成绩与学习时间的直线回归方程

(2)计算学习时间与考试成绩之间的相关系数

设学习时间为x ,学习成绩为y 则

9558

.02.54.20?4.202

.5)())((22==

+==-==--=

∑∑∑∑∑xx

xy L L r x y x b y a x x n y x xy n b

13. 以下数据记录了美国最大的旅馆业市场的客房使用率和平均房价的统计资料。

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

统计学期末考试试题和答案解析

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中,第二类错误的概率β表示( )。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

大学统计学复习题

(2) 钢产量“八五”计划提前完成的时间是多少?(可参照p83水平法) 解: (1) (1800+1800+1850+1900)/ 7200 × 100% = 102% (2) 将任四个季度的产值加起来,看是否达到7200万吨的目标。 E. g: 第四年的第二季加到第五年的第一季(上表灰色部分),如此类推,第四年第四季、第五年第一季、第二季、第三季四者之和刚好等于7200,符合要求。即“八五”计划提前完成的时间是第五年第三季。 2 C4课后习题(P94,4)某公司下属三个企业的有关资料如下表,试根据指标之间的关系计算并 3 C5 机械行业所属3个企业2000年计划产值分别为400万元、600万元、500万元。执行结果,计划完成程度分别为108%、106%、108%. 则该局3个企业平均计划完成程度为 解: 400×108%+600×106%+500×108%400+600+500×100% =532.67 1500×100%=106.5% 解:七月:15×30+25×78+35×108+45×90+55×42+65×12 360 = 37 八月:15×18+25×30+35×72+45×120+55×90+65×30360 = 44 因为八月份30~40开始,比重大了。

5 C5某厂生产某种机床配件,要经过三道工序, (1) 各加工工序的合格率分别为95.74%、92.22%、96.30%. 求三道工序的平均合格率。(可参照P113,例12) (2) 若三道工序的不合格率为4.26%,7.78%,3.70%,求三道工序的平均不合格率。 解: 合格率:3 95.74%×92.22%×96.30% = 94.7% 不合格率:1-3 (1-4.26%)×(1-7.78%)×(1-3.70%) 提示:计算平均比率或平均发展速度等具有连续性数据的平均值要用几何平均数。 6 C5例题(p114,例13)假定某地区的储蓄年利率(按复利计算)情况如下:持续1.5年为6%,接着持续4.0年为5%,然后再持续2.5年为3%。请问这8年内该地区平均储蓄年利率是多少。 解:该地区平均储蓄年利率 () %56.104%100428266.1%10003.105.106.185.20.45.15.20.45.1=?=???= ++G x %2=A x ;%4=B x 平均差:A : 5.74 2 12282327=-+--+--+-; B : 5.94 4 641245415=--+-+--+- 样本方差:V AR (A )=0.0083;V AR (B )=0.0122 总体方差:V ARP (A )=0.00625;V ARP (B )=0.00915 无论是平均差,还是样本方差和总体方差,A 股票都比B 股票的要小,故A 股票较B 股票更稳定。 8 C6 课后习题(p141,2) 新希望照明公司生产一批照明产品共10万件,为了解这批产品的质量,采取不重复抽样的方法抽取1000件进行检验,其结果如下:

统计学简答题期末复习题

1. 什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识? 统计学是一门关于统计设计、搜集、整理、分析统计数据的方法科学,其目的是探索数据内在的数量规律性,以达到对客观事物的科学认识。统计学可以通过对数据的分析达到对事务性质的认识是有客观事物本身的特点和统计方法的特性共同决定的。(1)从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。同样,任何一个数据也都是必然性与偶然性共同作用的结果,是二者作用的对立统一。(2)从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性。 2.解释总体与样本、参数和统计量的含义。 (1)总体:是我们所要研究的所有基本单位(通常是人、物体、交易或者事件)的总和,是在至少一种共性的基础上由许多独立的个别事物所组成的整体。(2)样本:是总体的一部分单位,是从总体中抽出的一部分被实际调查的子集合体。(3)参数:是对总体特征的数量描述,是研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。(4)统计量:根据样本数据计算出来的一个量,是对样本数据特征值的数量描述。 3.解释总体分布、样本分布和抽样分布的含义。 (1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总体中抽取容量为n的样本,得到n个样本观测值的概率分布,则为样本分布。(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。 4.简述描述统计学和推断统计学的概念及其联系。 (1)描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法;推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。(2)两者间联系:一方面反映了统计发展的前后两个阶段,另一方面也反映了统计方法研究和探索客观事物内在数量规律性的先后两个过程。 5. 简述中心极限定理。 中心极限定理就是对于一个抽自任意总体(均值为μ,方差为σ2),样本容量为n的随机样本。当n 充分大时(通常要求n≥30),样本均值的抽样分布将近似于一个具有μ、方差为σ2/n的正态分布。 6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。 (1)置信水平:置信区间中包含总体参数真值的次数所占的比率,也称置信系数。(2)置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间。(3)显著性水平:是指当原假设实际上正确时,检验统计量落在拒绝域的概率。联系:置信区间越宽,置信水平越高,显著性水平越低。 7. 几何平均数的适用条件分别是什么? 几何平均数的使用条件:总指标等于各个变量连乘积的值,一般用来计算社会经济问题的平均发展速度。 8. 抽样推断时为什么必须遵循随机原则抽取样本? 只有遵循随机原则从总体中抽取样本,才能排除主观因素等非随机因素对抽样调查的影响,从而使样本单位的分布接近总体单位的分布,样本对总体才具有较大的代表性。这样,根据样本的调查资料来估计和推断总体的数量特征才能较为科学和准确。 9. 简述假设检验的一般步骤。 (1)陈述原假设H0和备择假设H1;(2)从所研究的总体中抽了不起一个随机样本;(3)确定一个适当的检验统计量,并利用样本数据算出来具体数值;(4)确定一个适当的显著性水平a,并计算出其临界值,指定拒绝域;(5)将统计量的值与临界值进行比较,并做出决策:若统计量的值落在拒绝域内,拒绝原假设H0,否则不拒绝原假设H0。也可以直接利用P值作出决策,P值小于显著性水平的拒绝H0,否则不拒绝H0。

(完整版)统计学期末考试试卷

2009---2010学年第2学期统计学原理课程考核试卷(B)考核方式: (闭卷)考试时量:120 分钟 一、填空题(每空1分,共15分) 1、按照统计数据的收集方法,可以将其分为和。 2、收集数据的基本方法是、和。 3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是,中位数是。 4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率密 度函数为 0 ()1 f x b a ? ? =? ?- ? 则X的期望值为,方差为。 5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)= 。 6、概率是___ 到_____ 之间的一个数,用来描述一个事件发生的经常性。 7、对回归方程线性关系的检验,通常采用的是检验。 8、在参数估计时,评价估计量的主要有三个指标是无偏性、和 。 二、判断题,正确打“√”;错误打“×”。(每题1分,共10 分) 1、理论统计学与应用统计学是两类性质不同的统计学() 2、箱线图主要展示分组的数值型数据的分布。() 3、抽样极限误差可以大于、小于或等于抽样平均误差。() 4、在全国人口普查中,全国人口数是总体,每个人是总体单位。() 5、直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知, 仅需对分布的未知参数进行估计的问题称为参数估计。() 6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少() 7、在单因素方差分析中,SST =SSE+SSA() 8、右侧检验中,如果P值<α,则拒绝H 。() 9、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量 与边际误差成正比。() 10、当原假设为假时接受原假设,称为假设检验的第一类错误。() 三、单项选择题(每小题1分,共 15分) 1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职 工家庭的年人均收入。这项研究的样本()。 A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200个万个家庭的总收入 2、当变量数列中各变量值的频数相等时()。 A、该数列众数等于中位数 B、该数列众数等于均值 C、该数列无众数 D、该众数等于最大的数值 其他 (a

统计学试卷及答案

统计学试卷及答案 一、判断题 1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识。() 2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。 () 3.统计数据误差分为抽样误差和非抽样误差。() 4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据() 5.用来描述样本特征的概括性数字度量称为参数。() 6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数< 众数。() 7.通过散点图可以判断两个变量之间有无相关关系。() 8.所有可能样本均值的数学期望等于总体均值。() 9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变 动四种。() 10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一 种特殊相对数。() 二、单项选择题 1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。 A 100所中学 B 20个城市 C 全国的高中生 D 100所中学的高中生 2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。 A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为() A 24 B 25 C 26 D 27 4.两组数据相比较()。 A 标准差大的离散程度也就大 B 标准差大的离散程度就小 C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5.在下列指数中,属于质量指数的是()。 A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数 6.定基增长速度与环比增长速度的关系为()。 A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1 D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。 A 1.8% B 2.5% C 20% D 18% 8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍 9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。 A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是()。 A 函数关系 B 相关关系 C 没有关系 D 正比例关系 11.在回归分析中,描述因变量y如何依赖自变量x和误差项 的方程称为()。 A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的()的指标。

北华大学统计学期末复习题

一、单选题 1 以产品等级来衡量每件产品的质量好坏,则产品等级是(B )。 A 数量标志 B 品质标志C数量指标 D 质量指标 2 某市进行工业企业生产设备普查,总体单位是(B )。 A 工业企业全部生产设备 B 工业企业每一台生产设备 C 每个工业企业的生产设备 D 每一个工业企业 3 对一批食品进行质量检验,最适宜采用的调查方式是(B )。 A 全面调查 B 抽样调查 C 典型调查 D 重点调查 4 将总体按某一标志分组的结果表现为(A )。 A 组内同质性,组间差异性 B 组内差异性,组间同质性 C 组内同质性,组间同质性 D 组内差异性,组间差异性 5 企业按经济类型分组和按职工人数分组,这两个统计分组是(D )。 A 按数量标志分组 B 前者按数量标志分组,后者按品质标志分组 C 按品质标志分组 D 前者按品质标志分组,后者按数量标志分组 6 某市某年商品零售额190亿元,从时间上看,这是( C )。 A 总体单位总量 B 总体标志总量 C 时期指标 D 时点指标 7 用标准差比较分析两个同类总体平均指标的代表性的前提条件是( B )。 A 两个总体的标准差应相等B两个总体的平均数应相等C两个总体的单位数应相等 D 两个总体的离差之和应相等 8 动态数列中,每个指标数值可以直接相加的是( A )。 A 时期数列 B 时点数列 C 相对数动态数列D平均数动态数列 9我国在编制质量指标指数时,一般选择(D )作为同度量因素。 A 基期质量指标 B 报告期质量指标 C 基期数量指标 D 报告期数量指标 10 通过相关系数的计算,可说明(D )。 A线性相关还是非线性相关B 变量之间的因果数量关系 C 变量之间的相互依存关系D 变量之间相关方向和和密切程度 11 几位学生的成绩分别是80分、87分、90分,这些分数是(C )。 A 品质标志 B 数量标志 C 变量值 D 变量 12 下列指标中,属于质量指标的是(C )。 A 总产值B总成本C单位产品成本 D 职工人数 13 下述调查中,属于全面调查的是(B )。 A 对某种连续生产的产品质量进行抽查 B 某地区对工业企业设备进行普查 C 对全国钢铁生产中的重点单位进行了调查D抽取部分地块进行农产品调查 14 将总体按某一标志分组的结果表现为(A )。 A 组内同质性,组间差异性 B 组内差异性,组间同质性 C 组内同质性,组间同质性 D 组内差异性,组间差异性 15下列统计指标中,属于总量指标的是(C )。 A 产品废品率 B 劳动生产率 C 工人人数 D 平均工资 16 平均增长速度是(D )。 A 环比增长速度的算术平均数 B 总增长速度的算术平均数 C 环比发展速度的几何平均数 D 平均发展速度减100% 17 在其他条件不变的情况下,重复抽样的误差(A )不重复抽样的误差。 A 大于 B 小于 C 等于 D 不一定 18 相关系数的取值范围是(B)。 A 0≤r≤1 B -1≤r≤1 C r≤0 D -1≤r≤0 19已知甲、乙两个同类型企业职工平均产量的标准差分别为6元、7元、8元,企业职工生产的稳定性是(D)。 A 甲大于乙 B 乙大于甲 C 一样的D无法判断

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

《统计学》复习题(专升本)

《统计学》复习题(专升本) 一、单项选择题 1、在进行组距式分组时,凡遇到某单位的标志值正好等于相邻两组的上下限的数值时,一般将此值()。 A. 归于上限组 B. 归于下限组 C.归于上限组或下限组均可 D. 重新分组 2、把两个地区的粮食产量相对比,所得到的相对指标是()。 A. 比例相对指标 B. 结构相对指标 C. 比较相对指标 D. 强度相对指标 3、加权算术平均数的大小()。 A. 只受变量值大小的影响 B. 只受权数大小的影响 C. 受权数和变量值的双重影响 D. 都无影响 4、某企业计划规定产品单位成本降低6%,实际降低10%,则计划完成程度()。 A.97.94% B. 166.67 % C. 100.5% D. 95.74% 5、某企业2010年A产品销售收入比上一年增长8%,其中由于价格上涨增加销售收入为3%。那么,产量比上年增长()。 A. 5% B. 4.85% C. 11.24% D. 24% 6、一个统计总体()。 A. 只能有一个标志 B. 只能有一个指标 C. 可以有多个标志 D. 可以有多个指标 7、下列属于品质标志的是()。 A. 工人年龄 B. 工人性别 C. 工人体重 D. 工人工资 =270-0.5x,8、每吨铸件的成本(元)与每一个工人劳动生产率(吨)之间的回归方程为y c 这意味着劳动生产率每提高一个单位(吨),成本就会()。 A. 提高270元 B. 提高269.5元 C. 降低 0.5元 D. 提高0.5元

9、 判断现象之间相关关系密切程度的主要方法( )。 A. 编制相关表 B. 进行定性分析 C. 绘制相关图 D. 计算相关系数 10、对某地区工业企业职工状况进行了解,统计总体是( )。 A .该地区全部工业企业 B .某个工业企业 C .该地区工业企业的全部职工 D .每个工业企业的全部职工 11、按数量标志分组的关键是确定( )。 A .变量值的大小 B .组数 C .组中值 D .各组界限 12、拉氏的数量指标综合指数编制公式是( )。 A . ∑∑0 001p q p q B . ∑∑0 10 p q p q C . ∑∑0 1 11p q p q D . ∑∑1 11p q p q 13、构成总体的每个单位所有方面的特征是( )。 A .必须完全相同 B .不完全相同但至少有一个方面相同 C .完全不相同 D .既可以相同,也可以不相同 14、从纯理论出发,在直观上最符合随机原则的抽样方式是( )。 A. 简单随机抽样 B. 类型抽样 C. 等距抽样 D. 整群抽样 15、 如果零售物价上涨8%,销售量下降8%,则销售额( )。 A .没有变化 B .有所增长 C .有所下降 D .无法判断 16、连续变量分组,若第一组为200以下,第二组为200-300,第三组为300-400,第四组为400以上,则数据( )。 A. 200在第一组 B. 200在第二组 C. 200在第三组 D. 200在第四组 17、某种产品产量2014年比2013年增长了10%,2015年比2013年增长了12%,则2015年比2014年增长了( )。 A. 12%÷10% B.(112%÷110%)—1

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

高校统计学期末考试试题及答案

1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、%104%105

统计学复习题1要点

第一章绪论 一、填空 1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。 2、由一组频数2,5,6,7得到的一组频率依次是0.1 、0.25 、0.3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变。 3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。 4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。 5、中位数e M可反映总体的集中趋势,四分位差D Q.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。 四、计算题 1、某班的经济学成绩如下表所示: 43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。 (3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间? 4、对成年组和青少年组共500人身高资料分组,分组资料列表如下: 成年组青少年组按身高分组(cm) 人数(人) 按身高分组(cm) 人数(人) 150~155 155~160 160~165 165~170 22 108 95 43 70~75 75~80 80~85 85~90 26 83 39 28

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

大学统计学期末复习计算题(有答案)

1对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果 如下 第1页共4页 成年组 166 169仃2仃7 180 仃0 仃2仃4 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 (1)要比较成年组和幼儿组的身高差异, 你会采用什么样的指标 测度值?为什么? (2)比较分析哪一组的身高差异大? 解:(1)采用标准差系数比较合适,因为各标志变动值的数值大 小,不仅受离散程度的影响,而且还受到平均水平高低的影响。 标准 差系数适合于比较不同组数据的相对波动程度。 10 (2)成年组的均值:乂 =7 =172.1 cm ,标准差为:S = 4. 202cm 离散系数:V 1 二基二 4^202 : 0. 024 X 172. 1 10 X i 幼儿组的均值:X = V 71.3 cm ,标准差为:= 2. 497 cm 离散系数:v 2 = X = 71 3 : 0. 035 v1

(2)相对数分析 ' P i q i ' p°q 、 pq ' P o q 。 ' P o q 。 ' p°q 125550 117100 绝对数分析 ' pg 八 p °q ° =、 p °q 1 - p °q ° ' pg 八 p °q 1 94500-12500二 117100-125550 94500-117100 31050二 8450 -22600 由于产量q 下降6.73%,使总成本下降8450元; 由于单位成本p 下降 19.30%,使总成本下降22600元。 3、从一个标准差为5的总体中抽出一个容量为40的样本,样本均值 为25。 (1) 样本均值的抽样标准差C X 等于多少? (2) 在95%的置信水平下,允许误差是多少? (3) 试确定该总体均值95%的置信区间。(血25 = 1.96) 解:(1)样本均值的抽样标准差: (2) 在95%的置信水平下,允许误差是: z 0.025▽犬=0. 79 X 1. 96 1. 55 (3) 该总体均值95%的置信区间: 65 340 1000 35 400 150 94500 125550 65 65 340 1000 35 400 150

统计学复习题2

《统计学》复习题(二) 一、 判断题 1、在用计算机进行数据汇总时,往往将男性用“1”来表示,女性用“0”来表示,所以可将性别视为定比数据变量。( ) 2、 在进行普查时涉及的调查项目越多越好。( ) 3、 进行普查时,规定标准时间的目的是为了按时完成调查工作。( ) 4、 欲了解我国国民的年龄构成,对人口按年龄分组,适合采用等距式分组。 ( ) 5、 直方图适合用于显示连续型分组数据。( ) 6、 当均值小于中位数,且中位数小于众数时,数据分布具有左偏特征。( ) 7、 标准化是指将原始数据进行线性变换,使其平均数为1,标准差为0,改变了改组数据的分布情况。( ) 8、为了解学生参加英语培训是否能提高考试成绩,对某高校学生培训前后的英语成绩进行检验,这属于配对样本的检验。( ) 二、单项选择题 1、用部分数据推断总体数据的方法,属于( ) A 、理论统计学的内容 B 、应用统计学的内容 C 、推断统计学的内容 D 、描述统计学的内容 2、总体个数为N,用每隔一定数量的方法抽取容量为n 的抽样方式是( ) A 、多步抽样 B 、分层抽样 C 、整群抽样 D 、系统抽样 3、由切比雪夫定理知至少有( )的数据落在算术平均数正负2个标准差内 A 、88% B 、75% C 、93% D 、96% 4、在坐标轴中,横轴刻度表示直方图的( ) A 、频数 B 、组中值 C 、组距 D 、组限 5、两组数据的均值不等,但标准差相等,则( ) A 、均值大的一组数据差异程度大 B 、均值小的一组数据差异程度大 C 、两组数据的差异程度相同 D 、无法对两组数据进行比较 6、时间序列的加法模型中t T 代表( ) A 、季节变动 B 、不规则变动 C 、循环变动 D 、代表长期趋势 7、设总体服从均值为μ,方差为2δ的正态分布,从总体N 中按重复抽样方法抽取容量为n 的简单随机样本,则样本均值的抽样分布服从( ) A 、2(,)μδ B 、2 ( μ C 、2 (,)n δμ D 、2 (,)1 N n n N δμ-?- 8、进行假设检验时,在样本量一定的条件下,犯第一类错误的概率减小,犯第二类错误的概率就会( ) A 、减小 B 、增大 C 、不变 D 、不确定 三、简答题

相关文档
相关文档 最新文档