当前位置：文档库 › 统计学课后习题集参考答案解析

统计学课后习题集参考答案解析

思考题与练习题

参考答案

【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确，值得肯定；回答错误，请找出原因更正，这样使用参考答案，能力会越来越高，智慧会越来越多。学而不思则罔，如果直接抄答案，对学习无益，危害甚大。想抄答案者，请三思而后行！

第一章绪论

思考题参考答案

1．不能，英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机，因为英军被击毁的战机有的掉入海里、敌军占领区，或因堕毁而无形等，不能找回；没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验，也不能从多个弹孔中确认那个弹孔是危险的。

2．问题：飞机上什么区域应该加强钢板？瓦尔德解决问题的思想：在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置，找出几乎布满弹孔的区域；发现：没有弹孔区域是军机的危险区域。

3．能，拯救和发展自己的参考路径为：①找出自己的优点，②明确自己大学阶段的最佳目标，③拟出一个发扬自己优点，实现自己大学阶段最佳目标的可行计划。

练习题参考答案

一、填空题

1．调查。

2．探索、调查、发现。

3. 目的。

二、简答题

1．瓦尔德；把剩下少数几个没有弹孔的区域加强钢板。

2．统计学解决实际问题的基本思路，即基本步骤是：①提出与统计有关的实际问题；

②建立有效的指标体系；③收集数据；④选用或创造有效的统计方法整理、显示所收集数据的特征；⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断；⑥根据合理推断给出更好决策的建议。不解决问题时，重复第②-⑥步。

3．在结合实质性学科的过程中，统计学是能发现客观世界规律，更好决策，改变世界和培养相应领域领袖的一门学科。

三、案例分析题

1．总体：我班所有学生；单位：我班每个学生；样本：我班部分学生；品质标志：姓名；数量标志：每个学生课程的成绩；指标：全班学生课程的平均成绩；指标体系：上学期全班同学学习的科目；统计量：我班部分同学课程的平均成绩；定性数据：姓名；定量数据：课程成绩；离散型变量：学习课程数；连续性变量：学生的学习时间；确定性变量：全班学生课程的平均成绩；随机变量：我班部分同学课程的平均成绩，每个同学进入教室的时间；横截面数据：我班学生月门课程的出勤率；时间序列数据：我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率；面板数据：我班学生课程分别在第一个月、第二

个月、第三个月、第四个月的出勤率；选用描述统计。

2．(1)总体：广州市大学生；单位：广州市的每个大学生。(2)如果调查中了解的是价格高低，为定序尺度；如果调查中了解的是商品丰富、价格合适、节约时间，为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。

3．(1)10。(2)6。(3)定类尺度：汽车名称，燃油类型；定序尺度：车型大小；定距尺度：引擎的汽缸数；定比尺度：市区驾车的油耗，公路驾车的油耗。(4)定性变量：汽车名称，车型大小，燃油类型；定量变量：引擎的汽缸数，市区驾车的油耗，公路驾车的油耗。(5) 40%；(6)30%。

第二章收集数据

思考题参考答案

1．二手数据的特点主要有：易获得；成本低；快速获得；相关性差；时效性差和可靠性低。对于任何一项研究，首先想到有没有现成的二手数据可用，实在没有或有但无法使用时才进行原始数据的收集。

2．普查的特点有：一次性的；规定统一的标准时点调查期限；数据一般比较准确，规范化程度较高；使用范围比较窄；调查质量不易控制；工作量大，花费大，组织工作复杂；易产生重复和遗漏现象等特点。

抽样调查的特点有：经济性好；实效性强；适应面广；准确性高。

3．两者不能替代。两者的目的不同，调查对象不同，组织方式不同。经济普查的“全面”包括所有经济体，比如个体户，而全面统计报表中的“全面”是相对的，只有注册为公司或企业并具有一定经济规模的经济体，才是调查对象，并不包括个体经营户。

4．略。

练习题参考答案

一、判断题

1.×

2.×

3.√

4.√

5.×

6.√

7.√

8.√

9.×10.√

二、单项选择题

1.C

2.B

3.C

4.A

5.D

6.C

三、略。

第三章整理和显示数据

思考题答案

1．因为收集的数据符合数据通常要求后，往往杂乱无章，不可用，所以有必要对数据进行整理。

2．比如市场营销专业。为了解各种不同饮料在市场的占有率情况，于是采用了问卷调查方法，得到相关的数据结果，整理成如下所示频数分布表和复式条形图来显示结果。

3．洛伦茨曲线的思想是洛伦茨曲线图是用人口累计率与收入累计率绘出散点图，并用平滑曲线来连接这些散点，以此来描述一国财富或收入分配状况的统计工具。其一般为一条向下弯曲的曲线，偏离45度角直线越小，表明该社会收入分配状况的平等化程度越高，偏离45度角直线越大，表明该社会收入分配状况的平等化程度越低。

练习题参考答案

一、单选题

1．C2．D3．A

二、简答题

1.数值型数据的统计分组方法有两种，一种是单变量值分组，一种是组距分组。单变量值分组就是将一个变量值作为一组，总体中有几个不同的变量值就分几个组，适合于离散型变量，且适合变量值较少的情况。组距式分组是将变量值的一个区间作为一组，适合于连续变量和变量值较多的离散型变量情况。

2.（1）70应为第四组，因为是遵循“上组限不在内”的原则。70只能作为下限值放在第四组。

（2）91没有被分入组内，是违背了“不重不漏”的原则。

三、实操题

1.（1）上面数据属于分类型数据

（2）频数分布表如下表所示：

类别频数比例百分比(%)

A 10 0.25 25

B 9 0.225 22.5

C 7 0.175 17.5

D 6 0.15 15

E 8 0.20 20

（3）条形图如下所示

饼图如下所示

2.（1）Excel中得到的频数分布表

贷款数分组

频数频率（%）

向上累计频率

（%）

500以下 6 15 15

500～1000 16 40 55

1000～

1500 8

20 75

1500～

2000 6

15 90

2000以上 4 10 100

合计40 100 –（2）在Excel中绘制的频率直方图

在Excel中绘制的累计频率分布图

（3）钟型右偏分布。3．最低温度的茎叶图

最低温度Stem-and-Leaf Plot

Frequency Stem& Leaf

3.00 3 . 789

6.00 4. 002334

4.00 4 . 5677

8.00 5 . 00011233

2.00 5 . 59

2.00 6 . 13 4.00 6 . 5678 1.00 7 . 4 Stem width: 10 Each leaf: 1 case(s)

第四章数据分布的数字特征

思考题参考答案

1．典型案例5中解决问题的科学家是日本质量管理学家田口玄一教授。解决的结果是：田口玄一教授发现：当产品质量数据服从以最佳位置m 为中心的正态分布2

[,(3)]N m T 时，产品质量高。

2．3σ质量管理原则的基本思想：3σ质量管理中的最佳位置m 与平均数重合，3T 与标准差重合，产品质量数据的分布与正态分布重合，此时的产品质量最高。其中3σ质量代表了较高的对产品质量要求的符合性和较低的缺陷率。它把产品质量值的期望作为目标，并且不断超越这种期望，企业从3σ开始，然后是4σ、5σ、最终达到6σ。

对做人、做事的启示是：找到做人或做事的最佳目标，然后尽一切努力不断地靠近此目标，从而达到最佳状态。

3．3σ质量管理原则大到能拯救和强大一个国家，小到能拯救和强大自己。生活中，每个人都有自己的目标，目标或大或小，可能会有很多，但这些目标不可能全部实现，我们

需要根据自己的实际情况选择一个合适的、最有可能实现的目标（最佳目标），然后尽一切努力，心无旁骛地、不断地靠近此目标，继而达到理想状态。

4．煮饭的水位有一个最佳刻度值（最优目标），水位越靠近这个刻度值，则煮出的饭口感越好；水位越远离这个刻度值，则煮出的饭口感越差。即水位越向该刻度值（最优目标）靠拢则煮出的饭口感越好，这也体现了3σ质量管理原则的思想。

练习题参考答案

一、单选题

1．B 2．C 3．B 4．D 5．D 6．C 二、判断题

1．× 2．× 3．√ 4．√ 5．√ 三、计算题

1.（1）161o M =；161.5e M =；160.27i

x n

=≈∑

（2）=

7.54L n Q =位置；3=22.54U n

Q =位置 153153167168=153;167.522

L U Q Q ++∴===

（3

）9.06s =

≈

（4）因为是单峰分布，且满足e x M <，所以该组数据近似左偏分布。

2.（1）因为该题中产品销售额和销售利润两组数据的变量值水平不同，所以比较产品销售额和销售利润的差异应该选用离散系数这个统计量。

（2）因为1

584i

x x n

=∑

；1290.91s =

≈

38.21i

x x n

=∑

；224.02s =

≈

所以 111290.910.4981584s s v x =

=≈222

24.020.628638.21s s v x ==≈

因为12s s v v <，所以销售利润这组数据的差异大。

3.（1）假定数据对称分布，判断数据的百分比问题应该用经验法则。因为新员工的平均得分是85分，标准差是5分，所以可以判断75～95分正好对应着均值±2倍的标准差范围，根据经验法则可知大约有95%的数据落在此范围内。

（2）假定员工得分的分布未知，判断数据的百分比问题应该用切比雪夫不等式。因为新员工的平均得分是85分，标准差是5分，所以可以判断75～95分正好对应着均值±2倍的标准差范围，根据切比雪夫不等式（21

-1k

，其中k 为标准差前的倍数）可知至少有75%的数据落在此范围内。

4．根据题意，应用标准分数来比较。第一学期小明微积分的标准分数：;2570

801111=-=-=

s x x z 第二学期小明微积分的标准分数：;5.110

802222=-=-=

s x x z 因为21z z >，所以小明第一学期的微积分成绩更理想。

5.（1）84400105580i i

x f x f

==∑∑甲

85000106380i i i

x f x f ===∑∑乙

因为x x <甲乙，所以供应商乙的灯泡寿命更长。

（2

）因为258.4765s =

≈甲

261.6283s =

≈乙

所以258.47650.24501055s s v x =

≈甲甲甲

261.6283

0.24611063s s v x ==≈乙乙乙

因为s s v v <甲乙

，所以可知供应商甲灯泡寿命更稳定。

（3）因为是分组数据，所以偏态系数

0262.098.17268850452250

33-≈-=s a SK ＝

甲1553.05

.1790829125.278203133≈=s a SK ＝乙峰态系数

6940.034463593014510292898123-4

4-≈-=s

a K ＝

甲0109.034685315855314005004883-4

4-≈-=s

a K ＝

乙（4）从（3）可知：00262.0<-≈甲SK ，可知供应商甲的灯泡使用寿命分布是左偏分布，但偏斜程度较小；01553.0>≈乙SK ，可知供应商乙的灯泡使用寿命分布是右偏分布，但由于SK SK >乙甲，所以供应商乙灯泡寿命的偏斜程度比供应商甲的要大；

06940.0<-≈甲K ，可知数据是扁平分布，即数据较分散；

00109.0<-≈乙K ，可知数据是扁平分布，但因乙甲K K <，所以供应商甲的灯泡寿命分

布要比乙的分散。

（5）因为甲的偏斜程度比乙小，且偏态系数的值比较接近于0，所以供应商甲的灯泡寿命分布可以看作是近似对称分布，所以甲的平均寿命代表性更强。又由于s s v v <甲乙，即

供应商甲灯泡寿命更稳定，所以，选择供应商甲的灯泡更好些。四、案例分析

从平均数的意义及计算范围上解释通即可。（开放式，答案不唯一）

第五章抽样分布

思考题参考答案

1. 这种做法的理论依据是统计量X 和2

S 的抽样分布。因为X μμ=，

σσ=

，即X

的平均数为μ，方差随着n 的增大越来越小，从而X 的取值越来越向着μ靠拢，故用X 去估计μ理论依据成立。同理，2

S 的平均数为2

σ，方差随着n 的增大越来越小，从而2

S 的取值越来越向着2

σ靠拢，故用2

S 去估计2

σ理论依据成立。

2. 比如：（1）哈佛大学每年收到7000个优秀学生的入学申请，申请表中包含了大量申请人的信息，现入学主管需要知道一些基本信息比如SAT 平均成绩，于是抽取一个样本容量为50的样本，以此样本的SAT 平均成绩来估算7000人的平均成绩。（2）为估计广州市大瓶装纯水市场的市场容量，计算各品牌纯水的知名度，以及覆盖率，抽取一定数量的大瓶装纯水，计算其数字特征，以此估算全市情况。

练习题参考答案

一、判断题

1．√2．√ 3．× 4．√ 5．× 二、单项选择题

1．C 2．A 3．D 4．A 5．C 6．B 7．B 8．B 三、案例分析题

(213,4.5918)X N 。若是不重复抽样，方差需要用系数()1)N n N --进行修正，

从而抽样分布是：2(,

N n

X N n N σμ--。

第六章参数估计

思考题参考答案

1.矩估计法基本思想是，用样本原点矩作为总体原点矩的估计。最大似然方法的基本思想是，在估计θ?取值的可能范围内，挑选使样本观测值出现概率达到最大的θ?

作为参数θ的估计。

2.对同一参数，用不同的估计方法，可以得到不同的估计量，那个估计方法更好呢？

3.构造参数的置信区间时，要权衡以下两个方面，一是估计量的精度要求，二是估计量的可靠性程度。所谓精度要求就是要把估计误差控制在一定的范围内，我们用极限误差

2??12θθ-=

?来反映。△越小，表示估计的精度越高；△越大，表示估计的精度越低。极限误

差的大小要根据研究目的和研究对象的变异程度来确定。

练习题参考答案

一、单选题

1．C 2．C 3．A 4. B 5. D 二、判断题 1.√2.×3. √4. ×5. × 三、计算题

1.根据已知：,093.2)1(%,951,9,48,202/=-=-===n t s x n αα则：

即在置信度95％下，此次抽样得该邮箱每周平均收到邮件数的区间估计为（44，53）封。 2.

96.1,6.0,8.4,50025.0====z s x n

s z x 2

/α )

97.4,63.4(50

6.096.18.4=?

= ，

即在95%置信水平下，此次抽样得该批电子元件平均厚度的区间估计为（4.63，4.97）cm 。 3.已知

.1%,951,14.2,9,15.02==-===-

a z x n ασ

n z x a

±-

=21.4±0.098=（21.0302，21.498），

即在95%置信度下，此次抽样得该批零件平均长度的区间估计为（21.302，21.498）cm 之间。

4.样本比例：

48.010048

1===

n n p ，5)1(5≥-≥p n np 和，所以

09992.048.0100)48.01(48.0248.0)1(2 =-?=-?

n p p z p α

=（38.01%，57.99%）

即在95.45％概率保证程度下，此次抽样得该校学生成绩在80分以上比重的区间估计为（38.01%，57.99%）之间。

第七章假设检验

]32.52,68.43[20

9903.248)

1(2/=?

±=-±n

s n t x α

思考题参考答案

1. 区间估计中区间事件的逆是小概率事件和小概率原理。

2. 明确的陈述作为原假设，不明确的陈述作为备择假设。

3.t -检验是事后控制，σ3质量管理原则是按先给出的产品设计进行操作，是事前控制。

练习题参考答案

一、单选题

1. C

2. C

3. A

4. B

5. A 二、判断题

1.√

2. ╳

3. ╳

4. √ 三、计算题

1. 根据题意生产的零件是否符合标准要求，即加工某零件的标准口径的均值是否为20毫米，因此采用双侧检验。（1）建立假设：

0:20H μ=1:20H μ≠

（2）确定检验统计量，并计算检验统计量值

因为0=20 =0.3 =20.5 n=36x μσ，所以采用Z 检验统计量。

x z =

（3）给定显著性水平，并查表，得到拒绝域

0.05α=，拒绝域为/20.025 1.96α≥==z z z

（4）判断

因为/2=10α>z z ，z 落入了拒绝域，所以拒绝0H ，即此次抽样认为生产的零件不符合标准要求。

2.根据题意，要检验体院男生安静时心率与普通成年人的心率有无差异，即平均数是否达到72次／min ，因此采用双侧检验。（1）建立的假设为：

0:72H μ=1:72

H μ≠

（2）确定检验统计量，并计算检验统计量值已知

072μ=，64n =，68x =， 6.4s =，0.01α=，因为是大样本，所以采用Z 检验

统计量。

x z =

==-

（3）给定显著性水平，并查表，得到拒绝域

0.01α=，拒绝域为/20.005 2.58α≥==z z z

（4）判断因为

z z α>，z 落入拒绝域，所以拒绝0H ，即此次抽样体院男生安静时心率与普通

成年人的心率有差异。

（1）建立假设：

0:1020H μ≤1:1020H μ>

（2）确定检验统计量，并计算检验统计量值

因为正态总体，0=1020 =100 =1080 n=16x μσ，所以采用Z 检验统计量。

2.4

x z =

（3）给定显著性水平，并查表，得到拒绝域

0.05α=，拒绝域为： 0.05 1.645α≥==z z z

（4）判断

因为z z α>，z 落入拒绝域，所以拒绝0H ，即此次抽样认为这批产品的寿命有显著提高。

4.根据题意，要检验机器是否正常工作，即袋装糖重是否为0.5千克，因此采用双侧

检验。

（1）建立的假设为：

0:0.5H μ=1:0.5

H μ≠

（2）确定检验统计量，并计算检验统计量值因为正态总体，

00.5μ=，

，9n =，σ未知，所以采用t 统计量，

0.512

i x

x n

=∑，009.01

)(9

=--=

∑=n x x

s i i

。

4309.0012

.09

09.05.0512.00==-=-=

n u x t σ

（3）给定显著性水平，并查表，得到拒绝域

0.05α=，拒绝域为：306.2)1(2=-≥n t t α

（4）判断

因为)1(4-≥=n t t α，t 落入拒绝域，所以拒绝

H ，即认为机器不正常。

5.根据题意，要决定如何处理这批货物，也就是该百货商店要不要收这批货物，由次品率是否超过3%来决定，因此采用单侧检验。

（1）建立的假设为：

0:3%H π≤1:3%

H π>

（2）确定检验统计量，并计算检验统计量值已知

03%π=，4100=p =4%，0.05α=，采用z 检验统计量。

=0.581.71%

（3）给定显著性水平，并查表，得到拒绝域，

0.05α=，拒绝域为： 0.05 1.645α≥==z z z

（4）判断

因为αz z <，z 不落入拒绝域，所以不能拒绝0H ，即此次抽样认为可接受这批货物。 6.（1）建立假设：

σ=20:5000H σ≠21:5000H

（2）确定检验统计量，并计算检验统计量值已知σ=205000=2

9200s

=26n χσ--?=

0(1)(261)9200

465000

n s

（3）（3）给定显著性水平的值，查得2

χ分布表，并得出拒绝域

α=0.05 查2χ分布表，得到αχχ-==220.0252

(n 1)(25)40.6465

χχ--==2

20.975(1)

(n 1)(25)13.1197，得到拒绝域为：

222/20.005(1)=(25)=40.6465αχχχ>-n ，或222

1/20.995(1)=(25)=13.1197αχχχ-<-n

（4）判断因为αχ

χ>2

，2χ落入拒绝域，所以拒绝0H ，即此次抽样认为这批电池的寿命的

波动性较以往有显著的变化。四、案例分析题

1.第Ⅰ类错误是该供应商提供的这批炸土豆片的平均重量的确大于60g ，但检验结果却提供证据支持店方倾向于认为其质量少于60g 。

2.第Ⅱ类错误是该供应商提供的这批炸土豆片的平均重量其实少于60g ，但检验结果却却没有提供足够的证据支持店方发现这一点，从而拒收这批产品。

3.连锁店的顾客们看重第Ⅱ类错误，而供应商更看重第Ⅰ类错误。

第八章相关与回归分析

思考题参考答案

1．使残差的平方和达到最小来估计参数。

2．误差项零均值，误差项同方差，误差项无序列相关，解释变量与误差项不相关，误差项服从正态分布。

3．高尔顿，发现是：矮于父辈平均身高父亲的儿子、高于父辈平均身高父亲的儿子都有“回归”到父辈平均身高的趋势。

4．三个年度的诺贝尔经济学奖。

练习题参考答案

一、计算题

解法一：计算中间结果为：5.703147)()(=-=--∑∑y x n y x y y x x i i i i ，75.534=x ，75.869=y ，5.835769)(2

=-∑x x i ，5.691519)(2

=-∑y y i ，

（1）计算相关系数

r =

∑∑∑----2

)()

()

()(y y

x x

y y x x i

i i

=0.9249

显著相关检验：检验统计量2

9249

.01289249.012--=

--=

n r t =5.9587，

α=0.05下，查t 分布表，得拒绝域：︱t ︱≥t α/2(n -2)=2.447

t 落入拒绝域，拒绝H 0，表明工业增加值y 与生产性固定资产年均价值x 之间存在显著

正线性相关关系。

（2）确定直线回归方程

)

()()(?∑∑---=x x y y x x i

i i

β=0.841

86.419??1

0=-=x y ββ