当前位置：文档库 › 统计学课后答案

统计学课后答案

统计学

第一章

1.什么是统计学？怎样理解统计学与统计数据的关系？

答：统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系，统计学阐述的统计方法来源于对统计数据的研究，目的也在于对统计数据的研究，离开了统计数据，统计方法以致于统计学就失去了其存在意义。

2．简要说明统计数据的来源

答：统计数据来源于两个方面：直接的数据：源于直接组织的调查、观察和科学实验，在社会经济管理领域，主要通过统计调查方式来获得，如普查和抽样调查。间接的数据：从报纸、图书杂志、统计年鉴、网络等渠道获得。

3.简要说明抽样误差和非抽样误差

答：统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的，从理论上看，这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差，它是不可避免的，但可以控制的。

4.答：（1）有两个总体：A品牌所有产品、B品牌所有产品

（2）变量：口味（如可用10分制表示）

（3）匹配样本：从两品牌产品中各抽取1000瓶，由1000名消费者分别打分，形成匹配样本。

（4）从匹配样本的观察值中推断两品牌口味的相对好坏。

第二章、统计数据的描述

思考题

1描述次数分配表的编制过程

答：分二个步骤：

（1）按照统计研究的目的，将数据按分组标志进行分组。

按品质标志进行分组时，可将其每个具体的表现作为一个组，或者几个表现合并成一个组，这取决于分组的粗细。

按数量标志进行分组，可分为单项式分组与组距式分组

单项式分组将每个变量值作为一个组；组距式分组将变量的取值范围（区间）作为一个组。

统计分组应遵循“不重不漏”原则

（2）将数据分配到各个组，统计各组的次数，编制次数分配表。

2．解释洛伦兹曲线及其用途

答：洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。

3. 一组数据的分布特征可以从哪几个方面进行测度？

答：数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常

用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。

4 怎样理解均值在统计中的地位？

答：均值是对所有数据平均后计算的一般水平的代表值，数据信息提取得最充分，具有良好的数学性质，是数据误差相互抵消后的客观事物必然性数量特征的一种反映，在统计推断中显示出优良特性，由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。

5 对比率数据的平均，为什么采用几何平均？

答：比率数据往往表现出连乘积为总比率的特征，不同于一般数据的和为总量的性质，由此需采用几何平均。

6. 简述众数、中位数和均值的特点和应用场合。

答：众数、中位数和均值是分布集中趋势的三个主要测度，众数和中位数是从数据分布形状及位置角度来考虑的，而均值是对所有数据计算后得到的。众数容易计算，但不是总是存在，应用场合较少；中位数直观，不受极端数据的影响，但数据信息利用不够充分；均值数据提取的信息最充分，但受极端数据的影响。

7 为什么要计算离散系数？

答：在比较二组数据的差异程度时，由于方差和标准差受变量值水平和计量单位的影响不能直接比较，由此需计算离散系数作为比较的指标。

练习题：

1. 频数分布表如下：

服务质量等级评价的频数分布

服务质量等级家庭数（频率）频率%

A1414

B2121

C3232

D1818

E1515

合计100100

条形图（略）

2 （1）采用等距分组：

n=40 全距=152-88=64 取组距为10

组数为64/10=6.4 取6组

频数分布表如下：

（2）某管理局下属40个企分组表

按销售收入分组（万元）企业数（个）

频率（%）先进企业良好企业一般企业落后企业 11 11 9 9 27.5 27.5 22.5 22.5 合计

100.0

3 采用等距分组全距=49-25=24

n=40 取组距为5，则组数为 24/5=4.8 取5组

F r e q u e n c y

4. ．（1）排序略。

（2）频数分布表如下：

100只灯泡使用寿命非频数分布

按使用寿命分组（小时）灯泡个数（只）频率（%）

650~660 2 2

660~670 5 5

670~680 6 6

680~690 14 14

690~700 26 26

700~710 18 18

710~720 13 13

720~730 10 10

730~740 3 3

740~750 3 3

合计100 100 直方图（略）。

5 等距分组

n=65 全距=9-（-25）=34 取组距为5，组数=34/5=6.8, 取7组

F r e q u e n c y

且平均成绩较A 班低 8. 箱线图如下：（特征请读者自己分析）

9．（L U 。

（2）17.21=s （万元）。

10．甲企业平均成本3

1113

111i

i i i i

x m x ===

∑∑＝19.41（元），

乙企业平均成本3

2123

112i

i i i i

x m x ===

∑∑＝18.29（元）；

原因：尽管两个企业的单位成本相同，但单位成本较低的产品在乙企业的产量中所占

比重较大，因此拉低了总平均成本。

11．x =

i i

i k

i x f

==∑∑426.67（万元）；

s =

116.48(万元)

13（1）离散系数，因为它消除了不同组数据水平高低的影响。

（2）成年组身高的离散系数：024

.01.1722.4==s v ；幼儿组身高的离散系数：032

.03.713.2==s v ；

由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相对较大。

14 ．

先考虑平均指标，在平均指标相近时考虑离散程度指标。

应选择方法A ，其均值远高于其他两种方法，同时离散程度与其他两组相近。

15．(1)风险的度量是一个不断发展的问题，在古典金融理论中，主要采用标准差这个统计测度来反映，现代金融中，采用在险值（value at risk ）。（2）无论采用何种风险度量，商业类股票较小

（3）个人对股票的选择，与其风险偏好等因素有关。

第三章

1.总体分布指某个变量在总体中各个个体上的取值所形成的分布，它是未知的，是统计推断的对象。从总体中随机抽取容量为n 的样本()12,,,n x x x ，它的分布

称为样本分布。由样本的某个函数所形成的统计量()12,,,n f x x x ，它的分布称

为抽样分布（如样本均值、样本方差的分布）

2.重复抽样和不重复抽样下，样本均值的标准差分别为：

因此不重复抽样下的标准差小于重复抽样下的标准差，两者相差一个调整系数

3.解释中心极限定理的含义

答：在抽样推断中，中心极限定理指出，不论总体服从何种分布，只要其数学期望和方差存在，对总体进行重复抽样时，当样本容量充分大，样本均值趋近于正态分布。中心极限定理为均值的抽样推断奠定了理论基础。

第四章、参数估计

1．简述评价估计量好坏的标准

答：评价估计量好坏的标准主要有：无偏性、有效性和相合性。设总体参数θ的

估计量有1?θ和2?θ，如果()

1?E θθ=，称1?θ是无偏估计量；如果1?θ和2?θ是无偏估计量，且()

1?D θ小于()

2?D θ，则1?θ比2

?θ更有效；如果当样本容量n →∞，1?θθ→，

则1?θ是相合估计量。

2.说明区间估计的基本原理答：总体参数的区间估计是在一定的置信水平下，根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间，使该区间包含总体参数的概率为置信水平。置信水平反映估计的可信度，而区间的长度反映估计的精确度。

3．解释置信水平为95％的置信区间的含义

答：总体参数是固定的，未知的，置信区间是一个随机区间。置信水平为95％的置信区间的含义是指，在相同条件下多次抽样下，在所有构造的置信区间里大约有95％包含总体参数的真值。

4．简述样本容量与置信水平、总体方差、允许误差的关系

答：以估计总体均值时样本容量的确定公式为例：()2

2/22

z n E ασ=

样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。

练习题：

2. 解：由题意：样本容量为49n =

（1）

若15, 2.143x σσ==

= （2）

0.05, 1.96*2.143 4.20028E z αα====

（3）

若()()/2/2

120,120 4.20028,120 4.20028115.7997,124.20028x x z x z αα?

=-+=-+ ?=

3.解：由题可得：36, 3.317, 1.609n x s ===

尽管采用不重复抽样，但因为样本比例很小（不到0.5%），其抽样误差与重复抽样下近似相同，采用重复抽样的抽样误差公式来计算。 36n =为大样本，则在α的显著性水平下的置信区间为：

/2/2

x z x z αα?

-+ ?

当/20.1, 1.64z αα==，置信区间为（2.88,3.76）当/20.05, 1.96z αα==，置信区间为(2.80,3.84) 当/20.01, 2.56z αα==，置信区间为(2.63,4.01)

5解：假设距离服从正态分布，16,9.375, 4.113n x s ===

平均距离的95％的置信区间为(

(

0.0250.0251515x t x t ?

-+ ?＝

（7.18,11.57） 7解：由题意：32

50,64%50

n p ==

=。因为(),1np n p -均超过5，大样本

（1）总体中赞成比率的显著性水平为α的置信区间为

//p z p z αα? -+ ? 当0.05α=

时，

/13.3%E z α=== 置信区间为（50.7%,77.3%）

(2)如果要求允许误差不超过10％，置信水平为95％，则应抽取的户数：

()()2

2/222

1 1.96*0.8*0.2620.1z n E αππ-==≈

8.此题需先检验两总体的方差是否相等：

2222

012112:,:H H σσσσ=≠

在5%的显著性水平下，22

/96.8/102.00.949F s s === 0.0250.9750.025(13,6) 5.37,(13,6)1/(6,13)1/3.60.28F F F ====,不拒绝原假设

认为两总体方差是相同的。

（1）

()(

120.05190%,199.89.8 1.729*4.55x x t α-=-±=±=±即（1.93，17.669）（2）

()(

120.025195%,199.89.8 2.093*4.55x x t α-=-±=±=±即（0.27，19.32）

11.大样本的情况 ()

12p p z α-±

（1）90%置信度下

(

)40%30%10% 6.979%-±=±（3.021%，16.979）

（2）95%置信度下

(

)40%30%10%8.316%-±=±（1.684%，18.316%）

12．解：由题可计算：222

212

0.242,0.076s s == 两个总体方差比22

12/σσ在95％的置信区间为：

()()()22221212/2121/212//, 4.06,14.351,11,1s s s s F n n F n n αα-??= ? ?----??

14．解：由题意：/2120, 1.96,20z E ασ===

则必须抽取的顾客数为：()2

222

/22

1.96*12013920

z n E ασ=

第五章、假设检验思考题

1．1．理解原假设与备择假设的含义，并归纳常见的几种建立原假设与备择假设的原则. 答：原假设通常是研究者想收集证据予以反对的假设；而备择假设通常是研究者想收集证据予以支持的假设。建立两个假设的原则有：（1）原假设和备择假设是一个完备事件组。（2）一般先确定备择假设。再确定原假设。（3）等号“＝”总是放在原假设上。（4）假设的确定带有一定的主观色彩。（5）假设检验的目的主要是收集证据来拒绝原假设。

2．第一类错误和第二类错误分别是指什么？它们发生的概率大小之间存在怎样的关系？答：第I 类错误指，当原假设为真时，作出拒绝原假设所犯的错误，其概率为α。第II 类错误指当原假设为假时，作出接受原假设所犯的错误，其概率为β。在其他条件不变时，α增大，β减小；β增大，α减小。

3．什么是显著性水平？它对于假设检验决策的意义是什么？

答：假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值，用于检验结果的可靠性度量，但确定了显著性水平等于控制了犯第一错误的概率，但犯第二类错误的概率却是不确定的，因此作出“拒绝原假设”的结论，其可靠性是确定的，但作出“不拒绝原假设”的结论，其可靠性是难以控制的。

4．什么是p 值？p 值检验和统计量检验有什么不同？

答：p 值是当原假设为真时，检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P 值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平α，来控制犯第一类错误的上限，p 值可以有效地补充α提供地关于检验可靠性的有限信息。p 值检验的优点在于，它提供了更多的信息，让人们可以选择一定的水平来评估结果是否具有统计上的显著性。

5．什么是统计上的显著性？

答：一项检验在统计上是显著的（拒绝原假设），是指这样的（样本）结果不是偶然得到的，或者说，不是靠机遇能够得到的。显著性的意义在于“非偶然的

练习题

3．解（1）第一类错误是，供应商提供的炸土豆片的平均重量不低于60克，但店方拒收并投诉。

（2）第二类错误是，供应商提供的炸土豆片的平均重量低于60克，但店方没有拒收。（3）顾客会认为第二类错误很严重，而供应商会将第一类错误看得较严重。

4．解：提出假设 02:6,:6H H μμ≤> 已知 1.19,100,0.05n σα===

（1）

检验统计量为()6

0,1a

x Z N σ

（2）拒绝规则是：若Z z α>，拒绝0H ；否则，不拒绝0H （3）由 6.35x =

得：0.056.356

2.94 1.641.19Z z -=

=>=，拒绝0H ，认为改进工艺能提高其平均强度。

5解：设μ为如今每个家庭每天收看电视的平均时间（小时）

需检验的假设为：01: 6.70,: 6.70H H μμ

≤

调查的样本为：200,7.25, 2.5n x s ===

大样本下检验统计量为：0.55*14.14

3.112.5x z =

===

在0.01的显著性水平下，右侧检验的临界值为0.01 2.33z =

因为 2.33z >，拒绝0H ，可认为如今每个家庭每天收看电视的平均时间增加了

6. 解：提出假设 2222

201:0.75,:0.75TV

VCR TV H H σσσ≤=> 已知：230,2,0.05n s α===

检验统计量()()22

0.052

129*21032942.5570.75

VCR

n s χχσ-==

=>= 拒绝0H ，可判定电视使用寿命的方差显著大于VCR 7. 解：提出假设：012112:5,:5H H μμμμ-=-≠

120.02,100,50n n α===，独立大样本，则检验统计量为：

514.810.45 5.1458x x z ----=

==-

而0.01z =2.33 因为/2z z α>，拒绝0H ，平均装配时间之差不等于5分钟 8. 解：匹配小样本提出假设：01:,:a b a b H H μμμμ≤>

由计算得：0.625, 1.302,8,0.05d d s n α===

=，检验统计量为

()0.051.35777 1.8946d t t =

==<=，

不拒绝0H ，不能认为广告提高了潜在购买力的平均得分。

9. 解：提出假设：012112:,:H H ππππ≥< 已知：1122197301

288,0.684,367,0.82,0.1288367

n p n p α==

=====

大样本，则检验统计量为： 112212288*0.684367*0.82

0.76288367

p n p n p n n ++=

==++

4.0476z =

而0.1 1.29z =，因为0.1z z <-，拒绝0H ，可认为信息追求者消极度假的比率显著小于非信息追求者。

10. 解：提出假设：2222012112:,:H H σσσσ=≠

由题计算得：112225,0.221,22,0.077n s n s ====

检验统计量为：22

122

20.2218.23760.077

s F s ===，而()0.02524,21 2.37F = ()/2121,1F F n n α>--，所以拒绝0H ，认为两种机器的方差存在显著差异。

第七章相关与回归分析思考题

1．相关分析与回归分析的区别与联系是什么？答：相关与回归分析是研究变量之间不确定性统计关系的重要方法，相关分析主要是判断两个或两个以上变量之间是否存在相关关系，并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。但它们在研究目的和对变量的处理上有明显区别。它们均是统计方法，不能揭示现象之间的本质关系。

3.什么是总体回归函数和样本回归函数？它们之间的区别是什么？答：以简单线性回归模型为例，总体回归函数是总体因变量的条件期望表现为自变量的函数：()()i i i E Y X f X X αβ==+，或i i i Y X u αβ=++。总体回归函数是确定的和未知的，是回归分析所估计的对象。样本回归函数是根据样本数据所估

计出的因变量与自变量之间的函数关系：???i i y x αβ=+或??i i i y x e αβ=++。回归分析的目的是用样本回归函数来估计总体回归函数。它们的区别在于，总体回归函数是未知但是确定的，而样本回归函数是随样本波动而变化；总体回归函数的参

数,αβ是确定的，而样本回归函数的系数??,α

β是随机变量；总体回归函数中的误差项i u 不可观察的，而样本回归函数中的残差项i e 是可以观察的。

4. 什么是随机误差项和残差？它们之间的区别是什么？

答：随机误差项i u 表示自变量之外其他变量的对因变量产生的影响，是不可观察的，通常要对其给出一定的假设。残差项i e 指因变量实际观察值与样本回归函数计算的估计值之间的偏差，是可以观测的。它们的区别在于，反映的含义是不同且可观察性也不同，它们的联系可有下式:

()()()()()

垐?垐?i i i i i i i i

e y x x u x x u αβαβαβααββ=-+=++-+=-+-+

5.为什么在对参数进行最小二乘估计时，要对模型提出一些基本的假定？

答:最小二乘法只是寻找估计量的一种方法，其寻找到的估计量是否具有良好的性质则依赖模型的一些基本的假定。只有在一系列的经典假定下，最小二乘估计量才是BLUE 。

15. ．为什么在多元回归中要对可决系数进行修正？

答：在样本容量一定下，随着模型中自变量个数的增加，可决系数2R 会随之增加，模型的拟合程度上升，但自由度会损失，从而降低推断的精度，因此需要用自由度来修正可决系数，用修正的可决系数来判断增加自变量的合适性。 16．在多元线性回归中，对参数作了t 检验后为什么还要作方差分析和F 检验？答：t 检验仅是对单个系数的显著性进行检验，由于自变量之间存在着较为复杂的关系，因此有必要对回归系数进行整体检验，方差分析和F 检验就是对回归方程的整体统计显著性进行的检验方法。

练习题

1. 解：设简单线性回归方程为：12y x ββε=++

（1）采用OLS 估计：()()()

334229.09

?0.786425053.73i i i x x y y x x β--===-∑∑ 11

??549.80.786*647.8840.566y x ββ=-=-= 回归系数经济意义：销售收入每增加1万元，销售成本会增加0.786万元。

（2）可决系数为：()()()()2

334229.090.9998425053.73*262855.25

i i i i x x y y R x x y y ??--??===--∑∑∑

回归标准误：

? 2.29σ

===

（3）检验统计量为：()

2??223.76?t Se ββ==

所以2β是显著不为零

（4）预测：12???40.5660.786*800669.366f f y x ββ=+=+= 95%

的

预

测

区间为

：

? 1.96*669.366f y σ±=±即（ 664.579 ，674.153）

2. （1）

（2）负相关关系（3）

_cons 6.017831 1.05226 5.72 0.001 3.529632 8.50603

x -.0704144 .0141757 -4.97 0.002 -.1039346 -.0368941 y Coef. Std. Err. t P>|t| [95% Conf. Interval] Total .819155592 8 .102394449 Root MSE = .16082 Adj R-squared = 0.7474 Residual .181036906 7 .025862415 R-squared = 0.7790 Model .638118686 1 .638118686 Prob > F = 0.0016 F( 1, 7) = 24.67 Source SS df MS Number of obs = 9

（4）估计的斜率系数为－7.0414，表示航班的正点率每提高1％，百万名乘客的投诉次数会下降：7.0414*0.01=0.070414次。

（5）如果0.8f x =，则 6.01787.0414*0.80.38468f y =-=次 3.

Results of multiple regression for y

Summary measures

Multiple R 0.9521 R-Square 0.9065 Adj R-Square 0.8910 StErr of Est 3.3313

ANOVA Table

Source df SS

MS F p-value Explained 3 1937.7485 645.9162 58.2048

0.0000

Unexplained 18

199.7515

11.0973

Regression coefficients

Coefficient

Std Err t-value p-value Lower limit

Constant 32.9931 3.1386 10.5121 0.0000 26.3991 x1 0.0716 0.0148 4.8539 0.0001 0.0406 x2 16.8727 3.9956 4.2228 0.0005 8.4782 x3

17.9042

4.8869

3.6637 0.0018

7.6372

Source SS df MS Number of obs = 29 F( 1, 27) = 3034.13 Model 2.9873e+10 1 2.9873e+10 Prob > F = 0.0000 Residual 265831846 27 9845623.91 R-squared = 0.9912 Adj R-squared = 0.9909 Total 3.0139e+10 28 1.0764e+09 Root MSE = 3137.8 consump Coef. Std. Err. t P>|t| [95% Conf. Interval]

gnp .5459054 .0099106 55.08 0.000 .5255705 .5662403 _cons 2426.563 809.8789 3.00 0.006 764.829 4088.298 Source SS df MS Number of obs = 29

F( 1, 27) = 3034.13

Model 2.9873e+10 1 2.9873e+10 Prob > F = 0.0000

Residual 265831769 27 9845621.08 R-squared = 0.9912

Adj R-squared = 0.9909

Total 3.0139e+10 28 1.0764e+09 Root MSE = 3137.8

consump Coef. Std. Err. t P>|t| [95% Conf. Interval]

gnpf .5459054 .0099106 55.08 0.000 .5255705 .5662403

_cons 131260.2 1869.528 70.21 0.000 127424.3 135096.2

Source SS df MS Number of obs = 28 F( 2, 26) =12845.95 Model 6.2442e+10 2 3.1221e+10 Prob > F = 0.0000 Residual 63190678.2 26 2430410.7 R-squared = 0.9990 Adj R-squared = 0.9989 Total 6.2505e+10 28 2.2323e+09 Root MSE = 1559 consump Coef. Std. Err. t P>|t| [95% Conf. Interval]

gnp .1325853 .0398154 3.33 0.003 .0507435 .2144272 consump_lag .8546615 .0781069 10.94 0.000 .6941105 1.015213

_cons 1211.364 377.8058 3.21 0.004 433.2588 1989.47 consump_lag .7797504 .0710054 10.98 0.000 .633512 .9259889 gnp .1603467 .0352595 4.55 0.000 .0877283 .2329651 consump Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 2.9132e+10 27 1.0790e+09 Root MSE = 1338.3 Adj R-squared = 0.9983 Residual 44777396.2 25 1791095.85 R-squared = 0.9985 Model 2.9088e+10 2 1.4544e+10 Prob > F = 0.0000 F( 2, 25) = 8120.05 Source SS df MS Number of obs = 28

_cons .6662515 .0048402 137.65 0.000 .6563202 .6761829 gnp -6.59e-07 5.92e-08 -11.13 0.000 -7.81e-07 -5.38e-07 consump_ra~o Coef. Std. Err. t P>|t| [95% Conf. Interval] Total .053090118 28 .001896076 Root MSE = .01875 Adj R-squared = 0.8145 Residual .009495109 27 .000351671 R-squared = 0.8212 Model .043595009 1 .043595009 Prob > F = 0.0000 F( 1, 27) = 123.97 Source SS df MS Number of obs = 29

7. 解

（1）样本容量：115TSS n df =+=

（2）660426596577RSS TSS ESS =-=-= （3）15312,12RSS ESS df n k df k =-=-==-= (4)2659650.998866042ESS R TSS =

==，()()22114

11110.99880.998612

n R R n k -=--=--=- (5)用F 检验：()()/165965/2

5140/77/12

ESS k F RSS n k -===-，()0.052,12 3.89F =

23,x x 整体对y 有显著影响，但不能确定单个对y 的贡献。

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平）第三版第1章绪论 1．什么是统计学?怎样理解统计学与统计数据的关系? 2．试举出日常生活或工作中统计数据及其规律性的例子。 3．．一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此，他们开始检查供货商的集装箱，有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆，每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)描述推断。答：(1)总体：最近的一个集装箱内的全部油漆； (2)研究变量：装满的油漆罐的质量； (3)样本：最近的一个集装箱内的50罐油漆； (4)推断：50罐油漆的质量应为4.536×50＝226.8 kg。 4．“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分，选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中，两个品牌不做外观标记)，请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)一描述推断。答：(1)总体：市场上的“可口可乐”与“百事可乐” (2)研究变量：更好口味的品牌名称； (3)样本：1000名消费者品尝的两个品牌 (4)推断：两个品牌中哪个口味更好。第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量，随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为：A.好；B.较好；C.一般；D.差；E.较差。调查结果如下： B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型；

社会统计学复习题(有答案)

社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数）１、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零 ;各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度＝平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5％,实际增长了1０％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度。 9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。１0、从内容上看，统计表由主词和宾词两个部分组成;从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）; 四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数ｒ=0，则表明两个变量之间不存在线性相关关系。二、判断题

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章统计描述【】某企业生产铝合金钢，计划年产量40万吨，实际年产量45万吨；计划降低成本5%，实际降低成本8%；计划劳动生产率提高8%，实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量即产量超额完成%。成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比即成本超额完成%。劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比即劳动生产率超额完成%。【】某煤矿可采储量为200亿吨，计划在1991~1995年五年中开采全部储量的%，试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。【解】本题采用累计法：（1）该煤矿原煤开采量五年计划完成=100% ?数计划期间计划规定累计数计划期间实际完成累计 = 75%.1261021025357 4 =?? 即：该煤矿原煤开采量的五年计划超额完成%。（2）将1991年的实际开采量一直加到1995年上半年的实际开采量，结果为2000万吨，此时恰好等于五年的计划开采量，所以可知，提前半年完成计划。【】我国1991年和1994年工业总产值资料如下表：

要求：（1）计算我国1991年和1994年轻工业总产值占工业总产值的比重，填入表中；（2）1991年、1994年轻工业与重工业之间是什么比例（用系数表示）（3）假如工业总产值1994年计划比1991年增长45%，实际比计划多增长百分之几？ 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈； 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ （3） %37.25 1%) 451(2824851353 ≈-+ 即，94年实际比计划增长%。【】某乡三个村2000年小麦播种面积与亩产量资料如下表：要求：（1）填上表中所缺数字；（2）用播种面积作权数，计算三个村小麦平均亩产量；（3）用比重作权数，计算三个村小麦平均亩产量。

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念（1 ）随机变量答：在统计学上把取值之前，不能准确预料取到什么值的变量，称为随机变量。（2）总体答：总体（population ）又称为母全体或全域，是具有某种特征的一类事物的总体，是研究对象的全体。（3）样本答：样本是从总体中抽取的一部分个体。（4）个体答：构成总体的每个基本单元。（5）次数是指某一事件在某一类别中出现的数目，又称作频数，用f表示。（6）频率答：又称相对次数，即某一事件发生的次数除以总的事件数目，通常用比例或百分数来表示。（7）概率答：概率（probability）, 概率论术语，指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值，称为事件A的概率，记为P（A）。（8）统计量答：样本的特征值叫做统计量，又称作特征值。（9）参数答：又称总体参数，是描述一个总体情况的统计指标。（10）观测值答：随机变量的取值，一个随机变量可以有多个观测值。 2何谓心理与教育统计学？学习它有何意义？答：（1）心理与教育统计学是专门研究如何运用统计学原理和方法，搜集、整理、分析心理与教育科学研究中获得的随机性数据资料，并根据这些数据资料传递的信息，进行科学推论找出心理与教育统计活动规律的一门学科。具体讲，就是在心理与教育研究中，通过调查、实验、测量等手段有意地获取一些数据，并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理，最后得出结论的一种研究方法。（2）学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类，从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力，就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。凡是客观存在事物，都有数量的表现。凡是有数量表现的事物，都可以进行测量。心理与教育现象是一种客观存在的事物，它也有数量的表现。虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多，难以准确测量。但是它毕竟还是可以测量的。因此，在进行心理与教育科学研究时，在一定条件下，是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

统计学课后答案

4．1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位：台)排序后如下： 2 4 7 10 10 10 12 12 14 15 要求：（1）计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。解： Statistics 汽车销售数量 N Valid10 Missing0 Mean Median Mode10 Std. Deviation Percentiles25 50 75 4．2 随机抽取25个网络用户，得到他们的年龄数据如下： 1915292524 2321382218 3020191916 2327223424 4120311723 要求；(1)计算众数、中位数： 1、排序形成单变量分值的频数分布和累计频数分布：网络用户的年龄

从频数看出，众数Mo 有两个：19、23；从累计频数看，中位数Me=23。 (2)根据定义公式计算四分位数。 Q1位置=25/4=，因此Q1=19，Q3位置=3×25/4=，因此Q3=27，或者，由于25 和27都只有一个，因此Q3也可等于25+×2=。 (3)计算平均数和标准差； Mean=；Std. Deviation= (4)计算偏态系数和峰态系数： Skewness=；Kurtosis= (5)对网民年龄的分布特征进行综合分析：分布，均值=24、标准差=、呈右偏分布。如需看清楚分布形态，需要进行分组。为分组情况下的直方图：为分组情况下的概率密度曲线：分组： 1、确定组数：()lg 25lg() 1.398111 5.64lg(2)lg 20.30103 n K =+ =+=+=，取k=6 2、确定组距：组距＝( 最大值 - 最小值)÷ 组数=（41-15）÷6=，取5 3、分组频数表网络用户的年龄 (Binned)

统计学第六版部分课后题答案

第四章数据分布特征的测度 4.6 解：先计算出各组组中值如下： 4.8 解： ⑴ ⑵体重的平均数体重的标准差 ⑶ 55—65kg 相当于μ-1σ到μ+1σ 根据经验法则：大约有68％的人体重在此范围内。 ⑷ 40—60kg 相当于μ-2σ到μ+2σ 2501935030450425501865011426.7120116.5 i M f x f s ?+?+?+?+?=====∑∑ 大。所以，女生的体重差异＝＝＝离散系数＝＝＝离散系数女男10 .010 1 505v 08.012 1 605v =μσ=μσσσ) (1102.250)(1322.260磅＝磅＝女男=?μ=?μ) (112.25磅＝=?σ

根据经验法则：大约有95％的人体重在此范围内。 4.9 解：在A 项测试中得115分，其标准分数为：在B 项测试中得425分，其标准分数为：所以，在A 项中的成绩理想。 4.11 解：成年组的标准差为：幼儿组的标准差为：所以，幼儿组身高差异大。 115 100 115X Z =-=σμ-=5.050 400425X Z =-=σμ-= 172.1 4.24.2 2.4%172.1s x x n s s V x = == ====∑ 71.3 2.52.5 3.5% 71.3s x x n s s V x = =====∑

第七章参数估计 7.7 根据题意：N=7500，n=36（大样本）总体标准差σ未知，可以用样本标准差s 代替 32 .336 4.119n x x ===∑样本均值 2 1.61 s z α= =样本标准差：边际误差为：22222 90 1.645 1.6451.61 1.6450.446 3.320.44 (2.883.76)95 1.9699 2.58(2.803.84)(2.634.01) z z x z z z ααααα==?=±=±置信水平％时，＝平均上网时间的置信区间为：，同理，置信水平％时，＝；置信水平％时，＝平均上网时间的置信区间分别为：，；，

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下（单位：万元）： 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组，编制频数分布表，并计算出累积频数和累积频率； (2)如果按规定：销售收入在125万元以上为先进企业，115万～125万元为良好企业，105万～115万元为一般企业，105万元以下为落后企业，按先进企业、良好企业、一般企业、落后企业进行分组。解：（1）要求对销售收入的数据进行分组，全部数据中，最大的为152，最小的为87，知数据全距为152－87=65；为便于计算和分析，确定将数据分为6组，各组组距为10，组限以整10划分；为使数据的分布满足穷尽和互斥的要求，注意到，按上面的分组方式，最小值87可能落在最小组之下，最大值152可能落在最大组之上，将最小组和最大组设计成开口形式；按照“上限不在组内”的原则，用划记法统计各组内数据的个数——企业数，也可以用Excel 进行排序统计(见Excel练习题2.2)，将结果填入表内，得到频数分布表如下表中的左两列；将各组企业数除以企业总数40，得到各组频率，填入表中第三列；在向上的数轴中标出频数的分布，由下至上逐组计算企业数的向上累积及频率的向上累积，由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下： 40个企业按产品销售收入分组表（2）按题目要求分组并进行统计，得到分组表如下：某管理局下属40个企分组表按销售收入分组（万元）企业数（个）频率（%）先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业一、P118 1 题目：10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问：（1）学习时间与考试成绩之间是否相关？（2）比较两组数据谁的差异程度大一些？（3）比较学生2与学生9的期末考试测验成绩。表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤：（1）第一步：定义变量：“xuexishijian”、“xuexichengji”后，输入数据.如下图： 1

第二步：单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”，将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中，如下图：第三步：点击“确定“后，输出结果如下图：第四步：分析结果

3 由上图可知：学习时间与学习成绩之间的pearson 相关系数为0.714，p （双侧）为0.20。自由度 df=10-2=8时，查“皮尔逊积差相关系数显著临界值表”知：r 0.05= 0.623 ； r 0.01=0.765。因为0.765 > 0.714 >0.623，所以在0.05水平上学习时间和学习成绩是相关显著的。（2）SPSS 软件分析结果如下图：由上图可知：学习时间标准差和平均值为：S 1=12.037 ?X 1= 29.00 ；学习时间标准差和平均值为：S 2=12.437?X 2=56.00 根据差异系数公式可知：学习时间差异系数为：%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为：%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。（4）把学生2和学生9的期末考试成绩转化成标准分数： Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知：学生2期末考试测验成绩优于学生9的期末考试测验成绩。二、P119 2 题目：某班数学的平均成绩为90，标准差10；化学的平均分为85，标准差为8；物理的平均分为79，标准差为15.某生这三科成绩分别为95,80,80.试问（1）该生在哪一学科上突出一些？（2）该班三科成绩的差异度如何？有无学习分化现象？（3）该生的学期分数是多少？（4）三科的总平均和总标准差是多少？解题步骤：

社会统计学习题和答案--相关与回归分析报告

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类（列联表）·削减误差比例（PRE ）·λ系数与τ系数第三节定序变量的相关分析同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数（τa 系数、τb 与τc 系数）·萨默斯系数（d 系数）·斯皮尔曼等级相关（ρ相关）·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析（二次曲线指数曲线）一、填空 1．对于表现为因果关系的相关关系来说，自变量一般都是确定性变量，依变量则一般是（随机性）变量。 2．变量间的相关程度，可以用不知Y 与X 有关系时预测Y 的全部误差E 1，减去知道Y 与X 有关系时预测Y 的联系误差E 2，再将其化为比例来度量，这就是（削减误差比例）。 3．依据数理统计原理，在样本容量较大的情况下，可以作出以下两个假定：（1）实际观察值Y 围绕每个估计值c Y 是服从（）；（2）分布中围绕每个可能的c Y 值的（）是相同的。 4．在数量上表现为现象依存关系的两个变量，通常称为自变量和因变量。自变量是作为（变化根据）的变量，因变量是随（自变量）的变化而发生相应变化的变量。 5．根据资料，分析现象之间是否存在相关关系，其表现形式或类型如何，并对具有相关关系的现象之间数量变化的议案关系进行测定，即建立一个相关的数学表达式，称为（回归方程），并据以进行估计和预测。这种分析方法，通常又称为（回归分析）。 6．积差系数r 是（协方差）与X 和Y 的标准差的乘积之比。二、单项选择 1．当x 按一定数额增加时，y 也近似地按一定数额随之增加，那么可以说x 与y 之间存在（ A ）关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

教育统计学复习题及答案

２、标志是说明总体特征的，指标是说明总体单位特征的。（） 3、统计数据的真实性是统计工作的生命（） 4、汉族是一个品质标志。（） 5、描述一组数据波动情况的量数称为差异量数。（） 6、集中量数反映的是一组数据的集中趋势。（） 7、在一个总体中，算术平均数、众数、中位数可能相等。（） 8、同一总体各组的结构相对指标数值之和不一定等于100%。（） 9、不重复抽样误差一定大于重复抽样误差。（） 10. 一致性是用样本统计量估计统计参数时最基本的要求。（）三、选择题 1．某班学生的平均年龄为22岁，这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2．统计调查中，调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3．统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4．下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5．统计抽样调查中，样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中，b表示( )。增加1个单位，y增加a的数量增加1个单位，x增加b的数量增加1个单位，x的平均增加量增加1个单位，y的平均增加量 7．下列统计指标中，属于数量指标的有（） A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下，重复抽样的抽样极限误差增加1倍，则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍四、简答题 1．学习教育统计学有哪些意义？

统计学课后习题答案(Chap1.2)

第1章绪论 1．什么是统计学怎样理解统计学与统计数据的关系 2．试举出日常生活或工作中统计数据及其规律性的例子。 3．．一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此，他们开始检查供货商的集装箱，有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆，每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)描述推断。答：(1)总体：最近的一个集装箱内的全部油漆； (2)研究变量：装满的油漆罐的质量； (3)样本：最近的一个集装箱内的50罐油漆； (4)推断：50罐油漆的质量应为×50＝226.8 kg。 4．“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分，选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中，两个品牌不做外观标记)，请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)一描述推断。答：(1)总体：市场上的“可口可乐”与“百事可乐” (2)研究变量：更好口味的品牌名称； (3)样本：1000名消费者品尝的两个品牌 (4)推断：两个品牌中哪个口味更好。第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量，随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为：A.好；B.较好；C.一般；D.差；E.较差。调查结果如下： B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型； (2)用Excel制作一张频数分布表；

2014统计学课后复习题答案

《应用统计学》习题解答第一章绪论【1.1】指出下列变量的类型：（1）汽车销售量；（2）产品等级；（3）到某地出差乘坐的交通工具（汽车、轮船、飞机）；（4）年龄；（5）性别；（6）对某种社会现象的看法（赞成、中立、反对）。【解】（1）数值型变量（2）顺序变量（3）分类变量（4）数值型变量（5）分类变量（6）顺序变量【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。要求：（1）描述总体和样本。（2）指出参数和统计量。（3）这里涉及到的统计指标是什么？【解】（1）总体：某大学所有的大学生样本：从某大学抽取的200名大学生（2）参数：某大学大学生的月平均消费水平统计量：从某大学抽取的200名大学生的月平均消费水平（3）200名大学生的总消费，平均消费水平【1.3】下面是社会经济生活中常用的统计指标： ①轿车生产总量，②旅游收入，③经济发展速度，④人口出生率，⑤安置再就业人数，⑥全国第三产业发展速度，⑦城镇居民人均可支配收入，⑧恩格尔系数。在这些指标中，哪些是数量指标，哪些是质量指标？如何区分质量指标与数量指标？【解】数量指标有：①、②、⑤ 质量指标有：③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标，表现为绝对数的形式，并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标，通常是两个有联系的统计指标对比的结果。【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查，其中60%的居民对自己的居住环境表示满意，70%的居民回答他们的月收入在6000元以下，生活压力大。回答以下问题：（1）这一研究的总体是什么？（2）月收入是分类变量、顺序变量还是数值型变量？（3）对居住环境的满意程度是什么变量？【解】（1）这一研究的总体是某小区的所有居民。

教育统计学课后练习参考答案

教育统计学课后练习参考答案第一章 1、教育统计学，就是应用数理统计学的一般原理和方法，对教育调查和教育实验等途径所获得的数据资料进行整理、分析，并以此为依据，进行科学推断，从而揭示蕴含在教育现象中的客观规律的一门科学。教育统计学既是统计科学中的一个分支学科，又是教育科学中的一个分支学科，是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看，教育统计学属于教育科学体系的一个方法论分支；从学科性质来看，教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理，计算出简单明白的统计量数来描述庞大的资料，以显示其分布特征的统计方法。推断统计又叫分析统计，它根据统计学的原理和方法，从我们所研究的全体对象（即总体）中，按照等可能性原则采取随机抽样的方法，抽出总体中具有代表性的部分个体组成样本，在样本所提供的数据的基础上，运用概率理论进行分析、论证，在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中，一种事物常存在几种可能出现的情况或获得几种可能的结果，这类现象称为随机现象。随机现象具的特点：（1）一次条件完全相同的实验有多种可能的结果（这样的实验称为随机实验）；（2）在实验之前不能确切知道哪种结果会发生；（3）在相同的条件下可以重复进行这样的实验。 4、总体，也叫做母体或全域，是指具有某种共同特征的个体的总和。当所研究的总体数量非常大时，可以从总体中抽取其中一部分个体来观测，由此来推断总体的信息，从总体中抽出的这部分个体就称为样本，它是用以表征总体的个体的集合。通常将样本中样本个数大于或等于30个的样本称为大样本，小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后，仍放回原总体，然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数，简称参数。反映样本特征的量数叫做样本统计量，简称统计量。参数是总体的真正数值，是固定的常量，理论上应该通过计算总体中全部个体的数值而获得，但由于总体中个体的数量通常很大，总体参数往往很难获得，在统计分析中一般通过样本的数值来估计。在进行推断统计时，就是根据样本统计量来推断总体相应的参数。第二章 1、按照数据的来源，可分为计数数据和度量数据；按照数据的取值情况，可分为间断性数据和连续性数据；按照数据的测量水平，可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了；表的层次要清晰；主谓分明。 4、连续性数据：（2），（3）；间断性数据：（1），（4）。 5、略 6、（1）50；（2）75；（3）34；（4）5；（5）45

社会统计学复习题有答案

社会统计学复习题有答案集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题一、填空题（计算结果一般保留两位小数） 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标；某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零；各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度= 平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多；曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6％，实际降低了7％，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度；若某厂计划规定B 产品产量较上年增长5％，实际增长了10％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度。

9、按照标志表现划分，学生的民族、性别、籍贯属于品质标志；学生的体重、年龄、成绩属于数量标志。 10、从内容上看，统计表由主词和宾词两个部分组成；从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）；四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关；而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数r=0，则表明两个变量之间不存在线性相关关系。二、判断题 1、在季节变动分析中，若季节比率大于100%，说明现象处在淡季；若季节比率小于100%，说明现象处在旺季。（×；答案提示：在季节变动分析中，若季节比率大于100%，说明现象处在旺季；若季节比率小于100%，说明现象处在淡季。） 2、工业产值属于离散变量；设备数量属于连续变量。（×；答案提示：工业产值属于连续变量；设备数量属于离散变量） 3、中位数与众数不容易受到原始数据中极值的影响。（√；） 4、有意识地选择十个具有代表性的城市调查居民消费情况，这种调查方式属于典型调查。（√）

免费《统计学》课后答案

统计学费宇石磊（主编）第2章练习题参考答案 2.1解：(1)首先将顾客态度分别用代码1、2、3表示，然后在数据文件的Varible View窗口Values栏定义变量值标签：1代表“喜欢并愿意购买”；2代表“不喜欢”，3代表“喜欢并愿意购买”。操作步骤：依次点击File→点击open→点击Data→打开数据文件ex2.1→点击Analyze→点击Descriptive Statistics→点击Frequencies→将“态度”选入Variable框→点击OK。输出结果如表2.1所示：（2）根据表2.1频数分布表资料建立的数据文件为绘制条形图操作步骤：依次点击File→点击open→点击Data→打开数据文件，选中Summaries for groups of cases→单击Define→选中Other Summary function→将“人数”选入Variable（纵轴），将“态度分类”选入Category Axis （横轴）→点击OK。输出结果如图2.1所示：

图2.1 30名顾客满意程度分布条形图绘制饼图操作步骤：依次点击File→点击open→点击Data→打开数据文件 of individual cases→点击Define→将“人数”选入Slices Represent栏，将“态度分类”选入Variable栏→点击OK。输出结果如图2.2所示： 2.2解:首先列计算表如表2.2所示：表2.2 120名学生英语成绩的均值、中位数、众数、偏态系数、峰度系数计算表

（1）均值151 872072.67120 i i i i i x f x f === = =∑∑（分）表2.2中，分布次数最多的组是“40～50”组，这就是众数所在组；2 N =60，中位数大约在第60位，可确定中位数也在“40～50”组。众数10124230 701073.333018M L i ?-=+ ?=+?=?+?-+-（分）（42）（42）中位数11204922701072.6242 m e m N S M L i f ---=+?=+?=（分）（2）首先计算标准差：11.65s = =（分） 3 1 1 3 3 () /38389.64/120 0.202311.65k k i i i i x x f f SK s ==-= = =∑∑ 由计算结果可看出，偏态系数为正值，但与零的差距不大，说明120名大学生英语成绩为轻微右偏分布，成绩较低的同学占有一定的比例，但偏斜程度不大。 4 1 1 4 4 () /5108282.61/120 330.689111.65k k i i i i x x f f K s ==-= -= -=-∑∑ 由计算结果可看出，峰度系数为负值，说明120名大学生英语成绩为平峰分布，成绩较低的同学占一定比例，但低成绩区域的集中程度并不很高。 2.3解(1)整理的组距数列如表表2.3.1 连续60天计算机销售量频数分布表

精选-《教育统计学》复习题及答案

《教育统计学》复习题及答案一、填空题 1．教育统计学的研究对象是．教育问题。 2．一般情况下，大样本是指样本容量．大于30 的样本。 3．标志是说明总体单位的名称，它有．品质标志和数量标志两种。 4．统计工作的三个基本步骤是：、和。 5．集中量数是反映一组数据的趋势的。 6．“65、66、72、83、89”这组数据的算术平均数是。 7．6位学生的身高分别为：145、135、128、145、140、130厘米，他们的众数是。 8．若某班学生数学成绩的标准差是8分，平均分是80分，其标准差系数是。 9．参数估计的方法有和两种。 10．若两个变量之间的相关系数是负数，则它们之间存在。 11．统计工作与统计资料的关系是和的关系。 12．标准差越大，说明总体平均数的代表性越，标准差越小，说明总体平均数的代表性越。 13．总量指标按其反映的内容不同可以分为和。二、判断题 1、教育统计学属于应用统计学。（）２、标志是说明总体特征的，指标是说明总体单位特征的。（） 3、统计数据的真实性是统计工作的生命（） 4、汉族是一个品质标志。（） 5、描述一组数据波动情况的量数称为差异量数。（） 6、集中量数反映的是一组数据的集中趋势。（） 7、在一个总体中，算术平均数、众数、中位数可能相等。（） 8、同一总体各组的结构相对指标数值之和不一定等于100%。（） 9、不重复抽样误差一定大于重复抽样误差。（） 10. 一致性是用样本统计量估计统计参数时最基本的要求。（）三、选择题 1．某班学生的平均年龄为22岁，这里的22岁为( )。

A.指标值 B.标志值 C.变量值 D.数量标志值 2．统计调查中，调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3．统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4．下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5．统计抽样调查中，样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中，b表示( )。 A.x增加1个单位，y增加a的数量 B.y增加1个单位，x增加b的数量 C.y增加1个单位，x的平均增加量 D.x增加1个单位，y的平均增加量 7．下列统计指标中，属于数量指标的有（） A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下，重复抽样的抽样极限误差增加1倍，则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍四、简答题 1．学习教育统计学有哪些意义？答：（1）教育统计是教育科学研究的工具；（2）学习教育统计学有利于教育行政和管理工作者正确掌握情况，进行科学决策；（3）教育统计是教育评价不可缺少的工具；（4）学习教育统计学有利于训练科学的推理与思维方法。 2．统计图表的作用有哪几方面？ 1）表明同类统计事项指标的对比关系；（2）揭示总体内部的结构；（3）反映统计事项的发展动态；（4）分析统计事项之间的依存关系；（5）说明总体单位的分配；（6）检查计划的执行情况；（7）观察统计事项在地域上的分布。 3．简述相关的含义及种类。答：相关就是指事物或现象之间的相互关系。

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学（第五版）贾俊平课后思考题和练习题答案（最终完整版）第一部分思考题第一章思考题 1.1什么是统计学统计学是关于数据的一门学科，它收集，处理，分析，解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计描述统计；它研究的是数据收集，处理，汇总，图表描述，概括与分析等统计方法。推断统计；它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点统计数据；按所采用的计量尺度不同分；（定性数据）分类数据：只能归于某一类别的非数字型数据，它是对事物进行分类的结果，数据表现为类别，用文字来表述；（定性数据）顺序数据：只能归于某一有序类别的非数字型数据。它也是有类别的，但这些类别是有序的。（定量数据）数值型数据：按数字尺度测量的观察值，其结果表现为具体的数值。统计数据；按统计数据都收集方法分；观测数据：是通过调查或观测而收集到的数据，这类数据是在没有对事物人为控制的条件下得到的。实验数据：在实验中控制实验对象而收集到的数据。统计数据；按被描述的现象与实践的关系分；截面数据：在相同或相似的时间点收集到的数据，也叫静态数据。时间序列数据：按时间顺序收集到的，用于描述现象随时间变化的情况，也叫动态数据。 1.4解释分类数据，顺序数据和数值型数据答案同1.3 1.5举例说明总体，样本，参数，统计量，变量这几个概念对一千灯泡进行寿命测试，那么这千个灯泡就是总体，从中抽取一百个进行检测，这一百个灯泡的集合就是样本，这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数，这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说灯泡的寿命。 1.6变量的分类变量可以分为分类变量，顺序变量，数值型变量。变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量离散型变量，只能取有限个值，取值以整数位断开，比如“企业数” 连续型变量，取之连续不断，不能一一列举，比如“温度”。 1.8统计应用实例人口普查，商场的名意调查等。 1.9统计应用的领域经济分析和政府分析还有物理，生物等等各个领域。

社会统计学习题和答案--相关与回归分析

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数第三节定序变量的相关分析同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数第四节定距变量的相关分析相关表与相关图·积差系数的导出与计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5～0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;