当前位置：文档库 › 统计学部分课后答案Word版

统计学部分课后答案Word版

思考与练习（第五章） BY 缪嘉伦思考题

1. 解释原假设与备择假设的含义，并归纳常见的几种建立原假设与备择假设的原则。

答：原假设（null hypothesis ）通常是研究者想悼念证据予以反对的假设，也称零假设，用H 0表示。

备择假设(alternative hypothesis)通常是研究者想悼念证据予以支持的假设，也称研究假设，用H l 或 H a 表示。

几种常见的原则：

第一，原假设和备择假设是一个完备事件组，而且相互对立。

第二，在建立原假设时，通常是先确定备择假设，然后再确定原假设。

第三，在假设检验中，等号“=”总是放在原假设上。

第四，在面对某一实际问题时，由于不同的研究者有不同的研究目的，即使对同一问

题也可能提出截然相反的原假设和备择假设。

第五，假设检验的目的主要是收集证据拒绝原假设。

3.什么是显著性水平？它对于假设检验决策的意义是什么？与置信水平的区别？

答：显著性水平（level of significance ）是指当原假设实际上是正确时，检验统计量落在拒绝域的概率，记为α。

它是人们事先指定的犯第I 类错误概率α的最大允许值。显著性水平α越小，犯第I 类错误的可能性自然就越小，但犯第∏类错误的可能性随之增大。

置信水平是指变量落在置信区间的可能性，记为1-α。

4.什么是P 值？P 值检验和统计量检验有什么不同？

答：P 值（P value ）就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P 值很小，说明原假设情况的发生的概率很小，而如果出现了，根据小概率原理，我们就有理由拒绝原假设，P 值越小，我们拒绝原假设的理由越充分。总之，P 值越小，表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P 值的大小和实际问题来解决。

区别：从显著性水平来比较，如果选择的α值相同，所有检验结论的可靠性都一样；通过计算P 值，可测量出样本观测数据与原假设的值0μ的偏离程度。

练习题

4. 解：提出假设： H 0 ≤ 6, H 1 > 6

已知: σ = 1.19, n = 100, 0.5α=

（1）选择检验统计量 0

/z s n =（2）拒绝规则是：若Z z α>，拒绝0H ；否则，不拒绝0H

（3）计算检验统计量的数值，即

2.941/ 1.19/100

x z s n ===

即有， 0.052.941 1.64z z z α=>==

因此，拒绝0H ，认为改进工艺能提高纤维原的平均强度。

5. 解：提出假设：0:

6.70H μ≤，1: 6.70H μ>

其中μ为如今每个家庭每天收看电视的平均时间

调查的样本：200,7.25, 2.5n x s ===

检验统计量： 3.111x z === 进行P 值检验，利用Excel 的统计函数功能进行计算，如下图

图5.5

可得z 值3.111左边的面积为0.999067725，用1减去该值，即为单侧检验的P 值，

即P 值=1 - 0.999067725 = 0.000932275，小于给定的显著性水平0.01，所以拒绝

原假设，认为如今每个家庭收看电视的平均时间增加了。

6.解：提出假设：222201:0.75,:0.75TV VCR TV H H σσσ≤=>

已知：230,2,0.05n s α===

检验统计量： 2

222/20.02522(1)(301)2103.11(1)(301)42.7220.75

VCR n s n αχχχσ--?===>-=-= 因此，拒绝0H ，认为电视寿命的方差显著大于VCR 。

10．解：提出假设：2222012112:,:H H σσσσ=≠

在Excel

中输入相关数据，如下图：

图5.10.1

利用F-检验双样本方差分析，得下图

图5.10.2

可得，检验统计量为：

21220.0488898.28490.005901s F s === 则有， 120.0252

8.2849(1,1)(24,21) 2.37F F n n F α=>--==

因此，拒绝0H ，认为两种机器生产的袋茶重量的方差存在显著差异。

思考与练习（第六章）

思考题

1. 什么是方差分析？它所研究的是什么？

答：方差分析（analysis of variance ，ANOVA ）是检验多个总体均值是否相等的

统计方法。

本质上它研究的是分类型自变量对数值型因变量的影响。

3．方差分析中有哪些基本假设？

答：（1）每个总体都应服从正态分布；（2）各个总体的方差必须相同；（3）观测值

是独立的。

4. 简述方差分析的基本思想。

答：试验指标的变化可以用指标值的方差反映，导致试验指标值发生变化的原因有

两方面：一是可控因素，二是不可控因素或未加控制因素。方差分析就是将试验指标值的方差分解成条件变差与随机误差，然后，将各因素形成的条件变差与随机误差进行比较，评价由某种因素所引起的变异是否具有统计学意义。

简述方差分析的基本步骤。

答：（1）提出假设；（2）构造检验的统计量；（3）统计决策；（4）方差分析表。

7. 解释水平项平方和、误差项平方和的含义。

答：水平项误差平方和简记为SSA ，它是各组平均值与总平均值的误差平方和，反

映各总体的样本均值之间的差异程度，因此双称为组间平方各。误差项平方和，简记为SSE ，它是每个水平或的各样本数据与其组平均值误差的平方和，反映了每个样本各观测值的离散状况，因此双称为组内平方和或残差平方和。

11. 解释试验、试验设计、试验单元的含义。

答：试验：收集样本数据的过程。

试验设计：收集样本数据的计划。

试验单元：接受“处理”的对象或实体。

12. 简述完全随机化设计、随机化区组设计、因子设计的含义。

答：含义：

完全随机化设计：将k 种“处理”随机地指派给试验单元的设计。

随机化区组设计：先按一定规则将试验单元划分为若干同质组，称为“区组”，然后

再将各种处理随机地指派给各个区组。

因子设计：考虑两个因素（可推广到多个因素）的搭配试验设计。

练习题

1. 解：提出假设：01231123:,:,,H H μμμμμμ==不完全相等

式中，i μ为第i 个样本的均值。

在Excel 中输入相关数据，如下图：

图6.1.1

利用单因素方差分析，可得

图6.1.2

从分析方差表中可以看到，由于

0.014.6574(2,9)8.021517F F =<=

所以不拒绝原假设，即不能认为3个总体的均值之间存在显著差异。

4. 解: 对两个因素分别提出如下假设：

行因素（品种）为

012345

112345::,,,,H H μμμμμμμμμμ====不全相等

列因素（施肥方案）为 01234

11234::,,,H H μμμμμμμμ===不全相等

在Excel 中输入相关数据，如下图：

图6.4.1

利用无重复双因素分析，可得

图6.4.2

从分析方差表中可以看到，

由于，

7.239716492>F 3.2591667

R F α=

所以拒绝原假设0H ，认为品种对收获量有显著影响。

由于，

9.20465763>F 3.490295R F α==

所以拒绝原假设0H ，认为施肥方案对收获量有显著影响。

思考与练习（第七章）

思考题

1. 相关分析与回归分析的区别和联系是什么？

答：相关与回归分析是研究变量之间不确定性统计关系的重要方法，相关分析主要

是判断两个或两个以上变量之间是否存在相关关系，并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。但它们在研究目的和对变量的处理上有明显区别。它们均是统计方法，不能揭示现象之间的本质关系。

3．什么是总体回归函数和样本回归函数？它们之间的区别是什么？

答：答：以简单线性回归模型为例，总体回归函数是总体因变量的条件期望表现为

自变量的函数：，或。总体回归函数是确定的和未知的，是回归分析所估计的对象。样本回归函数是根据样本数据所估计出的因变量与自变量之间的函数关系：或。回归分析的目的是用样本回归函数来估计总体回归函数。它们的区别在于，总体回归函数是未知但是确定的，而样本回归函数是随样本波动而变化；总体回归函数的参数

, 是确定的，而样本回归函数的系数,是随机变量；总体回归函数中的误差项i u 不可观察的，而样本回归函数中的残差项i e 是可以观察的。

4．什么是机误差项和残差？它们之间的区别是什么？

答：随机误差项表示自变量之外其他变量的对因变量产生的影响，是不可观察的，

通常要对其给出一定的假设。残差项指因变量实际观察值与样本回归函数计算的估计值之间的偏差，是可以观测的。它们的区别在于，反映的含义是不同且可观察性也不同，它们的联系可有下式:

5．为什么在对参数进行最小二乘估计之前，要对模型提出一些基本的假定？

答：最小二乘法只是寻找估计量的一种方法，其寻找到的估计量是否具有良好的性

质则依赖模型的一些基本的假定。只有在一系列的经典假定下，最小二乘估计量才是BLUE 。

11．为什么用可决系数能够度量回归方程对样本数据的拟合程度？为什么对多元线性回归的多重可决系数要作修正？

答：可决系数是测定变量间相关关系密切程度的统计分析指标,它也是反映自变量对

因变量的联合的影响程度。可决系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。可决系数的取值范围在

0到1之间，它是一个非负统计量。随着抽样的不同而不同，既是随样本而变动的统计量。

在样本容量一定下，随着模型中自变量个数的增加，可决系数R2会随之增加，模型的拟合程度上升，但自由度会损失，从而降低推断的精度，因此需要用自由度来修正可决系数，用修正的可决系数来判断增加自变量的合适性。

12．对回归系数显著性作t检验的基本思想是什么？在多元线性回归中，对参数作了t检验以后为什么还要作方差分析和F检验？

答：回归系数显著性检验是检验模型中每个自变量与因变量之间的线性关系是否显著。显著性检验是通过计算各回归系数的t检验值进行的。回归系数的t检验值的计算公式为：= （j = 1，2，…，k），式中是回归系数的标准差。在多元回归模型中，某个变量回归系数的t检验没有通过，说明该变量与因变量之间不存在显著的线性相关关系，在回归分析时就可以将该变量删去，或者根据情况作适当的调整，而后用剩下的自变量再进行回归分析。

t 检验仅是对单个系数的显著性进行检验，由于自变量之间存在着较为复杂的关系，因此有必要对回归系数进行整体检验，方差分析和F 检验就是对回归方程的整体统计显著性进行的检验方法。

17．试证明“在一元回归情形下F=t2, F检验与t检验是等价的”。试证明在一元回归中t 检验与F检验是等价的。

练习题

2．解：在Excel中输入相关数据，如下图，

图7.2.1

（1）如图

图7.2.2

（2）负相关关系

（3）

图7.2.3 由Excel 回归分析结果可得， 6.0178319950.0704144y x =-

（4）估计的斜率系数为－0.0704144，表示航班的正点率每提高1％，百万名乘客的投诉

次数会下降：0.0704144*1=0.0704144次。

（5） 6.0178319950.070414480=0.38y =-?

4. 解：要Excel 中输入相关数据，如下图，

图7.4.1

Excel 回归分析，可得

图7.4.2

（1）2427.0303130.545903278y x =+

（2）由Excel 回归分析结果可得，

标准误差：3137.800667

可决系数：0.991179504

（3）提出假设：

**01**01:,::,:H H H H ααααββββ=≠=≠

由图7.4.2可得， α的t 统计量为2.996756，β的t 统计量为55.082234。

若取显著性水平为5%，查t 分布表得 0.025(292) 2.0518t -=

显然，α和β的t 统计量都大于0.025(292)t -，表明应拒绝0

（4）

20072427.0303130.545903278236000=131260.2

y =+? 利用预测系数的95%上下限计算可得到95%预测区间

[]

124799.3793,137721.0287

社会统计学复习题(有答案)

社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数）１、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零 ;各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度＝平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5％,实际增长了1０％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度。 9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。１0、从内容上看，统计表由主词和宾词两个部分组成;从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）; 四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数ｒ=0，则表明两个变量之间不存在线性相关关系。二、判断题

统计学(第三版课后习题答案

Hah 和网速是无形的 1：各章练习题答案 2.1 （1）属于顺序数据。（2）频数分布表如下：服务质量等级评价的频数分布服务质量等级家庭数（频率）频率% A1414 B2121 C3232 D1818 E1515 合计100100 （3）条形图（略） 2.2 （1）频数分布表如下： 40个企业按产品销售收入分组表按销售收入分组（万元）企业数（个）频率（%）向上累积向下累积企业数频率企业数频率 100以下100～110 110～120 120～130 130～140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 ————（2）某管理局下属40个企分组表按销售收入分组（万元）企业数（个）频率（%）先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0

2.3 频数分布表如下：某百货公司日商品销售额分组表按销售额分组（万元）频数（天）频率（%） 25～30 30～35 35～40 40～45 45～50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图（略）。 2.4 （1）排序略。（2）频数分布表如下： 100只灯泡使用寿命非频数分布按使用寿命分组（小时）灯泡个数（只）频率（%） 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图（略）。（3）茎叶图如下： 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念（1 ）随机变量答：在统计学上把取值之前，不能准确预料取到什么值的变量，称为随机变量。（2）总体答：总体（population ）又称为母全体或全域，是具有某种特征的一类事物的总体，是研究对象的全体。（3）样本答：样本是从总体中抽取的一部分个体。（4）个体答：构成总体的每个基本单元。（5）次数是指某一事件在某一类别中出现的数目，又称作频数，用f表示。（6）频率答：又称相对次数，即某一事件发生的次数除以总的事件数目，通常用比例或百分数来表示。（7）概率答：概率（probability）, 概率论术语，指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值，称为事件A的概率，记为P（A）。（8）统计量答：样本的特征值叫做统计量，又称作特征值。（9）参数答：又称总体参数，是描述一个总体情况的统计指标。（10）观测值答：随机变量的取值，一个随机变量可以有多个观测值。 2何谓心理与教育统计学？学习它有何意义？答：（1）心理与教育统计学是专门研究如何运用统计学原理和方法，搜集、整理、分析心理与教育科学研究中获得的随机性数据资料，并根据这些数据资料传递的信息，进行科学推论找出心理与教育统计活动规律的一门学科。具体讲，就是在心理与教育研究中，通过调查、实验、测量等手段有意地获取一些数据，并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理，最后得出结论的一种研究方法。（2）学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类，从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力，就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。凡是客观存在事物，都有数量的表现。凡是有数量表现的事物，都可以进行测量。心理与教育现象是一种客观存在的事物，它也有数量的表现。虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多，难以准确测量。但是它毕竟还是可以测量的。因此，在进行心理与教育科学研究时，在一定条件下，是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

(完整版)医学统计学第六版课后答案

第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果，需要对其进行统计描述和统计推断，统计描述可以使数据更容易理解，统计推断则可以使用概率的方式给出结论，两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律，使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率，并使结果更加准确和可靠，数据整理主要是对数据进行归类，检查数据质量，以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征，统计推断指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图，统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标，由样本数据计算得到，参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生，随机测量误差是生物体的自然变异和各种不可预知因素产生的误差，抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学第三版答案

第1章统计和统计数据第2章 1.1 指出下面的变量类型。（1）年龄。（2）性别。（3）汽车产量。（4）员工对企业某项改革措施的态度（赞成、中立、反对）。（5）购买商品时的支付方式（现金、信用卡、支票）。详细答案：（1）数值变量。（2）分类变量。（3）数值变量。（4）顺序变量。（5）分类变量。 1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查，其中60%回答他们的月收入在5000元以上，50%的人回答他们的消费支付方式是用信用卡。（1）这一研究的总体是什么？样本是什么？样本量是多少？（2）“月收入”是分类变量、顺序变量还是数值变量？（3）“消费支付方式”是分类变量、顺序变量还是数值变量？详细答案：（1）总体是“所有IT从业者”，样本是“所抽取的1000名IT从业者”，样本量是1000。（2）数值变量。（3）分类变量。 1.3 一项调查表明，消费者每月在网上购物的平均花费是200元，他们选择在网上购物的主要原因是“价格便宜”。

（1）这一研究的总体是什么？（2）“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量？详细答案：（1）总体是“所有的网上购物者”。（2）分类变量。

1.4 某大学的商学院为了解毕业生的就业倾向，分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。（1）这种抽样方式是分层抽样、系统抽样还是整群抽样？（2）样本量是多少？详细答案：（1）分层抽样。（2）100。第2章用图表展示数据

（3）帕累托图如下：（4）饼图如下： 2.2 为确定灯泡的使用寿命（单位：小时），在一批灯泡中随机抽取100只进行测试，所得数据如下：

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业一、P118 1 题目：10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问：（1）学习时间与考试成绩之间是否相关？（2）比较两组数据谁的差异程度大一些？（3）比较学生2与学生9的期末考试测验成绩。表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤：（1）第一步：定义变量：“xuexishijian”、“xuexichengji”后，输入数据.如下图： 1

第二步：单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”，将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中，如下图：第三步：点击“确定“后，输出结果如下图：第四步：分析结果

3 由上图可知：学习时间与学习成绩之间的pearson 相关系数为0.714，p （双侧）为0.20。自由度 df=10-2=8时，查“皮尔逊积差相关系数显著临界值表”知：r 0.05= 0.623 ； r 0.01=0.765。因为0.765 > 0.714 >0.623，所以在0.05水平上学习时间和学习成绩是相关显著的。（2）SPSS 软件分析结果如下图：由上图可知：学习时间标准差和平均值为：S 1=12.037 ?X 1= 29.00 ；学习时间标准差和平均值为：S 2=12.437?X 2=56.00 根据差异系数公式可知：学习时间差异系数为：%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为：%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。（4）把学生2和学生9的期末考试成绩转化成标准分数： Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知：学生2期末考试测验成绩优于学生9的期末考试测验成绩。二、P119 2 题目：某班数学的平均成绩为90，标准差10；化学的平均分为85，标准差为8；物理的平均分为79，标准差为15.某生这三科成绩分别为95,80,80.试问（1）该生在哪一学科上突出一些？（2）该班三科成绩的差异度如何？有无学习分化现象？（3）该生的学期分数是多少？（4）三科的总平均和总标准差是多少？解题步骤：

贾俊平统计学(第六版)思考题答案

1、什么是统计学？统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计：研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。推断统计：研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型，个有什么特点？按照计量尺度不同，分为：分类数据、顺序数据、数值型数据。分类数据：只能归于某一类别的，非数字型数据。顺序数据：只能归于某一有序类别的，非数字型数据。数值型数据：按数字尺度测量的观察值，结果表现为数值。按收集方法不同。分为：观测数据、和实验数据观测数据：通过调查或观测而收集到的数据；不控制条件；社会经济领域实验数据：在试验中收集到的数据；控制条件；自然科学领域。按时间不同，分为：截面数据、时间序列数据截面数据：在相同或近似相同的时间点上收集的数据。时间序列数据：在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。总体：是包含全部研究个体的集合，包括有限总体和无限总体（围、数目判定）样本：从总体中抽取的一部分元素的集合。参数：用来描述总体特征的概括性数字度量。（平均数、标准差、比例等）统计量：用来描述样本特征的概括性数字度量。（平均数、标准差、比例等）变量：是说明样本某种特征的概念，其特点：从一次观察到下一次观察结果会呈现出差别或变化。（商品销售额、受教育程度、产品质量等级等）（对一千灯泡进行寿命测试，那么这千个灯泡就是总体，从中抽取一百个进行检测，这一百个灯泡的集合就是样本，这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数，这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说灯泡的寿命。） 5、变量可以分为哪几类？分类变量：说明事物类别；取值是分类数据。顺序变量：说明事物有序类别；取值是顺序数据数值型变量：说明事物数字特征；取值是数值型数据。变量也可以分为：随机变量和非随机变量；经验变量和理论变量 6、举例说明离散型变量和连续型变量。离散型变量：只能取有限个、可数值的变量。（企业个数、产品数量）连续型变量：可以在一个或多个区间中取任何值的变量。（年龄、温度、零件尺寸误差）7、请举出统计应用的几个例子。市场调查、人口普查等。 8、请举出应用统计学的几个领域。社会科学中的经济分析、政府政策制定等；自然科学中的物理、生物领域等。

社会统计学习题和答案--相关与回归分析报告

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类（列联表）·削减误差比例（PRE ）·λ系数与τ系数第三节定序变量的相关分析同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数（τa 系数、τb 与τc 系数）·萨默斯系数（d 系数）·斯皮尔曼等级相关（ρ相关）·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析（二次曲线指数曲线）一、填空 1．对于表现为因果关系的相关关系来说，自变量一般都是确定性变量，依变量则一般是（随机性）变量。 2．变量间的相关程度，可以用不知Y 与X 有关系时预测Y 的全部误差E 1，减去知道Y 与X 有关系时预测Y 的联系误差E 2，再将其化为比例来度量，这就是（削减误差比例）。 3．依据数理统计原理，在样本容量较大的情况下，可以作出以下两个假定：（1）实际观察值Y 围绕每个估计值c Y 是服从（）；（2）分布中围绕每个可能的c Y 值的（）是相同的。 4．在数量上表现为现象依存关系的两个变量，通常称为自变量和因变量。自变量是作为（变化根据）的变量，因变量是随（自变量）的变化而发生相应变化的变量。 5．根据资料，分析现象之间是否存在相关关系，其表现形式或类型如何，并对具有相关关系的现象之间数量变化的议案关系进行测定，即建立一个相关的数学表达式，称为（回归方程），并据以进行估计和预测。这种分析方法，通常又称为（回归分析）。 6．积差系数r 是（协方差）与X 和Y 的标准差的乘积之比。二、单项选择 1．当x 按一定数额增加时，y 也近似地按一定数额随之增加，那么可以说x 与y 之间存在（ A ）关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

第三版统计学基础练习题部分答案

第一章 1统计数据可分为哪几种类型不同类型的数据各有什么特点按照所采用的计量尺度不同，分为分类数据、顺序数据和数值型数据；按照统计数据的收集方法，分为观测的数据和实验的数据；按照被描述的对象与时间的关系，分为截面数据和时间序列数据。按计量尺度分时：分数数据中各类别之间是平等的并列关系，各类别之间的顺序是可以任意改变的；顺序数据的类别之间是可以比较顺序的；数值型数据其结果表现为具体的数值。按收集方法分时：观测数据是在没有对事物进行人为控制的条件下等到的；实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时：截面数据所描述的是现象在某一时刻的变化情况；时间序列数据所描述的是现象随时间而变化的情况。 2变量分为那几类：分类变量、顺序变量和数值型变量。 3举例说明离散型变量和连续型变量：离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. 在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.

练习书上有答案：需注意：用数值表示的属于数值变量。分类选择的属于分类变量。投票选举的属于顺序变量。第二章：简述普查和抽样调查的特点：抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查，并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点：经济性，时效性强，适应面广，准确性高。普查是为某一特定目的而专门组织一次性全面调查。特点：第一普查通常是一次性的或周期性的。第二普查一般需要规定统一的调查时间。第三普查的数据一般笔记哦啊准确，规范化程度也较高，因此它可以为抽样调查或其他调查提供基本的依据。第四普查使用范围比较狭窄，只能调查一些最基本的、特定的现象。调查方案包括哪几方面的内容：调查目的、调查对象和调查单位、调查项目和调查表。什么是调查问卷：它由哪几部分组成调查问卷是用来收集调查数据的一种工具，是调查者根据调查目的和要求所涉及的，有一系列问题、备选答案、说明以及码表组成的一种调查形式。结构：开头部分、甄别部分、主体部分和背景部分组成。

教育统计学复习题及答案

２、标志是说明总体特征的，指标是说明总体单位特征的。（） 3、统计数据的真实性是统计工作的生命（） 4、汉族是一个品质标志。（） 5、描述一组数据波动情况的量数称为差异量数。（） 6、集中量数反映的是一组数据的集中趋势。（） 7、在一个总体中，算术平均数、众数、中位数可能相等。（） 8、同一总体各组的结构相对指标数值之和不一定等于100%。（） 9、不重复抽样误差一定大于重复抽样误差。（） 10. 一致性是用样本统计量估计统计参数时最基本的要求。（）三、选择题 1．某班学生的平均年龄为22岁，这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2．统计调查中，调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3．统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4．下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5．统计抽样调查中，样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中，b表示( )。增加1个单位，y增加a的数量增加1个单位，x增加b的数量增加1个单位，x的平均增加量增加1个单位，y的平均增加量 7．下列统计指标中，属于数量指标的有（） A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下，重复抽样的抽样极限误差增加1倍，则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍四、简答题 1．学习教育统计学有哪些意义？

_统计学概论第六版习题集总答案

第一章总论一、填空题 1．威廉·配弟、约翰·格朗特 2．统计工作、统计资料、统计学、统计工作、统计资料、统计学3．数量对比分析 4．大量社会经济现象总体的数量方面 5．大量观察法、统计分组法、综合指标法、统计推断法 6．统计设计、统计调查、统计整理、统计分析 7．信息、咨询、监督 8．同质性 9．大量性、同质性、差异性 10．研究目的、总体单位 11．这些单位必须是同质的 12．属性、特征 13．变量、变量值 14．总体单位、总体 15．是否连续、离散、性质二、是非题 1．非2．非3．是4．非5．是6．非7．是8．是9．是10．非11．非12．非13．非14．是15．非三、单项选择题 1.C 2．B 3．C 4．A 5．C 6．C 7．A 8．A 9．C 10．B 11．A 12．B 13．C 14．A 15．A 四、多项选择题 1.BC 2．ABC 3．ABE 4．ABCD 5．BCDE 6．AC 7．ABCDE 8．BD 9．AB 10．ABCD 11．BD 12．ABCD 13．BD 14．ABD 15．ABC 五、简答题略第二章统计调查

一、填空题 1.统计报表普查重点调查抽样调查典型调查 2．直接观察法报告法采访法 3. 统计报表专门调查 4. 经常性一次性 5. 调查任务和目的调查项目组织实施计划 6. 单一表一览表 7. 基层填报单位综合填报单位 8. 原始记录统计台帐 9. 单一一览二、是非题 1.是 2.是 3.非 4.是 5.非 6.是 7.是 8.非 9.是 10.是三、单项选择题 1. D 2. A 3. C 4. A 5. B 6. C 7. B 8. D 9. C 10. B 四、多项选择题 1. BCE 2. ABCDE 3. ADE 4. ADE 5.ACDE 6. ABD 7. BCDE 8. ABE 9.ACD 五、简答题略第三章统计整理一、填空题 1.统计汇总选择分组标志 2.资料审核统计分组统计汇总编制统计表 3.不同相同 4.频率比率（或频率） 5.全距组距 6.上限以下 7.组中值均匀 8.离散连续重叠分组 9.手工汇总电子计算机汇总 10.平行分组体系复合分组体系 11.主词宾词

统计学课后习题参考答案

思考题与练习题参考答案【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行！第一章绪论思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板？瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。练习题参考答案一、填空题 1.调查。

2.探索、调查、发现。 3、目的。二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。第二章收集数据思考题参考答案

教育统计学课后练习参考答案

教育统计学课后练习参考答案第一章 1、教育统计学，就是应用数理统计学的一般原理和方法，对教育调查和教育实验等途径所获得的数据资料进行整理、分析，并以此为依据，进行科学推断，从而揭示蕴含在教育现象中的客观规律的一门科学。教育统计学既是统计科学中的一个分支学科，又是教育科学中的一个分支学科，是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看，教育统计学属于教育科学体系的一个方法论分支；从学科性质来看，教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理，计算出简单明白的统计量数来描述庞大的资料，以显示其分布特征的统计方法。推断统计又叫分析统计，它根据统计学的原理和方法，从我们所研究的全体对象（即总体）中，按照等可能性原则采取随机抽样的方法，抽出总体中具有代表性的部分个体组成样本，在样本所提供的数据的基础上，运用概率理论进行分析、论证，在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中，一种事物常存在几种可能出现的情况或获得几种可能的结果，这类现象称为随机现象。随机现象具的特点：（1）一次条件完全相同的实验有多种可能的结果（这样的实验称为随机实验）；（2）在实验之前不能确切知道哪种结果会发生；（3）在相同的条件下可以重复进行这样的实验。 4、总体，也叫做母体或全域，是指具有某种共同特征的个体的总和。当所研究的总体数量非常大时，可以从总体中抽取其中一部分个体来观测，由此来推断总体的信息，从总体中抽出的这部分个体就称为样本，它是用以表征总体的个体的集合。通常将样本中样本个数大于或等于30个的样本称为大样本，小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后，仍放回原总体，然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数，简称参数。反映样本特征的量数叫做样本统计量，简称统计量。参数是总体的真正数值，是固定的常量，理论上应该通过计算总体中全部个体的数值而获得，但由于总体中个体的数量通常很大，总体参数往往很难获得，在统计分析中一般通过样本的数值来估计。在进行推断统计时，就是根据样本统计量来推断总体相应的参数。第二章 1、按照数据的来源，可分为计数数据和度量数据；按照数据的取值情况，可分为间断性数据和连续性数据；按照数据的测量水平，可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了；表的层次要清晰；主谓分明。 4、连续性数据：（2），（3）；间断性数据：（1），（4）。 5、略 6、（1）50；（2）75；（3）34；（4）5；（5）45

社会统计学复习题有答案

社会统计学复习题有答案集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题一、填空题（计算结果一般保留两位小数） 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标；某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零；各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度= 平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多；曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6％，实际降低了7％，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度；若某厂计划规定B 产品产量较上年增长5％，实际增长了10％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度。

9、按照标志表现划分，学生的民族、性别、籍贯属于品质标志；学生的体重、年龄、成绩属于数量标志。 10、从内容上看，统计表由主词和宾词两个部分组成；从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）；四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关；而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数r=0，则表明两个变量之间不存在线性相关关系。二、判断题 1、在季节变动分析中，若季节比率大于100%，说明现象处在淡季；若季节比率小于100%，说明现象处在旺季。（×；答案提示：在季节变动分析中，若季节比率大于100%，说明现象处在旺季；若季节比率小于100%，说明现象处在淡季。） 2、工业产值属于离散变量；设备数量属于连续变量。（×；答案提示：工业产值属于连续变量；设备数量属于离散变量） 3、中位数与众数不容易受到原始数据中极值的影响。（√；） 4、有意识地选择十个具有代表性的城市调查居民消费情况，这种调查方式属于典型调查。（√）

《统计学》答案_第三版

第2章统计数据的描述——练习题 ●2. 解：（1）要求对销售收入的数据进行分组，全部数据中，最大的为152，最小的为87，知数据全距为152－87=65；为便于计算和分析，确定将数据分为6组，各组组距为10，组限以整10划分；为使数据的分布满足穷尽和互斥的要求，注意到，按上面的分组方式，最小值87可能落在最小组之下，最大值152可能落在最大组之上，将最小组和最大组设计成开口形式；按照“上限不在组内”的原则，用划记法统计各组内数据的个数——企业数，也可以用Excel 进行排序统计(见Excel 练习题2.2)，将结果填入表内，得到频数分布表如下表中的左两列；将各组企业数除以企业总数40，得到各组频率，填入表中第三列；在向上的数轴中标出频数的分布，由下至上逐组计算企业数的向上累积及频率的向上累积，由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下： ●13. 因为女生的离散系数为 V= s x ＝550 ＝0.1 男生体重的离散系数为 V= s x ＝560 ＝0.08 对比可知女生的体重差异较大。（2）男生：x = 602.2公斤公斤＝27.27（磅），s =2.25公斤公斤=2.27（磅）；女生：x = 2.250公斤公斤=22.73（磅），s =2.25公斤公斤 =2.27（磅）；（3）68%；（4）95%。 14 解：（1）应采用离散系数，因为成年人和幼儿的身高处于不同的水平，采用标准差比较

不合适。离散系数消除了不同组数据水平高低的影响，采用离散系数就较为合理。（2）利用Excel 进行计算，得成年组身高的平均数为172.1，标准差为4.202，从而得：成年组身高的离散系数：024.01 .1722 .4== s v ；又得幼儿组身高的平均数为71.3，标准差为2.497，从而得：幼儿组身高的离散系数： 2.497 0.03571.3 s v = =；由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相对较大。第四章参数估计（1） ●1. 解：已知总体标准差σ=5，样本容量n =40，为大样本，样本均值x =25，（1）样本均值的抽样标准差 x σσ 5=0.7906 （2）已知置信水平1－α=95%，得 α/2Z =1.96，于是，允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2. 解：（1）已假定总体标准差为σ=15元，则样本均值的抽样标准误差为 x σσ15 =2.1429 （2）已知置信水平1－α=95%，得 α/2Z =1.96，于是，允许误差是E = α/2 σ Z 6×2.1429=4.2000。（3）已知样本均值为x =120元，置信水平1－α=95%，得 α/2Z =1.96，这时总体均值的置信区间为 ±α/2 σ x Z 0±4.2=124.2115.8 可知，如果样本均值为120元，总体均值95%的置信区间为（115.8，124.2）元。 ●3. 解：⑴计算样本均值x ：将上表数据复制到Excel 表中，并整理成一列，点击最后数据下面空格，选择自动求平均值，回车，得到x =3.316667， ⑵计算样本方差s ：删除Excel 表中的平均值，点击自动求值→其它函数→STDEV →选定计算数据列→确定→确定，得到s=1.6093 也可以利用Excel 进行列表计算：选定整理成一列的第一行数据的邻列的单元格，输入“＝(a7-3.316667)^2”，回车，即得到各数据的离差平方，在最下行求总和，得到： ∑ 2i （x -x ）=90.65

精选-《教育统计学》复习题及答案

《教育统计学》复习题及答案一、填空题 1．教育统计学的研究对象是．教育问题。 2．一般情况下，大样本是指样本容量．大于30 的样本。 3．标志是说明总体单位的名称，它有．品质标志和数量标志两种。 4．统计工作的三个基本步骤是：、和。 5．集中量数是反映一组数据的趋势的。 6．“65、66、72、83、89”这组数据的算术平均数是。 7．6位学生的身高分别为：145、135、128、145、140、130厘米，他们的众数是。 8．若某班学生数学成绩的标准差是8分，平均分是80分，其标准差系数是。 9．参数估计的方法有和两种。 10．若两个变量之间的相关系数是负数，则它们之间存在。 11．统计工作与统计资料的关系是和的关系。 12．标准差越大，说明总体平均数的代表性越，标准差越小，说明总体平均数的代表性越。 13．总量指标按其反映的内容不同可以分为和。二、判断题 1、教育统计学属于应用统计学。（）２、标志是说明总体特征的，指标是说明总体单位特征的。（） 3、统计数据的真实性是统计工作的生命（） 4、汉族是一个品质标志。（） 5、描述一组数据波动情况的量数称为差异量数。（） 6、集中量数反映的是一组数据的集中趋势。（） 7、在一个总体中，算术平均数、众数、中位数可能相等。（） 8、同一总体各组的结构相对指标数值之和不一定等于100%。（） 9、不重复抽样误差一定大于重复抽样误差。（） 10. 一致性是用样本统计量估计统计参数时最基本的要求。（）三、选择题 1．某班学生的平均年龄为22岁，这里的22岁为( )。

A.指标值 B.标志值 C.变量值 D.数量标志值 2．统计调查中，调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3．统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4．下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5．统计抽样调查中，样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中，b表示( )。 A.x增加1个单位，y增加a的数量 B.y增加1个单位，x增加b的数量 C.y增加1个单位，x的平均增加量 D.x增加1个单位，y的平均增加量 7．下列统计指标中，属于数量指标的有（） A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下，重复抽样的抽样极限误差增加1倍，则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍四、简答题 1．学习教育统计学有哪些意义？答：（1）教育统计是教育科学研究的工具；（2）学习教育统计学有利于教育行政和管理工作者正确掌握情况，进行科学决策；（3）教育统计是教育评价不可缺少的工具；（4）学习教育统计学有利于训练科学的推理与思维方法。 2．统计图表的作用有哪几方面？ 1）表明同类统计事项指标的对比关系；（2）揭示总体内部的结构；（3）反映统计事项的发展动态；（4）分析统计事项之间的依存关系；（5）说明总体单位的分配；（6）检查计划的执行情况；（7）观察统计事项在地域上的分布。 3．简述相关的含义及种类。答：相关就是指事物或现象之间的相互关系。

社会统计学习题和答案--相关与回归分析

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数第三节定序变量的相关分析同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数第四节定距变量的相关分析相关表与相关图·积差系数的导出与计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5～0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;