文档库 最新最全的文档下载
当前位置:文档库 › 统计学课后思考题

统计学课后思考题

统计学课后思考题
统计学课后思考题

统计学

第一章

1.什么是统计学?怎样理解统计学与统计数据的关系?

答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。

2.简要说明统计数据的来源

答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。

3.简要说明抽样误差和非抽样误差

答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。

4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品

(2)变量:口味(如可用10分制表示)

(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。

(4)从匹配样本的观察值中推断两品牌口味的相对好坏。

第二章、统计数据的描述

思考题

1描述次数分配表的编制过程

答:分二个步骤:

(1)按照统计研究的目的,将数据按分组标志进行分组。

按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。

按数量标志进行分组,可分为单项式分组与组距式分组

单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。统计分组应遵循“不重不漏”原则

(2)将数据分配到各个组,统计各组的次数,编制次数分配表。

2.解释洛伦兹曲线及其用途

答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。

3. 一组数据的分布特征可以从哪几个方面进行测度?

答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。

4 怎样理解均值在统计中的地位?

答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,

具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统

计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响

是其使用时存在的问题。

6. 简述众数、中位数和均值的特点和应用场合。

答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状

及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,

应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提

取的信息最充分,但受极端数据的影响。

7 为什么要计算离散系数?

答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能

直接比较,由此需计算离散系数作为比较的指标。

第三章

1.总体分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知的,是统计推

断的对象。从总体中随机抽取容量为n 的样本()12,,,n x x x ,它的分布称为样本分布。由

样本的某个函数所形成的统计量()12,,,n f x x x ,它的分布称为抽样分布(如样本均值、

样本方差的分布)

2.重复抽样和不重复抽样下,样本均值的标准差分别为:

因此不重复抽样下的标准差小于重复抽样下的标准差,两者相差一个调整系数

3.解释中心极限定理的含义

答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期望和方差存

在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正态分布。中心极限定理

为均值的抽样推断奠定了理论基础。

第四章、参数估计

1. 简述评价估计量好坏的标准

2.说明区间估计的基本原理

答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本

统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。置信水平

反映估计的可信度,而区间的长度反映估计的精确度。

3.解释置信水平为95%的置信区间的含义

答:总体参数是固定的,未知的,置信区间是一个随机区间。置信水平为95%的置信区间

的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参

数的真值。

4.简述样本容量与置信水平、总体方差、允许误差的关系

答:以估计总体均值时样本容量的确定公式为例:

()22

/2

2

z

n

E

α

σ=

样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。

第五章、假设检验

思考题

1.1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则. 答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。建立两个假设的原则有:

(1)原假设和备择假设是一个完备事件组。(2)一般先确定备择假设。再确定原假设。(3)等号“=”总是放在原假设上。(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要是收集证据来拒绝原假设。

2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α。第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β。在其他条件不变时,α

增大,β减小;β增大,α减小。

3.什么是显著性水平?它对于假设检验决策的意义是什么?

答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。

4.什么是p值?p值检验和统计量检验有什么不同?

答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,p值可以有效地补充α提供地关于检

验可靠性的有限信息。

p值检验的优点在于,它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。

5.什么是统计上的显著性?

答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。显著性的意义在于“非偶然的

相关与回归分析

思考题

1.相关分析与回归分析的区别与联系是什么?

3.什么是总体回归函数和样本回归函数?它们之间的区别是什么?

答:以简单线性回归模型为例,总体回归函数是总体因变量的条件期望表现为自变量的函数:

()()i i i E Y X f X X αβ==+,或i i i Y X u αβ=++。总体回归函数是确定的和未知的,

是回归分析所估计的对象。样本回归函数是根据样本数据所估计出的因变量与自变量之间的

函数关系:???i i y x αβ=+或??i i i

y x e αβ=++。回归分析的目的是用样本回归函数来估计总体回归函数。它们的区别在于,总体回归函数是未知但是确定的,而样本回归函数是随样本

波动而变化;总体回归函数的参数,αβ是确定的,而样本回归函数的系数??,α

β是随机变量;总体回归函数中的误差项i u 不可观察的,而样本回归函数中的残差项i e 是可以观察的。

4. 什么是随机误差项和残差?它们之间的区别是什么?

答:随机误差项i u 表示自变量之外其他变量的对因变量产生的影响,是不可观察的,通常

要对其给出一定的假设。残差项i e 指因变量实际观察值与样本回归函数计算的估计值之间的

偏差,是可以观测的。它们的区别在于,反映的含义是不同且可观察性也不同,它们的联系

可有下式:

()()()()()

垐 垐 i i i i i i i i

e y x x u x x u αβαβαβααββ=-+=++-+=-+-+

5.为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定?

答:最小二乘法只是寻找估计量的一种方法,其寻找到的估计量是否具有良好的性质则依赖

模型的一些基本的假定。只有在一系列的经典假定下,最小二乘估计量才是BLUE 。

15. .为什么在多元回归中要对可决系数进行修正?

答:在样本容量一定下,随着模型中自变量个数的增加,可决系数2R 会随之增加,模型的

拟合程度上升,但自由度会损失,从而降低推断的精度,因此需要用自由度来修正可决系数,

用修正的可决系数来判断增加自变量的合适性。

16.在多元线性回归中,对参数作了t 检验后为什么还要作方差分析和F 检验?

答:t 检验仅是对单个系数的显著性进行检验,由于自变量之间存在着较为复杂的关系,因

此有必要对回归系数进行整体检验,方差分析和F 检验就是对回归方程的整体统计显著性进

行的检验方法。

练习题

1. 解:设简单线性回归方程为:12y x ββε=++ (1) 采用OLS 估计:()()()22

334229.09?0.786425053.73i i

i

x x y y x x β--===-∑∑ 11

??549.80.786*647.8840.566y x ββ=-=-=

回归系数经济意义:销售收入每增加1万元,销售成本会增加0.786万元。

(2) 可决系数为:()()()()

22222334229.090.9998425053.73*262855.25i i i i x x y y R x x y y ??--??===--∑∑∑

回归标准误:

? 2.29σ=== (3) 检验统计量为:

()

22??223.76?t Se ββ==== 所以2β是显著不为零

(4) 预测:12???40.5660.786*800669.366f f

y x ββ=+=+= 95%的预测

区间为:

? 1.96*669.366f y σ±=±即( 664.579 ,674.153)

2.

(1)

(2)负相关关系

(3) _cons 6.017831 1.05226 5.72 0.001 3.529632 8.50603

x -.0704144 .0141757 -4.97 0.002 -.1039346 -.0368941

y Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total .819155592 8 .102394449 Root MSE = .16082

Adj R-squared = 0.7474

Residual .181036906 7 .025862415 R-squared = 0.7790

Model .638118686 1 .638118686 Prob > F = 0.0016

F( 1, 7) = 24.67

Source SS df MS Number of obs = 9

(4)估计的斜率系数为-7.0414,表示航班的正点率每提高1%,百万名乘客的投诉次数

会下降:7.0414*0.01=0.070414次。

(5)如果0.8f x =,则 6.01787.0414*0.80.38468f y =-=次

3.

Results of multiple regression for y

Summary measures

Multiple R 0.9521

R-Square 0.9065

Adj R-Square 0.8910

StErr of Est 3.3313

ANOVA Table

Source df SS MS F p-value Explained 3 1937.7485 645.9162 58.2048 0.0000 Unexplained 18 199.7515 11.0973

Regression coefficients

Coefficient Std Err t-value p-value Lower limit Upp Constant 32.9931 3.1386 10.5121 0.0000 26.3991 x1 0.0716 0.0148 4.8539 0.0001 0.0406 x2 16.8727 3.9956 4.2228 0.0005 8.4782 x3 17.9042 4.8869 3.6637 0.0018 7.6372

4.

Source SS df MS Number of obs = 29 F( 1, 27) = 3034.13 Model 2.9873e+10 1 2.9873e+10 Prob > F = 0.0000 Residual 265831846 27 9845623.91 R-squared = 0.9912 Adj R-squared = 0.9909 Total 3.0139e+10 28 1.0764e+09 Root MSE = 3137.8 consump Coef. Std. Err. t P>|t| [95% Conf. Interval]

gnp .5459054 .0099106 55.08 0.000 .5255705 .5662403 _cons 2426.563 809.8789 3.00 0.006 764.829 4088.298 Source SS df MS Number of obs = 29

F( 1, 27) = 3034.13

Model 2.9873e+10 1 2.9873e+10 Prob > F = 0.0000

Residual 265831769 27 9845621.08 R-squared = 0.9912

Adj R-squared = 0.9909

Total 3.0139e+10 28 1.0764e+09 Root MSE = 3137.8

consump Coef. Std. Err. t P>|t| [95% Conf. Interval]

gnpf .5459054 .0099106 55.08 0.000 .5255705 .5662403

_cons 131260.2 1869.528 70.21 0.000 127424.3 135096.2

5.

Source SS df MS Number of obs = 28 F( 2, 26) =12845.95 Model 6.2442e+10 2 3.1221e+10 Prob > F = 0.0000 Residual 63190678.2 26 2430410.7 R-squared = 0.9990 Adj R-squared = 0.9989 Total 6.2505e+10 28 2.2323e+09 Root MSE = 1559 consump Coef. Std. Err. t P>|t| [95% Conf. Interval]

gnp .1325853 .0398154 3.33 0.003 .0507435 .2144272 consump_lag .8546615 .0781069 10.94 0.000 .6941105 1.015213

_cons 1211.364 377.8058 3.21 0.004 433.2588 1989.47

consump_lag .7797504 .0710054 10.98 0.000 .633512 .9259889

gnp .1603467 .0352595 4.55 0.000 .0877283 .2329651

consump Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 2.9132e+10 27 1.0790e+09 Root MSE = 1338.3

Adj R-squared = 0.9983

Residual 44777396.2 25 1791095.85 R-squared = 0.9985

Model 2.9088e+10 2 1.4544e+10 Prob > F = 0.0000

F( 2, 25) = 8120.05

Source SS df MS Number of obs = 28 _cons .6662515 .0048402 137.65 0.000 .6563202 .6761829 gnp -6.59e-07 5.92e-08 -11.13 0.000 -7.81e-07 -5.38e-07 consump_ra~o Coef. Std. Err. t P>|t| [95% Conf. Interval] Total .053090118 28 .001896076 Root MSE = .01875 Adj R-squared = 0.8145 Residual .009495109 27 .000351671 R-squared = 0.8212 Model .043595009 1 .043595009 Prob > F = 0.0000 F( 1, 27) = 123.97 Source SS df MS Number of obs = 29

7. 解

(1)样本容量:115TSS n df =+=

(2)660426596577RSS TSS ESS =-=-=

(3)15312,12RSS ESS df n k df k =-=-==-=

(4)2659650.998866042ESS R TSS ===,()()2211411110.99880.998612

n R R n k -=--=--=- (5)用F 检验:()()/165965/25140/77/12

ESS k F RSS n k -===-,()0.052,12 3.89F = 23,x x 整体对y 有显著影响,但不能确定单个对y 的贡献。

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学课后练习题。部分题目有附标准答案。

第三章统计数据的整理和显示习题 二、单项选择题 1.统计分组的关键问题是( A ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为(C ) 每个组上限与下限的中点值称为组中值,对于开口组的组限是按相邻组的组距来计算的,所以末组开口组的组中值=末组下限+邻组组限/2=200+(200-170)=230 A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( B ) 品质标志是说明事物的性质或属性特征的,它反映的是总体单位在性质上的差异,它不能用数值来表现。 A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( C ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( D ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( A )

A变量分组B属性分组C分组体系D复合分组10.在频数分布中,频率是指( C ) A各组频数之比B各组频率之比C各组频数与总频数之比D各组频数与各组次数之比 11.频数分布用来表明( A ) A总体单位在各组的分布状况B各组变量值构成情况 C各组标志值分布情况D各组变量值的变动程度 12.在分组时,若有某单位的变量值正好等于相邻组的下限时,一般应将其归在( B ) A上限所在组B下限所在组 C任意一组均可D另设新组 13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( B ) A正例关系B反比例关系C乘积关系D毫无关系14.统计表的宾词是用来说明总体特征的( C ) A标志B总体单位C统计指标D统计对象 15.统计表的主词是统计表所要说明的对象,一般排在统计表的( A ) A左方B上端中部C右方D下方 三、多项选择题 1.统计分组的作用在于( BCD ) A区分现象的类型B反映现象总体的内部结构变化C比较现象间的一般水平D分析现象的变化关系E研

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学第六版部分课后题答案

第四章 数据分布特征的测度 4.6 解:先计算出各组组中值如下: 4.8 解: ⑴ ⑵体重的平均数 体重的标准差 ⑶ 55—65kg 相当于μ-1σ到μ+1σ 根据经验法则:大约有68%的人体重在此范围内。 ⑷ 40—60kg 相当于μ-2σ到μ+2σ 2501935030450425501865011426.7120116.5 i M f x f s ?+?+?+?+?=====∑∑ 大。所以,女生的体重差异===离散系数===离散系数女 男10 .010 1 505v 08.012 1 605v =μσ=μσσσ) (1102.250)(1322.260磅=磅=女男=?μ=?μ) (112.25磅==?σ

根据经验法则:大约有95%的人体重在此范围内。 4.9 解: 在A 项测试中得115分,其标准分数为: 在B 项测试中得425分,其标准分数为: 所以,在A 项中的成绩理想。 4.11 解: 成年组的标准差为: 幼儿组的标准差为: 所以,幼儿组身高差异大。 115 100 115X Z =-=σμ-=5.050 400425X Z =-=σμ-= 172.1 4.24.2 2.4%172.1s x x n s s V x = == ====∑ 71.3 2.52.5 3.5% 71.3s x x n s s V x = =====∑

第七章 参数估计 7.7 根据题意:N=7500,n=36(大样本) 总体标准差σ未知,可以用样本标准差s 代替 32 .336 4.119n x x ===∑样本均值 2 1.61 s z α= =样本标准差: 边际误差为:22222 90 1.645 1.6451.61 1.6450.446 3.320.44 (2.883.76)95 1.9699 2.58(2.803.84)(2.634.01) z z x z z z ααααα==?=±=±置信水平%时,=平均上网时间的置信区间为: ,同理,置信水平%时,=;置信水平%时,=平均上网时间的置信区间分别为:,;,

统计学课后习题

第二章统计数据调查与整理 9.对50只灯泡的耐用时数进行测试,所得数据如下: (单位:小时) 886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850 要求: (1)根据上述资料编制次数分布数列,并计算向上累计与向下累计频数与频率。 (2)根据所编制的次数分布数列,绘制直方图、折线图。 (3)根据图形说明灯泡耐用时数的分布属于何种类型。 最大值=651 最下限=650 最小值=1120 最上限=1150 全距=1120-651=469 组数=5,组距=100 组限人数频率%向上累计 频数 向上累计 频率% 向下累计 频数 向下累计 频率% 650-75010、02 1 0、0250 1 750-850 40、08 5 0、149 0、98 850-950300、635 0、745 0、9 950-1050120、2447 0、9415 0、3 1050-115030、0650 1 3 0、06 10.某服装厂某月每日的服装产量如下表所示。 某服装厂X月X日服装产量表 将表中资料编制成组距式分配数列,用两种方式分组,各分为五组,.比较哪一种分组较为合理。等距式分组(不考虑异常数据) 组限频次 0-505 50-1003 100-15012 150-2007

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计学(第三版)李金昌课后简答题个人整理版

《统计学》简答题 第一章 1.统计的含义与本质是什么? 含义:1、统计工作:调查研究。资料收集、整理和分析。 2、统计资料:工作成果。包括统计数据和分析报告。 3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。 本质:就是关于为何统计,统计什么和如何统计的思想。 2.什么是统计学?有哪些性质? 统计学是关于如何收集、整理和分析统计数据的科学。统计学就其研究对象而言,具有数量性、总体性和差异性的特点;就其学科范畴而言,具有方法型、层次性和通用性的特点;就其研究方式而言,具有描述性和推断性的特点。 3.统计学数据可分为哪几种类型,不同类型数据各有什么特点? 1)按照所采用的计量尺度,可分为定性数据和定量数据 定性数据是只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体分为定序数据和定类数据。定量数据是只能用数值来表现事物数量特征的数据,具体分为定距数据和定比数据。 2)按照表现形式不同,可以分为绝对数、相对数和平均数 绝对数是用以反映现象或事物绝对数量特征的数据。以最直观、最基本的形式体现现象或事物的外在数量特征,有明确的计量单位,是表示直接数量标志或总量标志的形式。 相对数是用以反映现象或事物相对数量特征的数据。通过另外两个相关统计数据的对比来体现现象或事物之间的联系关系,其结果主要表现为没有明确计量单位的无名数。 平均数是用以反映现象或事物平均数量特征的数据。体现现象或事物某一方面的一般数量水平。 3)按收集方法,可分为观测的数据和实验的数据 观测数据:数据是在没有对事物进行人为控制的条件下得到的。 实验数据:数据是在实验中控制实验对象而收集到的。 4)按照被描述的对象和时间的关系,可分为截面数据和时间序列数据 截面数据:描述的是现象在某一时刻的变化情况。 时间序列数据:描述的是现象随时间而变化的情况。 5)按照加工程度不同,可以分为原始数据和次级数据 原始数据是指直接向调查对象收集的、尚待加工整理、只反映个体特征的数据,或通过实验采集的原始记录数据。 次级数据是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 4.如何正确理解描述统计与推断统计的关系? 描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。描述统计对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。推断统计是和假设检验联系在一起的,这只是简单的描述现象,并没有进行假设,再利用数据检验,得出推断的结果。 5.统计研究的基本过程如何?常用的统计方法有哪些? 统计设计,数据搜集,数据整理,数据分析与解释(核心、最终目的) 常用的统计方法:大量观察发、统计分组法、综合指标法、统计推断法、统计模型法

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

统计学课后习题答案

第四章 统计描述 【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成12.5%。 成本的计划完成程=84%.96100%5% -18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成3.16%。 劳动生产率计划完= 85%.101100%8% 110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成1.85%。 【4.2】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的0.1%,在五年中,该矿实际开采原煤情况如下(单位:万吨) 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成26.75%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【4.3】我国1991年和1994年工业总产值资料如下表: 要求:

(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 【解】(1) (2)是比例相对数; 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04 .296826 .21670≈ (3) %37.251%) 451(28248 51353 ≈-+ 即,94年实际比计划增长25.37%。 【4.4】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。 【解】(1)

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核 B.编制统计表 C.统计汇总问题 D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性 B.正确性 C.全面性 D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组 B.60在第二组,80在第五组 C.70在第四组,80在第五组 D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列 B.单项式分布数列 C.开口式数列 D.异距式数列 5.组距式分布数列多适用于() A.随机变量 B.确定型变量 C.连续型变量 D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数 B.下限以上的累计次数 C.各组分布的次数 D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线 B.J型分布曲线 C.右偏分布曲线 D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉 B.不等 C.重叠 D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组 B.逻辑检查 C.数据录入 D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类 B.组限 C.组距 D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布 B.χ型分布 C.U型分布 D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列 B.品质数列 C.单项数列 D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有() A.粮食平均产量的分布 B.零件公差的分布

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

统计学课后习题答案(全)

<<统计学 >> 课后习题参考答案 第四章 1. 计划完成相对指标二一8% 100% =10 2.9% 1+5% 2. 计划完成相对指标二 1 一6 % 100% =97.9% 1—4% 3. 4. 5.解:⑴计划完成相对指标= 14 防 13 100 %" 5. 56 % (2)从第四年二季度开始连续四季的产量之和为: 10+11 + 12+14=47 该产品到第五年第一季 已提前完成任务,提前 完成的天数 90 ?该产品总共提前10个月零15天完成任务。 6.解:计划完成相对指标 10 11 12 14-45 V 天 14 一10

156 230 540 279 325 470 535 200 1040.1% 100% =126.75% (2) 156+230+540+279+325+470=2000 (万吨) 所以正好提前半年完成计划 7. 第五章平均指标与标志变异指标 1 . X 甲= :.26 27 28 29 30 31 3 2 3334=30 9 —20 25 28 30 32 34 36 38 40 '1.44 X乙二9 AD甲二 26-30卩27 -30 28-30 29 -30 30-30 |31 -30 32 - 30 亠|33 - 30 叫34 - 30 9 -2.22 AD乙二 20—31.44” 25—31.44 十2〔8—31.44 屮30—31.44 +|32|— 31.44 + 34卜31.44 + 網 + 31.44 + 38— |31.44 + 4Q — 9 = 5.06 R 甲=34-26=8 R 乙=40-20=20

相关文档