文档库 最新最全的文档下载
当前位置:文档库 › 统计学第九章练习题答案

统计学第九章练习题答案

统计学第九章练习题答案
统计学第九章练习题答案

第九章 习题参考答案

一、填空题

9.1.1 时间 观察值 9.1.2 相对数时间数列、平均数时间数列 9.1.3 定基发展速度 9.1.4 时期

9.1.5 4.17% 5.74% 9.1.6 32.25%

9.1.7 几何平均法、高次方程法

9.1.8 长期趋势、季节变动、循环变动、不规则变动 9.1.9 画散点图的方法、指标判别法 9.1.10 逐期增减量 9.1.11 二次曲线 、指数曲线 9.1.12 季节变动 同期平均法 9.1.13 长期趋势

9.1.14 ?()i i

y y 最小值2

=-? 9.1.15 1200% 调整系数 9.1.16 移动平均法

9.1.17 增降1%的绝对值 9.1.18 均方误差

9.1.19 移动平均法 9.1.20 趋势外推法

9.1.21 趋势季节模型 9.1.22 观察值与预测值

二、单项选择题

三、多项选择题

四、判断题

9.4.1 (×,各期环比增降速度不一定相等) 9.4.2 (×,计算年距发展速度) 9.4.3 (√)

9.4.4 (×,考察期末所达到的发展水平) 9.4.5 (√)

9.4.6 (×,其结果是不相同的)

9.4.7 (×,指增降速度中每一个百分点所代表的绝对额) 9.4.8 (√)

9.4.9 (×,逐期增长量不一定相等) 9.4.10 (×,a 不相同,b 相等) 9.4.11 (×,?()i i y y

最小值2

=-?)

9.4.12 (√)

9.4.13 (×,拟合抛物线曲线趋势方程) 9.4.14 (×,进行一次平均即能得到预测值) 9.4.15 (√)

9.4.16 (×,S j <100%时,表明现象此时处于淡季) 9.4.17 (√)

9.4.18 (×,构建趋势季节模型) 9.4.19 (×,??y y

s s

=

) 9.4.20 (√)

五、简答题

9.5.1 答:

依据相对数时间数列计算平均发展水平的基本思想:

①首先对相对数时间数列进行分解,找出各期的分子指标和分母指标;

②其次分别计算出分子时间数列的平均发展水平a、分母时间数列的平均发展水平b;

③最后将两个平均发展水平对比,以求得相对数时间数列的平均发展水平y。

用公式表示为

a y

b

9.5.2 答:

例如,将我国每年的出生人数按时间顺序排列所形成的动态数列,就是时期数列。它具有以下特点:

①时期数列中各时期的指标值具有可加性;

②时期数列中各期指标值的大小与时期的长短有直接的关系。

例如,将我国2000~2007年末人口总数按时间顺序排列形成的时间数列,就是时点数列。它具有以下特点:

①时点数列中各期的指标值不具有可加性;

②时点数列中各期指标值的大小与时点的间隔长短没有直接的关系。

9.5.3答:

社会经济现象的发展变化是由许多错综复杂的因素共同作用的结果。为了研究社会经济现象发展变化的趋势和规律,将影响时间数列的因素分类归纳起来,可分为四种:长期趋势、季节变动、循环变动和不规则变动。

长期趋势,指社会经济现象在一个较长时期内所呈现出的一种持续发展变动的趋势;季节波动,指社会经济现象在一年或更短的时间内所呈现的周期性波动;循环变动,指社会经济现象以若干年为周期的涨落起伏大致相等的变动;不规则性变动,指社会经济现象由于受突发事件或偶然因素的影响而引起的难以预测的变动。

9.5.4答:

若时间数列的逐期增减量大致相等,则现象的发展趋势近似于一条直线,配合直线方程;若时间数列的二次逐期增减量大致相等,则现象的发展趋势近似于一条抛物线,就配合抛物线方程;若时间数列的各期环比发展速度大致相等,则现象的发展趋势近似于一条指数曲线,就配合一条指数曲线方程;若时间数列各逐期增减量的环比值大致相等,则现象的发展趋势近似于一条修正的指数曲线,就配合修正的指数曲线方程;若时间数列各期观察值对数的一次差的环比值大致相等,则现象的发展趋势近似于一条龚珀资(Gompertz)曲线,就配合龚珀资曲线方程;若时间数列各期观察值倒数的一次差的环比值大致相等,则现象的发展趋势近似于一条罗吉斯蒂(Logistic)曲线,就配合罗吉斯蒂曲线方程。

9.5.5答:

同期平均法计算季节指数的基本原理如下:

①计算各年同月(或同季)的平均水平;

②计算全时期月(或季)总平均水平;

③以全时期月(或季)总平均水平为基础,将各年同月(或同季)的平均水平除以全时期月总平均水平得到季节指数,以季节指数为依据考察现象随季节变动而呈现的波动规律性。

9.5.6 答:

实际工作中的长期趋势模型很多时候是依据年度数据计算的,如果要作季节波动的预测,就需要将年值模型转换为季值趋势模型。若令时间数列的第一年为t=1,且以此资料建立的直线趋势方程为:T

=a+bt ?y

第一步:将年趋势值转换为季度趋势值,将方程bt a y T

+=?的两边同除以4,得

?4

44

T

a b t y

=

+

第二步:将按年计算的时间序号改为按季度计算的序号t ,得

?4

416

T

a b t y

=

+

第三步:变换原点。年值模型的原点年,即t=0代表的是时间数列第一年的前一年,当t=0时的年值模型的预测值对准的是原点年的年中,即6月30日。要将原点移到原点年的11月15日,使它成为季值模型的原点。由于6月30日与11月15日相隔1.5个季度,于是将其后移1.5季度,若记季度预测值为y i

?,则得到变换完毕的季值模型为:

i

a b b

=+1.5+t 41616

?y

9.5.7 答:

时间数列比较分析是将数列中各期的观察值相减、相除等,计算一系列比较分析指标,以分析事物的变动方向和变动速度。时间数列比较分析指标常用的有:

①增减量,指数列中两个不同时期的发展水平之差,有逐期增减量和累计增减量两种; ②发展速度,指数列中两个不同时期发展水平相除所得的相对数。发展速度进一步可分为定基发展速度和环比发展速度两种;

③增降速度,指增减量与发展水平相比所得的相对数,用以反映报告期水平比基期水平增减的相对程度。增降速度有环比增降速度和定基增降速度之分 ;

④增降1%的绝对值,指逐期增减量与相应的环比增降速度之比,用以说明增降速度中每增降一个百分点所代表的绝对额。

9.5.8 答:

移动平均法是将原时间数列采用逐项移动并按一定时期分别计算出一系列序时平均数,形成一个新的序时平均数时间数列,以削弱或消除偶然因素的影响,呈现出现象在较长时期内持续发展变动的基本态势。

采用移动平均法测定长期趋势应注意:

①合理选择移动平均的项数;

②注意新数列指标值的排列;

③注意移动平均的局限性。

六.计算题

9.6.1 解:

武汉市“九五”期间人均GDP增长量及增降速度等指标

9.6.2 解:

(1)“十五”期间年平均国民生产总值:

...

108068211909571839561

141176.1

5

y

y

n

+++

===

?L(亿元)

(2)“十五”期间年平均人口数:

..

..

n

n

y

y

y y y

y

n

…+

121

22

126743130756

127627129988

2212.88089

5

-

++++

=

++++

=

L

(3)“十五”期间国民生产总值的平均增长速度:

平均发展速度为113.4219685%x==

“十五”期间国民生产总值的平均增长速度=113.4219685%-1=13.422%

9.6.3 解:

(1)2006年企业年平均职工人数:

121

20102200

201820702120

22222078.25(

4

n

n

y

n

y y

y y y

-

++++++++

===

…+

人)

(2)该企全年劳动生产率:

年劳动生产率=

年总产值

年平均职工人数

+=(元人)565597614636

207825

11606++./

9.6.4 解:

企业第二季度工人占全体职工人数的平均比重: y a b

=

= 012012(

)22()22

n n a a

n

a a

b b

n b b ……++++÷+++÷

=+++÷+++÷=(

)().435245046257623

58025806006202

37963%

9.6.5 解:

2006年下半年商品的平均流转次数: 商品平均流转次数=商品平均零售额

商品平均库存额

(

)n a n

b b

n b b (01222)

?=+++ ?

(110711601150117012001370)6 1.77680710(675670650670690)622+++++÷==++++++÷(次) 2006年下半年平均流通费用率为: 平均流通费用率=

商品平均流通费用额

商品平均零售额

/(1081029895100104)6/(110711601150117012001n 370)6607

8.48%7157

a n y

b n +++++÷==

+++++÷=

=∑∑

9.6.6 解:

设平均发展速度为x ,则

n n y y x =0

600=5004

x

x =6005001210466%44/..== ∴平均增长速度=104.66%-1=4.66% 2009年粮食产量预计为:

..(y

万吨)

2009

60010466

62796=?) 9.6.7 解:

(1)用最小二乘法配合直线趋势方程,并预测该地区2007年、2008年该种产品的产量:

最小二乘法求参数的计算表

设:

i

a bt =+

b n ty t y n t t =

--∑∑∑∑∑22

()

2

539415123

2.555515?-?=?-

a y

n

b

t

n

=

-=

-?=∑∑12352515

5

171.. ∴

..?i

t y

17125=+

该企业这种产品产量2007年预测值为:

?y

2007

=17.1+2.5×6=32.1(万吨)

该企业这种产品产量2008预测值为:

?y

2008

=17.1+2.5×7=34.6(万吨)

(2) 预测2007年、2008年该产品各季的产量: 将年值模型转化为季值模型为:

i

i

a b b 17.1 2.5 2.5

=+1.5+t 1.5 4.509375+0.15625t 4161641616

?y y t 即=+?+= ①2007年各季的产量预测值分别为:

计算出2007年各季的不考虑季节波动影响的预测值为:

1

4.509375+0.15625217.790625()?y =?=万吨

2

4.509375+0.15625227.946875()?y =?=万吨

3

4.509375+0.15625238.103125()?y =?=万吨

4

4.509375+0.15625248.259375()?y =?=万吨

然后,依据趋势季节模型s

y

s ?y =? 计算出2007年各季的预测值分别为: 1

7.79062550% 3.8953125()?s y 万吨=?=

s 2

7.946875123%9.77465625()?y

万吨=?=

s 3

8.103125153%12.39778125()?y 万吨=?= s 4

8.25937574% 6.1119375()?y

万吨=?=

②2008年各季的产量预测值分别为:

依据上述同样方法,可以预测得到2008年1、2、3、4季的不考虑季节波动影响的预测值为:8.415625万吨、8.571875万吨、8.728125万吨以及8.884375(万吨)。

2008年考虑季节变动的1、2、3、4季的预测值分别为:4.207813万吨、10.54341万

吨、13.35403万吨以及6.574438万吨。

9.6.8 解

(1)配合直线趋势方程:

直线趋势方程计算表

设:i

a bt =+

b n ty t y

n t t =

--∑∑∑∑∑22()

=27151528347889 4.5357714019628?-?==?- 347284.535731.42867

7

y t a b n

n

=-=-?=∑∑

.?i

t y

31.4286453

57=+ (2)拟合指数曲线趋势方程:

指数曲线趋势方程计算表

b y

t

i

a =?

???

????∑-∑∑∑-?∑=?-=∑-∑=)(t t n logy t logy t n B t logb logy n t logb n logy A 22

得 A=1.521343 B=0.041482 a=33.21566 b=1.100227

..?t

i

y

33215661100227

= (3)配合二次曲线趋势方程:

二次曲线趋势方程计算表

t i

c bt a ++= ??

???∑+∑+∑=∑∑+∑+∑=∑∑+

∑+=∑t c t b t a y t t c t b t a ty t c t b na y 43223

22

将表中数据代入公式计算得到:

27.571437.107143-0.321429a b c =??

=??=?

2

i

27.57143

7.107143t - 0.321429t

?y

=+ 9.6.9 解

同期平均法季节指数计算表

9.6.10 解

y f

y y f y y f y y y n n

n =

++

++++--∑12

123

211

2

2

2

……

=13152351518241820

245

12

167+?++?++?=...(吨) 9.6.11 解

(1)2007年第一、第二季度的工人月平均产值:

12809296319820121038933

203044981201153

208220215311121433052y y a n b n a n b n =

=++÷++÷====++÷++÷==∑∑∑∑//()()..(///()()..(/万元人)万元人)

(2)2007年第一、第二季度平均每个工人的产值:

18092961982012103268203

132y a b n =

=++++÷==∑∑/().(/万元人) 298120115208220215333321433

155y a b n =

=++++÷==∑∑/()..(/万元人) (3)2007年上半年的平均每个工人的产值:

80929698120115/(198201210208220215)6268333601

2.88(/12526208.67

a y

b n 万元人)

+++++==

+++++÷+=

==÷∑∑ 9.6.12 解 依据趋势季节模型

s y y

s

?=

计算出2008年各季的预测值分别为:

1

(1600.533)50%88.25 ()?s y 万元=+??= 2

(1600.534)76%134.52 ()?s y 万元=+??= 3

(1600.535)120%213.00 ()?s y 万元=+??= 4

(1600.536)154%274.12 ()?s y

万元=+??=

统计学4章练习题+答案

| 第4章练习题 1、一组数据中出现频数最多的变量值称为(A) A.众数 B.中位数 C.四分位数 D.平均数 2、下列关于众数的叙述,不正确的是(C) A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 , D.众数不受极端值的影响 3、一组数据排序后处于中间位置上的变量值称为(B) A.众数 B.中位数 C.四分位数 D.平均数 4、一组数据排序后处于25%和75%位置上的值称为(C) A.众数 B.中位数 C.四分位数 D.平均数 5、非众数组的频数占总频数的比例称为(A) A.异众比率 B.离散系数 C.平均差 D.标准差 6、四分位差是(A) ) A.上四分位数减下四分位数的结果 B.下四分位数减上四分位数的结果 C.下四分位数加上四分位数 D.下四分位数与上四分位数的中间值 7、一组数据的最大值与最小值之差称为(C) A.平均差 B.标准差 C.极差 D.四分位差 8、各变量值与其平均数离差平方的平均数称为(C) A.极差 B.平均差 C.方差 D.标准差 | 9、变量值与其平均数的离差除以标准差后的值称为(A) A.标准分数 B.离散系数 C.方差 D.标准差 10、如果一个数据的标准分数-2,表明该数据(B) A.比平均数高出2个标准差 B.比平均数低2个标准差 C.等于2倍的平均数 D.等于2倍的标准差 11、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有(B)> %的数据 %的数据 %的数据%的数据 12、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是(C) A.至少有75%的数据落在平均数加减4个标准差的范围之内 B. 至少有89%的数据落在平均数加减4个标准差的范围之内 C. 至少有94%的数据落在平均数加减4个标准差的范围之内 D. 至少有99%的数据落在平均数加减4个标准差的范围之内

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学各章节课后习题答案

统计学各章练习题答案第1章绪论(略) 第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。

2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D

11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量 D 12.标志的具体表现是指() A.标志名称之后所列示的属性或数值 B.如性别 C.标志名称之后所列示的属性 D.标志名称之后所列示的数值 A 13.社会经济统计的研究对象是()。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.、社会经济统计认识过程的规律和方法 C 14.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。 A.绝对数 B.相对数 C.平均数 D.百分数 A 15.以产品的等级来衡量某种产品的质量好坏,则该产品“等级”是() A.数量标注 B. 品质标志 C. 数量指标 D. 质量指标 B 16.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 17.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 D 18.下列哪个是连续型变量() A. 工厂数 B. 人数 C. 净产值 D.设备台数 C 19.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 20.统计工作过程不包括()。 A.统计调查 B.统计分布 C.统计整理 D.统计分析 B 二、多项选择题 1.统计一词的含义是()

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

第九章统计学基础课后习题答案

第九章假设检验 一、填空题 1.第一类错误 2.Z统计量、标准正态分布 3.t统计量、t 4.P值 5.TDIST 6.≥30 7.正相关、负相关 二、单选题 1.A 2.D 3.A 4.C 5.C 三、简答题 1.小概率原理:在一个已知假设下,如果某个事件发生的概率非常小,我们通常认为这个假设可能是不成立的。小概率原理包含了两方面的意思:一是认为小概率事件在一次观察中是不会出现的,二是如果在一次观察中出现了小概率事件,那么合理的解释是原有事件具有小概率的说法不成立。 2.建立假设时应注意以下问题: (1)原假设和备择假设是相互对立的,在一项假设检验中,只能有一个假设成立。 (2)原假设必须包含等号。 (3)建立假设时,往往先确立备择假设,然后在确立原假设。 (4)备择假设的形式不同,相应的检验方法也不同。 (5)假设检验的没保底是搜集充分证据来拒绝原假设。 3.在原假设成立的条件下,检验统计量在某样本中至少达到相应值的概率称为P值。4.双侧检验(two-sided test)的备择假设中包含不等号(如m≠m0),实际上包括两种情况:m>m0或mm0或者m

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学各章练习

第一章绪论 一、判断改错题 1、统计学是一门研究现象总体数量方面的方法论科学,所以它不关心,也不研究个别现象 的数量特征。 2、社会经济统计学是一门实质性科学。 3、品质指标,是由名称和数值两部分组成的。 4、三个员工的工资不同,因此存在三个变量。 5、质量指标是反映总体质的特征,因此,可以用文字来表述。 6、连续变量的数值包括整数和小数。 7、指标体系是许多指标集合的总称。 8、总体和总体单位是固定不变的。 9、只要有了某个指标,就能对总体进行完整、全面的认识。 10、变量是指可变的数量标志。 11、时点指标均无可加性。 12、总量指标数值随总体范围大小而改变。 13、某厂年计划产量比去年提高8%,实际只提高5%,因此只完成计划的50%。 14、将若干个指标数值相加,即可得到指标体系的数值。 15、强度相对指标越大,说明分布密度越大。 二、多项选择题(在备选答案中,选出二个及以上正确答案) 1、下列各项中,属于品质标志的有( )。 A.性别 B.年龄 C.职务 D.民族 E.工资 2、下列各项中,属于连续变量的有( )。 A. 厂房面积 B.职工人数 C.产值 D.原材料消耗量(单位:千克) E.设备数量 3、统计指标按其反映的时间状况不同,有( )。 A.实体指标 B.客观指标 C.时期指标 D.主观指标 E.时点指标 4、在全国的工业普查中,有( )。 A.工业企业数是数量指标 B.设备台数是离散变量 C.工业总产值是连续变量 D. 每一个工业企业是总体单位 E.每个工业企业的职工人数是连续变量 5、某市工业企业状况进行调查,得到以下资料,其中统计指标是( )。 A.该市职工人数400000人 B.企业职工人数4000人 C.该市设备台数75000台 D.市产值40亿元 E.某企业产值20万元 6、商业网点密度=全市商业机构数/全市人口数,它是()。 A.比较相对指标 B.强度相对指标 C.数量指标 D.质量指标 E.平均指标 7、下列指标中的比例相对指标是()。 A.某厂工人中,技术工人与辅助工人人数之比为4∶5 B.某年全国高考录取与报考之比是1∶2 C.存款利息率 D.家庭收支比 E.甲地人均收入是乙地的3倍 8、间班组竞赛,结果甲组产量是乙组的2倍,废品总量中甲组占70%,说明()。 A.甲组产品质量优于乙组 B.甲组产品质量不如乙组 C.甲组废品率比乙组低 D.乙组废品率比甲组低 9、列指标类型中,分子、分母可以互换的有()。 A.强度相对指标 B.比例相对指标 C.比较相对指标 D.计划完成百分比 E.产品合格率 10、统计研究的方法有()。 A.大量观察法 B.时间数列分析法 C.统计分组法 D.指数分析法 E.综合指标法

统计学计算题和标准答案

企业型号价格(元/台)甲专卖店销售额(万元)乙专卖店销售量(台) A 2500 50.0 340 B 3400 115.6 260 C 4100 106.6 200 合计—272.2 — 要求:分别计算两个专卖店空调的平均销售价格,并分析平均价格差异的原因。 答案: 2某企业甲、乙两个生产车间,甲车间平均每个工人日加工零件数为65件,标准差为11件;乙车间工人日加工零件数资料如下表。试计算乙车间工人加工零件的平均数和标准差,并比较甲、乙两个生产车间哪个车间的平均日加工零件数更有代表性? 日加工零件数(件)60以下60—70 70—80 80—90 90—100 工人数(人) 5 9 12 14 10 答案: 三、某地区2009—2014年GDP资料如下表,要求: 1、计算2009—2014年GDP的年平均增长量; 2、计算2009—2014年GDP的年平均发展水平; 3、计算2009—2014年GDP的年平均发展速度和平均增长速度。

答案: x-== 年平均增长速度:100%100%22.9% 试用最小平方法配合销售额的直线趋势方程,并预测2016年的销售额将达到什么水平? 答案:2010年—2014年的数据有5项,是奇数,所以取中间为0,以1递增。设定x为-2、-1、0、1、2、 年份/销售额(y)x xy x2 2010 320 -2 -640 4 2011 332 -1 -332 1 2012 340 0 0 0 2013 356 1 356 1 2014 380 2 760 4 合计1728 0 144 10 b=∑xy/∑x2=144/10=14.4 a=∑y/n=1728/5=345.6 y=345.6+14.4x 预测2016年,按照设定的方法,到2016年应该是5 y=345.6+14.4*5=417.6元 五、某企业生产三种产品,2013年三种产品的总生产成本分别为20万元,45万元,35万元,2014年同2013年相比,三种产品的总生产成本分别增长8%,10%,6%,产量分别增长12%,6%,4%。试计算: 1、三种产品的总生产成本增长的百分比及增加的绝对额; 2、三种产品的总产量增长的百分比,及由于产量增长而增加的总生产成本; 3、利用指数体系推算单位产品成本增长的百分比。 试计算: 1、三种商品的销售额总指数; 2、三种商品的价格总指数和销售量总指数;

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学第一章课后习题及答案

第一章 练习题 一、单项选择题 1.统计的含义有三种,其中的基础是() A.统计学B.统计方法 C.统计工作D.统计资料 2.对30名职工的工资收入进行调查,则总体单位是() A.30名职工B.30名职工的工资总额 C.每一名职工D.每一名职工的工资 3.下列属于品质标志的是() A.某人的年龄B.某人的性别 C.某人的体重D.某人的收入 4.商业企业的职工人数,商品销售额是() A.连续变量B.离散变量 C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量5.了解某地区工业企业职工的情况,下列哪个是统计指标() A.该地区每名职工的工资额B.该地区职工的文化程度 C.该地区职工的工资总额D.该地区职工从事的工种 二、多项选择题 1.社会经济统计的特点,可概括为() A.数量性B.同质性 C.总体性D.具体性 E.社会性 2.统计学的研究方法是() A.大量观察法B.归纳推断法 C.统计模型法D.综合分析法 E.直接观察法 3.下列标志哪些属于品质标志() A.学生年龄B教师职称C企业规模D企业产值 4.下列哪些属于离散型变量 A年龄B机器台数C人口数D学生成绩 5.总体,总体单位,标志,指标这几个概念间的相互关系表现为() A.没有总体单位就没有总体,总体单位也离不开总体而独立存在 B.总体单位是标志的承担者 C.统计指标的数值来源于标志 D.指标是说明统计总体特征的,标志是说明总体单位特征的 E.指标和标志都能用数值表现 6.指标和标志之间存在着变换关系,是指() A.在同一研究目的下,指标和标志可以对调 B.在研究目的发生变化时,指标有可能成为标志

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

统计学原理第九章(相关与回归)习题答案

第九章相关与回归 一.判断题部分 题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。() 答案:× 题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。() 答案:√ 题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。() 答案:× 题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。() 答案:× 题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。() 答案:× 题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。() 答案:√ 题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。() 答案:×

题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。() 答案:× 题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。() 答案:√ 题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。() 答案:× 题目11:完全相关即是函数关系,其相关系数为±1。() 答案:√ 题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。() 答案× 二.单项选择题部分 题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。 A.相关关系 B.函数关系 C.回归关系 D.随机关系 答案:B 题目2:现象之间的相互关系可以归纳为两种类型,即()。 A.相关关系和函数关系 B.相关关系和因果关系

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

统计学第三章练习题(附答案)

一.单项选择题 1.比较两组数据的离散程度最合适的统计量是( D )。 A.极差 B.平均差 C.标准差 D.离散系数 2.如果峰度系数k>3,表明该组数据是(A )。 A.尖峰分布 B.扁平分布 C.左偏分布 D.右偏分布 3.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。上面的描述中,众数是( B )。 A.1200 B.经济管理学院 C.200 D.理学院 4.某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56,该班考试分数下四分位数和上四分位数分别是(A)。 A.64.5和78.5 B.67.5和71.5 C.64.5和71.5 D.64.5和67.5 5.对于右偏分布,平均数、中位数和众数之间的关系是(A )。 A.平均数>中位数>众数 B.中位数>平均数>众数 C.众数>中位数>平均数 D.众数>平均数>中位数 6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的指标是( B )。 A.方差 B.极差 C.标准差 D.变异系数 7.在离散程度的测度中,最容易受极端值影响的是(A )。 A.极差 B.方差 C.标准差 D.平均差 8.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( D )。 A.标准差不同 B.方差不同 C.数据个数不同 D.计量单位不同 9.总量指标按其反应的内容不同,可分为(C )。 A.总体指标和个体指标 B.时期指标和时点指标

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

统计学思考题

第一章导论 1、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。按照统计数据 的收集方法,可以将其分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中处理的大多数都是数值型数据。 2、解释分类数据、顺序数据和数值数据的意义。 对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合 样本:是从总体中抽出的一部分元素的集合。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。样本统计量通常用英文字母来表示。如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。 变量:是说明现象某种特征的概念。如,商品销售额,受教育程度,产品的质量等级等。 4、变量可分为哪几类? 变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。 5、举例说明离散型变量和连续性变量。 离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。它的取值是连续不断的,不 能一一列举,如,年龄,温度,零件尺寸的误差等。 第二章数据的搜集 1、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。第三章数据的图表表示 1、分类数据和顺序数据的整理和图示方法各有那些? 分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。 2、数值型数据的分组方法有哪些?简述组距分组的步骤。 数据分组的方法有单变量值分组和组距分组。 组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。 3、直方图与条形图有何区别? 直方图与条形图不同。首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章数据的概括性变量 1、一组数据的分布特征可以从那几个方面进行测度? 一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2、对于比率数据的平均为什么采用几何平均? 3、简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。 4、为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s=s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说 明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 第五章参数估计 1、怎样理解置信区间? 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。 2、解释95%的置信区间 如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。 第六章假设检验 1、什么是假设检验中的显著性水平?统计显著是什么意思? 通常把(a-er-fa)称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01. 2、什么是假设检验中的两类错误? 对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型,第一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa)表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta)表示,所以成为取伪错误。 3、解释假设检验中的P值。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。 第七章方差分析 1、什么是方差分析?它研究的是什么? 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。 方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。 2、简述方差分析的基本思想。 为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。3、解释组内误差和组间误差的含义。 组内误差(SSE):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。它反映了每个样本内各观测值之间的离散状况。 组间误差(SSA):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。它反映了样本均值之间的差异程度。 4、解释则内方差和组间方差的含义。 组间误差和组内误差经过平均后的数值称为均方或方差。 组间方差(MSA)=组间平方和/自由度(SSA/k-1) 组内误差(MSE)=组内平方和/自由度(SSE/n-k) 5、简述方差分析的基本步骤。 1、提出假设; 2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量 3、统计决策; 4、方差分析表; 5、用Excel进行方差分析。 第八章一元线性回归 1、解释相关关系的含义,说明相关系的特点。 相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量x 取某个值时,变量y 的取值可能有几个。 2、相关分析主要解决那些问题? 相关分析就是对两个变量之间线性关系的描述和度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本之间的变量关系是否能代表总体变量之间的关系? 3、解释回归模型、回归方程、估计的回归方程的含义。 回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 估计的回归方程:根据样本数据求出的回归方程的估计。 4、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的联系。 总平方和(SST):是全部观测值Xij与总均值x-两bar的误差平方和。 残差平方和(SSE):反映组内误差大小的平方和。 回归平方和(SSR):反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分。 SST=SSR+SSE 5、解释判定系数(R2)的含义和作用。 含义:判定系数是对估计的回归方程拟合优度的度量。判定系数等于相关系数的平方,即r2=(r)2 作用:反映回归直线的拟合程度;R2越接近1,说明回归方程拟合的越好;R2越接近0,说明回归方程拟合的越差。 6、在回归分析中,F检验和t检验各有什么作用? F检验是检验自变量和因变量之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y= 来表示。 t检验的显著性检验是要检验自变量对因变量的影响是否显著。在一元线性回归模型y= 中,如果白塔1=0,则回归线是一条水平线,表面因变量y的取值不依赖与自变量x,即两个变量之间没有线性关系。 7、简述线性关系检验和回归系数检验的具体步骤。 线性关系检验:1、提出假设,H0:回归系数等于0,两个变量之间的线性关系不显著;2、计算检验统计量F=(SSR/1)/(SSE/(n-2));3、做出决策,根据显著性水平,分子自由度和分母自由度查F分布表,找到相应的临界值,比较与F的大小,判断是否拒绝原假设 回归系数检验:1、提出检验;2、计算检验统计量t;3、做出决策

相关文档
相关文档 最新文档