文档库 最新最全的文档下载
当前位置:文档库 › 统计学教案习题02计量资料的统计描述

统计学教案习题02计量资料的统计描述

统计学教案习题02计量资料的统计描述
统计学教案习题02计量资料的统计描述

第二章 计量资料的统计描述

一、教学大纲要求

(一)掌握内容

1. 频数分布表与频数分布图 (1)频数表的编制。 (2)频数分布的类型。 (3)频数分布表的用途。

2. 描述数据分布集中趋势的指标

掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标

掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。 (二)熟悉内容

连续型变量的频数分布图:等距分组、不等距分组。

二、 教学内容精要

计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。

(一)频数分布表的编制

频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下:

1.求数据的极差(range )。

min max X X R -= (2-1)

2.根据极差选定适当“组段”数(通常8—10个)。

确定组段和组距。每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ

频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。

(二)描述频数分布中心位置的平均指标

描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。 1.算术均数

算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示,其计算方法如下:

(1)直接法:直接用原始观测值计算。

n

X X

∑= (2-2)

(2)加权法:在频数表基础上计算,其中X 为组中值,f 为频数。

∑∑=

f

fX X (2-3)

2.几何均数

几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。记为G 。其计算公式为:

?

?

? ??∑=-n X G lg lg

1

(2-4)

(2)加权法

?

??

? ??∑∑=-f X f G

lg lg

1

(2-5)

3.中位数

中位数(median )将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。

为奇数时 ?

?

? ??+=21n X M (2-6)

为偶数时 ()

(1)2212n n M X X +?

?=+ ???

(2-7)

2-1 常用平均数的意义及其应用场合

平均数 意义 应用场合

均数

平均数量水平

应用甚广,最适用于对称分布,特别是正态分布

几何均数 平均增(减)倍数 等比资料;对数正态分布

中位数 位次居中的观察值水平 偏态分布;分布不明;分布末端无确定值

(一)反映数据变异程度大小的变异指标

变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。

1.极差

极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

min max X X R -= (2-1)

2.百分位数与四分位数间距

(1)百分位数(percentile )是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。 百分位数用P x 表示,0< x <100,如25%位数表示为P 25。在频数表上,百分位数的计算公式为:

()∑-?+

=L x

x x x f x n f i L P %

(2-8)

(2)四分位数间距(inter-quartile range )是由第3四分位数(Q 3= P 75)和第1四分位数(Q 1= P 25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。其计算公式:

3

1Q R Q Q =

- (2-9)

3.方差

方差(variance )表示一组数据的平均离散情况,其计算公式为:

()1

2

2-∑-=n X S μ (2-10)

4.标准差

标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为:

S =

=

5.变异系数

变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示,计算公式为:

%

100?=

X

S CV

(2-12)

平均指标和变异指标分别反映资料的不同特征,作为资料的总结性统计量,两类指标要求一起使用。如常用S X ±或M (QR )。

三、典型试题分析

1.名词解释:平均数

答案:平均数(average )是描述数据分布集中趋势的指标,在卫生领域中最常用的平均数指标:算术均数、几何均数和中位数。

[评析]本题考察平均数的概念。平均数是一类统计指标,并不单纯指算术均数。 2.描述一组偏态分布资料的变异度,以( )指标较好。 A.全距 B.标准差 C.变异系数 D.四分位数间距 答案:D

[评析]标准差和变异系数均用于描述正态分布资料的变异度,全距和四分位数间距可用于任何资料,而四分位数间距更为稳定,故选D 。

3.用均数和标准差可以全面描述( )资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 答案:C

[评析]本题考察均数和标准差的应用条件。 4.同一资料的标准差是否一定小于均数?

答案:均数和标准差是两类不同性质的统计指标。标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小。标准差可大于均数,也可小于均数。

5.试述极差、四分位数间距、标准差及变异系数的适用范围。

答案:这三个指标均反映计量资料的离散程度。极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。

四、习 题

(一)名词解释

1.频数表

2.算术均数

3.几何均数

4.中位数

5.极差

6.百分位数

7.四分位数间距

8.方差

9.标准差 10.变异系数 (二)单项选择题

1.各观察值均加(或减)同一数后( )。

A.均数不变,标准差改变

B.均数改变,标准差不变

C.两者均不变

D.两者均改变 2.比较身高和体重两组数据变异度大小宜采用( )。 A.变异系数 B.差 C.极差 D.标准差

3.以下指标中( )可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差

4.偏态分布宜用( )描述其分布的集中趋势。

A.算术均数

B.标准差

C.中位数

D.四分位数间距

5.各观察值同乘以一个不等于0的常数后,()不变。

A.算术均数 B.标准差

C.几何均数

D.中位数

6.()分布的资料,均数等于中位数。

A.对称

B.左偏态

C.右偏态

D.偏态

7.对数正态分布是一种()分布。

A.正态

B.近似正态

C.左偏态

D.右偏态

8.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。

A.均数

B.标准差

C.中位数

D.四分位数间距

9.()小,表示用该样本均数估计总体均数的可靠性大。

A. 变异系数

B.标准差

C. 标准误

D.极差

10.血清学滴度资料最常用来表示其平均水平的指标是()。

A. 算术平均数

B.中位数

C.几何均数

D. 平均数

11.变异系数CV的数值()。

A. 一定大于1

B.一定小于1

C. 可大于1,也可小于1

D.一定比标准差小

12.数列8、-3、5、0、1、4、-1的中位数是()。

A. 2

B. 0

C. 2.5

D. 0.5

13.关于标准差,那项是错误的()。

A.反映全部观察值的离散程度

B.度量了一组数据偏离平均数的大小

C.反映了均数代表性的好坏

D.不会小于算术均数

14.中位数描述集中位置时,下面那项是错误的()。

A. 适合于偏态分布资料

B.适合于分布不明的资料

C.不适合等比资料

D.分布末端无确定值时,只能用中位数

15. 5人的血清滴度为 <1:20、1:40、1:80、1:160、1:320描述平均滴度,用那种指标较好()。

A.平均数 B.几何均数

C.算术均数

D. 中位数

16.数列0、48、49、50、52、100的标准差为()。

A.50 B. 26.75

C. 28.90

D. 70.78

17.一组变量的标准差将()。

A.随变量值的个数n的增大而增大

B.随变量值的个数n的增加而减小

C.随变量值之间的变异增大而增大

D.随系统误差的减小而减小

18.频数表计算中位数要求()。

A.组距相等

B.原始数据分布对称

C.原始数据为正态分布或近似正态分布

D.没有条件限制

19.一组数据中20%为3,60%为2,10%为1,10%为0,则平均数为()。

A.1.5 B. 1.9

C. 2.1

D. 不知道数据的总个数,不能计算平均数

20.某病患者8人的潜伏期如下:2、3、3、3、4、5、6、30则平均潜伏期为()。

A.均数为7天,很好的代表了大多数的潜伏期

B.中位数为3天

C.中位数为4天

D.中位数为3.5天,不受个别人潜伏期长的影响

21.某地调查20岁男大学生100名,身高标准差为4.09cm,体重标准差为4.10kg,比较两者的变异程度,结果()。

A. 体重变异度大

B.身高变异度较大

C.两者变异度相同

D.由单位不同,两者标准差不能直接比较

(三)判断正误并简述理由

1.均数总是大于中位数。( )

2.均数总是比标准差大。( )

3.变异系数的量纲和原量纲相同。( )

4.样本均数大时,标准差也一定会大。( )

5.样本量增大时,极差会增大。( )

(四)计算题

1.某卫生防疫站测得大气中的二氧化硫的浓度,用两种计量单位表示:

mg/m3: 1 2 3 4 5

ug/m3: 1000 2000 3000 4000 5000

分别计算几何均数及标准差,会发现两种不同单位得标准差相等,试解释其原因。

2.尸检中测得北方成年女子80人的肾上腺重量(g)如下,试(1)编制频数表,(2)求中位数、均数和标准差。

19.0 12.0 14.0 14.0 8.2 13.0 6.5 12.0 15.0 17.2

12.0 12.7 25.0 8.5 20.0 17.0 8.4 8.0 13.0 15.0

20.0 13.0 13.0 14.0 15.0 7.9 10.5 9.5 10.0 12.0

6.5 11.0 12.5

7.5 14.5 17.5 12.0 10.0 11.0 11.5

16.0 13.0 10.5 11.0 14.0 7.5 14.0 11.4 9.0 11.1

10.0 10.5 8.0 12.0 11.5 19.0 10.0 9.0 19.0 10.0

22.0 9.0 12.0 8.0 14.0 10.0 11.5 11.0 15.0 16.0

8.0 15.0 9.9 8.5 12.5 9.6 18.5 11.0 12.0 12.0

3.测得某地300名正常人尿汞值,其频数表如下。试计算均数、中位数、何者代表性较好。

表2-2 300例正常人尿汞值(μg/L)频数表

尿汞值例数尿汞值例数尿汞值例数

0- 49 24- 16 48- 3

4- 27 28- 9 52- -

8- 58 32- 9 56- 2

12- 50 36- 4 60- -

16- 45 40- 5 64- -

20- 22 44- - 68- 1

4.有5个变量值7,9,10,14,15,试计算X 及()X X -∑。

5.下表为10例垂体催乳素微腺瘤经蝶手术前后的血催乳素浓度,试分别求术前、术后的均数,标准差及变异系数。应以何指标比较手术前后数据的变异情况?能说明手术前数据的变异大吗?为什么?

表2-3 手术前后患者血催乳素浓度(mg/ml )

例号 血催乳素浓度 例号 血催乳素浓度 术前 术后 术前 术后 1 276 41 6

266 43 2 880 110 7 500 25 3 1600 280 8 1700 300 4 324 61 9 500 215 5 398 105

10

220 92

6.某地微丝蚴血症者42例治疗后7年用间接荧光抗体试验测得抗体滴度如下。求平均滴度。 抗体滴度的倒数 10 20 40 80 160 例 数

5

12

13

7

5

五、习题答案要点

(一)名词解释

1.答案:频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。

2.答案:算术均数(arithmetic mean )描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。

3.答案:几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。记为G 。

4.答案:中位数(median )将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。

5.答案:极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

6.答案:百分位数(percentile )是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

7.答案:四分位数间距(inter-quartile range )是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。

8.答案:方差(variance ):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。 9.答案:标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

10.答案:变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。

(二)单项选择题

1.B 2.A 3.D 4.C 5.B 6.A 7.C 8.C 9.C 10.C 11.C 12.B 13.D 14.C 15.B 16.C 17.C 18.D 19.B 20.D 21.D

(三)判断正误并简述理由

1.错。均数和中位数的大小关系取决于所描述资料的分布状况。对于负偏态的资料来说,均数大于中位数;对于正偏态的资料来说,均数小于中位数;对称分布的均数和中位数相等。

2.错。

3.错。变异系数无量纲,是一个相对数。

4.错。

5.正确。样本例数越多 ,抽到较大或较小变量值的可能性越大,因而极差可能越大。 (四)计算题

1.答案:用第一组资料计算得几何均数为

2.61 mg/m 3

,标准差为0.27 mg/m 3

;第二组资料算得几何均数为2605.17 ug/m 3,标准差为0.27 ug/m 3。两组资料均数不等,标准差相等,可见标准差的大小只与资料的离散程度有关,而与均数的大小无关。

2.答案: (1)编制频数表

①求极差:min max X X R -==25.0-6.5=18.5。 ②根据极差确定组距为2.0,组段数为10。 ③编制频数表。

表2-4 80名北方成年女子肾上腺重量(g )频数分布表

肾上腺重量(g ) 组中值

(X ) 频 数 (f ) fX

2

fX

累计频数 累计频率(%) 6.00- 7.00 5 35.00 245.00 5 6.25 8.00- 9.00 14 126.00 1134.00 19 23.75 10.00- 11.00 19 209.00 2299.00 38 47.50 12.00- 13.00 17 221.00 2873.00 55 68.75 14.00- 15.00 12 180.00 2700.00 67 83.75 16.00- 17.00 5 85.00 1445.00 72 90.00 18.00- 19.00 4 76.00 1444.00 76 95.00 20.00- 21.00 2 42.00 882.00 78 97.50 22.00- 23.00 1 23.00 529.00 79 98.75 24.00- 25.00

1 25.00 625.00 80 100.00 合 计 80

1022.00 14176.00

80

100.00

(2)求中位数,均数和标准差。 ①求中位数

??

?

??∑-+

=L M x x f n f i L M 2=12.0+170.2(80·50%-38)=12.24g ②求均数

∑∑=

f

fX X =12.78

③求标准差

()

1

2

-∑-=

n X

X S =

()

()1

2

2

-∑∑∑∑

-

f f

fX

fX

=3.77g

3.答案:

表2-5 300例正常人尿汞值(μg/L )频数表

尿汞值 (μg/L ) 组中值 (X ) 频 数 (f ) 累计频数 累计频率 (%) 0.00- 2.00 49 49 16.33 4.00- 6.00 27 76 25.33 8.00- 10.00 58 134 44.67 12.00- 14.00 50 184 61.33 16.00- 18.00 45 229 76.33 20.00- 22.00 22 251 83.67 24.00- 26.00 16 267 89.00 28.00- 30.00 9 276 92.00 32.00-

34.00

9

285

95.00

36.00- 38.00 4 289 96.33 40.00- 42.00 5 294 98.00 44.00- 46.00 - 294 98.00 48.00- 50.00 3 297 99.00 52.00- 54.00 - 297 99.00 56.00- 58.00 2 299 99.67 60.00- 62.00 - 299 99.67 64.00- 66.00 - 299 99.67 68.00- 70.00 1 300 100.00 合 计 300 300 100.00

(1)求均数

∑∑=

f

fX X =15.08μg/L

(2)求中位数

??

?

??∑-+

=L M x x f n f i L M 2=13.28μg/L 由频数表可以看出,此资料为偏态分布,因此用中位数代表性较好。 4.答案: (1)求均数

=++++=∑=5

15141097n X

X 11.00

(2)求离均差之和

()∑-X X =0.00

5.答案:

(1)求术前各指标

=∑=

n

X X 666.40mg/ml

()

12

-∑-=

n X X S =551.99mg/ml

100%S

C V X

=?=82.83%

(2)求术后各指标

=∑=

n

X X 127.20 mg/ml

()

1

2

-∑-=

n X

X S =101.27 mg/ml

100%S C V X

=

?=79.61% mg/ml

两组资料均数相差悬殊,故而只能用变异系数比较两组何者变异度大,虽然术前变异系数较大,但差异并不明显,需做进一步的统计分析才能知道何者变异度大。

6.答案:

其平均滴度的倒数为

=??

?

??=???

? ??∑∑=--4270.65lg lg lg

1

1

f X f G 36.67 平均滴度为1︰37。

(姚晨 陈平)

描述统计学思考题

1、调查问卷的结构? 2、多项选择题的编码?(多重响应) 3、多项选择排序题的编码? 4、缺失值有哪些处理方法? 5、离群值如何判断和筛选出来? 6、什么是问卷的信度和效度?怎样检验问卷的信度和效度? 7、问卷调查中的信度分析,有几种信度系数?写出三种信度的测 量方法。 8、问卷调查中的效度分析,有几种关于效度的测定方法? 9、信度与效度之间有什么关系? 10、条形图、直方图、茎叶图的区别。 11、箱线图中的离群点是哪些点?离群程度? 12、数据特征从哪几个方面进行描述?描述统计量分别是? 13、众数、中位数、均值的异同? 14、根据下表数据, (1)用描述统计的方法概括表中数据,并讨论你的结论。 (2)对变量数据的最大值、最小值、平均数以及适当的分位数进行评价和解释;通过这些描述统计量,你对亚太地区的商学院有何看法或发现? (3)对本国学生学费和外国学生学费进行比较。 (4)对要求或不要求工作经验的学校学生的起薪进行比较。 (5)对要求或不要求英语测试的学校学生的起薪进行比较。

(6)分析报告中如果有必要的图表,将更便于反映你希望反映的问题。(见下页)

表亚太地区25所知名商学院 商学院名称录取 名额 每系 人数 本国 学生 学费 ($) 外国 学生 学费 ($) 年龄 国外 学生 比例 (%) 是否 要求 GMAT 是否 要求 英语 测试 是否 要求 工作 经验 起薪 ($) 麦夸里商学院 (悉尼) 12 5 24420 29600 28 47 是否是71400 阿德莱德大学20 4 19993 32582 29 28 是否是65200 梅西大学(新 西兰,北帕默 斯顿) 30 5 4300 4300 22 0 否否否7100 墨尔本皇家工 商学院 30 5 11140 11140 29 10 是否否31000 马来西亚 Sains大学(槟 城) 30 4 33060 33060 28 60 是是否87000 澳大利亚国立 大学(堪培拉) 42 5 7562 9000 25 50 是否是22800 De La Salle大 学(马尼拉) 44 5 3935 16000 23 1 是否否7500 南洋理工大学 (新加坡) 50 6 6146 7170 29 51 是是是43300 香港理工大学60 8 2880 16000 23 0 否否否7400 拉合尔管理科 学院 70 2 20300 20300 30 80 是是是46600 香港大学90 5 8500 8500 32 20 是否是49300 柯廷理工学院 (珀思) 98 17 16000 22800 32 26 否否是49600 日本国际大学126 2 11513 11513 26 37 是否是34000 昆士兰大学 (布里斯本) 138 8 17172 19778 34 27 否否是60100 新加坡国立大 学 147 7 17355 17355 25 6 是否是17600 墨尔本商学院200 13 16200 22500 30 30 是是是52500 Chulalongkorn 大学(曼谷) 200 10 18200 18200 29 90 否是是25000 新南威尔士大 学(悉尼) 228 19 16426 23100 30 10 否否是66000 Jamnalal Bajaj 管理学院(孟 买) 240 15 13106 21625 37 35 否是是41400 亚洲管理学院300 7 13880 17765 32 30 否是是48900

习题-计量资料统计描述

计量资料统计描述----习题 1、中位数是表示变量值()的指标。 A.平均水平 B.变化范围 C.频数分布 D.相互间差别大小 E.变异程度 2、血清学滴度资料最常计算()来表示平均水平。 A.算术均数 B.中位数 C.几何均数 D.全距 E.百分位数 3、最小组段无下限或最大组段无上限的频数分布资料宜用() A.算术均数 B.中位数 C.几何均数 D.全距 E.标准差 4、原始数据同减去一个不等于零的常数后,()。 A. x 不变,S 变 B. x 变,S 不变 C. x 和S 都不变 D. x 和S 都变 E.以上均不对 5、变异系数CV()。 A.表示X 的绝对离散度 B.表示X 的相对离散度 C.表示x的绝对离散度 D.表示x的相对离散度 E.以上均不对 6、描述一组偏态分布资料的变异度,以()指标较好。 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.均数 7、用均数和标准差可以全面描述()资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.分布不知 E.对数正态分布 8、比较身高和体重两组数据变异度大小宜采用() A.变异系数 B.标准差 C.四分位数间距 D.全距 E.方差 9、偏态分布宜用()描述其分布的集中趋势 A.算术均数 B.标准差 C.中位数 D.众数 E.百分位数 10、各观察值同乘以一个不等于0 的常数后,()不变。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.变异系数 11、()分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 E.以上均不对 12、随机抽查某地成年女子身高,算得均数x =160cm,标准差S=5cm,则可计算变异系数CV=------- 5 160 C.(160/5)cm D.(5/160)cm ×160 13、变异系数CV 的数值()。 A.一定大于1 B.一定小于1 C.可大于1,也可小于1 D.一定比标准差小 E.不能判定 14、列数8、-3、5、0、4、-1 的中位数是()。 、关于标准差,哪项是错误的()。 A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数 E.适用于对称分布资料 16、5 人的血清滴度为<1:20、1:40、1:80、1:160、1:320 描述平均滴度,用哪种指标较好()。 A.平均数 B.几何均数 C.算术均数 D.中位数 E.众数

@2017.3.16-统计学-计量资料的统计描述方法

计量资料的统计描述方法 怎样表达一组数据? 描述计量资料的常用指标— A 、描述平均水平(中心位置): 均数X 、中位数和百分位数、几何均数G 、众数(mode ) B 、描述数据的分散程度: 标准差、四分位数间距、 变异系数、方差、全距 (一)均数mean 和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式: 应用条件:适用于对称分布,特别是正态分布资料。 2. 中位数(median )M 和百分位数(percentile ) A.中位数M 是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件: 12n X X X X X n n +++== ∑L

用于任何分布类型,包括偏态资料、两端数据无界限的资料。 计算: n 为奇数时-- n 为偶数时-- 9人数据:12,13,14, 14, 15, 15, 15, 17, 19天 B.百分位数 是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。 四分位数间距(quartile range ) =第25百分位数(P25)~第75百分位数(P75)。 四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。 ) (天1552 19===+X X M 88451 22221415214.5() M X X X X ?? ==== ???+如果只调查了前八位中学生,则: +(+)(+)天

百分位数计算(频数表法): X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距 n :总例数f x :所在组段频数 注:有的教材X= r ; L f ∑=C 例:求频数表的第25、第75百分位数(四分位数间距) 组段 频数f 累积频数∑f 56~ 2 2 59~ 5 7 62~ 12 19 ∑f 25 L 2565~ 15 34 P 25在此 68~ 25 59 71~ 26 85∑f 75 L 7574~ 19 104 P 75在此 77~ 15 119 80~ 10 129 83~85 1 130 合计 130 ① 确定Px 所在组段: P 25所在的组段:n X %=130×25%=32.5, 65~组最终的累积频数=34,32.5落在65~组段内;

统计学期末考试试题(含答案)..

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报 单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

统计习题集(附参考答案)

《卫生统计学》习题集 上海医药高等专科学校 《营养与卫生》教研组

一、最佳选择题 (一)基本概念与步骤 1、将计量资料制作成频数表的过程,属于统计工作基本步骤。 A、统计设计 B、收集资料 D、分析资料 2、某地区抽查1000名成年人的血压并制作成频数表,这属于资料。 B、计数资料 C、等级资料 D、半定量资料 3、上述调查按血压正常与否整理资料,其中高血压患者200名,血压正常者 800名,这属于资料。 A、定量资料 C、等级资料 D、半定量资料 4、对变异的事物可采用抽样观察,其主要目的是 A、反映某个体情况 B、反映某样本情况 D、上述都是 5、要使样本对总体具有代表性,下列是错误的措施。 A、样本与总体应同质 B、样本含量应适宜 C、应采用随机抽样 7、与抽样误差大小无关的是 A、个体变异大小 B、样本含量大小 C、随机抽样方法不同 8、从一个总体中抽取样本,产生抽样误差的原因是 B、抽样未遵循随机化原则 C、被抽取的个体不同质 D、组成样本的个体较少 9、从4个市级医院外科病史中随机抽样,反映全市外科医护质量,你认为 A、可以,抽样面广 B、不可以,可能样本太小 C、可以,是随机抽样

10、搞好统计工作,达到预期目标,最重要的是 A 、原始资料要正确 B 、整理资料要全面 C 、分析资料要合理 11、某地区1000名儿童粪检蛔虫卵,按阳性和阴性整理汇总,这属于 资料。 A 、定量资料 C 、等级资料 D 、半定量资料 12、统计学上通常认为P < 的事件,在一次观察中不会发生。 、0.1 C 、0.5 D 、1.0 14、由变异所导致的现象中,下列 除外。 A 、X 1≠X 2 B 、1X ≠2X C 、μ≠X 1≠μ2 15、概率P=0,则表示 B 、某事件必然发生 C 、某事件发生的可能性很小 D 、某事件发生的可能性很小 16、要减少抽样误差,最切实可行的方法是 B 、控制个体变异 C 、遵循随机化原则抽样 D 、严格挑选研究对象 (二)计量资料统计描述(频数分析) 1、X 是表示变量值 的统计指标。 B 、频数分布 C 、相互间差别大小 D 、变化范围 1、某计量资料的分布性质未明,要计算集中趋势指标,下列 适宜。 A 、X B 、、均适宜 2、用频数表计算算术均数时,公式: X = 中“x ”是 A 、频数 C 、组距 D 、组段下限 n Σfx

统计学期末考试试题库和答案解析

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。()

三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备 4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。

统计概述计量描述习题

实习二计量资料的统计描述 名词解释 1. 均数 答:均数是能反映全部观察值的平均水平的统计指标,适用于对称分布尤其是正态分布资料。 2. 标准差 答:标准差是用于描述资料离散趋势的统计指标,适用于对称分布资料,尤其正态分布资料的。标准差大,表明资料的变异度大,组内数据参差不齐的程度较明显。 填空题 1 计量资料的分布特征有____和____。 答:集中趋势和离散趋势。 2 描述计量资料集中趋势的常用指标有____ 、____和____ 答:均数、几何均数和中位数。 3 描述计量资料离散趋势的常用指标有____ 、_______和____ 答:极差、方差与标准差和变异系数 是非题 1. 频数表中组数越多越好。(?) 解释:频数表中组数不宜过多也不宜过少。 2. 对称分布资料理论上均数和中位数一致(∨) 解释:对于对称分布的资料,两者的计算结果在理论上是相同的。但在实际计算中往往也会存在一定偏差。 选择题 1 有5人的血清滴度为:1:20,1:40,1:80,1:160,1:320则平均滴度是 A.1:40 B.1:80 C.1:160 D.1:320 答:应选B。描述平均滴度宜用几何均数。 2.一组变量值,其大小分别为10,12,9,7,11,其中位数是 A.9 B.7 C.10 D.11 答:应选C。先将观察值由小到大顺序排列,7,9,10,11,12。n为奇数时,M=X3=10 3.一组变量值,其大小分别为 10,12,9,7,11,39,其中位数是 A.9 B.7 C.10.5 D.11 答:应选C。先将观察值由小到大顺序排列,7,9,10,11,12,39。n为偶数时, M=( X3 +X4)/2 =(10+11)/2=10.5 4. 某组资料共5例, ∑X2=190, ∑X=30, 则均数和标准差分别是 1

描述性统计分析报告--Descriptive Statistics菜单详解

第六章:描述性统计分析-- Descriptive Statistics菜单详解 描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。 本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。 §6.1 Frequencies过程 频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。 和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并 不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。 6.1.1 界面说明 Frequencies对话框的界面如下所示:

该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】 确定是否在结果中输出频数表。 【Statistics钮】 单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。 现将各部分解释如下:

统计学期末考试试题(含答案)

交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对)

统计学的发展历程

统计学的发展历程

统计学概述 [编辑本段] 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。 统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。 统计学的发展历程 [编辑本段] 统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。 统计学的发展过程的三个阶段 第一阶段称之为“城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计 学”(Statistics)。统计学依然保留了城邦(state)这个词根。 第二阶段称之为“政治算数”(Politcal arthmetic)阶段 与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。

统计学期末考试试卷及答案

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为平方米,乡村人均居住面积为30平方米,标准差为平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降 7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨% B 上涨% C 下跌% D 下跌% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式

描述统计学

2. 数据汇总Summarizing Data 频数分布与图形展示 本章和下一章讨论有关统计描述的问题。关于收集、组织、展示数值数据的方法。其中包括描述各种数据分布,各种统计图形的使用,描述数据的各种指标,如平均值、期望值、方差等等。 2.1 频数分布Frequency distribution 为了进行决策或推断,我们需要信息。例如,为了进行制定有关销售方面的决策需要了解员工的实际销售情况,或者说要获得有关销售的信息。获得了数据以后,就需要对数据进行组织,也就是将数据组织成容易观察的形式。然后就是展示数据,通常都是以图形的方式。最后就可以得出关于这一组数据的结论,并将这些结论用于决策。 一种常用的方式是首先获得一组原始数据。将这组数据组织成数组,即将数据从大到小或从小到大进行排序。然后将其总结成一组频数分布。也就是将这一数组按一定的间隔进行计数,清点出位于每一间隔中的数据出现的次数。这样就获得了频数表或频数分布。 频数分布就是一张显示一组数据位于每一独立区间间隔内的次数的数据表格。频数分布也称为频数表。 频数分布又可以划分为定性数据的频数分布和定量数据的频数分布。一般我们主要对定量数据进行频数分布研究。 为了建立一频数分布,我们需要确定: ? 间隔的数量, ? 间隔的长度(或宽度), ? 间隔的边界,或者说是划分间隔的位置 然后我们就可以清点落在每一间隔中的数值。 例: PP28表2-2显示了一个频数分布。 确定间隔长度(或宽度)的公式为: 间隔数量 最小值 最大值估计的间隔长度-= 在此,如果间隔数量选为8,则间隔的长度应该为: 813.88 26000 96500=-= 估计的间隔长度 当然,这个数值看起来不太好,所以可以取整为9000或10000。 如果我们不能确定应该用多少个间隔数量,则可以通过下列估计间隔长度的公式进行计算:

统计学习题与答案(完整)_2

第一部分计量资料的统计描述、最佳选择题 1、描述一组偏态分布资料的变异度,以()指标较好° A、全距 B、标准差 C、变异系数 D、四分位数间距 E、方差 2.用均数和标准差可以全面描述资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布 D .对称分布E.对数正态分布 3.各观察值均加(或减)同一数后( A .均数不变,标准差改变B.均数改变,标准差不变 C.两者均不变 D.两者均改变 E.以上都不对 4.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差标准差 E .四分位数间距 5.偏态分布宜用()描述其分布的集中趋势 A.算术均数 B.标准差 C.中位数四分位数间距 E .方差 6.各观察值同乘以一个不等于0的常数后,()不 变° A.算术均数 B.标准差 C.几何均数 D.中位数 E .变异系数 7.()分布的资料,均数等于中位数° A.对数正态 B.正偏态 C.负偏态 D .偏态E. 正态 &对数正态分布是一种()分布。 (说明:设X变量经Y=lgX变换后服从正态分布问X变量属何种分布 A.正态 B.近似正态 C.左偏态 D.右偏态 E .对称 9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势° A.均数 B.标准差 C.中位数 D.四分位数间距 E .几何均数

10 .血清学滴度资料最常用来表示其平均水平的指标是 ()° 学习参考 A. 算术平均数 B .中位数 C .几何均数 D .变异系数 E .标准差 二、简答题 1、 对于一组近似正态分布的资料 ,除样本含量n 夕卜,还可计算 挽,S 和X ' Z 山,问各说明什么? 2、 试述正态分布、标准正态分布及对数正态分布的 某单位1999年正常成年女子血清 联系和区别° 3、 说明频数分布表的用途° 4、 变异系数的用途是什么? 甘油三酯(mmol/L)测量结果 组段 频数 5、试述正态分布的面积分布规律 ° 0.6~ 1 0.7~ 3 三、计算分析题 0.8~ 9 1、根据1999年某地某单位的体检资料 ,116名正常 0.9~ 13 成年女子的血清甘油三酯 (mmol/L )测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25 (1)描述集中趋势应选择何指标 ?并计算之° 1.2~ 18 (2)描述离散趋势应选择何指标 ?并计算之° 1.3~ 13 (3)求该地正常成年女子血清甘油三酯的 95%参考值范围° 1.4~ 9 (4)试估计该地正常成年女子血清甘油三酯在 0.8mmol/L 1.5~ 5 以下者及1.5mmol/L 以下者各占正常女子总人数的百分比 ° 1.6~1.7 1 合计 116 2、某些微丝蚴血症者 42例治疗后7年用间接荧火抗体试验得抗体滴度如下 °求平均抗体滴度

统计学期末试题

统计学期末试题B 一、单选题(15×1分) 1、指出下面的数据哪一个属于品质标志() A、年龄 B、工资 C、汽车产量 D、购买商品的支付方式(现金、信用卡、支票) 2、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是() A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200万个家庭的人均收入 3、从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为() A、简单随机抽样 B、分层抽样 C、系统抽样 D、整群抽样 4、在累计次数分布中,某组的向下累计次数表明() A、大于该组上限的次数是多少 B、大于该组下限的次数是多少 C、小于该组上限的次数是多少 D、小于该组下限的次数是多少 5、将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为() A、单变量值分组 B、组距分组 C、等距分组 D、连续分组 6、将某企业职工的月收入依次分为2000元以下、2000~3000元、3000~4000元、4000~5000元、5000元以上几个组。第一组的组中值近似为() A、2000 B、1000 C、1500 D、2500 7、一组数据排序后处于25%和75%位置上的值称为() A、众数 B、中位数 C、四分位数 D、均值 8、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。描述该组数据的集中趋势宜采用() A、众数 B、中位数 C、四分位数 D、均值 9、下列数列平均数都是50,在平均数附近离散程度最小的数列是() A、0 20 40 50 60 80 100 B、0 48 49 50 51 52 100

统计概述计量描述习题

For personal use only in study and research; not for commercial use 计量资料的统计描述 填空题 1 计量资料的分布特征有____和 ____。 2 描述计量资料集中趋势的常用指标有____ 、____和 ____ 3 描述计量资料离散趋势的常用指标有____ 、_______和 ____ 是非题 1. 频数表中组数越多越好。() 2. 对称分布资料理论上均数和中位数一致() 选择题 1 有5人的血清滴度为:1:20,1:40,1:80,1:160,1:320则平均滴度是 A.1:40 B.1:80 C.1:160 D.1:320

2.一组变量值,其大小分别为10,12,9,7,11,其中位数是 A.9 B.7 C.10 D.11 3.一组变量值,其大小分别为 10,12,9,7,11,39,其中位数是 A.9 B.7 C.10.5 D.11 4. 某组资料共5例, ∑X2=190, ∑X=30, 则均数和标准差分别是 A.6 和 1.29 B.6.33和2.5 C.3和 6.78 D.6和 1.58 5. 正常成年男子的血铅含量系偏态分布资料,对数变换后的呈正态分布。欲描述血铅的平均水平宜用 A.原始数据的算术均数 B.原始数据的几何均数 C.原始数据的中位数 D.原始数据的标准差 6. 偏态分布数值资料,对数变换后,分布仍呈偏态。描述数据的集中趋势宜用

A.算术均数 B.几何均数 C.中位数 D.标准差 7. 描述一组对称(或正态)分布资料的离散趋势时,最适宜选择的指标是 A.极差 B.标准差 C.均数 D.变异系数 8. 比较身高与体重的变异程度,适宜的指标 A.极差 B.标准差 C.方差 D.变异系数 9. 关于标准差,下面哪个说法是正确的 A.标准差可以是负数 B.标准差必定大于或等于零 C.标准差无单位 D.同一资料的标准差一定比均数小 10. 关于变异系数,下面哪个说法是错误的 A.变异系数就是的比值表 B.比较同一人群的身高、体重两项指标的变异度时宜采用变异系数 C.两组资料均数相差悬殊时,应用变异系数描述

统计学期末考试试题(含答案)分解

1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、% 104% 105 C 、%96% 95 D 、%4%5

统计学概述

统计学概述 统计学是一门通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。 统计学主要分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称作推断统计学。这两种用法都可以被称为应用统计学。另外还有数理统计学专门讨论这门科目背后的理论基础。 统计学,英文Statistics,最早源于现代拉丁文statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。 统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说:它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。 统计学的发展过程的三个阶段: 1).城邦政情(Matters of state)

“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十余种纪要,其内容包括各城邦的历史、行政、科学、艺术、人口、资源和财富等社会和经济情况的比较、分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。 2).政治算术 “政治算术”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。 1690年英国威廉·配弟出版《政治算数》一书作为这个阶段的起始标志。 威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉·配弟的《政治算术》被后来的学者评价为近代统计学的来源,威廉·配弟本人也被评价为近代统计学之父。 从配弟使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。 3).统计分析科学(Science of statistical analysis) 在“政治算术”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。 “统计分析科学”课程的出现是现代统计发展阶段的开端。1908年,“学生”氏(William Sleey Gosset,笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。

用统计量描述数据习题

第3章习题 一、选择题 1. 一组数据中出现频数最多的变量值称为()。 A.众数B.中位数 C.四分位数D.均值 2.一组数据排序后处于中间位置上的变量值称为()。 A.众数B.中位数 C.四分位数D.均值 3. n个变量值乘积的n次方根称为()。 A.众数B.中位数 C.四分位数D.几何平均数 4. 标准差与均值的比值称为()。 A.异众比率B.离散系数 C.平均差D.标准差 5. 一组数据的最大值与最小值之差称为()。 A.平均差B.标准差 C.极差D.四分位差 6. 如果一个数据的标准分数是-2,表明该数据()。 A.比平均数高出2个标准差B.比平均数低2个标准差 C.等于2倍的平均数D.等于2倍的标准差 7. 一组数据的标准分数,其()。 A.均值为1,方差为0 B.均值为0,方差为1 C.均值为0,方差为0 D.均值为1,方差为1 8. 经验法则表明,当一组数据对称分布式,在均值加减1个标准差的范围内大约有()。A.68%的数据B.95%的数据 C.99%的数据D.100%的数据 9. 离散系数的主要用途是()。 A.反映一组数据的离散程度B.反映一组数据的平均水平 C.比较多组数据的离散程度D.比较多组数据的平均水平 10. 两组数据相比较()。 A.标准差大的离散程度也大B.标准差大的离散程度也小 C.离散系数大的离散程度也大D.离散系数大的离散程度也小 11. 某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是()。 A.1200 B.经济管理学院 C.200 D.理学院 12. 对于分类数据,测度其离散程度使用的统计量主要是()。 A.众数B.异众比率 C.标准差D.均值 13. 对于右偏分布,均值、中位数和众数之间的关系是()。 A.均值>中位数>众数B.中位数>均值>众数 C.众数>中位数>均值D.众数>均值>中位数 14. 在某行业中随即抽取10家企业,第一季度的利润额(单位:万元)分别为72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的极差为()。

相关文档
相关文档 最新文档