文档库 最新最全的文档下载
当前位置:文档库 › 统计学全本 习题及参考答案(期末复习完整版资料)

统计学全本 习题及参考答案(期末复习完整版资料)

一、单项选择题

【 】1、若住宅房地产“评估的房地产价值X ”与“销售价格Y ”之间建立的直线回归方程为x y t 1.398.1+-=∧

,则二者的相关系数可能..

是 A 、-1.98 B 、+3.1 C 、+0.9237 D 、-0.8963 【 】2、单因素方差分析中,误差项离差平方和SSE 实质上反映了 A 、多种因素的综合作用带来的影响 B 、系统因素带来的影响 C 、随机因素带来的影响 D 、随机因素和系统因素带来的影响

【 】3、单项式变量数列中,如果各标志值都扩大1倍,而频数都减少为原来的四分之一,则平均数 A 、不变 B 、扩大1倍 C 、减少1/4 D 、无法判断大小

【 】4、如果用P 表示商品的价格,用q 表示商品销售量,则∑∑-1011q p q p 综合反映

A 、商品价格和商品销售量变动引起销售额变动的绝对值

B 、商品销售额变动的相对数

C 、多种商品价格变动使商品销售额变动的绝对值

D 、多种商品销售量变动使商品销售额变动的绝对值 【 】5、某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为0.6,则 A 、举重能力的60%归因于其体重

B 、平均来说,运动员能举起其体重60%的重量

C 、如果运动员体重增加10公斤,则可多举6公斤的重量

D 、运动员体重和能举起的重量之间有正相关关系

【 】6、某企业最近几批产品的优质品率P分别为80%、85%、90%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选

A 、90%

B 、85%

C 、80%

D 、82%

【 】7、原始资料平均法计算季节指数时,计算各年同期(月或季)的平均数,其目的是消除各年同一季度(或月份)数据上的

A 、季节变动

B 、循环变动

C 、长期趋势

D 、不规则变动

【 】8、为了分析我校不同专业学生的某次统计学测验成绩是否有显著差异,可运用方差分析法。在1%的显著性水平下, 在12个专业中共计随机抽取60个学生进行调查,拒绝原假设的区域是 A 、 )),59,11(01.0+∞F B 、)),59,11(005.0+∞F C 、)),48,11(01.0+∞F D 、)),48,11(005.0+∞F

【 】9、一项对一所大学学生上课出勤情况及成绩的研究指出,一般来说,出勤率较高的学生,成绩也较好。若上课出勤率说明了成绩变异的36%,则

A 、上课出勤率与成绩之间的相关系数是0.36

B 、上课出勤率与成绩之间的可决系数是0.36

C 、根据上课出勤率与成绩建立的回归方程中回归系数(斜率)是0.36

D 、根据上课出勤率与成绩建立的回归方程中的常数项是0.36

【 】10、若一组数据的均值为28,众数为31,中位数为29,则大体上可断定数据的分布形态为 A 、正态分布 B 、左偏分布 C 、右偏分布 D 、尖峰分布

二、多项选择题

【 】1、可决系数2r =86.49%时,意味着

A 、自变量与因变量之间的相关关系密切

B 、因变量的总变差中,有86.49%可通过回归直线来解释

C 、因变量的总变差中,有13.51%可由回归直线来解释

D 、相关系数绝对值一定是0.93

E 、相关系数绝对值一定是0.8649

【 】2、下列那些属于测度数据离散程度的指标

A 、极差

B 、内距

C 、方差

D 、标准差

E 、离散系数 【 】3、假设检验中,关于两类错误与显著性水平,下列说法正确的有

A 、第Ⅰ类错误称为弃真错误,犯第Ⅰ类错误的概率记为α

B 、第Ⅱ类错误称为取伪错误,犯第Ⅱ类错误的概率记为β

C 、当α增大时,β减小;当β增大时,α减小

D 、要使βα和同时减小的唯一办法是增加样本容量

E 、犯第Ⅰ类错误的概率α被称为显著性水平

【 】4、在参数估计中,统计学家给出了评价估计量的一些标准,主要有以下几个:

A 、相合性

B 、有效性

C 、均衡性

D 、时效性

E 、无偏性 【 】5、下列那些属于拉氏指数公式 A 、∑∑=

10q

p q p L q

B 、∑∑=

01q

p q p L p

C 、∑∑=

1

011q

p q p P p

D 、∑∑=

11

1q

p q p P q

E 、∑∑=

1

11

011q

p q q

q p H q

三、填空题

1、单因素方差分析问题中,F=12.24,P -value =0.0056,表示拒绝原假设的概率为 。

2、如果物价指数上涨了18%,则现在1元钱只值原来的 元。

3、可决系数2r 的取值范围为 。

4、均值的缺点主要是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较 。

5、∧

21θθ、都是总体参数的无偏估计量,若,)()(21∧

<θθD D 则∧

1θ是比∧

2θ更有效的一个估计量。在无偏估计的

条件下,估计量方差越 估计也就越有效。

6、线性趋势的特点是其逐期变化量或趋势线的 基本保持不变。

7、偏态系数SK 的值小于零时,可判断数据分布为 偏。

8、简单相关系数r 的取值范围为 。

9、显著性水平α=0.05,表示拒绝原假设的概率为 %。 10、总指数的计算形式有综合指数和 指数两种。 四、判断题

【 】1、四水平的单因素方差分析,每个水平下的样本容量是5,则SSE 的自由度必定为20。 【 】2、数据无需排序,位置在最中间的数值称为中位数。

【 】3、当峰度系数K 的值大于0时,可判定该组数据为平峰分布 。 【 】4、的大小有关。

的分布和样本容量分布的形式与原有总体n x 【 】5、无论单侧检验还是双侧检验,用P 值进行决策的准则都是:如果α<值P ,拒绝0H ;α>值P ,不拒绝0H 。

【 】6、当总体服从正态分布且2σ已知时,或者总体不是正态分布但为大样本时,样本均值x 的分布均为t 分布。

【 】7、方差分析中,如果根据样本计算的统计量F=12.25,而临界值F =3

,那么因素的作用不显

著。

【 】8、假设检验具有100%的准确率。

【 】9、某企业产值2004—2006年3年的环比发展速度分别为102%、110%、115%,则2006年产值比2003年增长了29.03%。

【 】10、已知基期总值指标及个体指数时,可使用加权算术平均指数编制总指数。 五、简答题

1、一组数据的分布特征可以从哪几个方面进行测度?

2、某商店采用三种不同的方式推销商品。从三个总体中随机抽取容量相同的样本,得到12个销售量数

六、计算分析题

要求:建立适当的指数体系(V=L q ·P p ),从相对数和绝对数两方面对总成本的变动进行因素分析。

(10分)

(10分) 3、一种汽车配件的平均长度要求为10cm ,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验,结果平均长度cm x 89.9= ,样本标准差S =0.43 。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?(262.2)9()1(,96.1025.02

2

==-=t n t Z αα)(10分)

4、研究某市1990-2001年地方预算内财政收入(Y )与国内生产总值(X )的关系。通过Excel 计算得到下面的有关结果()05.0=α:(10分)

要求(1)计算地方预算内财政收入与国内生产总值的简单相关系数;

作出解释;系数线回归方程,并对回归入对国内生产总值的直建立地方预算内财政收∧

β)2((3)对回归直线的

拟合优度作出评价; 检验;

作)对回归系数(t β4 )作比较。

值检验并与(作)对回归系数(45P β 第一章 绪 论

一、 单项选择题

1、在整个统计工作过程中处于基础地位的是( )

A 、统计学

B 、统计数据搜集

C 、统计分析

D 、统计数据的整理 2、统计学的核心内容是( )

A 、统计数据的搜集

B 、统计数据的整理

C 、统计数据的发布

D 、统计数据的分析

3、某班三名学生期末统计学考试成绩分别为78分、84分和95分,这三个数字是( ) A 、指标 B 、标志 C 、变量 D 、变量值

4、某管理局有20个下属企业,若要调查这20个企业全部职工的工资收入情况,则统计总体为( ) A 、20个企业 B 、20个企业的每个职工 C 、20个企业的全部职工 D 、20个企业每个职工的工资

5、现代统计学的主要内容是( )

A 、描述统计

B 、理论统计

C 、应用统计

D 、推断统计 6、( )是整个统计学的基础。

A 、理论统计

B 、描述统计

C 、推断统计

D 、应用统计 二、多项选择题

1、统计学( )

A 、主要特征是研究数据

B 、研究具体的实际现象的数量规律

C 、研究方法为演绎与归纳相结合

D 、研究抽象的数量规律

E 、研究有具体实物或计量单位的数据 2、数学( )

A 、为统计理论和统计方法的发展提供数学基础

B 、研究具体的数量规律

C 、研究抽象的数量规律

D 、研究方法为纯粹的演绎

E 、研究没有量纲或单位的抽象的数 三、填空题

1、_________和_________是统计方法的两个组成部分。

2、统计过程的起点是_________,终点是探索出客观现象内在的______________。

3、统计数据的分析是通过___________和___________的方法探索数据内在规律的过程。

四、联系实际举例说明,为什么统计方法能够通过对数据的分析找出其内在的规律性?(要求举三个例子且不与教科书上的例子雷同)

第一章 参考答案 一、单项选择题

1、 B

2、D

3、D

4、C

5、D

6、B 二、多项选择题

1、ABCE

2、ACDE 三.填空题

1、描述统计、推断统计

2、数据搜集、数量规律性

3、统计描述、统计推断

第二章 统计数据的搜集与整理

一、单项选择题

1、某种产品单位成本计划比基期下降3%,实际比基期下降了 3.5%,则单位成本计划完成相对数为( D )

A 、116.7%

B 、100.5%

C 、85.7%

D 、99.5%

)

2281.2)212((025.0=-t

2、计算结构相对数时,总体各部分数值与总体数值对比求得的比重之和( C )

A、小于100%

B、大于100%

C、等于100 %:

D、小于或大于100%

3、将全班学生划分为“男生”和“女生”,这里采用的数据计量尺度位( C )

A、定比尺度

B、定距尺度

C、定类尺度

D、定序尺度

4、将全班学生期末统计学考试成绩划分为优、良、中、及格、不及格,这里采用的数据计量尺度为( C )

A、定类尺度

B、定距尺度

C、定序尺度

D、定比尺度

5、昆明市的温度为260C与景洪市的温度310C相差50C,这里采用的数据计量尺度位( A )

A、定距尺度

B、定类尺度

C、定比尺度

D、定序尺度

6、张三的月收入为1500元,李四的月收入为3000元,可以得出李四的月收入是张三的两倍,这里采用的数据计量尺度位( B )

A、定序尺度

B、定比尺度

C、定距尺度

D、定类尺度

7、一次性调查是指( C )

A、只作过一次的调查

B、调查一次,以后不再调查

C、间隔一定时间进行一次调查

D、只隔一年就进行一次的调查

8、在统计调查中,调查单位和填报单位之间( D )

A、无区别

B、是毫无关系的两个概念

C、不可能是一致的

D、有时一致,有时不一致

9、下列中,属于品质标志的是( B )

A、工人年龄

B、工人性别

C、工人体重

D、工人工资

10、商业企业的职工人数、商品销售额是( C )

A、连续变量

B、前者是连续变量,后者是离散变量

C、前者是离散变量,后者是连续变量

D、离散变量

11、对昆明市所有百货商店的工作人员进行普查,调查对象是( B )

A、昆明市所有百货商店

B、昆明市所有百货商店的全体工作人员

C、昆明市的一个百货商店

D、昆明市所有百货商店的每一位工作人员

12、在全国人口普查中,调查单位是( B )

A、全国人口

B、每一个人

C、每个人的性别

D、每个人的年龄

13、对某城市工业企业的设备进行普查,填报单位为( C )

A、全部设备

B、每台设备

C、每个工业企业

D、全部工业企业

14、某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是( D )

A.普查 B、典型调查 C、抽样调查 D、重点调查

15、人口普查规定统一的标准时间是为了( A )

A、避免登记的重复和遗漏

B、确定调查的范围

C、确定调查的单位

D、登记的方便

16、( C )是对事物最基本的测度。

A、定序尺度

B、定比尺度

C、定类尺度

D、定距尺度

17、下列中,最粗略、计量层次最低的计量尺度是( A )

A、定类尺度

B、定序尺度

C、定比尺度

D、定距尺度

18、下列中,计量结果只能进行加减运算的计量尺度是( A )

A、定距尺度

B、定比尺度

C、定类尺度

D、定序尺度

二、多项选择题

A、变量是150、250、200

B、变量是660、680、700、820

C、工资是变量

D、变量有3个

E、组中值有3个

2、下列各项中,属于统计指标的是( A C E )

A、某地区2004年GDP1000亿元

B、某工人月工资850元

C、某地区2004年货物运输量2000万吨

D、某地区明年小麦预计产量21万吨

E、某地区去年人口自然增长率7?

3、抽样调查与重点调查的主要区别是( B C D )

A、抽选调查单位的多少不同

B、抽选调查单位的方式方法不同

C、取得资料的方法不同

D、在对调查资料的使用时所发挥的作用不同

E、原始资料的来源不同

4、某地区进行工业企业的现状调查,则每一个工业企业是( C E )

A、调查对象

B、统计总体

C、调查单位

D、调查项目

E、填报单位

5、搜集统计数据的具体方法主要有( A B C D E )

A、访问调查

B、邮寄调查

C、电话调查

D、座谈会

E、个别深度访问

6、某地区对集市贸易个体户的偷税漏税情况进行调查,1月5日抽选5%样本,5月1日抽选10%样本检查,这种调查是( A B D )

A、非全面调查

B、一次性调查

C、定期调查

D、不定期调查 D、经常性调查

7、为了研究全国乡镇工业企业的发展情况,国家决定对全国乡镇工业企业进行普查,则每一个乡镇工业企业是( B C E )

A、调查总体

B、调查单位

C、报告单位

D、调查对象

E、既是调查单位又是报告单位

8、在某一组距数列中( A B C E )

A、组数的确定应以能够显示数据的分布特征和规律为目的

B、组距大小与组数的多少成正比

C、组距大小与组数的多少成反比

D、组距宜取5或10的倍数

E、第一组的下限应低于最小变量值;最后一组的上限应高于最大变量值

三、填空题

1、数量型统计数据通常有两种基本的形式,即__________和___________。

2、统计的原始数据都有一定的计量单位。绝对数的计量单位有__________、___________和_____________三种。

3、数字变量根据其取值的不同,可以分为___________和_____________。

4、离散变量只能取_________个值,而且其取值都以________断开,可以一一列举。

5、连续变量可以取________个值,其取值是___________的,不能一一列举。

6、从使用者的角度看,统计数据主要来源于两种渠道:一是来源于________________,二是来源于___________________。

7、根据对比的数量不同,相对数可分为_________和__________两种基本形式。

8、访问调查又称__________,它是调查者与被调查者之间通过________________而得到所需资料的调查方法。

9、在市场调查中,基本上都是采用_______调查方式,调查对象是确定_______框的基本依据。

10、调查表是用来登记调查数据的一种表格,一般由________、________和______________三部分组成。

11、调查时间包括_________________和___________________。

12、数据整理通常包括数据的________、____________、_______等几个方面的内容,它是__________之前的必要步骤。

13、数据的预处理是______________的先前步骤,内容包括数据的______与______、______等。

14、对于通过直接调查取得的原始数据应主要从_________和________两个方面去审核。

15、审核数据准确性的方法主要有____________和_____________。

16、对于其它渠道取得的第二手数据,除了对其_________和________进行审核外,还应着重审核数据的__________和___________。

17、按数量标志分组的方法主要有___________和_____________。

18、频数密度=_____________÷_________________。

19、闭口组组中值=(______+_______)÷2

20、直方图是用__________和__________来表示频数分布的图形

四、判断题

1、调查单位可以是调查对象的全部单位,也可以是调查对象的部分单位。(√)

2、人口普查的调查单位是每一个人。(√)

3、调查项目是调查的具体内容,它可以是调查单位的数量特征,也可以是调查单位的某种属性或品质特征。(√)

4、消费者购买某种产品的动机的调查,常用“座谈会”调查方法。( x )

5、搜集与研究课题有密切关系的少数人员的倾向和意见,常用个别深度访问。( x )

6、品质标志实际上就是定类尺度和定序尺度。(√)

7、数量标志实际上就是定距尺度和定比尺度。(√)

8、组距可以根据全部数据的最大值和最小值及所分的组数来确定。(√)

9、组数越多,数据分布越集中,组数越少,数据分布就越分散。( x )

10、组距分组时,为了解决“不重”问题,习惯上规定“上组限不在内”。( x )

11、若一个班的统计学考试成绩的最高分为99分,最低分为2分,则在组距分组时宜采用“××以下”和“××以上”这样的开口组。(√)

12、用组中值作为一组数据的代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两

侧称对称分布。(√)

13、从变量值小的一方向变量值大的一方累加频数,称为向下累计。( x )

14、从变量值大的一方向变量值小的一方累加频数,称为向上累计。( x )

15、人和动物的死亡率分布近似服从正态分布。( x )

16、经济学中的供给曲线呈现为正J型分布。(√)

五、简答题

1、普查作为一种特殊的调查方式具有哪些特点?

2、组距分组需要经过哪几个步骤?

六、计算分析题

1、某行业管理局40个企业1999年的产品销售收入统计数据如下(单位:万元):

152 124 129 116 100 103 92 95 127 104 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120

136 117 108 97 88 123 115 119 138 112 146 113 126

要求:

①对上面的数据资料进行适当的分组,编制频数分布表,并绘制频数分布的直方图和折线图。

②根据频数分布表计算累计频数和累计频率。

③如果按企业成绩规定:销售收入在125万元以上为“先进企业”;115~125万元为“良好企业”;105~

115万元为“一般企业”;105万元以下为“落后企业”。试按先进企业、良好企业、一般企业和落后企业进行分组。

6.1[解]:

(2)计算频数分布的累计频数和累计频率。(见上表)

次数(频数);③计算各组组距、组中值、频率。

6.2[解]:(1)该变量数列为“数量型变量数列”。

(2)表中:“变量”为“日产量”和“工人人数”;

“变量值”为:50-60,60-70,80-90,90-100和6,12,18,10,7。

上限分别为:60,70,80,90,100;

下限分别为:50,60,70,80,90;

各组次数(频数)为:6,12,18,10,7;

3、某商店有职工20人,月工资额(单位:元)分别如下:

550 550 640 640 660 660 680 680 700 700

720 720 740 740 690 690 698 698 590 590

要求:利用分组法,将上述20人的工资分成三个组,并说明该商店职工工资的分布特征。

625元至725元之间,且这20名职工的月工资额数据大致呈“右偏分布”,有90%的职工月工资额低于725元。

B、一批商品运到商业仓库,在这批商品中选出10件进行仔细检查,以判断和记录其质量。

C、某乡在春播期间每隔5天向上级主管部门提交播种进度报告。

D、为了了解科技人员分配、使用状况,有关部门向各单位布置调查表,要求填报。

E、对大中型基本建设项目投资效果进行调查。

F、选取部分企业进行调查,以了解扩大企业自主权试点后的成果及问题。

要求:(1)指出上述各项调查按组织方式分类各属于哪种调查?(2)指出上述各项调查按登记事物的连续性分类各属于哪种调查?(3)指出上述各项调查按调查对象的范围分类各属于哪种调查?(4)指出各项调查按收集资料的方法分类各属于哪种调查?

一、单项选择题 1、D 2、C 3、C 4、C 5、A 6、B 7、C 8、D 9、B 10、C 11、B 12、B 13、C 14、D 15、A 16、C 17、A 18、A 二、多项选择题

1、CE

2、ACE

3、BCD

4、CE

5、ABCDE

6、ABD

7、BCE

8、ABCE 三、填空题

1、绝对数、相对数

2、实物单位、价值单位、复合单位

3、离散变量、连续变量

4、有限,整数位

5、无穷多、连续不断的

6、直接的调查和科学试验(第一手或直接的统计数据);别人调查或实验的数据(第二手或间接的统计数据)

7、比例、比率

8、派员调查、面对面地交谈

9、抽样调查、抽样 10、表头、表体、表外附加 11、调查数据所属的时间、调查工作的期限 12、预处理、分类或分组、汇总;统计分析 13、数据分组整理、审核、筛选、排序 14、完整性、准确性 15、逻辑检查法、计算检查法 16.完整性、准确性、时效性、适用性 17、单变量值分组、组距分组 18、频数、组距 19.下限值、上限值 20、矩形的宽度、高度 四、判断题

1、 √

2、√

3、 √

4、×

5、×

6、 √

7、 √

8、√

9、 × 10、√ 11、√ 12、 √ 13、 × 14、 × 15、 × 16、 √ 五、(略) 六、计算题

第三章 数据分布特征的描述

一、单项选择题

1、经验表明,当数据分布近似于正态分布时,则有95%的数据位于区间( B ) A 、σ±X B 、σ2X ± C 、σ3X ± D 、σ4X ±

2、实际中应用最广泛的离散程度测度值是( C )

A 、极差和平均差

B 、平均差和四分位差

C 、方差和标准差

D 、异众比率和四分位差 3、集中趋势的测度值中,最主要的是( C )

A 、众数

B 、中位数

C 、均值

D 、几何平均数

4、有10个数据,它们对数据6的离差分别为:-3,-2,-2,-2,0,0,4,4,5,5。由此可知这10个数据的( D )

A 、均值为0

B 、均值为1

C 、均值为6

D 、均值为6.9

5、某生产小组由36名工人,每人生产的产量数量相同,其中有14人生产每件产品耗时8分钟;16人生产每件产品耗时10分钟;6人生产每件产品耗时5分钟,计算该生产小组生产每件产品的平均耗时应采用( C )

A 、简单算术均值

B 、简单调和算术均值

C 、加权算术均值 D.、加权调和均值

6、某敬老院里有9位百岁老人的岁数分别为101、102、103、104、108、102、105、110、102 ,据此计算的结果是( B )

A 、均值=中位数=众数

B 、均值>中位数>众数

C 、众数>中位数>均值

D 、中位数>均值>中数 7、几何均值主要适合于( C )

A、具有等差关系的数列

B、变量值为偶数的数列

C、变量值的连乘积等于总比率或总速度

的数列 D、变量值之和等于总比率或总速度的数列

8、加权算术均值不但受变量值大小的影响,也受变量之出现的次数多少的影响,因此下列情况中对均值不

发生影响的是( A )

A、变量值出现次数相等时

B、变量值较小、次数较多时

C、变量值较大、次数较少时

D、变量值较大、次数较多时

9、一组数据的均值为350,众数为200,则( D )

A、中位数为275,数据呈右偏分布

B、中位数为275,数据呈左偏分布

C、中位数为300,数据呈左偏分布

D、中位数为300,数据呈右偏分布

10、一组数据的均值为5,中位数为3,则( A )

A、数据呈右偏分布

B、数据呈对称分布

C、数据呈左偏分布

D、数据呈正态分布

11、经验表明,当数据分布近似于正态分布时,则变量值落在区间σ

X的概率为( B )

±

A、95%

B、68%

C、99.86%

D、95.45%

12、当众数(Mo)中位数(Me)和均值(X)三者的关系表现为:Mo=Me=X,则( C )

A、数据有极小值

B、数具有极大值

C、数据是对称分布

D、数据是左偏分布

E、数据右偏分布

13、在单项式数列中,假定标志值所对应的权数都缩小1/10,则算术平均数( A )

A、不变

B、无法判断

C、缩小1/100

D、扩大10倍

14、若单项式数列的所有标志值都减少一倍,而权数都增加一倍,则其算术平均数( B )

A、增加一倍

B、减少一倍

C、不变

D、无法判断

15、各变量值与其算术平均数的离差之和( C )

A、等于各变量值之和的平均数

B、等于最大值

C、等于零

D、等于最小值

16、各变量值与其算术平均数的离差平方之和( D )

A、等于各变量值之和的平均数

B、等于最大值

C、等于零

D、等于最小值

二、多项选择题

1、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:X<Me<Mo,则( A D )

A、数据是左偏分布

B、数据是右偏分布

C、数据是对称分布

D、数据存在极小值

E、数据存在极大值

2、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:Mo<Me<X,则( A D )

A、数据是右偏分布

B、数据是对称分布

C、数据是左偏分布

D、数据有极大值

E、数据有极小值

3、数据分布的两个重要特征是( B E )

A、正态分布

B、集中趋势

C、t分布

D、χ2分布

E、离散程度

4、利用组距分组数据计算众数时,有一些基本假定,即( B D )

A、假定数据分布具有明显的离中趋势B、既定数据分布具有明显的集中趋势

C、假定众数组的频数在该组内是正态分布D、假定众数组的频数在该组内是均匀分布

E、假定众数组的频数在该组内是二项分布

5、众数( A B C D E )

A、是一组数据分布的最高峰点所对应的数值B、可以不存在C、也可以有多个D、是位置代表值E、不受数据中极端值的影响。

6、极差( A C D E )

A、是描述数据离散程度的最简单测度值

B、不易受极端值影响

C、易受极端值影响

D、

不能反映出中间数据的分散状况 E、不能准确描述出数据的分散程度

7、一组数据为17、19、22、24、25、28、34、35、36、37、38。则( A B D E )

A、该组数据的中位数为28

B、该组数据的第一个四分位数为22

C、该组数据的众数为38

D 、该组数据无众数

E 、该组数据的第三个四分位数为36

8、下列标志变异指标中,与变量值计量单位相同的变异指标有( A B C ) A 、全距 B 、平均差 C 、标准差 D 、标准差系数 E 、平均差系数 9、下列标志变异指标中,用无名数表示的有( D E )

A 、全距

B 、平均差

C 、标准差

D 、标准差系数

E 、平均差系数 10、比较两个单位的资料发现,甲的标准差大于乙的标准差,甲的平均数小于乙的平均数,由此可推断( A D )

A 、甲单位标准差系数大

B 、乙单位标准差系数大

C 、甲单位平均数代表性大

D 、乙单位平均数代表性大

E 、无法判断两单位平均数代表性大 11、已知

这100)

A 、

406040

%1560%10+?+? B 、10%×60%+15%×40% C 、10%?80%+15%?20%

D 、2%15%10+

E 、200

800200%15800%10+?+?

三、填空题

1、中位数将全部数据分为两部分,一部分数据_____________,另一部分数据则________________。

2、根据未分组数据计算中位数时,若数据个数N 为奇数时,则中位数Me=_____________;若数据个数为N 为偶数时,则中位数Me=________________。

3、几何平均数是适用于特殊数据的一种平均数,它主要用于计算___________的平均;在实际应用中,几何平均数主要用于计算社会经济现象的___________________。

4、均值的主要缺点是易受数据___________的影响,对于_________的数据,均值的代表性较差。

5、均值的变形主要有_______________和_______________。前者主要用于__________________的数据,后者主要用于计算____________的平均数。

6、方差是__________与其均值___________的平均数。

7、极差也称_______,它是一组数据的___________和_________之差。

8、众数是一组数据中____________的变量值,从分布的角度看,它是具有明显_______________的数值。 四、 判断题

1、在均值加减3个标准差的范围内几乎包含了全部数据。( √ )

2、样本方差与总体方差在计算上的区别是:总体方差是通体数据个数或总频数减1去除离差平方和,而样本方差则是用样本数据个数或总频数去除离差平方和。( X )

3、从统计思想上看,均值是一组数据的重心所在,是数据误差相互抵消后的结果。( √ )

4、由于中位数是一个位置代表值,其数值的大小受极大值和极小值的影响,因此中位数据有稳健性的特点。( X )

5、中位数与各数据的距离最长。( X )

6、min Me N

1i i

X

=-∑

=(最小) ( √ )

7、从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均。( √ )

8、几何平均数的对数是各变量值对数的算术平均。( √ ) 9、根据Mo 、Me 和X 之间的关系,若已知Me=4.5,X =5,则可以推算出Mo=3.5。 ( √ ) 10、对于具有偏态分布的数据,均值的代表性要好于中位数。( X )

11、当数据分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。( √ ) 五、 简答题

1、权数的实质内容是什么?

2、数据集中趋势的测度值与离中趋势的测度值各有哪些?

3、试比较众数、中位数和均值三者的特点及应用场合。

4、什么是离散系数?为何要计算离散系数?

5、均值具有哪些重要的数学性质?

6、离散特征数在统计分析中的作用?

7、实际中几何平均数应用于哪些场合? 六、计算分析题 1、根据要求计算:

(1)已知500X =,V=0.3 , 求方差σ2。

(2)已知5.5X = ∑X 2=385, N=10 , 求离散系数V σ。 (3)已知σ=20 ,60X = ,求各数据值对50的方差。 (4)已知350X = ,V=0.4 ,求各数据值对400的标准差。

(5)已知∑=810X ,657702=∑X ,N=10,求标准差σ和离散系数V σ。 (6)已知:σ2

=100,26002______

=X ,求离散系数V σ

(7)已知:样本方差S 2n-1=16,∑(X-X )2=784,求样本容量n 。

2、某车间生产三批产品的废品率分别为1%、2%、1.5%,三批产品的产量占全部产量的比重分别为25%、35%、40%,试计算该车间三批产品的平均废品率。

3、某产品精加工车间加工零件5000件,其中合格品4500件,不合格品500件。 要求:计算是非标志的平均数、方差、标准差及离散系数。

4、有两个教学班进行《统计学》期中测验,甲班有45个学生,平均成绩为78分,标准差为8分;乙班有50个学生,平均成绩为72分,标准差额为10分。要求计算两个教学班总的平均成绩和标准差。

5、某厂长想研究星期一的产量是否低于其他几天,连续观察六个星期,所得星期一日产量(单位:吨)为:

(3)分别计算星期一和非星期一产量的标准差;(4)比较星期一和非星期一产量的离散程度哪一个大一些?(5)计算非星期一产量数据分布的偏态系数和峰度系数。

6、甲工厂工人的工资的离差的绝对值之和是乙工厂工人工资离差绝对值之和的3倍,即:∑-=∑-x x x x 乙乙甲甲3;

而乙工厂工人工资的平均差却是加工厂工人工资平均差的3倍,即:D A D A ..2甲乙=,求:通过计算判断上述情况在什么情况下可能会发生?

(3)计算分布的偏态系数和峰度系数,并作简要分析说明。

可)

(2)试通过计算,比较分析哪一组的身高差异大?

(2)哪个单位工人的日产量水平均衡?

(2)根据计算结果回答,该地区平均每户家庭人均年收入与其平均数相比,平均相差多少元?(即是问标准差)

(提示:用中位数。因为收入分布为右偏,且频数较多的几个组的家庭百分比相差不大,众数不十分明显。)

判断甲车间数据分布的形态。

(2)通过计算判断哪个车间工人平均奖金额的代表性强?

来分析)

15、某企业某种产品须经过4个车间的流水作业才能完成,如果第一车间的产品合格率为90%,第二车间的产品合格率为97%,第三车间的产品合格率为95%,第四车间的产品合格率为98%,求平均合格率。 16、某种产品的生产须经过10道工序的流水作业才能完成,有2道工序的合格率都为90%,有3道工序的合格率都为92%,有4道工序的合格率都为94%,有1道工序的合格率为98%,试计算平均合格率。 17、某班共有60名学生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为6分;女生的平均考试成绩为80分,标准差为6分。根据给出的条件回答下面的问题:

(1)如果该班的男女学生各占一半,全班考试成绩的平均数是多少?标准差又是多少?

(2)如果该班中男生为36人,女生为24人,全班考试成绩的平均数是多少?标准差又是多少? (3)如果该班中男生为24人,女生为36人,全班考试成绩的平均数是多少?标准差又是多少? (1) 比较(1)、(2)和(3)的平均考试成绩有何变化,并解释其变化的原因。 (2) 比较(2)和(3)的标准差有何变化,并解释其原因。

(6)如果该班的男女学生各占一半,全班学生中考试成绩在64.5分~90.5分的人数大概有多少?

(提示:采购总数量

采购总金额

总平均价格

试求:三个工厂的平均计划完成程度。

%)100%10033%

100%100(?=?÷÷=?=?=

∑∑∑∑计划产值

实际产值计划产值实际产值平均计划产值

平均实际产值

;平均计划完成程度计划产值实际产值提示:计划完成程度

第3章 数据分布特征的描述

一、单项选择题

1、B

2、C

3、C

4、D

5、C

6、B

7、C

8、A

9、D 10、A 11、B 12、C 13、A 14、B 15、C 16、D 二、多项选择题

1、AD

2、AD

3、BE

4、BD

5、ABCDE

6、ACDE

7、ABDE

8、ABC

9、DE 10、AD 11、CE 三、填空题

1、大于中位数、小于中位数

2、X

M N e ??

? ??+=

21,??

????

+=

??

?

??+?

?

? ??X

X M N N e 12221 3、比率或速度、年平均发展速度 4、极端值、偏态分布 5、调和平均数、几何平均数、不能直接计算均值、比率数据 6、各变量值、离差平方 7、全距、最大值、最小值 8、出现次数最多、集中趋势 四、判断题

1、 √

2、 ×

3、√

4、×

5、×

6、√

7、 √

8、√

9、√ 10 × 11、√ 五、(略) 六、计算题 6.1[解]:

(1)∵ X

V σ

= ∴ 1503.0500=?=?=X V σ

2σ=22500

(2)()87.225.825.305.385.510

3852

22≈=-=-=-∑=X N X σ 2

%22.525222.05

.5872

.2===

=

X

V σ

(3)(P.37)因为

2

0222

20)

()()()(X X N X X NC X X X X -+∑-=+∑-=∑

-

得:2

02202

20)()(()(X X X X N

X N X X -+=-+∑-=∑-σ

(上式左边即是各数据对0X 的方差) 若令500=X ,则各数据对50的方差为:

5005060202

22022

0=-+=-+=∑-)()()(X X N

X X σ

(4) 1404.0350=?=?=X V σ 各数据对400的标准差为:

()()()66.1484003501404004002

2222

=-+=-+=∑-X N

X σ

(5)416656165771081010657702

22

==-=??

? ??-=-∑=X N X σ %94.40494.081

4

===

∑=

=

N

X X

V σ

σ

(6)5025001002600.......2_____

2_____

22

2==-=-=

?-=σσX X X X

2.050

10

50100===

=

X

V σ

(7)()()..1 (12)

1

2

2

2

1

--∑-=-?-∑-=n n S x x n n x x S

()50116

7841212

=+=+∑-=-n S x x n 6.2[解]:设X 废品率

∑F

F

为产量比重,则该车间三批产品的平均废品率:%55.1%40%5.1%35%2%25%1=?+?+?=∑∑?

=F

F

X X 6.3[解]:5000=N ,45001=N ,5000=N 是非标志的平均数%909.05000

45001====

N N P 是非标志的方差()09.01.09.01=?=-P P 是非标志的标准差()3.009.01==-P P

是非标志的离散系数()%33.333333.09

.03

.01===-=

P P P V 6.4[解]:依题意45=N 甲 78=X 甲 8=σ甲 50=N 乙 72=X 乙

10=σ乙

于是两个教学班总的平均成绩84.74957110504550724578==+?+?=

++=N N N

X N X X 乙甲乙乙甲甲(分) ∵ X N X 22

2

-∑=σ ∴根据已知条件得出方程组 ??

???-∑=-∑=5184501006084456422

X X 乙甲

解得:???∑=∑=2642002766602

2

X X 乙甲

于是两个教学班总的标准差:

()604.984.7450452642002766602

222=-++=-+∑∑+=X N N X X 乙

甲乙甲σ(分)

5.[解]:

(1)6个星期一产量的均值

1506

90061201502101701501001

==+++++=x (吨) 6个星期一产量的中位数

排序后产量为:100 120 150 150 170 210

中为数的位置=5.32

1

621=+=+N ,即:中位数在第3个数据和第4个数据之间的中间位置,亦即:1502

150150=+=M e

(吨)

∴ 非星期一产量的均值17524

4200

==

=

∑∑f xf x (吨) 中位数的位置=

122

24

2

==

∑f

因为:向上累计频数18刚好大于12 所以150——200这一组即为“中位数所在组”, 于是: 150=L 81=-S m 10=f m 50=i 则:非星期一产量的中位数为:

17050108

121502

1

=?-+=?-∑+=-i f S f

L M m

m e 因为:10=f 出现次数最多,所以他所在组150——200这一组即为“众数组”,于是:150=L 10=f

81=-f 41=+f 50=i 则:非星期一产量的众数为: ()()()()

5.16250410810810150111=?-+--+=?-+--+

=+--i f f

f f f f L M O

(3)星期一和非星期一产量的标准差的计算: 星期一产量的标准差的计算表:(1501=x )

()12.356

74002

1

==∑-=n x x σ (吨)

x

()64.4524500002

2==∑∑-=

f

f x x σ (吨) (3)星期一产量的离散系数:2341.0150

12.351

11===

x V σ

非星期一产量的离散系数:2608.0175

64.452

22===

x V σ

因为:V V 21<,所以非星期一产量的离散程度要大一些。 (4)非星期一产量数据的偏态系数和峰度系数:

()()396.2281645150000064.4524150000033

3

3

3

3=?=∑?∑-=∑∑

-=

σ

σf f

x x f

f x x a )(=0.66>0 呈“右偏分布” ()()64.29.10413429527500000064.452427500000044

4

4==?=∑?∑-=σf f

x x a <3 呈“扁平分布” 6.6[解]:D A X X N N X X D A ?∑-=

?∑-=

?甲

甲甲甲甲甲甲.... 因为:????=?∑∑-=-....................23D A D A X X X X 甲乙乙

乙甲甲

所以:N D A D A N D A X X D A X X N 乙乙乙

乙乙乙乙甲

甲甲62

323=????=?∑-=

?∑-=

表明:只有在甲工厂的工人人数是乙工厂工人人数6倍的条件下,上述情况才能发生。

6.7[解]:有关计算表(见后面)

因为:400——500这一组出现次数42为最多,故它为“众数组” 于是:400=L 42=f 301=-f

181

=+f

100=i

则:这120家企业利润的众数为:

()()()()

33.4331001842304230

42400111=?-+--+=?-+--+

=+--i f f f f f f L M O (万元)

中位数位置=602

2== 因为累计频数91>60 所以其所在组400-500这一组就是“中位数所在组”,于

是400=L 491=-S m

42=f m 100=i

则这120家企业利润的中位数为:

19.42610042496040021

=?-+=?-∑+

=-i f S F

L M m

m e (万元

所以:这120家企业利润的均值为:67.42612051200

==∑∑=F

XF X (万元) 这120家企业利润的标准差为:

()116998.115120668.16146662

≈==∑∑-=

F

F

X X σ

这120家企业利润数据分布的偏态系数为:

()()21.02057.01873075204616.385349641161204616.38534964

33

3

3≈==?=∑?∑-=σ

F F X X a >0 故:该组数据呈“正(右)偏分布”。

这120家企业利润数据分布的峰度系数为:

()()35.20217276720008.1510874419211612008.151********

24

4

4==?=∑?∑-=σ

F F X X a <3 故:该组数据呈“扁平分布”。

相关文档
相关文档 最新文档