文档库 最新最全的文档下载
当前位置:文档库 › 统计学思考题

统计学思考题

统计学思考题
统计学思考题

思考题(仅供参考)

部分题目超出范围。同学们仅作上课讲授过的题目即可

二、判断题

1、对于定性变量不能确定平均数.( )

2、根据组距式数列计算的平均数、标准差等都是近似值.( )

3、任何平均数都受变量数列中的极端值的影响.( )

4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( )

5、任何变量数列都存在众数.( )

6、如果x

7、若比较两个变量分布平均数代表性的高低,则方差或标准差大的平均数的代表性差.( )

8、只要变量分布具有相同的标准差就会有相同的分布形状.( )

9、在统计学实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的.( )

10.各标志值平方和的算术平均数公式为 ( )

11.各个变量值对其算术平均数的离差绝对值之和等于零。 ( )

12.计算加权算术平均数时,其权数必须是各组的次数或比率。( )

13.计算数值平均数时,要求资料中的各项数值必须大于零。( )

14.根据分组资料计算的算术平均数,只是一个近似值。( )

15.权数的绝对数越大,对算术平均数的影响也就越大。( )

16.组距数列条件下,众数的大小主要取决于众数组相邻两小次数多少的影响。( )

17.两个企业比较,若B A B A x x σσ>>,”,由此可以肯定B 企业生产的均衡性比A 企业好。

( )

18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。

( )

19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( )

20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( )

21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( )

22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( )

三、选择题

1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( )

A 、 600元

B 、 533.33元

C 、466.67元

D 、 500元

2、标志变异指标是反映同质总体的( ).

A 、集中程度

B 、离中程度

C 、一般水平

D 、变动程度

3、权数对算术平均数的影响作用,实质上取决于( )

A 、作为权数的各组单位数占总体单位数比重的大小

B 、各组标志值占总体标志总量比重的大小

C 、标志值本身的大小

D 、标志值数量的多少

4、对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的( )来

比较

A.标准差系数

B.平均差

C.全距

D.均方差

5、统计学中最重要的离散指标是( ).

A 、平均差

B 、全距

C 、标准差

D 、变异系数

6、离散指标中受极端值影响最大的是( )

A 、平均差

B 、全距

C 、标准差

D 、方差

7、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,则全班考试成绩的水平高低应该用什么平均数来说明?( )

A 、算术平均数

B 、众数

C 、众数或中位数

D 、中位数

8、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则( )

A 、平均数大者代表性强

B 、平均数小者代表性强

C 、两个平均数的代表性一样

D 、无法判断哪个平均数的代表性强

9、某企业有A 、B 两个车间,去年A 车间人均产量3.6万件,B 车间人均产量3.5万件.今年A 车间人数增加6%,B 车间增加8%.如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比( )

A 、上升

B 、下降

C 、不变

D 、不能确定如何变化

10、已知某变量分布属于钟形分布且M0=900,Me=930,则( )

A 、x <900

B 、900

C 、x >930

D 、x =915

11.受极大值影响较大的平均数是( )。

A 位置平均数

B .几何平均数

C .算术平均数

D .调和平均数

12.若某总体次数分布呈轻微左偏分布,则有( )式成立。

A .0M M X e >>

B .0M M X e <<

C .e M M X >>0

D .e M M X <<0

13.若各个变量值都扩大2倍,而频数都减少为原来的言,则平均数( )。

A .扩大2倍

B .减少到1/3

C .不变

D .不能预期平均数的变化

14.某车间三个班组生产同一种产品,某月劳动生产率分别为

2、3、4(件/工日),产量分别为400、500、600(件),则该车间平均劳动生产率计算式为

( )。

A .32432=++(件/工日)

B .13.31500

600450034002=?+?+? (件/工日)

C .90.24

60035002400600500400=++++ (件/工日) D .88.24323=??(件/工日) 15.计算中位数时,符号m m m m f S f f S f

11

22+--+-∑∑ 等于 ( )。

A .1

B .i

C .∑f

D .f m

16.由左数列可知下列判断( )。

A .M 0 > Me

B .Me > M 0

C .M 0 > 30

D .Me > 30

17.计算平均发展速度最合适的平均数是( )。

A .简单算术平均数

B .加权算术平均数

C .几何平均数

D .调和平均数

18.已知某企业职工消费支出,年支出6000元人数最多,平均年支出为5500元,该企业职工消费支出分布属于( )。

A .左偏分布 D .右偏分布 C .对称分布 D .J 型分布 19.在下列成数数值中,哪一个成数数值的方差最小( )。

A .0.8

B .0.5

C .0.3

D .0.1

20.检验一批成品,400个中8个是废品,则废品比重的方差为( )。

A .0.02

B .0.98

C .0.14

D .0.0196

21.分组资料条件下,组内方差的计算公式为( )。 A .22)(i i i

x f f x -∑∑ B .22)(X f f x i i

-∑∑ C .22)(X f f x i i

-∑∑

D .22)(i i i

x f f x -∑∑

22.平均差系数抽象了( )。

A .总体指标数值大小的影响

B .总体次数多少的影响

C .标志变异程度的影响

D .平均水平高低对离散分析的影响

23.某企业1996年职工平均工资为5200元,标准差110元,1999年职工平均工资增长了40%,标准差增大到150元,职平均工资的相对变异( )。

A .增大

B .减小

C .不变

D .不能比较

24.若峰态系数的值明显不同于3,表明分布曲线为( )

A 、平峰分布

B 、尖峰分布

C 、缓峰分布

D 、偏峰分布

2

比较哪个企业的总平均成本高?并分析其原因.

3、为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本.请回答下面的问题,并解释其原因.

(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?

(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?

(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?

4、一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg.请回答下面的问题:

(1)是男生的体重差异大还是女生的体重差异大?为什么?

(2)以磅为单位(1kg=2.2lb),求体重的平均数和标准差.

(3)粗略地估计一下,男生中有百分之几的人体重在55kg到65kg之间?

(4)粗略地估计一下,女生中有百分之几的人体重在40kg到60kg之间?

5、一家公司在招聘收职员时,首先要通过两项能力测试.在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分.一位应试者在A项测试中得了115分,在B项测试中得了425分.与平均分数相比,该位应试者哪一项测试更为理想?

6、一条成品生产线平均每天的产量为3700件,标准差为50件.如果某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生产线“失去控制”.下表是一周内各天的产量,该生产线哪几天失去了控制?

时间周一周二周三周四周五周六周日

产量3850 3670 3690 3720 3610 3590 3700

二、判断题

1、不重复抽样的结果,其精度比重复抽样高,因为它的样本的代表性更好。()

2、抓阄和抽签,就是简单随机抽样。()

3、从总体中按照随机原则抽取容量为n的样本,只可能有一个样本并有唯一的样本统计量值。()

4、抽样调查就是按主观意识来抽取对调查总体有代表性的样本单位。()

5、抽样误差范围是可以在一定的可靠程度下得到控制。()

6、参数是用来描述总体数量特征的概括性数字度量,是随机变量。()

7、对某种连续生产的零件质量进行检验,现每隔两个小时抽出10分钟的零件进行检验,这种抽样方法是整群抽样。()8、根据中心极限定理,只要在样本容量n充分大时,不论总体的变量分布是否属于正态分

布,其样本平均数也趋近于正态分布,即随n→∞,

2

(,)

x N

n

σ

μ

。()

四、选择题

1、从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会被抽中,这样的抽样方法称为()。

A、简单随机抽样

B、分层抽样

C、系统抽样

D、整群抽样

2、从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。

A、重复抽样

B、不重复抽样

C、分层抽样

D、整群抽样

3、从总体中抽取一个元素后不再放回到总体,然后再从所剩下的元素中抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。

A、重复抽样

B、不重复抽样

C、分层抽样

D、整群抽样

4、在抽样之前先将总体的元素划分成若干类,然后从各类中抽取一定数量的元素组成一个样本,这样的抽样方法称为()。

A、简单随机抽样

B、分层抽样

C、系统抽样

D、整群抽样

5、先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素构成一个样本,这样的抽样方法称为()。

A、简单随机抽样

B、分层抽样

C、系统抽样

D、整群抽样

6、先将总体划分成若干个群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方法称为()。

A、简单随机抽样

B、分层抽样

C、系统抽样

D、整群抽样

7、为了调查某校学生生活费用支出,从男生中抽取60名学生,从女生中抽取40名学生进行调查,这种调查方法称为()。

A、简单随机抽样

B、整群抽样

C、系统抽样

D、分层抽样

8、为了调查某校学生生活费用支出,从全校抽取4个班级的学生进行调查,这种调查方法称为()。

A、简单随机抽样

B、系统抽样

C、分层抽样

D、整群抽样

9、为了调查某校学生生活费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方法称为()。

A、简单随机抽样

B、整群抽样

C、系统抽样

D、分层抽样

10、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的参数是()。

A、2000个家庭

B、200万个家庭

C、2000个家庭的人均收入

D、200万个家庭的人均收入

11、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。这项研究的统计量是()。

A、2000个家庭

B、200万个家庭

C、2000个家庭的人均收入

D、200万个家庭的人均收入

12、为了估计某城市中拥有汽车的家庭比例,抽取500个家庭的一个样本,得到拥有汽车的家庭比例为35%,这里的35%是()。

A、参数值

B、统计量的值

C、样本量

D、变量

13、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中研究者感兴趣的参数是()。

A、100所中学

B、20个城市

C、全国高中学生的平均身高

D、100所中学的中学生的平均身高

14、统计量的抽样分布是指()。

A、一个样本中各观测值的分布

B、总体中各观测值的分布

C、样本统计量的概率分布

D、样本观测值的概率分布

15、根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为()。

A、μ

B、x

C、2σ

D、

2 n σ

16、根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为()。

A、μ

B、x

C、2σ

D、

2 n σ

17、从均值为μ,方差为2σ的任意一个总体中抽取样本量为n的样本,则()。

A、当n充分大时,样本均值x的分布近似服从正态分布

B、只有当30

n<时,样本均值x的分布近似服从正态分布

C、样本均值x的分布与n无关

D、无论n多大,样本均值x的分布都为非正态分布

18、假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布()。

A、服从非正态分布

B、近似正态分布

C、服从t分布

D、服从2χ分布

19、从正态分布的总体中分别抽取样本量为4、16、36的样本,当样本量增大时,样本均值的标准差()

A、保持不变

B、增加

C、变小

D、等于总体标准差

20、设总体均值为50、标准差为8,从该总体中随机抽取样本量为64的样本,则样本均值的抽样分布的均值和标准差分别为()。

A、50,8

B、50,1

C、50,4

D、8,8

21、从均值为200、标准差为50的总体中抽取样本量为100的简单随机样本,样本均值的期望值和方差分别为()。

A、150和50

B、200和5

C、100和10

D、250和15

22、假设总体比例为0.55,从此总体中抽取样本量为100的样本,则样本比例的标准差为()。

A、0.01

B、0.05

C、0.06

D、0.55

23、假设总体比例为0.4,从此总体中抽取样本量为100的样本,则样本比例的期望值为()。

A、0.3

B、0.4

C、0.5

D、0.45

五、计算题

n 的简单随机样本,用于获得总体信1、从均值为400,标准差为50的总体中,抽取100

息。

(1)x的数学期望值是多少?

(2)x的标准差是多少?

(3)x的抽样分布是什么?

二、判断题

1、评价估计量无偏性标准的直观意义是没有抽样误差。()

2、当样本容量确定时,置信区间的宽度随着置信水平的增大而缩小。()

3、点估计就是以样本估计量直接代替总体参数的一种推断方法。()

4、所有可能的样本平均数的平均数,等于总体平均数。()

5、置信水平为95%的置信区间意味着一次抽样所构造的置信区间有95%的可能性包含总体参数的真值。()

6、对一个研究总体来说,样本容量越大,估计的精度越高。()

7、点估计和区间估计的主要区别在于,前者不能反映估计的误差和可靠性,后者则能。()

8、样本统计量估计相应的总体参数,要求误差越小越好,这说明满足了无偏性的标准。()

三、选择题

1、在用样本的估计量估计总体参数时,评价估计量的标准之一是使它与总体参数的离差越小越好,这种评价标准称为()。

A、无偏性

B、有效性

C、一致性

D、充分性

2、根据一个具体的样本求出的总体均值95%的置信区间()。

A、以95%的概率包含总体的均值

B、有5%的可能性包含总体均值

C、绝对包含总体均值

D、绝对包含总体均值或绝对不包含总体均值

3、估计量的无偏估计是指()。

A、样本估计量的值恰好等于待估的总体参数

B、所有可能样本估计值的期望值等于待估总体参数

C、估计量与总体参数之间的误差最小

D、样本量足够大时等于总体参数

4、下面的陈述正确的是()。

A、95%的置信区间将以95%的概率包含总体参数

B、当样本量不变时,置信水平越大得到的置信区间就越窄

C、当置信水平不变时,样本量越大得到的置信区间就越窄

D、当置信水平不变时,样本量越大得到的置信区间就越宽

5、总体均值的置信区间等于样本均值加减估计误差,其中的估计误差等于所要求置信水平的临界值乘以()。

A、样本均值的标准误差

B、样本标准差

C、样本方差

D、总体标准差

6、95%的置信水平是指()。

A、总体参数落在一个特定的样本所构造的区间内的概率为95%

B、在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%

C、总体参数落在一个特定的样本所构造的区间内的概率为5%

D、在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%

7、一个估计量的有效性是指()。

A、该估计量的期望值等于被估计的总体参数

B、该估计量的一个具体数值等于被估计的总体参数

C、该估计量的方差比其他估计量大

D、该估计量的方差比其他估计量小

8、一个估计量的一致性是指()。

A、该估计量的期望值等于被估计的总体参数

B、该估计量的方差比其他估计量小

C、随着样本量的增大该估计量的值越来越接近被估计的总体参数

D、该估计量的方差比其他估计量大

9、指出下面的说法哪一个是正确的()。

A、一个大样本给出的估计量比一个小样本给出的估计量更接近总体参数

B、一个小样本给出的估计量比一个大样本给出的估计量更接近总体参数

C、一个大样本给出的总体参数的估计区间一定包含总体参数

D、一个小样本给出的总体参数的估计区间一定不包含总体参数

10、用样本量的值直接作为总体参数的估计值,这一估计方法称为()。

A、点估计

B、区间估计

C、无偏估计

D、有效估计

11、将构造区间估计的步骤重复多次,其中包含总体参数真值的次数所占的比例称为()。

A、置信区间

B、显著性水平

C、置信水平

D、临界值

12、在总体均值和总体比例的区间估计中,估计误差是由()。

A、置信水平确定

B、统计量的抽样标准差确定

C、置信水平和统计量的抽样标准差确定

D、统计量的抽样方差确定

13、在置信水平不变的条件下,要缩小置信区间则()。

A、需要增加样本量

B、需要减少样本量

C 、需要保持样本量不变

D 、需要改变统计量的抽样标准差

15、当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是( )。

A 、正态分布

B 、t 分布

C 、2χ分布

D 、F 分布

16、当总体的方差未知,在大样本条件下,估计总体均值使用的分布是( )。

A 、正态分布

B 、t 分布

C 、2χ分布

D 、F 分布

17、在其他条件不变时,要使估计时所需的样本量小,则应该()。

A 、提高置信水平

B 、降低置信水平

C 、使置信水平不变

D 、使置信水平等于1

18、使用t 分布估计一个总体均值时,要求()。

A 、总体为正态分布且方差已知

B 、总体为非正态分布

C 、总体为非正态分布但方差已知

D 、正态总体方差未知且为小样本

19、在大样本条件下总体均值在(1α-)置信水平下的置信区间可以写为( )。

A

、2x t α

±

B

、2x t α± C

、2x z α± D

、2x z α±

20、正态总体方差已知时,在小样本条件下总体均值在(1α-)置信水平下的置信区间可以写为( )。

A

、2x t α

±

B

、2x t α± C

、2x z α± D

、2x z α±

21、正态总体方差未知时,在小样本条件下总体均值在(1α-)置信水平下的置信区间可以写为( )。

A

、2x t α

±

B

、2x t α± C

、2x z α± D

、2x z α±

22、指出下面的说法哪一个是正确的( )。

A 、样本量越大,样本均值的抽样标准差就越小

B 、样本量越大,样本均值的抽样标准差就越大

C 、样本量越小,样本均值的抽样标准差就越小

D 、样本均值的抽样标准差与样本量无关

23、抽取一个样本量为100的随机样本,其均值为81x =,标准差12s =。总体均值μ的

95%的置信区间为( )。

A 、81 1.97±

B 、81 2.35±

C 、81 3.10±

D 、81 3.52±

24、如果估计误差5,40E σ==,要估计总体均值μ的95%的置信区间所需的样本量为( )。

A 、146

B 、246

C 、346

D 、446

25、某大型企业要提出一项改革措施,为估计职工中赞成该项改革的人数的比例,要求估计误差不超过0.03,置信水平为90%,应抽取的样本量为( )。

A 、552

B 、652

C 、752

D 、852

26、根据某保险公司收集的36个投保人的资料,得到平均年龄为39.5,年龄标准差为7.77.据此资料,可用( )的概率确信该公司投保人的平均寿命在37.37到41.63之间.

A 、68%

B 、90%

C 、95%

D 、99%

27、根据城市电信网的100次通话,已知通话平均时间为4分钟,标准差为2分钟,则在概率保证为95%的情况下,通话平均持续时间的允许误差为( ).

A 、0.2

B 、0.4

C 、0.28

D 、0.14

28、根据抽样调查的资料,某企业工人生产定额平均完成百分比为165%,抽样标准差为1%,在概率保证为95%的情况下,可以断定生产定额平均完成百分比( ).

A 、在164%至166%之间

B 、在160%至165%之间

C 、在163%至167%之间

D 、不大于163%和不小于167%

四、计算题

1、某大学为了解学生每天上网的时间,在全校7500名学生中随机抽取36人,调查他们每天上网的时间,得到这36人的平均上网时间为3.3小时,样本标准差为1.6小时。求该校大学生平均上网时间的置信区间,置信水平为90%(总体容量在5000以上一般认为总体N 趋向于很大)。

2、某快餐店想要估计每位顾客的午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机的样本。假定总体标准差为15元,如果样本均值为120元,求总体均值在95%置信水平下的置信区间。

3、有一大批糖果,现从中随机地抽取16袋,称得其平均重量为503.75g,样本标准差为6.20g,设袋装糖果的重量近似地服从正态分布,试求总体均值 的置信水平为0.95的置信区间。

4、一项调查显示,每天每个家庭看电视的平均时间为7.25小时,假定该调查中包括了196个家庭,且调查得到样本标准差为平均每天2.5小时.求总体均值在95%置信水平下的置信区间。

5、某车间要估计一批零件的合格率.随机抽取了100个零件,其中,合格率为90%.试以95%的置信水平估计这批零件的合格率的置信区间。

6、某电子元件的寿命的标准差大约为2000小时,假定想要以95%的置信水平估计其寿命的置信区间,希望边际误差为400小时,应抽取多大的样本容量?

7、根据以往的生产数据,某种产品的废品率为2%,如果要求在95%的置信水平下的置信区间,若要求边际误差不超过4%,应抽取多大的样本?

一、判断题

1、假设检验的目的就是希望有充分的依据去推翻原假设。 ( )

2、假设检验的目的是判断原假设和备择假设哪一个更准确。 ( )

3、假设检验的实质就是保护原假设,不轻易否定原假设。 ( )

4、备择假设是希望能够成立的假设。 ( )

5、所谓的小概率事件是相对的,与事先规定的显著性水平有直接的关系。 ( )

6、如果检验统计值的绝对值小于临界值的绝对值,就接受原假设。 ( )

7、如果我们不能拒绝原假设,也不能说明原假设一定正确。 ( )

8、如果在双侧检验中原假设成立,那么在单侧检验中原假设也一定成立。 ( )

9、假设检验的第一类错误是“以假为真”的错误,而第二类错误是“以真为假”的错误。( )

10、假设值与实际值之间的差距越大,犯第二类错误的概率也越大。 ( )

11、原假设与备选假设一定是对应的关系。 ( )

12、假设检验中犯一类错误的后果比犯第二类错误的后果更为严重。 ( )

13、显著性水平越小,犯检验错误的可能性越小。 ( )

14、假设检验一般是针对错误的抽样推断做的。 ( )

15、对总体比例的检验一般采用Z 检验法为好。 ( )

二、选择题

1、某种产品的使用者要求厂商提供的产品平均使用寿命不得低于1000小时,否则拒收.

(1)使用者在决定是否接受某批产品而进行抽样检验时,应建立的原假设为( )。

A 、1000:0≥μH

B 、1000:0=μH

C 、1000:0≤μH

D 、1000:0<μH

(2)在检验中标准正态分布区域被分为接受和拒绝原假设的两个区域,本检验问题的拒绝区域处于接受域的( )。

A 、左侧

B 、右侧

C 、两侧

D 、内侧

(3)在本检验问题中2,如果规定显著性水平为0.05,那么作为判断标准的临界值是( )。

A 、1.96

B 、1.64

C 、-1.64

D 、±1.64

(4)如果某批次产品的实际平均使用寿命为1115小时,但检验统计值为1.5,则( )。

A 、接受了正确的原假设

B 、拒绝了正确的原假设

C 、犯了纳伪的错误

D 、犯了弃真的错误

(5)如果使用者偏重于担心出现纳伪错误二造成的损失,则应把显著性水平定得( )。

A 、大一些

B 、小一些

C 、大小无所谓

D 、无法决定

2、假设检验中的第一类错误也叫( ).

A 、弃真错误

B 、取伪错误

C 、假设错误

D 、判断错误

3、某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为( )。

A 、01:0.2,:0.2H H ππ≤>

B 、01:0.2,:0.2H H ππ=≠

C 、01:0.2,:0.2H H ππ≥<

D 、01:0.2,:0.2H H ππ<≥

4、一项新的减肥计划声称:在计划实施的第一个月,参加者的体重平均至少减少8公斤。随机抽取40为参加该项计划的样本,结果显示:样本的平均体重平均减少7公斤,标准差为3.2公斤,该检验的原假设和备则假设是( )。

0101C 、01:7,:7H H ππ≤> D 、01:7,:7H H ππ≥<

5、在假设检验中,原假设所表达的含义是( )。

A 、参数发生了变化

B 、参数没有发生变化

C 、变量之间没有关系

D 、参数是正确的

6、在假设检验中,备择假设所表达的含义是( )。

A 、参数发生了变化

B 、参数没有发生变化

C 、变量之间没有关系

D 、参数是正确的

7、在假设检验中,不拒绝原假设意味着( )。

A 、原假设肯定是正确的

B 、原假设肯定是错误的

C 、没有证据证明原假设是正确的

D 、没有证据证明原假设是错误的

8、在假设检验中,原假设和备择假设( )。

A 、都有可能成立

B 、都有可能不成立

C 、只有一个成立而且只有一个成立

D 、原假设一定成立,备择假设不一定成立

9、在假设检验中,第一类错误是指( )。

A 、当原假设正确时拒绝原假设

B 、当原假设错误时拒绝原假设

C 、当备择假设正确时没有拒绝原假设

D 、当备择假设不正确时没有拒绝备择假设

10、在假设检验中,第二类错误是指( )。

A 、当原假设正确时拒绝原假设

B 、当原假设错误时没有拒绝原假设

C 、当备择假设正确时没有拒绝备择假设

D 、当备择假设不正确时拒绝备择假设

11、当备择假设为10H μμ<:,此时的假设检验称为( )。

A 、双侧检验

B 、右侧检验

C 、左侧检验

D 、显著性检验

12、指出下列假设检验哪一个属于右侧检验()。

A 、0010:,:H H μμμμ=≠

B 、0010:,:H H μμμμ≥<

C 、0010:,:H H μμμμ≤>

D 、0010:,:H H μμμμ>≤

13、指出下列假设检验哪一个属于左侧检验( )。

A 、0010:,:H H μμμμ=≠

B 、0010:,:H H μμμμ≥<

C 、0010:,:H H μμμμ≤>

D 、0010:,:H H μμμμ>≤

14、指出下列假设检验形式的写法哪一个是错误的( )。

A 、0010:,:H H μμμμ=≠

B 、0010:,:H H μμμμ≥<

C 、0010:,:H H μμμμ≤>

D 、0010:,:H H μμμμ>≤

15、一种零件的标准长度为5厘米,要检验某天生产的零件是否符合标准要求,建立的原假设和备择假设应为( )。

A 、01:5,:5H H μμ=≠

B 、01:5,:=5H H μμ≠

010116、一所大学的教务管理人员认为,大学生吸烟的比例超过30%。为检验这一说法是否属实,一家研究机构在该地区所有大学生中抽取一个随机样本进行检验,建立的原假设和备择假设应为( )。

A 、01:30%,:30%H H μμ=≠

B 、01:30%,:30%H H ππ=≠

C 、01:30%,:30%H H ππ≥<

D 、01:30%,:30%H H ππ≤>

17、某企业每月发生事故的平均次数为5次,企业准备制定一项新的安全生产计划,希望新计划能减少事故次数。用来检验这一计划有效性的原假设和备择假设应为( )。

A 、01:5,:5H H μμ=≠

B 、01:5,:=5H H μμ≠

C 、01:5,:5H H μμ≤>

D 、01:5,:5H H μμ≥<

18、随机抽取一个100n =的样本,计算得到60x =、15s =,要检验假设

01:65,:65H H μμ=≠,检验的统计量值为( )

。 A 、-3.33 B 、3.33 C 、-2.36 D 、2.36

三、计算题

1、一项调查显示,每天每个家庭看电视平均时间为7.25小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.7小时,取显著性水平a =0.05,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”?

2、某厂生产某种元件,规定厚度为5mm .已知元件的厚度服从正态分布。现从某批产品中随机抽取50件,测得平均厚度为4.91mm ,标准差为0.2mm ,问在0.05的显著性水平下,该批元件的厚度是否符合规定的要求?

3、已知某品牌保健品中某维生素含量服从正态分布N (5.2,0.112

)。某天从生产的产品种随机抽取了10瓶,某维生素的平均含量为5.02,问在0.05的显著性水平下,该天生产的保健品的某维生素含量是否处于产品质量控制状态?

4、某体育学院男生100m跑的平均成绩为12秒,标准差为0.3秒。在采用一种新的教学训练方法三个月后,随机抽查25名男生进行测试,结果100m跑的平均成绩为11.89秒,问在0.05的显著性水平下,是否可以认为新的教学训练方法已使男生100m跑的成绩明显加快了?

5、某电视台某栏目是针对平均年龄65岁老年人的,该电视台想了解该栏目是否为目标观众所喜爱,随机抽取收看该栏目的25名观众进行调查,其平均年龄为68岁,样本标准差为3岁。试在显著性水平0.05的条件下检验该栏目的内容是否具有针对性?

6、某汽车轮胎厂生产的轮胎合格标准为平均行驶里程至少2万公里,现从该厂生产的一批汽车轮胎中随机抽取10个,测得行驶里程(万公里)为:2.12、2.15、1.98、2.10、1.99、2.08、2.22、1.9

7、2.31、2.28。试在显著性水平0.01条件下检验该厂汽车轮胎平均行驶里程与至少2万公里标准是否相符合。

7、某研究机构猜测,至少80%的行人在过马路时曾有闯红灯、不走斑马线等违章行为。为了证实这一说法,随机询问了200名行人,结果有146人如实承认有过交通违章行为。问在0.05显著性水平下,该研究机构的猜测是否成立?

8、某鞋厂与外商签订的合同规定,皮鞋的优质率不得低于95%.现从某批20000双皮鞋中随机抽查45双,发现有3双没有达到优质标准,问在0.05的显著性水平下,外商是否应该接受该批皮鞋?

统计学基础课后思考题答案(仅供参考)前六章

第一章概论 1、“统计”一词有统计工作、统计资料、统计学三种涵义。统计资料是统计工作的成果,统计工作和统计资料是过程与成果的关系。 2、统计学的研究对象是客观现象(包括社会现象和自然现象)总体的数量方面。它具有数量性、总体性、变异性、具体性、社会性的特点。 3、统计学的性质是属于方法论学科,统计学是一门研究客观现象总体数量方面的独立的方法论科学。 4、统计学的基本研究方法:大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法。 5、统计学的基本职能有:信息职能、咨询职能、监督职能。 6、统计的基本任务:一方面是以国民经济和社会发展为统计调查的对象,在对其数量方面进行科学的统计分析的基础上,为党和国家制定政策、各部门编制计划,指导经济和社会发展及进行科学管理提供信息和咨询服务;另一方面则是对国民经济和社会的运行状态、国家政策,计划的执行情况等进行统计监督。 7、统计工作的过程包括:统计设计、统计调查、统计整理和统计分析。 8、统计总体是指客观存在的,在同一性质的基础上结合起来的许多个别事物构成的整体,简称总体。总体单位是指构成总体的个别事物,简称个体。总体和总体单位是整体与部分、集合与元素的关系,它们互为存在条件。总体是界定总体单位的前提条件,总体单位是构成总体的基本元素。 9、标志按性质不同可分为品质标志和数量标志,按变异情况可分为不变标志和可变标志。 10、统计指标的特点:数量性、综合性、具体性。统计指标按其说明总体特征的性质不同,可分为数量指标和质量指标;按表现形式不同,可分为总量指标、相对指标,平均指标;按计量单位的不同,可分为实物量指标、价值指标和劳动量指标;按指标功能的不同,可分为描述指标、评价指标和预警指标。 11、(简)指标与标志的联系,具有对应关系、汇总关系、转换关系;指标与标志的区别,说明对象范围的不同,具体表现形式不同。(详)指标与标志有哪些区别及联系? 区别: ①指标和标志的概念明显不同,标志是说明个体特征的,一般不具有综合的特征:指标是说明总体特征的,具有综合的性质。 ②统计指标分为数量指标和质量指标,它们都是可以用数量来表示的;标志分为数量标志和品质标志,它们不是都可以用数量来表示,品质标志只能用文字表示。 联系: ③统计指标是建立在标志值的基础之上的,它是各个总体单位的数量标志值的汇总,没有总体单位的标志值 也就不可能有总体的指标值。 ④随研究目的不同,指标与标志之间可以互相转化。两者体现这样的关系,指标在标志的基础上形成,指标又是确定标志的依据。 12、变量的分类:按变量值是否连续,可分为连续型变量和离散型变量;按照其性质不同,可分为确定性变量和随机变量。13、统计指标体系分为基本统计指标体系和 专题统计指标体系两大类。 第二章统计调查 1、统计调查是根据统计研究的目的、要求和 任务,采用科学的调查方法,有计划、有组 织地搜集统计资料的工作过程。统计调查在 统计工作的整个过程中,担负着提供基础资 料的任务,所有的统计计算和统计研究都是 在原始资料搜集的基础上建立起来的。 2、统计调查的基本要求: (1)准确性。即统计调查得到的资料应 该是真实可靠的、符合客观实际,不受人的 主观偏见和错误意识的影响。 (2)及时性。即统计调查要按时完成资 料的搜集和上报任务,以及充分发挥统计资 料的时间价值。 (3)完整性。统计调查搜集的资料,一 是要调查单位的完整、做到调查单位不重复、 不遗漏,以保证反映被研究对象整体的面貌; 二是要做到搜集的项目齐全,调查项目不仅 具有层次性,而且是紧密链接、赋予逻辑联 系,齐全的调查项目才能实现调查研究的目 的和任务。 3、一份完整的统计调查方案,应包括: (1)确定调查目的; (2)确定调查对象、调查单位和报告单位; (3)拟定调查项目、制定调查表; (4)规定调查时间和调查期限、调查地点 和方法; (5)制定调查工作的组织实施计划。 4、调查表的内容有:表头、表体和表脚。 调查表分无记名调查反馈表和记名调查 反馈表。 5、统计调查的组织形式有统计报表、普查、 重点调查、典型调查和抽样调查。 6、重点调查与典型调查有何异同? 相同点: 都是非全面调查;调查单位少,可节省 人力、物力、时间;灵活性强;属于有部分 到全面的调查方式。 区别: (1)定义不同 重点调查是一门专门组织的非全面调 查,它是在调查对象的全部单位中只选择一 小部分重点单位进行调查,以了解总体的基 本情况。 典型调查是一种十分重要的,行之有效 的非全面调查方法。它是根据调查目的和要 求,在对被研究对象做全面分析的基础上, 有意识地从中选择少数具有代表性的典型单 位进行深入细致地调查研究,以便认识事物 的本质及其规律性的一种非全面调查。 (2)特点不同 重点调查的主要特点是:投入少、调查 速度快、所反映的主要情况或基本趋势比较 准确。 典型调查的主要特点是:调查单位少、 机动灵活、典型单位的选择带有一定的主观 性、典型单位可以注重于现象数量方面的分 析。 (3)组织形式不同 重点调查既可以是一次性调查性调查, 也可以用于经常性调查。其组织形式可以是 组织专门调查,也可以颁发统计报表,由选 中重点单位填报。 典型调查一般有两种方式:“解剖麻雀” 式和“化类选典”式。 (4)调查方式的优缺点不同 重点调查:优点:调查单位少,可调查 较多的项目和指标,了解较详细的效果,能 使党政领导尽快的掌握基本情况,发现问题, 采取措施,以指导工作。 缺点:因为重点调查单位与一般单位的 差别较大,通常不能用重点调查结果来推算 调查总体的指标 典型调查:优点:是补充全面调查资料 的缺口,利用典型调查资料,可以分析全面 调查不能认识清楚地一些具体问题,还可以 深入研究新生事物,找出事物变化发展的规 律,用来推断总体的指标数值。 缺点:主要是针对问题的普遍性研究, 不够深入 根本区别在于选取调查单位的方法不同。 典型调查单位的选择取决于调查者的主 观判断,因此具有主观性。重点调查单位的 选择取决于某一标志总量在总体所占比重, 因此具有客观性。 典型调查虽然在一定条件下,能根据典 型单位估计推断总体。但由于无法合理估计 其误差,因此不能根据典型单位的数量特征, 推断总体单位的数量特征。不过,可以利用 典型调查得到的具体、详细事例,补充分析 抽样调查无法获得具体、详细事例的不足。 7、统计调查的方法有:观察法、询问法、报 告法、网络调查法和问卷调查法。 观察法:优点是取得的资料比较准确; 缺点是花费的人力、物力、财力和时间都较 多,而且具有局限性。 询问法:优点是调查者能按统计口径逐 项询问,对统计项目有统一的理解,可保证 调查资料的准确性;缺点是花费大量的人力 和时间。 报告法:优点是准确性不亚于观察法; 缺点是花费较多的人力和物力。 网络调查法:优点是速度快、费用低、 易获得联系性数据、调研内容设置灵活、调 研群体大和可视性强;缺点是代表性问题、 安全性问题和无限制样本问题。 问卷调查法:优点是节省时间、经费和 人力;调查结果容易量化、便于统计处理与 分析;现在的电子问卷克服了纸质问卷的一 些缺点,方便实施与调整;可以进行大规模 的调查。 缺点是面向设计的问题问卷调查比较 难;调查结果广而不深;问卷调查经常采用 由用户自己填答问卷的方式,所以其调查结 果的质量常常得不到保证。;问卷调查的回 收率难以保证。 8、调查问卷的结构由卷首语(开场白)、正 文和结尾组成。 问卷的设计形式有开放式和封闭式。 第三章统计数据的整理与显示 1、统计数据整理的主要内容(步骤)是:(1) 统计资料整理方案的设计;(2)对调查资料 的审核;(3)对调查资料进行科学的分组、 汇总;(4)数据资料的显示——编制和绘制 统计表(图);(5)统计资料的保管与积累。 2、统计分组就是根据统计研究的目的和被研 究现象总体的内在特征,将统计整体按照一 定的标志划分为若干性质不同的部分或组的 一种统计方法。统计分组的关键在于确定分 组标志和组距。

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

应用统计学案例统计调查方案设计

应用统计学案例统计调查方案设计

统计调查方案设计案例 ▲统计调查方案的内容和撰写: 一、统计调查方案的主要内容 1、确定统计调查目的和任务 2、确定调查对象和调查单位 调查对象是指依据调查的任务和目的,确定本次调查的范围及需要调查的那些现象的总体。 调查单位是指所要调查的现象总体所组成的个体,也就是调查对象中所要调查的具体单位,即我们在调查中要进行调查研究的一个个具体的承担者。 3、确定调查内容和调查表 (1)调查课题如何转化为调查内容 调查课题转化为调查内容是把已经确定了的调查课题进行概念化和具体化。 (2)调查内容如何转化为调查表 如何把调查内容设计为调查表,这一问题会在下一章中专门介绍。 4、调查方式和调查方法 5、调查项目定价与预算 6、统计数据分析方案 7、其它内容

包括确定调查时间,安排调查进度,确定提交报告的方式,调查人员的选择、培训和组织等。 二、统计调查方案的撰写 1、统计调查方案的格式 包括摘要、前言、统计调查的目的和意义、统计调查的内容和范围、调查采用方式和方法、调查进度安排和有关经费开支预算、附件等部分。 2、撰写统计调查方案应注意的问题 (1)一份完整的统计调查方案,上述1—7部分的内容均应涉及,不能有遗漏。否则就是不完整的。 (2)统计调查方案的制订必须建立在对调查课题的背景的深刻认识上。 (3)统计调查方案要尽量做到科学性与经济性的结合。 (4)统计调查方案的格式方面能够灵活,不一定要采用固定格式。 (5)统计调查方案的书面报告是非常重要的一项工作。一般来说,统计调查方案的起草与撰写应由课题的负责人来完成。三、统计调查方案的可行性研究 (一)统计调查方案的可行性研究的方法 1、逻辑分析法 逻辑分析法是指从逻辑的层面对统计调查方案进行把关,考察其是否符合逻辑和情理。

统计学思考题答案

4.1一组数据的分布特征可以从哪几个方面进行测度? 数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2. 4.5简述众数、中位数和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。 平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。 4.7标准分数有哪些用途? 标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。 7.3怎样理解置信区间? 置信区间:由样本统计量所构造的总体参数的估计区间 7.4解释95%的置信区间。 95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。 7.5 Za/2的含义是什么 含义:Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。 7.6 解释独立样本和匹配样本的含义。 独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。 匹配样本:一个样本中的数据与另一个样本中的数据相对应。 7.8简述样本量与置信水平、总体方差、边际误差的关系。 样本量越大置信水平越高,总体方差和边际误差越小 10.1什么是方差分析?它研究的是什么? 答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。 10.4方差分析中有哪些基本假定? 答:方差分析中有三个基本假定: (1)每个总体都应服从正态分布 (2)各个总体的方差σ2必须相同 (3)观测值是独立的

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

多元统计分析案例分析.docx

精品资料 一、对我国30个省市自治区农村居民生活水平作聚类分析 1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中

2、将数据进行标准化变换:

3、用K-均值聚类法对样本进行分类如下:

分四类的情况下,最终分类结果如下: 第一类:北京、上海、浙江。 第二类:天津、、辽宁、、福建、甘肃、江苏、广东。 第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。 第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。 二、判别分析 针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:

**. 错误分类的案例 从上可知,只有一个地区判别组和原组不同,回代率为96%。 下面对新疆进行判别: 已知判别函数系数和组质心处函数如下: 判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7 Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7 Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671 Y2=-0.62213 Y3=-0.84188 计算Y值与不同类别均值之间的距离分别为:D1=138.5182756 D2=12.11433124 D3=7.027544292 D4=2.869979346 经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。 三,因子分析: 分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。经spss软件分析结果如下:

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40个企业按产品销售收入分组表 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

贾俊平 统计学(第六版)思考题答案

第一章: 1、什么是统计学 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

相关文档
相关文档 最新文档