第1章统计和统计数据
第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:
(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调
查,其中60%回答他们的月收入在5000元以上,50%的人回答他
们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?
(2)“月收入”是分类变量、顺序变量还是数值变量?
(3)“消费支付方式”是分类变量、顺序变量还是数值变量?
详细答案:
(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,
他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?
(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?
详细答案:
(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽
取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?
(2)样本量是多少?
详细答案:
(1)分层抽样。
(2)100。
第2章用图表展示数据
(4)饼图如下:
(2 )雷达图如下:
箱线图如下:
第3章用统计量描述数据
3.1 随机抽取25个网络用户,得到他们的年
龄数据如下(单位:周岁):
计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。详细答案:
网民年龄的描述统计量如下:
从集中度来看,网民平均年龄为24岁,中位数为23岁。从离散度来看,标准差在为6.65岁,极差达到26岁,说明离散程度较大。从分布的形状上看,年龄呈现右偏,而且偏斜程度较大。
3.2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:
(1)计算第二种排队时间的平均数和标准差。
(2)比两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
详细答案:
(1)(岁);(岁)。
(2);。第一中排队方式的离散程度大。
(3)选方法二,因为平均等待时间短,且离散程度小。
3.3 在某地区随机抽取120家企业,按利润额进行分组后结果如下:
计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。
详细答案:
=426.67(万元);(万元)。
3.4 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想?
详细答案:
通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.5 一种产品需要人工组装,现有3种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):
1.你准备用哪些统计量来评价组装方法的优劣?
2.如果让你选择一种方法,你会做出怎样的选择?试说明理由。详细答案:
评价。从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A 的离散系数最小,方法C最大;从分布的形状看,方法A和方法B的偏斜程度都不大,方法C则较大。
(2)综合来看,应该选择方法A,因为平均水平较高且离散程度较小。
第4章概率分布
4.1 消费者协会经过调查发现,某品牌空调器有重要缺陷的产品数出现的概率分布如下:
根据这些数值,分别计算:
(1)有2到5个(包括2个与5个在内)空调器出现重要缺陷的概率。
(2)只有不到2个空调器出现重要缺陷的概率。
(3)有超过5个空调器出现重要缺陷的概率。
详细答案:
(1)0.724。(2)0.171。(3)0.105。
4.2 设是参数为和的二项随机变量。求以下概率:
(1);(2)。
详细答案:
(1)0.375。(2)0.6875。
4.3 求标准正态分布的概率:
(1);(2);(3)。
详细答案:
(1)0.3849。(2)0.1844。(3)0.0918。
4.4 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据如下(单位:公升)
绘制正态概率图,判断该种汽车的耗油量是否近似服从正态分布?
详细答案:
正态概率图如下:
由正态概率图可以看出,汽车耗油量基本服从正态分布。
4.5 从均值为200、标准差为50的总体中,抽取的简单随机样本,
用样本均值估计总体均值。
(1)的期望值是多少?
(2)的标准差是多少?
(3)的概率分布是什么?
详细答案:
(1)200。(2)5。(3)近似正态分布。
4.6 从的总体中,抽取一个容量为500的简单随机样本。
(1)的期望值是多少?
(2)的标准差是多少?
(3)的分布是什么?
详细答案:
(1)0.4。(2)0.0219 。(3)近似正态分布。
4.7 假设一个总体共有8个数值,54,55,59,63,64,68,69,70。从该总体中按重复抽样方式抽取的随机样本。
(1)计算出总体的均值和方差。
(2)一共有多少个可能的样本?
(3)抽出所有可能的样本,并计算出每个样本的均值。
(4)画出样本均值的正态概率图,判断样本均值是否服从正态分布?
(5)计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得到的结论是什么?
详细答案:
(1),。
(2)共有64个样本。
(3)所有样本的样本均值如下:
(4)样本均值的正态概率图如下:
从正态概率图可以看出,样本均值近似服从正态分布。
(5),。样本均值的
平均数等于总体平均数,样本均值的标准差等于总体标准差的。
第5章参数估计
5.1 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的
时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的标准误差。
(2)在95%的置信水平下,求估计误差。
(3)如果样本均值为120元,求总体均值的95%的置信区间。
详细答案:
(1)。
(2)E=4.2。
(3)(115.8,124.2)。
5.2 利用下面的信息,构建总体均值的置信区间。
(1)总体服从正态分布,且已知,,,置信水平为95%。
(2)总体不服从正态分布,且已知,,,置信水平为95%。
(3)总体不服从正态分布,未知,,,,置信水平为90%。
(4)总体不服从正态分布,未知,,,,置信水平为99%。详细答案:
(1)(8647,9153)。
(2)(8734,9066)。
差和