文档库 最新最全的文档下载
当前位置:文档库 › 上财浙院统计学第七章课后习题

上财浙院统计学第七章课后习题

上财浙院统计学第七章课后习题
上财浙院统计学第七章课后习题

P163 课后题

五、计算题(注:全部修改如下)

1.某地区粮食播种面积共5000亩,按不重复抽样方法随机抽取了100亩进行实测。调查结果,平均亩产为450公斤,亩产量的标准差为52公斤。试以95%的置信度估计该地区粮食平均亩产量的区间。

2.电话咨询服务部门在每次通话结束时都要记下通话的时间。从一个由16个记录组成的

简单随机样本得出一次通话的平均时间为1.6分钟。试求总体平均值的置信度为90%的置信区间。已知总体服从标准差为0.7分钟的正态分布。

3.为了解某村1 200户农民的年收入状况,抽取一个由80户组成的简单随机样本,得出每户农民年平均收入为3 210元,标准差为205元。试求该村每户农民年平均收入置信度为95%的置信区间。

4.为了在正常条件下研究一种杂交作物的两种新处理方案,在同一地区随机地抽选八块地,在每块试验地上按两种方案种植作物。这八块地的单位面积产量分别是:

一号方案产量86 87 86 93 84 93 85 79

二号方案产量80 79 68 84 77 82 74 66

假设这两种方案的产量都服从正态分布,且方差相等。试求这两种方案平均产量之差的置信度为95%的置信区间。

5.某地对上年栽种一批树苗共3000株进行了抽样调查,随机抽查的200株树苗中有170株成活。试以95.45%的概率估计该批树苗的成活率的置信区间和成活总数的置信区间。

6.为调查某市郊区72 000户农民家庭中拥有彩电的成数,随机抽取了其中的400户,结果有92户有彩电,试求总体成数的置信度为95%的置信区间。

7.一个随机样本由居民区甲400户家庭组成,其中有18%的家庭至少有一个学龄前儿童。另一个由居民区乙600户家庭组成的随机样本中,有23%的家庭至少有一个学龄前儿童。试求两个总体成数之差置信度为95%的置信区间。

8.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:

(1)试以0.95的置信度估计该公司工人的月平均工资所在范围;

(2)试以0.9545的置信度估计月收入在1000元及以上工人所占比重。

9.对一批产品按不重复抽样方法抽选200件,其中废品8件。又知道抽样总体是成品总量的1/20,当概率为95.45%时,可否认为这一批成品的废品率低于5%。

10.某企业从长期实践得知,其产品直径X是一随机变量,服从方差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。在0.95的置信度下,试求该产品直径的均值的置信区间。

11. 某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质品率为85%,试计算当把握程度为95%时优质品率的区间范围。

12.在某大学中随机抽取16名教师,了解到他们的月平均收入为2000元,标准差为800元,试以95%的置信度,估计该大学教师的月平均收入及其标准差的置信区间。

13.某企业有3 000名职工,该企业想估计职工们上下班花在路途上的平均时间。以置信度为99%的置信区间进行估计,并使估计值处在真正平均值附近1分钟的误差范围之内。一个先前抽取的小样本给出的标准差为4.3分钟。试问应抽取多大的样本?

14.一个市场分析人员想知道:为了确定某忧区内看过某种报纸广告的家庭占多大成数,需要从该区抽选多少家庭作样本。这个居民区共有1 000户,分析人员希望以95%的置信度对这个成数做出估计,并使估计值处在真正成数附近0.05范围之内。在一个先前抽取的样本中,有25%的家庭看过这种广告。试问应取多大的样本?

15.检验某食品厂本月生产的10 000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品。

16. 某企业对一批产品进行质量检验,这批产品的总数为5 000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品。

试以95.45%(t=2)的概率,估计以下指标的范围:

(1)该储蓄所存款户平均每户的存款余额;

(2)该所储蓄存款余额在30 000元以上的户数占全部存款户数的比重。

18.某市人口普查显示,该市老年人口老龄化(65岁以上)比率为14.7%。随机调查了400名当地市民,发现有57人年龄在65岁以上。那么调查结果是否支持该市老龄化率为14.7%的看法?(α=0.05)

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

旗开得胜 1 第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u , n x σμ0 -,标准正态; ),( ),(2/2/+∞- -∞n z n z σσααY 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差

旗开得胜 2 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。( ×) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。( √) 3

《统计学》-第7章-习题答案

第七章思考与练习参考答案 1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。 2.答:相关和回归都是研究现象及变量之间相互关系的方法。相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。 3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数 ,样本相关系数 。复相关系数是多元线性回归分 析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。 4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。根据样本数据拟合的方程,就是样本回归函数,以一元线 性回归模型的样本回归函数为例可表示为:t t X Y 10???ββ+=。总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。第二,总体回归函数中 的0β和1β是未知的参数,表现为常数;而样本回归直线中的0 ?β和1?β是随机变量,其具体数值随所抽取的样本观测值不同而变动。 5.最小二乘法是在根据样本数据估计样本回归方程时,采用残差平方和作为衡量总偏 差的尺度,找到使得残差平方和最小的回归系数0 ?β和1?β的取值的估计方法。根据微积分中

统计学(第三版课后习题答案

Hah 和网速是无形的 1:各章练习题答案 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: 40个企业按产品销售收入分组表 按销售收入分组(万元)企业数 (个) 频率 (%) 向上累积向下累积 企业数频率企业数频率 100以下100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 ————(2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0

2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%) 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 (3)茎叶图如下: 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

贾俊平第四版统计学-第七章参数估计练习答案

第七章参数估计练习答案 二.填空题 1. 2b a + , 025.0224)(z n a b **- 。 2b a + , )14(415)(025.022t a b *?-。 2b a + , 025.022430 )(z a b **-。 变小 2. 27.3896.15*15025.0==* =z n E σ 3. 338, 理由:当E=30,n=150时,可得,150*30**2/==n E z σα当E 变为20时,总体标准 差不变,置信水平不变,因此σα*2/z 不变。由3385.337400150*900)*(22 2/≈===E z n σα 4.不能。对于分布形态未知或严重偏斜的总体,不能根据正态分布来构造总体均值的置信区间,除非样本量非常大。但本例中的样本是个小样本。 5.(1)正确。(2)、(3)不正确。因为总体比例和所求区间都是确定的,不存在随机性,不涉及概率。(4)正确,这是对置信区间的正确理解。 6.(1)45个 (2)这些置信区间的中心不完全相同,因为置信区间是以样本估计值为中心的,不同的抽样会有不同的样本均值。 (3)不完全相等。因为总体的标准差未知,边际误差根据样本标准差来计算的,而各个样本的标准差有可能不等。 三.计算题 1.解:(1)由已知可得办理该业务的时间服从正态分布,总体的标准差未知,n=16<30 是小样本。1.4,12==s x ,1-α=95%,1314.2)15(025.0=t , )18.14,82.9(18.212161 .4*1314.21215(025.0=±=±=±n s t x ) 此银行办理该业务的平均时间的置信水平为95%的区间估计是9.82分钟到14.18分钟。 (2)由已知可得办理该业务的时间服从正态分布,总体的标准差未知,n=40>30 是大样本。1.4,12==s x ,1-α=95%,z 0.025=1.96

统计学课后习题和答案

第一章 1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出 如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A. 9252157g B. 9282157g C.528292g D. 655292g E. 9252 82 g 1*. Answer :B Analysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为: 92829282 (,)()()157157157157 P Earned Employed Total P Earned P Employed Total == = g g g g g g 2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组 的试验结果。 如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱 绿色的人数的期望值? A. (99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35) 314 2*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为: 1089999108 (3050,)(3050)()314314314314 P green Total P P green Total -=-= = g g g g g g 第二章 1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。下面哪个图代表了有最大标准差的数据集?

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 (1)已知σ=5,n=40,x =25,α=, z 2 05.0= 样本均值的抽样标准差 σ x =n σ= 79.0405 = (2)估计误差(也称为边际误差)E=z 2 α n σ =*= (1)已知σ=15,n=49,x =120,α=, z 2 05.0= (2)样本均值的抽样标准差 σ x =n σ= =4915 估计误差E= z 2 α n σ=* =4915 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±*=±,即(,) (1)已知σ=85414,n=100,x =104560,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =100 85414±.144即(,) (1)已知n=100,x =81,s=12, α=, z 1.0= 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (2)已知α=, z 2 05.0= 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (3)已知α=, z 2 01.0= 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n s x z 2 α±=±* =100 12±,即(,) (1)已知σ=,n=60,x =25,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =60 .53±,即(,) (2)已知n=75,x =,s=, α=, z 02.0= 由于n=75为大样本,所以总体均值μ的98%的置信区间为: n s x z 2 α±=± =75 9.823±,即(,) (3)已知x =,s=,n=32,α=, z 2 1.0= 由于n=32为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=± =32 74.90±,即(,) (1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=,z 2 05.0= 由于总体服从正态分布,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =15 500±,即(,) (2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=, z 2 05.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =35 500±,即(,) (3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 1.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =35 500±,即(,) (4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 2 01.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间

统计学课后第一章习题答案.doc

第1章导论 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25000颗成年松树,该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究的总体是() A、250颗成年松树 B、公园中25000颗成年松树 C、所有高于60英尺的成年松树 D、森林公园中所有年龄的松树 2、某森林公园的一项研究试图确定成年松树的高度。该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是() A、森林公园中松树的年龄 B、森林公园中松树的数量 C、森林公园中松树的高度 D、森林公园中数目的种类 3、推断统计的主要功能是() A、应用总体的信息描述样本 B、描述样本中包含的信息 C、描述总体中包含的信息 D、应用样本信息描述总体 4、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育。这一叙述是()的结果 A、定性变量 B、试验 C、描述统计 D、推断统计 5、一名统计学专业的学生为了完成其统计学作业,在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中,他应该将此数据报告来源于() A、试验 B、实际观察 C、随机抽样 D、已发表的资料

6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据的收集方式可以认为是() A、观察研究 B、设计的试验 C、随机抽样 D、全面调查 7、下列不属于描述统计问题的是() A、根据样本信息对总体进行的推断 B、感兴趣的总体或样本 C、图、表或其他数据汇总工具 D、了解数据分布特征 8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是() A、该大学的所有学生 B、所有的大学生 C、该大学所有的一年级新生 D、样本中的200名新生 9、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的变量是()A、该大学一年级新生的教科书费用 B、该大学的学生数 C、该大学新生的年龄 D、大学生的生活成本 10、在下列叙述中,关于推断统计的描述是() A、一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌; B、.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计

上财出版社统计学第七章课后作业

第七章课后习题 (一)思考题 略 (二)填空题 1. 参数估计有两种形式:一是_ ,二是_ 。 2. 判别点估计优良性的三个准则是:、和。 3.抽样的允许误差是指与的最大绝对误差范围。 4.对于简单随机重复抽样,若其他条件不变,则当允许误差Δ缩小一半,抽样单位数必须为原来的倍。若Δ扩大一倍,则抽样单位数为原来的。 5.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是,允许误差是,抽样平均误差是。 6.在同样的精度要求下,不放回抽样比放回抽样需要的样本容量。 7.置信区间表达了区间估计的精确性,置信概率表达了区间估计的可靠性它是区间估计的可靠概率;而表达了区间估计的不可靠的概率。 8.影响必要样本容量的因素有总体方差、和可靠程度等。 参考答案: 1.点估计;区间估计 2.一致性;无偏性;有效性 3.样本估计值;总体参数4.4;1/4 5. 1000;40;20.41 6. 少 7. 显著性水平 8. 允许误差 (三)判断题 1.抽样误差是抽样调查中无法避免的误差。() 2. 抽样误差的产生是由于破坏了随机原则所造成的。() 3. 在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。() 4. 抽样允许误差就是抽样平均数的标准差。()

参考答案: 1.(√) 2. (×) 3. (√ ) 4.(√) (四)单项选择题 1. 在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量 A.增加9倍 B.增加8倍 C.为原来的2.25倍 D.增加2.25倍 2. 比例和比例方差的关系是() A.比例越接近于0,比例方差越大 B.比例越接近于1,比例方差越大 C.比例越接近于0.5,比例方差越大 D.比例越接近于0.25,比例方差越大 3. 对400名大学生抽取19%进行不放回抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的允许误差为() A. 4% B. 4.13% C. 9.18% D. 8.26% 4. 区间估计表明的是一个 A.绝对可靠的范围 B.可能的范围 C.绝对不可靠的范围 D.不可能的范围 5 无偏性是指 A.抽样指标的平均数等于被估计的总体指标 B.当样本容量n充分大时,样本指标充分靠近总体指标 C.随着n的无限增大,样本指标与未知的总体指标之间的离差任意小的可能性趋于实际必然性 D.作为估计量的方差比其他估计量的方差小 6 样本统计量和总体参数 A.前者是一个确定值,后者是随机变量 B.前者是随机变量,后者是一个确定值

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核B.编制统计表 C.统计汇总问题D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性B.正确性 C.全面性D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组B.60在第二组,80在第五组 C.70在第四组,80在第五组D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列B.单项式分布数列 C.开口式数列D.异距式数列 5.组距式分布数列多适用于() A.随机变量B.确定型变量 C.连续型变量D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数B.下限以上的累计次数 C.各组分布的次数D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线B.J型分布曲线 C.右偏分布曲线D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉B.不等 C.重叠D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组B.逻辑检查 C.数据录入D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类B.组限 C.组距D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布B.χ型分布 C.U型分布D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列B.品质数列 C.单项数列D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有()

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学答案第七章

1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

(完整版)社会统计学复习题(有答案),DOC

o o 海量资源,欢迎共阅 社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标;某产品的废品率为结构相对指标;某地区福利机构网点密度为强度相 对指标。2最小 值。345、正J 6于 重点7;总 8计划超额完成程度为;若某 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程 度为。 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。

海量资源,欢迎共阅 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位 13 1 100%, ) 2 3 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√) 5、统计调查按调查范围划分可以分为全面调查和非全面调查。(√) 6、用移动平均法修匀时间数列时,如果移动项数为偶数项,只要进行一次移动平均;如果移动项数为奇数项,则要进行二次移动平均。(×;答案提示:用移动平均法修匀时间数列 时,如果移动项数为奇数项,只要进行一次移动平均;如果移动项数为偶数项,则要进行二

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 7.1 (1)已知σ=5,n=40,x =25,α=0.05, z 05.0=1.96 样本均值的抽样标准差 σ x =n σ= 79.040 5 = (2)估计误差(也称为边际误差)E= z 2 α n σ =1.96*0.79=1.55 7.2(1)已知σ=15,n=49,x =120,α=0.05, z 05.0=1.96 (2)样本均值的抽样标准差 σ x =n σ= =4915 2.14 估计误差E= z 2 α n σ=1.96* =4915 4.2 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α ± =120±1.96*2.14=120±4.2,即(115.8,124.2) 7.3(1)已知σ=85414,n=100,x =104560,α=0.05, z 05.0=1.96 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α ± =104560±1.96* =100 85414104560±16741.144即(87818.856,121301.144) 7.4(1)已知n=100,x =81,s=12, α=0.1, z 2 1.0=1.645 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=81±1.645* =100 1281±1.974,即(79.026,82.974) (2)已知α=0.05, z 2 05.0=1.96 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=81±1.96* =100 1281±2.352,即(78.648,83.352) (3)已知α=0.01, z 2 01.0=2.58 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

相关文档
相关文档 最新文档