文档库 最新最全的文档下载
当前位置:文档库 › 厦门大学《应用多元统计分析》习题第02章 多元正态分布的参数估计

厦门大学《应用多元统计分析》习题第02章 多元正态分布的参数估计

厦门大学《应用多元统计分析》习题第02章 多元正态分布的参数估计
厦门大学《应用多元统计分析》习题第02章 多元正态分布的参数估计

思考与练习

2.1 试述多元联合分布和边缘分布之间的关系。

2.2 设随机向量12(,)X X ′=X 服从二元正态分布,写出其联合分布密度函数和1X 、2X 各自的边缘密度函数。

2.3 已知随机向量12(,)X X ′=X 的联合分布密度函数为:

()()()()()()()()()

121122

2

22,d c x a b a x c x a x c f x x b a d c ??+?????2????

=

??

其中,。求:

12,a x b c x d ≤≤≤≤⑴ 随机变量1X 和2X 各自的边缘密度函数、均值与方差。 ⑵ 随机变量1X 和2X 的协方差和相关系数。 ⑶ 判断1X 和2X 是否相互独立。

2.4 设随机向量12(,,,)p X X X ′=X L 服从正态分布,已知其协差阵为对角阵,证明ΣX 的分量是相互独立的随机变量。

2.5 从某企业全部职工中随机抽取一个容量为6的样本,该样本中各职工的目前工资、受教育年限、初始工资和工作经验资料如下表所示: 职工编号

目前工资 (美元)

受教育年限(年)

初始工资 (美元)

工作经验(月)

1

1 2 3 4 5 6 57,000 40,200 21,450 21,900 45,000 28,350 15 16 12 8 15 8 27,000 18,750 12,000 13,200 21,000 12,000 144 36 381 190 138 26

设职工总体的以上变量服从多元正态分布,根据样本资料求出均值向量和协差阵的最大似然估计。

2.6 均值向量和协差阵的最大似然估计量具有哪些优良性质? 2.7 试证多元正态总体的样本均值向量(,)p N μΣ1

~(,

p N n

X μΣ)。 2.8 试证多元正态总体的样本协差阵S 为(,)p N μΣΣ的无偏估计。 2.9 设()1x 、()2x 、…、()n x 是从多元正态总体中独立抽取的一个随机样本,试求样本协差阵的分布。

(,)p N μΣS 2.10 设()i i X n p ×是来自(),p i i N μΣ的数据阵,1,,i k =L , ⑴ 已知1k ===μμμL 且1k ===ΣΣL Σ,求μ和的估计。 Σ⑵ 已知1k ===ΣΣL Σ,求1,,k μμL 和Σ的估计。

2

第二章 多元正态分布及参数的估计汇总

第二章多元正态分布及参数的估计 在多元统计分析中,多元正态分布占有相当重要的地位.这是因为许多实际问题涉及到的随机向量服从正态分布或近似服从正态分布;当样本量很大时,许多统计量的极限分布往往和正态分布有关;此外,对多元正态分布,理论与实践都比较成熟,已有一整套行之有效的统计推断方法.基于这些理由,我们在介绍多元统计分析的种种具体方法之前,首先介绍多元正态分布的定义、性质及多元正态分布中参 数的估计问题. 目录 §2.1 随机向量 §2.2 多元正态分布的定义与基本性质 §2.3 条件分布和独立性 §2.4 多元正态分布的参数估计 §2.1 随机向量 本课程所讨论的是多变量总体.把p个随机变量放在一起得X=(X1,X2,…,Xp)′为一个p维随机向量,如果同时对p维总体进行一次观测,得一个样品为p维数据.常把n个样品排成一个n×p矩阵,称为样本资料阵.

?? ? ? ?? ??'''= ?????? ??=)()2()1(2 1 2222111211n np n n p p X X X x x x x x x x x x X def =(X 1,X 2,…,X p ) 其中 X(i)( i =1,…,n)是来自p 维总体的一个样品. 在多元统计分析中涉及到的都是随机向量,或是多个随机向量放在一起组成的随机矩阵. 本节有关随机向量的一些概念(联合分布,边缘分布,条件分布,独立性;X 的均值向量,X 的协差阵和相关阵,X 与Y 的协差阵)要求大家自已复习. 三﹑ 均值向量和协方差阵的性质 (1) 设X ,Y 为随机向量,A ,B 为常数阵,则 E(AX )=A·E(X ), E(AXB )=A·E(X )·B D(AX)=A·D(X)·A' COV(AX,BY)=A·COV(X,Y)·B' (2) 若X,Y 相互独立,则COV(X,Y)=O;反之不成立. 若COV(X,Y)=O,我们称X 与Y 不相关.故有: 两随机向量若相互独立,则必不相关;

厦门大学《应用多元统计分析》习题第02章 多元正态分布的参数估计

思考与练习 2.1 试述多元联合分布和边缘分布之间的关系。 2.2 设随机向量12(,)X X ′=X 服从二元正态分布,写出其联合分布密度函数和1X 、2X 各自的边缘密度函数。 2.3 已知随机向量12(,)X X ′=X 的联合分布密度函数为: ()()()()()()()()() 121122 2 22,d c x a b a x c x a x c f x x b a d c ??+?????2???? = ?? 其中,。求: 12,a x b c x d ≤≤≤≤⑴ 随机变量1X 和2X 各自的边缘密度函数、均值与方差。 ⑵ 随机变量1X 和2X 的协方差和相关系数。 ⑶ 判断1X 和2X 是否相互独立。 2.4 设随机向量12(,,,)p X X X ′=X L 服从正态分布,已知其协差阵为对角阵,证明ΣX 的分量是相互独立的随机变量。 2.5 从某企业全部职工中随机抽取一个容量为6的样本,该样本中各职工的目前工资、受教育年限、初始工资和工作经验资料如下表所示: 职工编号 目前工资 (美元) 受教育年限(年) 初始工资 (美元) 工作经验(月) 1

1 2 3 4 5 6 57,000 40,200 21,450 21,900 45,000 28,350 15 16 12 8 15 8 27,000 18,750 12,000 13,200 21,000 12,000 144 36 381 190 138 26 设职工总体的以上变量服从多元正态分布,根据样本资料求出均值向量和协差阵的最大似然估计。 2.6 均值向量和协差阵的最大似然估计量具有哪些优良性质? 2.7 试证多元正态总体的样本均值向量(,)p N μΣ1 ~(, p N n X μΣ)。 2.8 试证多元正态总体的样本协差阵S 为(,)p N μΣΣ的无偏估计。 2.9 设()1x 、()2x 、…、()n x 是从多元正态总体中独立抽取的一个随机样本,试求样本协差阵的分布。 (,)p N μΣS 2.10 设()i i X n p ×是来自(),p i i N μΣ的数据阵,1,,i k =L , ⑴ 已知1k ===μμμL 且1k ===ΣΣL Σ,求μ和的估计。 Σ⑵ 已知1k ===ΣΣL Σ,求1,,k μμL 和Σ的估计。 2

厦门大学统计学原理期末试题与答案完整版

厦门大学网络教育 2013-2014学年第一学期 《统计学原理》复习题 、单选题 1、统计调查方法体系中,作为“主体”的是( A ) A .经常性抽样调查 B.必要的统计报表 2、考虑全国的工业企业的情况时,以下标志中属于不变标志的有( A .产业分类 B.职工人数 C.劳动生产率 3、某地区抽取3个大型钢铁企业对钢铁行业的经营状况进行调查,这种调查是 4、下列这组数列15,17,17,18,22,24,50,62的中位数是(C )。 现象之间的相关程度越低,贝刑关系数越( 接近+1 B 接近-1 接近0 8、假定其他变量不改变,研究一个变量和另一个变量间的相关关系的是( 9、已知两个同类型企业职工平均工资的标准差分别为 8元,12元,则两个企业职 工平均工资的代表性是(A ) 10、( C 。是标志的承担者。 C.重点调查及估计推算 D.周期性普查 D.所有制 A .普查 B .典型调查 C.重点调查 D .抽样调查 A.17 B.18 C.20 5、标志变异指标中最容易受极端值影响的是( A.极差 B.平均差 &简单分组与复合分组的区别在于( 总体的复杂程度不同 选择分组标志的性质不同 A. C. D.22 C. B. D. 标准差 D.标准差系数 ) 组数多少不同 选择的分组标志的数量不同 7、 A.偏相关 B.正相关 C.完全相关 D.复相关 A.甲大于乙 B.乙大于甲 C. 一样的 D.无法判断

11、 下列各项中属于数量标志的是(A ) A.年龄 B.学历 C.民族 D.性别 12、 某商品价格上涨了 5%,销售额增加了 10%,则销售量增加了( C ) A. 15% B. 5.2 % C. 4.8 % D. 2 % 13、某变量数列末组为开口组,下限是 500;又知其邻组的组中值是 480,则该组 的组 中值应为(D )0 B.时间和指标数值 C.时间和次数 20、现象总体中最普遍出现的标志值是( A ) A.变量 B.总体 C.总体单位 D.指标 A. 490 B. 500 C. 510 D. 520 14、根据最小二乘法原理所配合的一元线性回归方程,是使( B )0 无 (Y -Y?)2 为最小 送(Y -Y?) = 0 A S (Y -Y ) = 0 C 送(Y -Y )为最小 15、 以下不是统计量特点的是( A.不确定 B.已知 16、 不属于专门调查的有(A A.统计年报 B.抽样调查 C.未知 C 普查 17、 今有N 辆汽车在同一距离的公路上行驶的速度资料, Z xf B. ----- Z f C 旦 C 7 x D.不唯一 D.典型调查 m 表示路程,x 表示速度, ) D. 18、 抽样推断的特点有(B )0 A.事先人为确定好样本 C.缺乏一定的科学性和可靠性 19、 时间数列的构成要素是( B.按随机原则抽取样本 D.事先无法计算和控制抽样误差 A.变量和次数 D.主词和宾词 A.众数 B.中位数 C.平均数 D.频数 21、定基发展速度等于相应的各环比发展速度(C A.之和 B.之差 C.之积 D.之商 22、平均指标不包括(A ) 0 A.标准差 B.调和平均数

统计学习题及答案

单选 问题:下列不属于相关关系的现象是( 3 )。 选项一:企业的投资与产出 选项二:居民的收入与存款 选项三:电视机产量与西红柿产量 选项四:商品销售额与商品销售价格 问题:抽样调查中的抽样误差是指(3 ) 选项一:在调查过程中由于观察、测量等差错所引起的误差 选项二:在调查中违反随机原则出现的系统误差 选项三:随机抽样而产生的代表性误差 选项四:人为原因所造成的误差 问题:企业职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( 2 )。 选项一:10.0% 选项二:7.1% 选项三:7.0% 选项四:7.2% 问题:在假设检验中,原假设与备择假设( 3 ) 选项一:都有可能被接受 选项二:都有可能不被接受 选项三:只有一个被接受而且必有一个被接受 选项四:原假设一定被接受,备择假设不一定被接受 问题:小王收集了1978年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,用什么图形最为合适?(2 ) 选项一:直方图 选项二:散点图 选项三:饼图 选项四:折线图 问题:若回归直线方程中的回归系数为0,则直线相关系数( 3 )。 选项一:r=1

选项二:r=-1 选项三:r=0 选项四:r 无法确定 问题:若消费者价格指数为95%,则表示( 4 )。 选项一:所有商品的价格都上涨了 选项二:所有商品的价格都下跌了 选项三:商品价格有涨有落,总体来说是上涨了 选项四:商品价格有涨有落,总体来说是下跌了 问题:某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( 1 )。选项一:230 选项二:200 选项三:210 选项四:180 问题:若两变量的r=0.4,且知检验相关系数的临界值为,则下面说法正确的是( 3 )。 选项一:40%的点都密集分布在一条直线的周围 选项二:40%的点低度相关 选项三:两变量之间是正相关 选项四:两变量之间没有线性关系 问题:下列指标中包含有系统性误差的是(1 ) 选项一:SSA 选项二:SSE 选项三: 选项四: 问题:人口普查规定标准时间是为了( 1 )。 选项一:避免登记的重复与遗漏 选项二:将来资料具有可比性 选项三:确定调查单位 选项四:登记的方便 问题:SST的自由度是(4 )。 选项一:r-1

练习一多元正态分布的参数估计(精)

练习一 多元正态分布的参数估计 1.试叙述多元联合分布和边际分布之间的关系。 2.设二维随机向量12()X X '服从二元正态分布,写出其联合分布。 3.已知随机向量1 2()X X '的联合密度函数为 12121222 2[()()()()2()()] (,)()()d c x a b a x c x a x c f x x b a d c --+-----= -- 其中1a x b ≤≤,2c x d ≤≤。求 (1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。 4.设12(,,)p X X X X '= 服从正态分布,已知其协方差矩阵∑为对角阵,证明其分量是相互独立的随机变量。 5. 影响粮食产量的因素很多, 大致可分为三个层次:第一层次是宏观因素。主要有三种,一是制度创新, 如20世纪50年代初的土地改革、60年代初的“ 三自一包”和 80年代初的联产承包责任制和现行的粮食直补及税费改革等。二是政策导向, 如收购政策及价格、市场政策结构调整、储备政策、财政投人、政府抓粮食生产的力度等。三是科技进步,如良种的培育、播种技术的改进、机械化程度的提高等等, 特别是杂交水稻的发明, 是粮食生产的一次绿色革命, 大大地提高了粮食单位面积产量。第二层次是中观因素。主要有粮食播种面积、单位面积产量、受灾面积等等, 这些因素是影响粮食产量的直接因素。第三层次是微观因素, 主要有有效灌溉面积、化肥施用量、农业机械化程度、财政三项投入等。为了分析粮食产量的影响因素及其影响程度,将用1978一2007年的统计数据进行分析。其中:Y 是粮食产量(万吨),X1是农业化肥试用量(万吨),X2是粮食播种面积(千公顷),X3是成灾面积(千公顷),X4是农业劳动力(万人),X5是农业机械总动力(万千瓦)。

统计学习题带答案

统计学习题答案 第一章绪论 一、单项选择 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25 000棵成年松树,该研究需要从中随机抽取250棵成年松树并丈量它们的高度后进行分析。该研究的总体是(B )。 A. 250棵成年松树 B.公园中25 000棵成年松树 C.所有高于60英尺的成年松树 D.森林公园中所有年龄的松树 2、推断统计的主要功能是(D )。 A.应用总体的信息描述样本 B.描述样本中包含的信息 C.描述总体中包含的信息 D.应用样本信息描述总体 3、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育,这一叙述是(D )的结果。 A.定性变量 B.试验 C.描述统计 D.推断统计 4、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此他观察了200名新生,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是( C )。 A.该大学的所有学生 B.所有的大学生 C.该大学所有的一年级新生 D.样本中的200名新生 5、在下列叙述中,关于推断统计的描述是( B )。 A.一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌 B.从一个果园中抽取36个橘子的样本,用该样本的平均重量估计果园中橘子的平均重量 C.一个大型城市在元月份的平均汽油价格 D.反映大学生统计学成绩的直方图 6、你询问了你们班8位同学的经济学成绩,这些成绩的平均数是65分。基于这种信息,你认为全班的经济学平均成绩不超过70分。这个例子属于统计学的哪个分支( C )? A.参数统计 B.描述统计 C.推断统计 D.理论统计 7、某手机厂商认为,如果流水线上组装的手机出现故障的比率每天不超过3%,则认为组装过程是令人满意的。为了检验某天生产的手机质量,厂商从当天生产的手机中随机抽取了30部进行检测。手机厂商感兴趣的总体是( A )。 A.当天生产的全部手机 B.抽取的30部手机 C. 3%有故障的手机 D.30部手机的检测结果

如何统计分析非正态分布的数据

如何统计分析非正态分布的数据 小飞看了9月23日医咖会微信推送的“降糖药物利拉鲁肽,还能治疗心衰吗?”的研究(FIGHT 研究)后[1],不明白研究方法II中的Wilcoxon秩和检验到底是什么,于是来找小咖讨论。 小飞:Wilcoxon秩和检验到底是个什么鬼? 小咖:这是一种非参数检验方法。 小飞:非参数检验又是个什么鬼啊? 小咖:平时我们常用的t检验、卡方检验、方差分析等方法都要求样本服从特定的分布(比如t检验要求样本服从正态分布),这些方法被称为参数检验方法。但有些数据并不符合参数检验的要求,最常见的情况是数据不符合正态分布,这时可以使用非参数检验的方法。 非参数检验有很多种,Wilcoxon秩和检验就是其中一种。 小飞:不明觉厉...你还是来个栗子呗。

小咖:好吧。某医生为了评价A药对绝经后妇女的骨质疏松症是否有效,将30名绝经后妇女随机分为两组,干预组研究对象15例,给予A药+乳酸钙治疗;对照组15例,仅给予乳酸钙治疗。24周之后观察两组L2-4骨密度的改善率。数据如下图: 两组骨密度改善率(%) 干预组对照组 ID 改善率ID 改善率 1 -0.20 1 -0.83 2 0.21 2 0.26 3 1.86 3 0.48 4 1.97 4 1.03 5 2.31 5 1.06 6 2.80 6 1.19 7 3.30 7 1.27 8 3.60 8 1.71 9 4.31 9 1.75 10 4.40 10 2.33 11 5.29 11 2.66 12 5.87 12 2.80 13 6.06 13 3.22 14 6.08 14 3.34 15 7.00 15 3.34 小飞:嗯,我明白了。对于这种两组平行设计、结局是不符合正态分布的连续变量,就应当使用Wilcoxon秩和检验对吧? 小咖:很聪明,给你满分。接下来给你演示一下用SPSS 22.0怎么操作。 (1)数据录入SPSS

厦门大学统计学考研868概率论与数理统计考试重难点名校真题答案与考试真题

厦门大学统计学考研868概率论与数理统计考试重难点、名校真题答案与考试真题 《概率论与数理统计教程》考试重难点与名校真题答案(茆诗松第二版)由群贤厦大考研网依托多年丰富的教学辅导经验,组织教学研发团队与厦门大学优秀研究生合作整理。全书内容紧凑权威细致,编排结构科学合理,为参加2019厦门大学考研同学量身定做的必备专业课资料。 《概率论与数理统计教程》考试重难点与名校真题答案全书编排根据厦门大学考研参考书目: 《概率论与数理统计教程》(茆诗松第二版) 本资料旨在帮助报考厦门大学考研的同学通过厦大教材章节框架分解、配套的课后/经典习题讲解及相关985、211名校考研真题与解答,为考生梳理指定教材的各章节内容,深入理解核心重难点知识,把握考试要求与考题命题特征。 通过研读演练本书,达到把握教材重点知识点、适应多样化的专业课考研命题方式、提高备考针对性、提升复习效率与答题技巧的目的。同时,透过测试演练,以便查缺补漏,为初试高分奠定坚实基础。 适用院系:

统计系:071400统计学(理学) 王亚南经济研究院:统计学(理学) 适用科目: 868概率论与数理统计 内容详情 本书包括以下几个部分内容: Part 1 - 考试重难点与笔记: 通过总结和梳理《概率论与数理统计教程》(茆诗松第二版)各章节复习和考试的重难点,建构教材宏观思维及核心知识框架,浓缩精华内容,令考生对各章节内容考察情况一目了然,从而明确复习方向,提高复习效率。该部分通过归纳各章节要点及复习注意事项,令考生提前预知章节内容,并指导考生把握各章节复习的侧重点。 Part 2 - 教材配套课后/经典习题与解答 针对教材《概率论与数理统计教程》(茆诗松第二版)课后/经典习题配备详细解读,以供考生加深对教材基本知识点的理解掌握,做到对厦大考研核心考点及参考书目内在重难点内容的深度领会与运用。

统计学习题习题

统计学习题习题 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

一、单项选择题 1、在累计次数分布中,某组的向下累计次数表明() A、大于该组上限的次数是多少 B、大于该组下限的次数是多少 C、小于该组上限的次数是多少 D、小于该组下限的次数是多少 2、数据筛选的主要目的是() A、发现数据的错误 B、对数据进行排序 C、找出所需要的某类数据 D、纠正数据中的错误 3、样本或总体中各不同类别数值之间的比值称为() A、频率 B、频数 C、比例 D、比率 4、将比例乘以100得到的数值称为() A、频率 B、频数 C、比例 D、比率 5、下面的哪一个图形最适合描述结构性问题() A、条形图 B、饼图 C、雷达图 D、直方图 6、下面的哪一个图形适合比较研究两个或多个总体或结构性问题() A、环形图 B、饼图 C、直方图 D、茎叶图 7、将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为() A、单变量值分组 B、组距分组 C、等距分组 D、连续分组 8、下面的哪一个图形最适合描述大批量数据分布的图形() A、条形图 B、茎叶图 C、直方图 D、饼图 9、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为() A、环形图 B、茎叶图 C、直方图 D、箱线图

10、10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。下面哪种图形不宜用于描述这些数据() A、茎叶图 B、散点图 C、条形图 D、饼图 11.标志是() A.说明总体特征的名称 B.说明总体单位特征的名称 C.说明总体单位数量特征的名称 D.说明总体单位品质特征的名称 12.下列标志哪一个是品质标志() A.产品成本 B.企业增加值 C.企业经济类型 D.企业职工人数 13.下列标志中属于数量标志的是() A.人的性别 B.人的年龄 C.人的民族 D.人的文化程度 14.某一学生的统计学成绩为 85 分,则 85 分是() A.品质标志 B.数量标志 C.数量指标 D.标志值 15.某学生的统计学成绩为 85 分,则成绩是() A.品质标志 B.质量指标 C.变量 D.标志值 答案: 一、1-5 B,C,D,B,B; 6-10 A,B,C,D,B; 7-15 B,C,B,D,C。

参数估计和假设检验习题解答

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,取0.05,α=26,n = 0.0250.9752 1.96z z z α===, 由检验统计量 1.25 1.96Z = ==<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。问,新工艺上浆率能否推广(α=0.05)? 解: 012112:, :,H H μμμμ≥< 3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)? 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n = 由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)? 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n = 由检验统计量0.9733Z = ==<1.65,接受H 0:p ≤0.05. 即, 以95%的把握认为p ≤0.05是成立的. 5.某产品的次品率为O.17,现对此产品进行新工艺试验,从中抽取4O0件检验,发现有次品56件,能否认为此项新工艺提高了产品的质量(α=0.05)? 解: 01:0.17, :0.17,H p H p ≥<采用非正态大样本统计检验法,拒绝域为Z z α<-,400,n = 0.950.05, 1.65z α=-=-,由检验统计量 400 1.5973i x np Z -= = =-∑>-1.65, 接受0:0.17H p ≥, 即, 以95%的把握认为此项新工艺没有显著地提高产品的质量. 6.从某种试验物中取出24个样品,测量其发热量,计算得x =11958,样本标准差s =323,问以5%的显著水平是否可认为发热量的期望值是12100(假定发热量是服从正态分布的)?

2018统计学习题(1-10)(1)(1)

第一章总论 一、判断题 1.统计学是一门关于如何搜集、整理、分析和解释数据并从数据中得出结论的方法论 科学。() 2.统计活动与统计数据的关系是统计资料与统计实践的关系,统计学与统计活动是理 论与实践的关系。() 3.政治算术学派提出了一个世界公认的名词“统计学”,该学派是“有统计之名,无统 计之实”的学派。() 4.统计学是一门应用性很强的方法论学科,它能解决各门学科的所有问题。() 5.同质性是构成统计总体的前提条件。() 6.总体的同质性是指总体中的各个单位在所有标志上都相同。() 7.个体的变异性也是构成总体的必要条件。() 8.总体单位是标志的承担者,标志是依附于总体单位的。() 9.在全国工业普查中,全国工业企业数是统计总体,每个工业企业是个体。() 10.标志按标志值的表示方式不同分为品质标志和数量标志两种。() 11.电话号码是数量标志。() 12.蓝色是品质标志。() 13.统计总体和总体单位的存在具有相对性。() 14.不变标志是总体同质性特征的体现,而可变标志是总体差异性特征的体现。() 15.任何总体,其所包含的个体必须具备多个可变标志和至少一个不变标志。() 16.数量指标是由数量标志汇总来的,质量指标是由品质标志汇总而来的。() 17.品质标志表明个体属性方面的特征,其标志表现只能用文字来表现,所以品质标志 不能转化为统计指标。() 18.一个统计指标只能反映总体某一方面的数量特征。( ) 19.数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。() 20.可变标志、统计指标都是变量。() 21.连续型变量的变量值均是带有小数点的。() 22.人的体重是离散型变量。() 23.统计上的变异是指可变标志的标志表现之间的差别。() 24.大量观察法就是对尽可能多的总体单位进行观察,越多越好。() 25.统计描述法是在整个统计研究过程中都很有用的方法。() 二、单项选择题 1.统计学的研究对象是()。 A.客观现象的内在规律 B.客观现象的数量特征和数量关系 C.统计活动过程 D.统计活动结果 2.要了解某企业职工的文化水平情况,则总体是()。 A.该企业的全部职工 B.该企业每一个职工的文化程度 C.该企业的每一个职工 D.该企业全部职工的平均文化程度 3.要了解50所中学的学生视力状况,则个体是()。 A.每所中学 B.全部中学 C.每名学生 D. 每名学生的视力 4.总体与总体单位不是固定不变的,是指()。 A.随着客观情况的变化发展,各个总体所包含的总体单位数也是在变动的 B.随着人们对客观认识的不同,对总体与总体单位的认识也是有着差异的 C.随着统计研究范围的变化,总体和总体单位的角色可以变换 D.客观上存在的不同总体和总体单位之间,总是存在着差异

非参数分析

非参数统计分析――Nonparametric Tests菜单详解 平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。 SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类: 1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括: Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。 Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。 Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括: Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。 Two-Related-Samples Tests:配对设计的两样本秩和检验。 Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。 一、分布位置检验方法

统计学习题大全(含答案)

统计学习题大全(含答案) 1、简述统计的涵义及其关系。 2、简述统计学与其他学科的关系。 3、什么是统计学的研究对象?它有什么特点? 4、统计研究的基本方法是什么? 5、社会经济统计和职能有那些? 6、统计活动过程阶段及各阶段的关系如何? 7、什么是总体与总体单位? 8、什么是标志和标志表现?标志的种类。 9、什么是变量和变量值?变量的种类。什么是连续变量和离散变量?如何判断? 10、什么是统计指标?指标有哪些特点?指标有那些主要分类?(简述标志和指标的区别和联系)。 11、什么是统计指标体系?为什么统计指标体系比统计指标更重要? (在每小题的四个备选答案中选出一个正确的答案,并将正确答 案的号码填在题干后的括号内) 1、统计学的基本方法包括()。 A、调查方法、汇总方法、预测方法 B、相对数法、平均数法、指数法 C、大量观察法、综合分析法、归纳推断法 D、整理方法、调查方法、分析方法 2、社会经济统计学的研究对象是()。

A、抽象的数量关系 B、社会经济现象的数量关系 C、社会经济现象的规律性 D、数量关系和研究方法 3、几位学生的某门课程成绩分别是67分、78分、88分、89分、和 96分,则成绩是()。 A、质量指标 B、数量指标 C、数量标志 D、品质标志 4、要了解20个工业企业的职工的工资情况时,则总体是()。 A、20个工业企业 B、20个工业企业的职工工资总额 C、每一个工业企业的职工 D、20个工业企业的全部职工 5、标志是说明()。 A、总体单位特征的 B、总体特征的 C、单位量的特征的名称 D、单位值的特征的名称 6、工业企业的设备台数、产品产值是()。 A、连续变量 B、离散变量 C、前者是连续变量,后者是离散变量 D、前者是离散变量,后者是连续变量 7、为了了解某市高等学校的基本情况,对该市所有高等学校进行调查,其中某一高等学校有学生5285人,教师950人,该校最大系有师生780,其中教师120人,正、副教授36人,占教师总数的19.3%,上述数值中属于统计指标的有()。 A、0个 B、1个 C、6个 D、3个 8、变量是指()。 A、可变的品质标志 B、可变的数量标志 C、品质标志的标志值 D、数量标志的标志值 1、标志是说明总体单位特征的名称;标志值是标志的数值表现, 所以, ()()()()()。

厦门大学统计学简答题整理+答案

统计学简答题整理 第一章 1.时期指标与时点指标(定义.特点),也可能多选,课件 ?时期数据是反映现象在某一段时期内活动过程的总结果。 例如,人口出生数、粮食产量、商品销售额等。 ?时点数据是反映现象在某一时刻(瞬间)上的数量状况。 例如,人口数、职工人数、商品库存量等。 ?1)时期指标数值是连续登记、累计的结果。 例如,月产量是对每天的生产量进行登记后累计得到的,而年产量是将12个月产量累计得到的。 ?2)不同时期的时期指标数值具有可加性,相加后表示较长时期现象总的发展水平。 例如,将一年内12个月的钢产量相加就得到全年的钢产量。 ?3)时期指标数值大小与包含的时期长短成正比。 ? ?1)时点指标数值只能间断计数,它的每个数据都表示社会经济现象发展到一定时 点上所处的水平。 ?2)不同的时点的指标数值不具有可加性,即相加后不具有实际意义。 ?3)时点指标的数值大小与其时间间隔长短无直接关系。 ? 2.总体与总体单位、指标与标志的区别联系,见课件 1统计总体(Population):简称总体,是指根据统计任务要求所确定的,由客观存在的,在同一性质基础上结合起来的许多个别事物的集合或整体。 2总体单位(unit):又称单位。是指构成总体的个别事物(或个体)。 3.总体和单位是可以变换的。 ?总体和单位的概念是相对而言的,随着研究目的不同,总体范围不同而相互 变换。同一个研究对象,在一种情况下为总体,但在另一种情况下又可能变 成单位。 ?标志:总体各单位普遍具有的属性或特征。 ?指标:反映总体现象数量特征的概念。 区别: ?(1)标志是说明总体单位的特征和属性;而指标则是说明总体的数量特征。 ?(2)标志有不能用数值表示的品质标志与能用数值表示的数量标志;而指标都是 能用数值表示的。 联系: ?(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的。如一个学校的 教师工资总额是由每个教师工资加总得到的。 ?(2)指标与数量标志之间存在变换关系。 例如,研究福建省各县人口情况时,福建省是总体,各县是总体单位,福建省人口总

统计学习题及答案(完整)-2

. 第一部分计量资料的统计描述 一、最佳选择题 1、描述一组偏态分布资料的变异度,以()指标较好。 A、全距 B、标准差 C、变异系数 D、四分位数间距 E、方差 2.用均数和标准差可以全面描述()资料的特征。 A.正偏态分布B.负偏态分布C.正态分布 D.对称分布E.对数正态分布 3.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变B.均数改变,标准差不变 C.两者均不变D.两者均改变E.以上都不对 4.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数B.方差C.极差D.标准差E.四分位数间距 5.偏态分布宜用()描述其分布的集中趋势。 A.算术均数B.标准差C.中位数D.四分位数间距E.方差 6.各观察值同乘以一个不等于0的常数后,()不变。 A.算术均数B.标准差C.几何均数D.中位数E.变异系数 7.()分布的资料,均数等于中位数。 A.对数正态B.正偏态C.负偏态D.偏态E.正态 8.对数正态分布是一种()分布。 (说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?) A.正态B.近似正态C.左偏态D.右偏态E.对称 9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。 A.均数B.标准差C.中位数D.四分位数间距E.几何均数 10.血清学滴度资料最常用来表示其平均水平的指标是()。 A.算术平均数B.中位数C.几何均数D.变异系数E.标准差 二、简答题 1、对于一组近似正态分布的资料,除样本含量n 外,还可计算,S 和,问各说明什么? 2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清 联系和区别。甘油三酯(mmol/L)测量结果 3、说明频数分布表的用途。 4、变异系数的用途是什么?组段频数 5、试述正态分布的面积分布规律。0.6~ 1 0.7~ 3 三、计算分析题0.8~ 9 1、根据1999年某地某单位的体检资料,116名正常0.9~ 13 成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25 (1)描述集中趋势应选择何指标?并计算之。 1.2~ 18 (2)描述离散趋势应选择何指标?并计算之。 1.3~ 13 (3)求该地正常成年女子血清甘油三酯的95%参考值范围。 1.4~ 9 (4)试估计该地正常成年女子血清甘油三酯在0.8mmol/L 1.5~ 5 以下者及1.5mmol/L以下者各占正常女子总人数的百分比。 1.6~1.7 1 合计116 可编辑范本

统计学习题含答案

2010年《统计学》练习题 一、单项选择题 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.下面属于品质标志的是()。 A、年龄 B、收入 C、电话号码 D、体重 2.要了解在杭高校的学生的视力情况,则总体单位是( ) 。 A、每个学生 B、每个学生的视力 C、每个学校 D、每个学校的所有学生 3.统计总体的同质性是指() A、总体各单位具有某一共同的品质标志或数量标志 B、总体各单位具有若干个不同的品质标志或数量标志 C、总体各单位具有某一共同的质量指标或数量指标 D、总体各单位具有若干不同的数量指标或质量指标 4、下面属于连续变量的是()。 A、职工人数 B、机器台数 C、工业总产值 D、车间数 5.政治算术的主要代表人物是()。 A、威廉.配第 B、阿亨瓦尔 C、凯特勒 D、康令 6.在对某高中的学生的学习情况调查中,不变标志是( ) 。 A、性别 B、学校名称 C、年龄 D、身高 7.下列各项属于存量的是()。 A、出生人数 B、期初资产额 C、国民收入 D、最终消费 8.重点调查的重点单位是()。 A、这些单位在全局中占举足轻重的地位 B、这些单位的单位总量占全部单位总量的很大比重 C、这些单位的标志总量占总体全部标志总量的很大比重 D、这些单位是我们工作中的重点 9.统计表从内容上可以由以下几部分组成()。 A、调查单位、调查项目和填表人 B、表头、表身和表脚 C、主词、宾词 D、总标题、横行标题、纵栏标题和数字 10.2010年的第六次人口普查属于()。 A、重点调查 B、典型调查 C、一次性调查 D、经常性调查 11.具有统一规定的表式、指标、报送程序和时间,自下而上逐级提供基本统计资料的是()。 A、普查 B、重点调查 C、典型调查 D、统计报表 12.杭州市工商银行要了解2009年第一季度全市储蓄金额的基本情况,调查了储蓄金额最高的几个储蓄所,这种调查属于()。 A、重点调查 B、典型调查 C、抽样调查 D、普查 13.为了了解城市职工家庭的基本情况,以作为研究城市职工收入水平及生活负担的依据,需要进行一次专门调查,最为适合的调查组织形式是()。

厦门大学《应用多元统计分析》试题A

厦门大学《多元统计分析》试卷A 经济学院计统系 级 专业 本科生 一、(20%)判断题 1、“p 维随机向量1(,...,)p X X X ′=的协差阵及相关阵一定是非负定阵”是否正确,并说明理由。 2、 “距离判别是Bayes 判别的一种特例”是否正确,为什么? 二、(15%)设标准化变量12,,3X X X 的协差阵(即相关阵)为 1.000.630.450.63 1.000.350.450.35 1.00?? ??=?? ???? R , R 的特征值和相应的正则化特征向量分别为: '11'22' 331.9633,(0.6250,0.5932,0.5075)0.6795,(0.2186,0.4911,0.8432)0.3572, (0.7494,0.6379,0.1772)l l l λλλ====??==?? 要求: 1)计算因子载荷矩阵A ,并建立因子模型; 2)计算公因子的方差贡献,并说明其统计意义。 j F 2(1,2,3j g j =)三、(10%)设三元总体的协方差阵为 X 2 22 222 200σρσρσσρσρσσ??? ? =????? ? Σ,试求总体主成分(0ρ<≤。 四、(15%)金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析 员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布),今测得两个总体的若干数据,并由这些数据得到 ????????=62?1μ????????=24?2μ? ???????=∑4111? 对某一金融分析员进行判别是否能满足这项工作。进行测量得到两个指标为 ,且当两组先验概率分别为)4,5(′=X 269.01=q 与731.02=q ,损失相同。

统计学习题(选择)

( ) 1.若以舒张压大于等于12kPa为高血压,调查某地1000人,记录每人是否患有高血压。最后清点结果,其中有10名高血压患者,有990名正常人。 A. 这是定量资料 B. 这是定性资料 C. 还看不出是定量还是定性资料 D. 这是连续型数据 ( ) 2.下面关于假设检验的说法,正确地是_______ A. 在P值大于检验水准时,我们可以接受H0 B.在两样本均数比较的t检验中,P值越小,说明两个总体均数差得越大。 C.若发现双侧检验不能拒绝H0,可以进行单侧检验提高检验效能 D.以上说法都不对 ( ) 3.某一个总体的总体均数的可信区间________ A. 随总体均数的改变而改变 B. 随样本的改变而改变 C. 不随总体均数的改变而改变 D. 不随样本的改变而改变 ( ) 4.用某种新降压药治疗15名高血压患者,测得每位患者治疗前,治疗后第3,6,9天血压值,假定资料满足参数检验的要求。为排除个体差异的影响,在分析资料时,应选择________ A. 单因素4水平设计的方差分析 B. 配对设计资料的

t检验 C. 配伍组设计资料的方差分析 D. x2检验 ( ) 5. 下列关于描述定量资料特征的统计量的说法,正确的是________ A.算术均数适用于对称资料平均水平的描述 B.标准差越大,说明资料的代表性越差 C.当资料中含有不确定值时,一定可以用中位数描述其平均水平 D.比较儿童和成年人身高的变异程度,不宜直接比较标准差。( ) 6. 比较两种不同手术治疗某病的疗效,疗效用痊愈和未愈表示,该资料属于________。 A.数值变量资料B.无序分类变量资料 C.有序分类变量资料D.等级变量资料 ( ) 7. 关于均数抽样误差的规律性,下列说法正确的是________ A.从均数为μ,标准差为σ的总体中进行随机抽样,样本均数服从于自由度为n-1的t分布。 B.从均数为μ,标准差为σ的总体中进行随机抽样,在样本含量足够大时,样本均数近似服从于自由度为n-1的t分布。 C.从均数为μ,标准差为σ的总体中进行随机抽样,样本均数服从于正态分布。 D.从均数为μ,标准差为σ的正态分布总体中进行随机抽

统计学习题及答案

精品文档 . 第一部分计量资料的统计描述 一、最佳选择题 1、描述一组偏态分布资料的变异度,以()指标较好。 A、全距 B、标准差 C、变异系数 D、四分位数间距 E、方差 2.用均数和标准差可以全面描述()资料的特征。 A.正偏态分布B.负偏态分布C.正态分布 D.对称分布E.对数正态分布 3.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变B.均数改变,标准差不变 C.两者均不变D.两者均改变E.以上都不对 4.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数B.方差C.极差D.标准差E.四分位数间距 5.偏态分布宜用()描述其分布的集中趋势。 A.算术均数B.标准差C.中位数D.四分位数间距E.方差 6.各观察值同乘以一个不等于0的常数后,()不变。 A.算术均数B.标准差C.几何均数D.中位数E.变异系数 7.()分布的资料,均数等于中位数。 A.对数正态B.正偏态C.负偏态D.偏态E.正态 8.对数正态分布是一种()分布。 (说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?) A.正态B.近似正态C.左偏态D.右偏态E.对称 9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。 A.均数B.标准差C.中位数D.四分位数间距E.几何均数 10.血清学滴度资料最常用来表示其平均水平的指标是()。 A.算术平均数B.中位数C.几何均数D.变异系数E.标准差 二、简答题 1、对于一组近似正态分布的资料,除样本含量n 外,还可计算,S 和,问各说明什么? 2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清 联系和区别。甘油三酯(mmol/L)测量结果 3、说明频数分布表的用途。 4、变异系数的用途是什么?组段频数 5、试述正态分布的面积分布规律。0.6~ 1 0.7~ 3 三、计算分析题0.8~ 9 1、根据1999年某地某单位的体检资料,116名正常0.9~ 13 成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19 请据此资料: 1.1~ 25 (1)描述集中趋势应选择何指标?并计算之。 1.2~ 18 (2)描述离散趋势应选择何指标?并计算之。 1.3~ 13 (3)求该地正常成年女子血清甘油三酯的95%参考值范围。 1.4~ 9 (4)试估计该地正常成年女子血清甘油三酯在0.8mmol/L 1.5~ 5 以下者及1.5mmol/L以下者各占正常女子总人数的百分比。 1.6~1.7 1 合计116

相关文档
相关文档 最新文档