统计学复习题整理(仅供参考!!!)
一、名词(着重前面几个都记下的,后面没记到的估计。。。5个共20分)
1、实验设计:广义是在科研工作未进行前,对整个试验研究课题的设计,包括试验计划和方案的制定,实验地点的选择,以及相关资料的收集、整理和统计分析方法等内容。狭义指试验方法的设计。
2、费雪三原则:重复,随机,局部控制。由于设置重复,重复数增加,误差随之降低;由于随机化,能够无偏的正确估计误差。由于引入了局部控制的方法,一方面,可以把区组间的误差分离出来,另一方面通过控制区组内的条件一致,进一步缩小误差,从而提高了试验的精确度。
3、相关:设有两个随机变量X和Y,对任意一个随机变量的每一个可能的值,另一个随机变量都有一个确定的分布与之对应,则称这两个随机变量间存在着相关关系,简称相关。
4、回归:在两个变量间之间,自变量X固定,受试验误差影响较小,依变量Y随自变量X的变化而变化,受试验误差影响较大,这种关系称为回归关系,简称回归。(或在两个变量间之间,如果两个变量间的地位不再平等,而是有主有次,此时两个变量间的相关就变为回归关系,简称回归。)
5、最小二乘法:在残差满足VPV为最小的条件下解算测量估值或参数估值并进行精度估算的方法。其中V为残差向量,P为其权矩阵。它通过最小化误差的平方和寻找数据的最佳函数匹配。
6、相关系数:两变量之间存在的相互关系就是相关关系,这种相关关系定量的度量,就是相关系数。
7、拒绝域:它是指概率分布中这样一个区域(横轴上):当统计推断时,所计算的统计量落入这个区域之内就会导致零假设的拒绝,所以这个区域称为零假设的拒绝域。
8、接受域:
9、临界值:(百度:在正常值与异常值之间的值称为临界值)
10、样本:在实际工作中,研究总体时抽出的若干个体组成的单元称为样本。
11、标准差:为方差的平方根值,有一表示资料的变异度,其单位与观察值的单位相同。
12、抽样分布:统计量的概率分布称为抽样分布。
13、自由度:指资料中能自由变动的观测值个数。
14:总体:指研究对象的全体,由具有共同性质的个体组成。
15、参数:从总体中计算所得的用以描述总体特征的数值,称为参数。
16、统计量:从样本中计算所得的数值称为统计量。
17:、单尾检验:选择备择假设H A:μ>μ0或H A:μ<μ0,都是一方情况被排除后对另一方情况是否存在所作的推断进行的显著性测验称为单尾检验
18、双尾检验:选择备择假设H A:μ≠μ0是两种可能均存在,用以推断两均数是否相等的显著性测验称为双尾检验
19、Ⅰ型错误:如果假设是正确的,却错误地拒绝了它,统计上称为Ⅰ型错误。
20、Ⅱ型错误:如果假设是错误的,却错误地接受了它,统计上称为Ⅱ型错误。
21、决定系数:指由X 引起的Y 的平方和U 所占Y 变数总平方和SS y 的比率(或由Y 引起的X 的平方和U ’所占X 变数总平方和SS x 的比率),决定系
数是相关系数的平方。
二、填空(5题共10分)
1.变量之间的相关关系主要有两大类:( 因果关系 ),( 平行关系 )
2.在统计学中,常见平均数主要有( 算术平均数 )、( 几何平均数)、( 调和平均数)
3.样本标准差的计算公式( 1)
(2--=∑n X X S )
4.小概率事件原理是指( 某事件发生的概率很小,人为的认为不会发生 )
5.在标准正态分布中,P (-1≤u ≤1)=( 0.6827 ) (其他两个为
0.9545、0.9973)
(已知随机变量1的临界值为0.1587)
6.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为( 自变量 ),Y 称为( 依变量 )
1、显著性检验又称 假设检验 ,是统计学的核心内容。
2、随机实验的每一个可能的结果称为 变数 。
3、通常把α称为显著性水平或置信系数,常用显著性水平有两个,它们是 0.05
和0.01
4、当随机变量的正态分布的μ=0,?= 1 时,正态分布就转化成标准正态分布。
5、数据资料按其性质不同各分为 计数 资料和 计量 资料两种。
6、小概率事件原理判定的基础是 原假设 。
7、试验设计的三大基本原则是设置重复、 随机化 和 局部控制 。
三、选择(5题共10分)
1、下列数值属于参数的是: A
A 、总体平均数
B 、自变量
C 、依变量
D 、样本平均数
2、 下面一组数据中属于计量资料的是 D
A 、产品合格数
B 、抽样的样品数
C 、病人的治愈数
D 、产品的合格率
3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 C
A 、12
B 、10
C 、8
D 、2
4、变异系数是衡量样本资料 A 程度的一个统计量。
A 、变异
B 、同一
C 、集中
D 、分布
5、方差分析适合于, A 数据资料的均数假设检验。
A 、两组以上
B 、两组
C 、一组
D 、任何
6、在t 检验时,如果t = t 0、01 ,此差异是: B
A 、显著水平
B 、极显著水平
C 、无显著差异
D 、没法判断
7、 生物统计中t 检验常用来检验 A
A 、两均数差异比较
B 、两个数差异比较
C 、两总体差异比较
D 、多组数据差异比较
8、平均数是反映数据资料 B 性的代表值。
A、变异性
B、集中性
C、差异性
D、独立性
9、在假设检验中,是以 C 为前提。
A、肯定假设
B、备择假设
C、原假设
D、
有效假设
10、抽取样本的基本首要原则是 B
A、统一性原则
B、随机性原则
C、完全性原则
D、重复性原则
11、统计学研究的事件属于 D 事件。
A、不可能事件
B、必然事件
C、小概率事件
D、随机事件
12、下列属于大样本的是 A
A、40
B、30
C、20
D、
10
13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 D
A、0.11
B、8.64
C、2.88
D、0.32
14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 B 。
A、正比关系
B、反比关系
C、加减关系
D、没有关系
15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 B
A、18
B、12
C、10
D、5
16、已知数据资料有10对数据,并呈现线性回归关系,它的总自由度、回归自由度和残差自由度分别是
A
A、9、1和8
B、1、8和9
C、8、1和9
D、 9、8和1
17、观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为 D
A、偶然误差
B、系统误差
C、疏失误差
D、
统计误差
18、下列那种措施是减少统计误差的主要方法。 B
A、提高准确度
B、提高精确度
C、减少样本容量
D、增加样本容量
19、相关系数显著性检验常用的方法是 C
A、t-检验和u-检验
B、t-检验和X2-检验
C、t-检验和F检验
D、F检验和X2-检验
20、判断整体中计数资料多种情况差异是否显著的统计方法是 B
A、t-检验
B、F-检验
C、X2-检验
D、u-检验
4、在均数假设检验中,当样本的个数大于30时,通常选择 B 检验。
A、 t-检验
B、u-检验
C、F-检验
D、都可以
6、百分数检验中,只有np和nq都大于 D 时,可用u或t检验。
A、 30
B、 20
C、 10
D、 5
14、多重比较是对各个处理间的差异显著性检验的一种方法,它是对各处理的 D 间进行多重比较。
A、统计数
B、变数
C、F值
D、平均数
15、在X2检验中,当自由度为 A 时,需要对在X2检验的连续性进行矫正。
A、1
B、2
C、3
D、4
16、已回归方程的决定系是0.81,那么此回归方程的相关系数是 B 。
A、0.6561
B、0.9
C、0.59
D、0.81
17、下列数值属于参数的是: A
A、总体平均数
B、自变量
C、依变量
D、
样本平均数
19、抽取样本的基本首要原则是 B
A、统一性原则
B、随机性原则
C、完全性原则
D、重复性原则
20、一组成组数据资料,每组具有10个观察值。该配对资料的自由度是 D
A、20
B、19
C、18
D、9
四、计算(2题共40分)
(着重看置信区间、回归)
五、简答(2题共20分)
1、算术均值特征
(1)、离均差总和等于零。(2)、离均差平方和最小
2、标准差、标准误、(变异系数)的区别和联系
(1)联系:以样本均数为变量,求出它们的标准差即可表示其变异程度,所以将样本均数的“标准差”定名为均数的标准误,简称标准误。
(2)区别:标准差表示个体值的散布情形,即某一变量变异程度的大小;而标准误则说明样本均数的参差情况,即均数的抽样误差大小。
3、概率是怎么样的,与频率有什么联系
概率是随机事件发生可能性大小的数值度量,古典定义为在随机试验中,如果基本事件的总和n为有限多个,且每个基本事件的发生是等可能的,事件A由其中m个基本事件所组成,则事件A的概率为P(A)=A中包含的基本事件数/基本事件总数=m/n。
联系:⑴事件的频率与概率是度量事件出现可能性大小的两个统计特征数;⑵当试验次数无限增大时,事件发生的频率会逐渐稳定于概率附近,概率的值可能是频率的某个具体值,也可能不是频率的具体的某个值;⑶频率具有稳定性,概率具有确定性。
4、二项分布和泊松分布间的特征和联系(区别和联系)
二项分布特征:均值为np,方差为npq,取值范围为0—n,两个参数
泊松分布特征:均值=方差,即μ=σ= ,
(1)区别:①二项分布的形状由n和p来决定,它由一族;泊松分布只决定于它的总体均值μ,它也有一族。②当n增大时,无论p的大小,二项分布都趋于对称;随着μ的增大,泊松分布逐渐趋于对称。③二项分布的参数为:μ=np, σ2=npq;泊松分布的参数为:μ=σ2。
(2)联系:1泊松分布是二项分布的特例,是特殊的二项分布;②除了泊松分布特有的条件外,其它的条件与普通的二项分布相同。③分布都为单峰。
5、一般正态分布的特点。
①曲线为一个单峰钟形曲线,关于 x=μ称轴
②曲线在x=μ处达到最高点,然后往左右两个方向下降,无限逼近x轴
③曲线在x=μ+-σ处各有一个拐点
④曲线以参数μ和σ2的不同表现为一系列曲线。μ决定曲线在x轴的位置,而σ2决定分布的曲线的形状;σ2越小,曲线越陡,σ2越大,曲线越平坦
6、统计假设的基本步骤
(1)、提出测验的假设和标准
(2)、选择测验方法和计算统计量
(3)、确定概率P值和做出统计推断
7、方差分析的基本思想
答:ANOVA的基本思想是ANOVA法不变的灵魂。其基本思想可概括为:按照变异原因将试验资料的总变异和总自由度剖分为各个原因变异组分。总变异基本上可剖分为两大块:一块是处理因素的变异组分,另一是误差因素的变异组分。然后将处理变异组分同误差变异组分相比较,即可做出统计推断。
8、统计推断为什么不能避免犯错误?
答:因为统计推断是建立在概率论的基础之上的,统计推断过程实际上就是运用小概率原理的过程,所以统计结论具有概率性而不具有完全的确定性。也即是说一切统计推断都有可能犯错误。
9、适应性、独立性检验有何异同
相同:
不同:其一,研究目的不同前者是研究实际次数与理论次数是否相符合,后者是研究两因素间是相互独立还是相互关联的问题;其二,前者只按某一因素的属性类别归组,后者根据因素水平数的多少按行、列两向排成联列表;其三,前者理论次数的计算是按已知的属性分配理论比例进行,后者在计算理论次数时无已知的理论比例,理论次数的计算是在因素相互独立的前提下推算出来的。
10、回归分析注意问题
①研究两个变量间是否存在相关关系,所建立的回归方程有无实际意义,必须结合相关专业知识及客观规律等
②利用回归方程估测时,变量的定义域相一致
③利用回归方程预测依变量时,自变量不能超出实际观察值范围,前后时间段内发生的情况的回归分析情况相似
④两变量间的一元回归分析,必须严格控制其他因素的干扰
⑤为提高精确度,变量观察值尽量多
11、实验设计的基本要点
①试验目的要明确;②试验对象、试验条件要有代表性;③试验条件要相对一致;④试验结果要可靠;⑤试验结果应具有重演性