文档库 最新最全的文档下载
当前位置:文档库 › 教育统计学

教育统计学

教育统计学
教育统计学

第一章:概述

一、教育统计学的含义

(一)什么是统计学

A统计学是研究随机现象的数量规律性的一门数学分支。自然界中有两类现象:a.确定现象b.随机现象。随机现象的规律性可用概率论来描述,起源于(法)帕斯卡对赌博现象的研究。

B数理统计学:以概率论为基础

C应用统计学:是数理统计学理论在各个学科领域中的应用。

(二)什么是教育统计学

探讨如何将统计学的原理和方法应用于研究教育现象中数量关系的科学。根据不同功能可划分为:

1.统计设计:研究如何科学全面地搜集统计数据以确保统计结论的可靠性。如:如何进行随机抽样,如何设计实验等。

2.描述统计:研究如何对搜集到的统计数据进行分析整理,以显示数量关系,如:计算数据的集中度、离散度等。

3.推断统计:研究如何利用样本数据来推测和判断未知的总体特征,如总体参数估计、假设检验等。

二、几个基本概念

(一)变量与变量值

A变量:可以定量并能取不同数值的事物的某种特征。

B变量值:变量具体的数值如考试的分数、智力水平

C变量的类型:

①类别变量:只是用数字来代表事物或对事物进行分类,数字没有任何数值意义。不能做量化分析,无大小意义,只表明类别。如性别男1 女2

②顺序变量:表明类别的大小或某种属性的多少。主要用于分等论级和分类。仅表示等级,不表示某种属性的真正量和绝对值。无参照点(没有绝对零度)和相等单位。如:五点评分:ABCDE

③等距变量:存在大小关系,无绝对零点,但存在相对零点。可进行数学运算、有相等单位。如IQ

④比率变量:有相等单位和绝对零点,可以知道事物之间的某种特点上相差多少及他们之间的倍数关系。如长度

(二)总体与样本

A总体:具有某种特征的个体总和例如大学生、中学生、女性、男性,包括有限总体和无限总体。总体的量化特征称为总体参数。如总体平均数

B样本:从总体中抽取的观察对象。样本容量(>30称为大样本,<30称为小样本),样本的量化特征称为样本统计量,如样本平均数。(研究分布关系越大越好;研究事物关系越小越好)

第二章:原始数据的整理

一、次数分布表

(一)分类

1.简单次数分布表:又称简单频叔分布表,根据不同组别数据出现频数编制而成。

2.相对次数分布表:又称相对频数分布表,根据不同组别数据出现相对频数编制而成。

3.累积次数分布表:又称累积频数分布表,根据不同组别数据出现累计频数编制而成。

4.累计相对次数分布表:又称累计相对频数分布表,根据不同组别数据出现累积相对频数编制而成。

表格一:某校大一新生英语测验得分次数分布表表格二:某校大一新生英语测验累计次数分

(二)次数分布表的制作方法

1.求全距:全距指的是全部观察值中最大值与最小值之差。

2.决定组数和组距:a 一般不少于5组,也不要超过15组,常见的是10组。B 组距指的是每一个组内包含的距离(用i 表示)c 斯特奇斯(H.A.Sturges )根据经验公式: i=Max-Min/1+

3.322logN 3决定组限:组限是每一组的起点值和终点值。

4.登记次数。(三线表) 二、次数分布图

(一)将次数分布表中的数据以图的形式表现出来。 (二)分类:

1.简单次数分布图——直方图

2.简单次数分布图——折线图

3.累积次数分布图 (S 形)

4.累积相对次数分布图 图一样,纵坐标不一样

第三章:集中量和差异量 一、集中量:是代表一组数据典型水平或集中趋势的量

集中量包括:算数平均数、加权平均数、几何平均数、中位数、众数等。 (一)算数平均数

1.算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。 ①根据原始数据求平均数:

n

X

X n

i ∑==

1

i

②根据相对次数分布表求平均数

∑∑===

k i i

k

i f

X f

X 1

1

i

i

f i --- 频数

x

i----组中值

例1:计算下表计算其算术平均值

表格一:某校大一新生英语测验得分次数分布表

分数 人数 百分比 低于20分 10 3.33 20—39 30 10.00 40—59 40 13.33 60—79 121 40.33 80—100 99 33.00 总和

300

100

分数 累积次数 累计百分比 低于20分 10 3.33 20—39 40 13.33 40—59 80 26.66 60—79 201 66.99 80—100 300 100 总和

300

100

2.算术平均数的优缺点:

A 优点:反应灵敏;严密确定,简明易懂,计算方便;适合代数运算;总体平均数的最好估计值。

B 缺点:a 易受极端数值的影响 b 数据中某个数值的大小不够确切或缺失就无法计算。 (二)中位数

1.中位数(Md )是位于一定顺序排列的一组数据中央位置的数值,在这一数值的上、下各有一半的频数分布着。

2.根据次数分布表求中位数

)N -(0.5N l ?+=f

i

L Md L:中位数所在组的下限 N :总频数

Nl :小于中位数所在组下限的频数总和 I :表示组距 F :中位数所在组的频数

例2:计算例1中数据的中位数

中位数适用于以下情况: 一组数据中有极端数值; 一组数据中有个别数据不确切; 百分位数

百分位数:一组从小到大排列的数据中某一百分位置所对应数值

)N -(pN l ?+=p

p p f i

L P

例3:同样是上表,求25%所对应的数值。

(三)众数

众数(Mo )是指一组数据中频数出现最多的那个数。 1.根据原始数据求众数 2.根据次数分布表求众数:

i f f f L M l

u u

o ?++=

L :频数最多组的下限 fu:众数所在组上限后一组的频数 Fl :众数所在组下限前一组的频数

分数 人数 百分比 低于0分 10 3.33 20—39 30 10.00 40—59 40 13.33 60—79 121 40.33 80—100 99 33.00 总和

300

100

3.主要在以下情况下使用

A 当需要快速而粗略地找出一组数据的代表值时

B 分析一组频数分布的峰态

算术平均数、中数、众数的关系 皮尔逊经验公式:M Md M 2-3o ≈ 例4:试求上表的众数。 (四)加权平均数

加权平均数是不同权重数据的平均数。 Wi : 权重

∑∑===

n

i i

n

i i

i u W

X

W X 1

1

例5:期末考试中,数学80,语文92,英语78,其中数学在总分中占40%,语文占40%,英语占20%,其总平均分是多少?

(五)几何平均数

几何平均数,是N 个数值连乘积的N 次方根,计算公式为:n n g X X X X .......21=

例6:某工厂第一年产量为100,第二年产量为120,第三年为132,第四年为156,试求年增长率。

(六)调和平均数

调和平均数:是N 个数值倒数平均数之倒数 计算公式为:

∑==

n

i X 1i

h )X 1(n 例7:某学生记30个单词,头十个单词用了五分钟,中间十个单词用了三分钟,最后十个单词

用了四分钟,请问每分钟记单词多少个?

二、差异量的计算

差异量用来表示数据变异程度和离散程度,包括全距、平均差、方差、标准差和差异系数等。 (一)全距(=最大值—最小值)

优点:概念清楚、意义明确、计算简单 缺点:易受极端数值的影响 (二)四分位距:一组依序排列的数据中间50%数据涵盖的数值范围的一半 QD=(Q3-Q1)/2 Q3=L+i/f*(0.75N-Nl ) Q1=L+i/f*(0.25N-Nl )

(三)平均差:每一个数据与该组数据中位数(或算术平均数)离差的绝对值的算术平均数。

n

x x AD i n

i -1

==

根据次数分布表

N

x

x f

AD i k

i i

-1

∑==

例8:根据表格一,试求其平均值。

(四)方差(S 2)和标准差(S ) A 方差指离差平方的算术平均数

2

2

n

1

i i 1

21

2

i

2)

x (-

)

x -(x

n

n

x

n

S n

i i

n

i ∑∑∑====

=

2

2

1

1

21

2

i

)(-

)

x -(x

n x n

x

n

S n

i i n

i i

n

i ∑∑∑====

=

根据次数分布表求方差和标准差

2

2

1

21

2

1

2)

()

(N

x f N

x

f N

x x f S i k

i i i

k

i i i

k

i i

∑∑∑===-

=

-=

2

2

1

21

2

1

)()

(N x f N

x

f N

x x f S i k

i i i

k

i i i

k

i i

∑∑∑===-

=

-=

例9:试求表格一的方差。

(五)差异系数:差异系数是标准差与其算术平均数的百分比。一般在5%—35%之间。 %100x

?=

S

CV 第四章:概率分布 一、概率和概率分布

(一)随机现象和随机事件:随机现象是指存在多种肯能结果且事先无法预料哪种结果会出现的现象。随机现象的每次发生可称为随机实验,例如:掷骰子。 随机现象的某些结果组合称为随机事件。

(二)概率:描述某个随机事件在若干次随机实验中出现可能性的数学概念。可分为后验概率和先验概率 1.后验概率:设A 为某个随机事件,在N 次随机试验中发生Na 次,则A 的频率为

N

N (A)A

=

f 如果随着N 的无限增大,f (A )趋近于某个常数P ,那么P 为随机事件A 的后验概率。 2.先验概率(古典概率):在满足以下条件时通过理论计算获得的概率 (1)随机试验的结果数目有限 (2)每种结果出现的可能性相同

假设A 为某个随机事件,随机实验的所有可能总数为N ,A 包含的结果数为Na ,则N

N (A)A

=

f (三)概率分布

①如果随机变量x 的可能取值为有限个且以各种确定的概率取这些不同的值,则称X 为离散型随机变量(如投掷硬币的结果)

②如果随机变量x 的可能取值范围为某范围的任何数值,且在其取值范围内的任一区间中取值的,其概率是确定的,则称x 为连续型随机变量(如 某学生的考试成绩)

③概率分布是对随机变量的取值与概率之间的关系的描述。 1.离散型随机变量的概率分布:

如果我们将离散型随机变量X 的取值记作Xi(i=1,2,3,.....,n)对应的概率记作P ,则: P(a <X <b)=Pi (i=1,2,3,.....,n)称为X 的概率分布。

2.连续型随机变量的概率分布

如果我们将连续型的随机变量X 的取值范围记作a <X <b ,对应的概率记作P ,则: P(a <X <b)= f (x )dx 称为X 的概率分布。

二、常见概率分布 (一)二项分布

问题:一个学生全凭猜测答两道是非题,则答对0、1、2题的概率是多大?

解:2道是非题的情况:TT 、TF 、FT 、FF 3道是非题:TTT 、TFT 、TFF 、TTF 、

FTT 、FTF 、FFT 、FFF

1.二项试验:满足以下条件的试验称为二项试验: (1)一次试验只有两种可能的结果,即成功与失败。 (2)各次试验相互独立,互不影响 (3)各次试验中成功的概率相等。

2.二项分布函数

①在n 次二项式验中成功事件出现不同次数(X=0,1,........,n )的概率分布叫做二项分布。 ②x n x x

n x x n

Q P x n Q

P C x P --x )!

-(n !!)

(== 1) 当P <Q ,且nP ≥5,或当P >Q 且nP ≥5时,二项分布接近正态分布。 2) 当n 趋于无穷大时,二项分布为正态分布。 3.二项分布的平均数和标准差

当二项分布接近于正态分布时,在n 次二项试验中成功事件出现次数的平均数和标准差分别为:M=np 和 δ=npq =

(二)正态分布

1.正态分布是应用最广泛的一种连续型随机变量的概率分布

① 函数表达式:2

2

2-21

μ

μ)

(π

x e Y =

② 函数图形: 2.标准正态分布

① 标准正态分布函数:2

-2

21z e Y π

= 其中z=

② 图形:

3.正态分布的应用

① 将原始分数转化成标准分数Z 值

例10:2001年某市公务员选拔考试甲乙二人成绩:

写作 法规 综合 合计 X Z X Z X Z X Z 甲 87 80 98 265 乙

95

83

88

266

② 确定录取分数线。

例11.某年高考平均分为500,标准差100,考分呈正态分布,某考生得到650分,设当年高考录取率为10%,问该生能否被录取。

例12.某项职业录取考试,在参加的1600人中准备录取200人,考试分数接近正态分布,去年同样考试的平均分数为74分,标准差为11,问今年的分数线会是多少?

答对2题 答对1题 答对0题

1 2

1

答对3题 答对2题 答对1题 答对0题 1

3

3

1

③确定等级评定人数。

例13.如果100人的教育实习成绩呈正态分布,现将其分为优、良、中、合格、不合格五个等距的等级,问各等级应有相应的多少人?

第五章:总体平均数估计

一、抽样分布

1.三种不同性质的概率分布

①总体分布:总体内个体数值的概率分布

②样本分布:样本内个体数值的概率分布

③抽样分布:样本统计量的概率分布。

2.样本平均数的抽样分布

①若(X1,X2,......Xn)是抽自总体X的一个样本容量为n的随机样本,则依据样本样本所有可能观察值计算出的样本平均数的分布,称为样本平均数的抽样分布,简称平均数抽样分布。

②平均数抽样分布的标准差称为平均数的标准差

③平均数抽样分布的定理

A.平均数抽样分布的平均数等于总体平均数:

B.平均数抽样分布的方差等于总体方差除以样本容量n

C.抽自正态分布总体的样本平均数分布也是一个正态分布

④样本平均数与总体平均数离差统计量的抽样分布

A.当总体方差已知时,为Z分布

B.当总体方差未知时,为T分布

二、总体平均数的估计

(一)总体参数估计(含义:只用样本统计量来估计相应总体参数)

1.点估计

①用某一样本统计量的值来估计相应总体参数的值。(例如用某个班级的考试成绩分数平均值作为全年级的总体分数平均值的估计值)

②判断估计量优劣的标准

A.无偏性:指样本统计量与总体参数的离差平均值为0

B.有效性:指样本统计量的方差大小

C.一致性:指样本容量无限增大时,样本统计量趋近于总体参数

③评价:由于点估计依赖于样本抽样情况,因此可靠性和稳定性较差。

2.区间估计:以样本统计量的抽样分布为理论依据,按一定概率要求,用样本统计量的值估计总体参数值所在的范围。

(1)总体方差已知:样本平均数与总体平均数离差统计量呈Z分布

例14.某种零件的长度服从正态分布。已知总体标准差为1.5cm,从总体中抽取100个零件组成样本,测得它们的平均长度为10.0cm,试估计在96%置信水平下,全部零件平均长度的置信区间。

(2)总体方差未知:样本平均数与总体平均数离差统计量呈T分布。

例15.某种零件的长度服从正态分布,从总体中抽取30个零件组成样本,测得它们的平均长度为10厘米,标准差为1.5厘米,试估计在95%置信水平下,全部零件平均长度的置信区间。

(3)当样本容量大于30时,T分布接近于正态分布,用Z分布计算。

(二)假设检验

1.指对总体的分布形态或参数做出某种假设,然后根据样本信息,用统计分析方法检验这一假设是否合理,从而做出接受或拒绝这一假设的决定。

假设检验是统计推断的另一种形式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。

假设检验分为两类:一类是参数假设检验;另一类是非参数假设检验。 2.假设基本形式:

H 0:原假设 H 1:备择假设 H 0: μ=μ0 H 1:μ≠μ0 3.假设检验基本原理

小概率原理:小概率事件在一次实验中几乎不可能发生。

4.显著性水平

①拒绝零假设的概率称为显著性水平α

②显著性水平和可靠程度(置信水平)之间的关系是:两者之和为1 (1)总体方差已知: (2)总体方差未知:(样本平均数与总体平均数离差统计量呈T 分布) 当样本容量大于三十,可按正态分布处理

例16:某小学历届毕业生汉语拼音测验分数为66分,标准差为10分,现以同样的试题测验应届毕业生(假设应届与历届毕业生条件基本相同)并从中随机抽取25份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?

例17.把例16中已知的历届总体标准差为十分放到抽取的25份试卷的标准差为10分,其余都一样.

例18.在例17的基础上,将抽取的25份试卷改为50份。

统计决断的两种错误

①第一类型错误——α错误:拒绝了属于真实的零假设。这种错误的可能性大小正是显著性水平的大小 ②第二类型的错误——β错误:保留了不真实的零假设。

A.对于一定样本容量的n ,不能同时做到两类错误的概率都很小。如果减小α错误,就会增长犯β错误的机会,若减小β错误,也会增大犯α错误的机会。

B.使α、β同时变小的办法就是增大样本容量。

C.一般地说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首类控制目标。但在假设检验中,一般首先控制犯α错误。

第六章:平均数差异检验

一、样本平均数差异检验假设

H 0:μ1-μ2=0 H 1:μ1-μ2≠0 1.样本平均数的分布

①当两个样本所取值的总体呈现正态分布时,样本平均数也呈现正态分布 ②当总体标准差已知时,其离差统计量为:

当总体标准差未知时,离差统计量呈现T 分布。

二、相关样本平均数差异的显著性检验

不同样本数据之间存在一一对应的关系,例如:同一群被试接受两次测验 (一)小样本

1

-2--212

2212

1n r

s s s s x x t +=

用差来算: 1

-)(

--1

-2--2

1

122

12122

21

21n n

d

n

d x x n r

s s s s x x t n

i i

n

i i ∑∑===

+=

(二)大样本 30以上

1

-2--z 212

2212

1n r

s s s s x x +=

例19.某班学生两次智力测验结果,这两次测验的结果有差异么?

学号 得分 学号 得分 1 103 1 107 2 114 2 85 3 129 3 110 4 105 4 94 5 103 5 108 6 97 6 92 7 102 7 113 8 108 8 108 9 102 9 122 10

87

10

107

三、独立样本平均数差异的显著性检验 (一)小样本

1.两个总体方差相同

使用两个样本的联合方差来估计总体方差。 2.两个总体方差不同 临界值求法:

(二)大样本:T 分布近似于正态分布,用Z 分布。

例20.在甲乙两个工厂生产的蓄电池中,分别取5个测电容量,数据如下: 甲厂:143 141 138 142 140 乙厂:141 143 139 144 141

假设两个总体方差齐性,问两厂电池的电容量有无显著差异?

例21.从某地区6岁儿童中随机抽取男生30人,平均身高114cm ,随机抽取女生27人,平均身高为112.5cm ,已知该地区六岁男童身高标准差为5cm ,6岁女童身高标准差为6.5cm ,请问,该地区6岁儿童身高是否有性别差异?

例22.对某班级25个学生进行英语口语培训。在培训前和培训后分别进行两次英语口语测试,

平均数分别是76和82,标准差分别是12.5和14.3,相关系数为0.65,请问英语口语培训是否有效果?

第七章:方差分析

一、基本原理:当存在多个平均数时,比较其差异可采用方差分析 (1)方差分析中的术语

1、因素或处理:因素是影响因变量变化的条件,即自变量。

2、水平:因素的不同等级称作水平。水平值取有限的离散值。如:性别中的0,1(男、 女)等。

3、单元:指各因素不同水平之间组合。如性别(0,1)和年龄(10,11,12)的六种组合。 (2)基本前提

1、效应的可加性:各个处理效应以及误差效应是可加的。

2、分布的正态性:总体呈正态分布

3、方差的同质性:各处理内方差齐性

(3)方差分析基本原理:认为不同处理组的均值差异基本来源有两个:

(1)随机误差:即由不可控的随机因素造成的差异,称为组内差异。用组内平方和的总和 表示, 记作SSw 。

(2)实验条件:即由不同的因素水平造成的差异,称为组间差异。用组间平方和的总和表 示,记作SSb 。

组内SSw 、组间SSb 除以各自的自由度(组内dfw =n-m ,组间dfb=m-1,其中n 为样本总数,m 为组数),得到其均方MSw 和MSb :一种情况是处理没有作用,即各组样本均来自同一总体, MSb/MSw ≈1。另一种情况是处理确实有作用,那么, MSb>>MSw 。

MSb/MSw 比值构成F 分布,用F 值与其临界值比较,推断各样本是否来自相同的总体. F 分布(费舍尔分布)

1.从方差相同的两个正态总体中,随机抽取两个独立样本,其方差之比形成F 分布

2.方差分析的基本假设

H0:m 组样本均值都相同,即μ1= μ2=....= μm H1:至少有两组样本均值不同,即μi μj

二、单因素方差分析

1.含义:只包含一个因素的方差分析

2.假设某单因素实验有k 个处理水平,每个水平有n 个被试,共有nk 个观测值。

3.方差分析的基本步骤

①总偏差平方和的分解:总偏差平方和是各观测值与总平均数的离差平方和,记为SST

②总平方和=组间平方和+组内平方和 SST =SSb+SSw ③组间平方和反映各处理水平的变异,记作SSb

SSb= ④组内平方和反映各处理水平内的变异即随机误差,记作SSw 或SSe

∑∑

==-=k i n

j ij T x x SS 11

2

..)(∑=-k

i i

x x n 12

..).(∑∑==-=k i n

j i ij e x x SS 11

2

.)(

2、计算自由度

各部分偏差平方和除以各自的自由度便可得到总均方、处理间均方和处理内均方, 分别记为 MSt 、MSb 和MSw 。

3、进行F 检验

例23.在某项技能训练中使用5种训练方法,试验结果见下表,试分析不同训练方法的效果有无差异?

三、多因素方差分析

1.包含两个及以上因素的方差分析

2.存在A 、B 两个因素,A 因素分a 个水平,B 因素分b 个水平 。 两者交叉搭配形成ab 个水平组合。(下表)

观测值的总变异可以分解为 A 因素水平间变异、B 因素水平间变异、AB 交互作用、组内变异。

总平方和

A 因素偏差平方和

B 因素偏差平方和

组间偏差平方和

误差平方和 SSe=SST-SSb

训练方法

成绩(xij )

合计

平均

方差

A1 25.6 24.4 25.0 25.9 A2 27.8 27.0 27.0 28.0 A3 27.0 27.7 27.5 25.9 A4 29.0 27.3 27.5 29.9 A5

20.6

21.2

22.0

21.2

w

b t df df df +=)

1(11-=-=-=n k df k df kn df w b t b

b b df SS MS /=t

t t df SS MS /=w

w w df SS MS /=w

b MS MS F /

=)

,,2,1;,,2,1;,,2,1()(n k b j a i x e

ij j i ijk ===++++=εαββαμe

AB B A T e AB B A T df df df df df SS SS SS SS SS +++=+++=2

1 (11)

)(∑∑∑===-=a i b j ijk n

k T x x SS 2

...1.)(x x bn SS a

i i A -=∑=2

...1

.)(x x an SS b

j j B -=∑=2

(11)

)(x x n SS b

j ij a

i b -=∑∑==

交互平方和 SSAB=SSb-SSA-SSB 总自由度 dfT=abn-1 组间自由度 dfb=ab-1 组内自由度 dfw=ab(n-1) A 因素自由度 dfA=a-1 B 因素自由度 dfB=b-1

交互自由度 dfAB= dfb - dfA – dfB =(a-1)(b-1)

例24.以下是3种教学方法对使用3种不同教材的教学效果影响结果,试作方差分析。

3.随机区组设计的方差分析

1.把被试分成若干个区组,每个区组内尽可能同质

2.可以把区组变异从组内变异中分离出来

3.SSw =SSr+SSe SSr= 区组自由度 dfb=n-1

例25.在某项技能训练中使用5种训法,试验结果下表,试分析不同训练方法的效果有无差异?

训练方法 成绩 合计 平均 方差 A1 25.6 24.4 25.0 25.9 A2 27.8 27.0 27.0 28.0 A3 27.0 27.7 27.5 25.9 A4 29.0 27.3 27.5 29.9 A5

20.6

21.2

22.0

21.2

方法(A )

教材(B ) B1 B2 B3

A1

8

7 6

8 7 5

8 6 6

A2

9

7 8

9 9 7

8 6 6 A3

7

8 10 7 7 9 6

8

9

变异来源

平方和

自由度

均 方

F 值

显著性

A 因素

6.23

2

3.12

5.29

*

B 因素

1.56

2

0.78

1.32

A ×B

22.21

4

5.55

9.41

**

误 差

10.67

18

0.59

总变异

40.67

26

w

AB AB w B B w A A MS MS F MS MS F MS MS F ///===∑

=-n

r r x x k 12..).(,

//,/,/AB AB df SS MS df SS MS df SS MS df SS MS AB e

e e B B B A A A ====

四、事后检验——q 检验 1.将各组平均数从大到小排好 2.

第八章:卡方检验 1.卡方检验主要用于对总体分布形态的假设检验。

2.卡方检验公式:∑-=t

t f f f X 2

02

)( 0f 为实际频数;t f 为理论频数

实际频数:指在试验或调查中得到的频数。

理论频数:指根据各种理论次数分布计算出来的频数。 3.卡方检验的一般步骤。

① 首先做出假设

② 然后计算2

x 值

③ 最后根据2x 值出现的概率判断假设是否成立。

例26.正常情况下中国婴儿的性别比为:男51:女49。某地区的婴儿性别比为男婴4619人,女婴4159人,试问该地区的新生儿性别比正常吗?

4.当自由度为1时且某一组理论频数小于5,2

x 公式应做连续校正。

∑-=t

t f f f X 2

02)5.0-(

二、独立性检验:当数据按照两种标准分类时,对于这两种分类标准是否独立所进行的检验。 1、假设某种标准分为r 类,另一种标准分为c 类,则:

N

nc

nr f t ?= 1)-1)(c -(r =df 例27.将苗鸡放进鸡舍前先将鸡舍消毒。检验消毒能否减轻苗鸡的发病情况,先后作了一些实验得数据如下:

发病 不发病 合计 消毒 300 920 1220 不消毒 580

630 1210 合计

880

1550

2430

2.R ×C 表:当行>2,列>2时,2×2表就变成R ×C 表或称列联表。

例:检验教学方法A 、B 、C 与学生成绩(优良中差)是否有关,设计如下试验 等级 A B C 合计 优 22 18 16 56 良 18 16 14 48 中 11 13 14 38 差

8

11 10 29 合计 59

58

54

171

3.四格表(分为独立样本和相关样本 独立样本: 组别 优

n

MS x x q W

2

1-=

d)

d)(b c)(c b)(a (a )-d (22

++++?=N

bc a x

当N 小于30,公式应当作连续型校正: d)

d)(b c)(c b)(a (a )5.0-bc -ad (22++++?=N N x

相关样本 c

b c)-(b 2

2

+=x

当b+c 小于30时,公式应做连续性校正:c

b 1)-

c -b (2

2

+=

x

例题1某小学历届毕业生汉语拼音测验平均分数为66分,标准差为10分。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽取25份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?

例题2某小学历届毕业生汉语拼音测验平均分数为66分。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽取25份试卷,算得平均分为69分, 标准差为10分。问该校应届与历届毕业生汉语拼音测验成绩是否一样?

例2 从某地区6岁儿童中随机抽取男生30人,平均身高为114cm ,随机抽取女生27人,平均身高为114cm ,已知该地区 6岁男童身高标准差为5cm ,6岁女童身高标准差为6.5cm ,请问该地区 6岁儿童身高是否有性别差异?

在某项技能训练中使用5种训练方法,试验结果见下表,试分析不同训练方法的效果有无差异?

训练方法(Ai ) 成绩(xij ) 合计

(xi.)

平均 方差Si2

A1 25.6 24.4 25.0 25.9 A2 27.8 27.0 27.0 28.0 A3 27.0 27.7 27.5 25.9 A4 29.0 27.3 27.5 29.9 A5 20.6 21.2

22.0

21.2

等 教学方法 合 级 A B C 计 优 22(19.32) 18(18.99) 16(17.68) 56 良 18(16.56) 16(16.28) 14(15.16) 48 中 11(13.11) 13(12.89) 14(12.0 ) 38 差 8(10.01) 11 (9.84) 10(9.16) 29

和 59 58 54 171

例题为研究高考的预测效度,在被录取的高考考生中随机抽取10人,其高考测验得分为(X ),对他们进行跟

踪研究,求得他们大学一年级有关科目平均分数(Y ),求该测验的效度。

A a b a+b

B c d c+d

a+c

b+d

组别 优 良 优 a b 良

c

d

X 74 71 80 85 76 77 77 68 74 74 756 Y

82

75

81

89

82

89

88

84

80

87

837

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

《教育统计学》超详细知识点及重点笔记

华东师大心理统计学大纲 教材:《教育统计学》 第一章绪论 第一节什么是统计学和心理统计学 一、什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 统计学分为两大类。一类是数理统计学。它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。它是数学的一个分支。另一类是应用统计学。它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。应用统计学是与研究对象密切结合的各科专门统计学。 二、统计学和心理统计学的内容 统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。 1.描述统计 对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。 2.推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。推断统计的内容包括总体参数估计和假设检验两部分。 3.实验设计 实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。 以上三部分内容,不是截然分开,而是相互联系的。 第二节统计学中的几个基本概念 一、随机变量 具有以下三个特性的现象,成为随机变量。第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。随机现象的每一种结果叫做一个随机事件。我们把能表示随机现象各种结果的变量称为随机变量。统计处理的变量都是随机变量。 二、总体和样本 总体是我们所研究的具有共同特性的个体的总和。总体中的每个单位成为个体。样本是从总体中抽取的作为观察对象的一部分个体。当总体所包含的个数有限时,这一总体称为有限总体。而总体所包含的个数无限时,则称为无限总体。样本中包含的个体数目称为样本的容量,一般用n来表示。一般来说,样本中个体数目大于30称为大样本,等于或小于30称为小样本。在对数据进行处理时,大样本和小样本所用的统计方法不一定相同。 三、统计量和参数

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

统计学20个重点知识整理

一、统计的含义及其之间的关系 统计一词一般有三种含义,即统计工作、统计资料和统计学。 1、统计工作即统计实践活动,是指按照调查研究的任务,对社会经济现象的数量方面进行搜集资料、整理资料和分析运用资料等一系列调查研究的工作过程。 2、统计资料是指反映社会经济现象特征的各项数字资料以及与之有联系的其他资料,包括调查阶段搜集的原始资料,经过加工整理和分析后的图标和文字资料等系统资料。 3、统计学是研究怎样进行社会经济统计活动的方法论科学,它阐述了统计研究社会经济现象的数量和数量关系时应该遵循的原理、原则和采用的方法等,是系统化的知识体系。 4、关系:统计资料是统计工作的成果,是对社会经济现象进行统计研究的基础;统计学是统计活动经验的科学总结和理论概括,统计学来源于实践,又高于实践,对统计实践起着指导的作用;统计工作要以统计学的理论为指导,并检验和发展统计理论。 二、统计总体和统计单位及其之间的关系 1、统计总体:是由客观存在的、具有某种共同性质的许多个别单位所构成的整体,简称总体。 2、统计总体的特征:大量性、同质性、差异性 3、总体单位:构成统计总体的个别事物 4、例:要研究某一乡镇企业的职工素质情况,则该乡镇企业的全体人员构成一个总体,其中每一个职工就是总体单位。 5、关系:a.总体由总体单位组成; b.组成总体的个体是有差别的; C.根据统计研究目的的不同,总体与总体单位是可以相互转化的。 三、统计指标和统计标志之间的关系 两者之间既有明显的区别,又有密切的联系。主要区别在于: 1、指标说明总体特征;而标志则说明总体单位特征; 2、统计指标必须是可量的;统计标志未必都是可量的; 3、统计指标具有综合性;而统计标志一般不具有综合性; 两者之间的主要联系在于: 1、许多统计指标的指标数值是从总体单位的数量标志值汇总而来; 2、指标与标志之间存在着变换关系; 例如:要了解我国粮食生产状况,则我国的粮食总产量是指标,而某省的粮食总产量是标志。 四、一个完整的统计调查方案包括的内容 1、确定调查目的; 2、确定调查对象和调查单位; 3、确定调查项目,设计调查表; 4、确定调查时间和方法; 5、制定调查工作的组织实施计划 五、统计调查的分类 1、按统计调查方式的不同,可分为定期统计报表和专门调查; 2、按调查总体包括的范围不同,可分为全面调查和非全面调查; 3、按调查登记的时间是否具有连续性,可分为经常性调查和一次性调查; 4、按统计调查是否具有强制性,可分为政府统计调查、民间统计调查和涉外社会调查; 5、按收集资料的方法,可分为直接观察法、报告法、采访法和问卷法

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

统计学第三版 复习重点

统计学复习重点 1、理解描述统计学与推断统计学(p5-6) 2、熟悉定量数据与定性数据的图表描述,常用图表 3、理解教材p51思考题T1、T2、T3、T5、T7、T10 4、熟练掌握加权算术平均数、标准差、标准差系数的计算方法(参考教材 p55T11、T13) 5、理解样本均值、样本比例的抽样分布及中心极限定理 6、理解点估计的三个评价标准,区间估计的有关概念(置信度、估计精度、区 间宽度等) 7、熟练掌握总体均值、总体比例的区间估计方法、样本容量的计算方法(参考 p129例题4.2、p131例题4.4、p142例题4.12、例题4.13) 8、理解样本容量与置信水平、总体方差、允许误差间的关系 9、理解假设检验的原理、步骤及两类错误、p值 10、熟练掌握总体均值、总体比例的假设检验方法(参考教材p159例题5.4、5.5、 5.6、5.8) 11、理解方差分析的相关概念、原理及基本步骤 12、熟练掌握单因素方差分析方法,理解单因素方差分析表的内在联系(参考教材p194表6.5、6.6、p210T3) 13、熟练掌握一元线性、多元线性回归分析方法及相关概念、重点熟悉Excel回归分析输出表的内在联系(参考教材p227表7.4、p241表7.6、p249T4) 14、熟练掌握时间序列的速度分析(参考教材p287习题1、2、3) 15、理解时间序列的组成因素及两类模型 16、熟悉选择拟合时间序列趋势模型的分析方法、常用模型(如指数曲线模型) 17、理解加权综合指数(拉氏指数和帕氏指数)、理解指数体系中的恒等式 18、熟练掌握总量指标的两因素分析方法(参考教材p306例题9.4) 19、理解CPI指数及其经济意义,CPI指数与购买力指数的关系 20、理解构建综合评价指数的基本问题(p312)

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

2017年秋教育统计学答案(20200627082742)

综合作业20170802 1. (单选题)从含有N 个元素的总体中抽取n 个元素作为样 本,使得总体中的每一个元素都有相同的机会(概率)被抽中, 这样的抽样方式称为( )(本题6.0分) 简单随机抽样 整群抽样 系统抽样(等距抽样) 分层抽样(类型抽样) 学生答案:A 标准答案:A 解析: 得分:6 2. (单选题)从含有N 个元素的总体中抽取n 个元素作为样 本,使得总体中的每一个样本量为 n 的样本都有相同的机会(概 率)被抽中,这样的抽样方式称为( )(本题6.0分) A 、简单随机抽样 3 B 、整群抽样 B c 、系统抽样(等距抽样) D 、分层抽样(类型抽样) B 、

学生答案:A 标准答案:D 解析: 得分:0 3. (单选题)从总体中抽取一个元素后,把这个元素放回到总 体中再抽取第二个元素,直至抽取n 个元素为止,这样的抽样方 法称为()(本题6.0分) 重复抽样 不重复抽样 整群抽样 分层抽样(类型抽样) 学生答案:A 标准答案:A 解析: 得分:6 4. (单选题)一个元素被抽中后不再放回总体, 然后再从所剩 下的元素中抽取第二个元素, 直至抽取n 个元素为止,这样的抽 样方法称为()(本题6.0分) B 、

3 A 、重复抽样 3 B 、不重复抽样 3 c 、整群抽样 d D 、 分层抽样(类型抽样) 学生答案:B 标准答案:B 解析: 得分:6 5. (单选题)在抽样之前先将总体的元素划分为若干类,然后 为()(本题 6.0分) 简单随机抽样 整群抽样 系统抽样(等距抽样) 分层抽样(类型抽样) 学生答案:D 标准答案:D 解析: 得分:6 从各类中抽取一定数量的元素组成一个样本, 这样的抽样方式称 B 、

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

教育统计学

第一章绪论 一、什么是教育统计学 1.什么是统计学 统计学是研究统计原理和方法的科学。它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 统计学的分为数理统计学和应用统计学两类。 2.什么是教育统计学 教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。 教育统计学的主要任务是研究如何搜集、整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。 3.统计学和教育统计学的内容 (1)描述统计 对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。包括归组、编表、绘图等数据整理工作和计算各种特征量反映其分布特征。 (2)推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测,这种统计方法称为推断统计。包括总体参数估计和假设检验两部分。(3)实验设计 实验者为了揭示实验中自变量与因变量的关系,在实验之前所制订的实验计划,称为实验设计。包括抽样设计、样本容量计算、确定实验对照形式、实现实验组和对照组的等组化、安排实验因素、控制无关因素以及用什么统计方法处理及分析实验结果等等。 (4)三者的关系 描述统计是推断统计的基础,推断统计通过样本信息估计、推测总体,从已知情况估计、推测未知情况。良好的实验设计才能使我们获得真实的有价值的数据,对这样的数据进行统计处理才能得出正确的结论。 二、统计学中的几个基本概念与符号 1.随机变量 (1)随机现象与随机事件:随机现象具有以下三个特征:一次试验有多种可能结果,其所有可能结果是已知的;试验之前不能预料哪一种结果会出现;在相同的条件下可以重复试验。随机现象的每一种结果叫做一个随机事件。 (2)随机变量:这些随机事件在一次试验中,可能出现,也可能不出现,而在大量重复试验中,它们的发生却具有一定的规律性。我们把能表示随机现象各种结果的变量称为随机变量。统计处理的变量都是些随机变量。每个随机事件往往表现为一种数值。对于不是以数值表示的随机事件,可以将之数量化。 (3)变量的类型 ①离散变量/间断变量:数据的取值只能在固有的单位上计算,而不能划分更小的单位。如人数、名次、等级。 ②连续变量:数据的取值不仅可以在固有单位上计算,而还能划分为其他若干单位。 教材23页练习2:识别下列观察值所属的变量是连续变量还是间断变量。2.总体、样本和个体 (1)总体:具有某种共同特性的个体的总和。(人+物) (3)样本:从总体中抽取的作为观察对象的一部分个体。 (4)样本中包含的个体数目称为样本的容量,一般用n表示。样本中个体数目大于30一般称为大样本,等于或小于30称为小样本。在有些情况下对数据进行统计处理时,大样本和

教育统计学答案

(0282)《教育统计学》复习思考题答案 一、填空题 1. 统计学是研究统计原理和方法的科学。 2.我们所研究的具有某种共同特性的个体总和称为总体。 3.一般情况下,大样本是指样本容量超过30 的样本。 4.表示总体的数字特征的特征量称为参数。 5.要了解一组数据的集中趋势,需计算该组数据的集中量。 6. “65、69、72、87、89”这组数据的算术平均数是76.4 。 7. “78、69、53、77、54”这组数据的中位数是69 。 8. 6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是145厘米。 9. 要了解一组数据的差异程度,需计算该组数据的差异量。 10.有7个学生的语文成绩分别为:80、65、95、70、55、87、69分,他们的全距是40分。 11.若某班学生数学成绩的标准差是5分,平均分是85分,其差异系数是5.88% 。 12.比较某班学生在身高和体重两方面的差异程度,要把学生身高和体重的标准差转化为差异系数。 13.两个变量之间不精确、不稳定的变化关系称为相关关系。 14.要描述两个变量之间变化方向及密切程度,需要计算相关系数。 15. 若两个变量之间存在正相关,则它们的相关系数是正数。 16.若两个变量之间的相关系数是负数,则它们之间存在负相关。 17.质与量的相关分析的方法主要包括二列相关、点二列相关和多系列相关。 18.品质相关的分析方法包括四分相关、Φ相关和列联相关。 20. 某班50个学生中有30个女生,若随机抽取一个同学,抽到男生的概率是2/5。 21.某一种统计量的概率分布称为抽样分布。 22.平均数差异显著性检验中需要判断两个样本是相关样本还是独立样本。 23. 单纯随机抽样能保证抽样的随机性和独立性。 24. χ2检验的数据资料是点计数据。 25. 单向表是把实测的点计数据按一种分类标准编制而得的表。 26. 单向表χ2检验是对单向表的数据进行χ2检验,即单因素的χ2检验。 27. 双向表是把实测的点计数据按两种分类标准编制而得的表。 28. 双向表χ2检验是对双向表的数据进行的χ2检验,即双因素的χ2检验。 29.假设检验的方法包括参数检验和非参数检验。 30.符号秩次检验属于非参数检验。 31.标准正态曲线在Z=0处为最高点。 32.直条图是表示间断变量的统计图。 33.直方图是表示连续变量的统计图。 34.教育统计资料的来源主要是经常性资料和专题性资料。 35.教育调查从范围来看,可分为全面调查和非全面调查。 36.对数据进行统计分类的标志按照形式可分为性质类别和数量类别。 二、简述题 1.简述教育统计学的研究对象和内容。 教育统计学的主要任务是研究如何搜集、整理、分析有关教育研究和教育实践工

《教育统计学》名词解释重点

第一章绪论 1,教育统计学是运用数理统计学的原理来研究教育问题的一门应用科学。 2,教育统计学分为描述统计、推断统计和实验设计三类。 (1)描述统计:计算集中量(算术平均数、中位数、众数、加权算术平均数、几何平均数、调和平均数)来反映集中趋势;计算差异量(全距、四分位距、百分位距、平均差、标准差、差异系数)反映离散程度;计算偏态量及峰态量反映分布形态;计 算相关量(积差相关系数、等级、点二列、二列、四分、C相关系数、肯德尔和谐 系数、多系列相关系数)反映一致性程度。 (2)推断统计包括总体参数估计和假设检验两部分。 3,随机现象三个特性:一,一次试验有多种可能的结果,其所有结果是已知的;二,试验之前不能预料那一种结果会出现;三,在相同条件下可以重复试验。 随机事件:随机现象的每一种结果。 随机变量:把能表示随机现象各种结果的变量称之 4,总体:是我们研究的具有某种共同特性的个体的总和。 样本数目大于30称为大样本,小于等于30称为小样本。 第二章数据的初步整理 1,教统资料来源有经常性资料和专题性资料。 专题性资料包括(1)教育调查。按调查方法分为现情调查、回顾调查和追踪调查;按调查范围分全面调查和非全面调查(抽样调查和典型调查)。(2)教育实验。分为单组实验(指对同一实验对象先后实施两种实验处理)、等组实验(指在甲乙两组条件基本相同的情况下,对之实行不同的实验处理)和轮组实验(指在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次,也即每个或多个单组实验的联合) 2,数据的分类。按来源分为点计数据和度量数据;按随机变量取值情况分为间断型随机变量(取值个数有限、独立的、两个单位之间不能再划分细小单位、一般用整数表示,如优劣程度、品德爱好打分)和连续性随机变量(个数无限、单位之间可以再划分、可以用小数表示如身高体重、完成作业的时间等)。 3,频数分布表制作步骤:求全距;决定组数和组距;决定组限;登记频数。 4,用累计频数表示的频数分布表称为累计频数分布表。 第三章集中量 1,集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。 2,加权平均数:是不同比重数据(或平均数)的平均数。 几何平均数:是n个数值连乘积的n次方根。 调和平均数:是一组数据倒算的算术平均数的倒数,亦称倒数平均数。 第四章差异量 1,差异量是指表示一组数据变异程度或离散程度的量。差异量越大,表示数据分布越广,越不整齐;相反,表示分布越集中,变动范围越小。 2,全距是一组数据中最大值与最小值之差,又称极差,用R表示。 四分位距是指用依一定顺序排列的一组数据中间部分50%个频数距离的一半作为差异量指标。四分位距就是第三个四分位数(第75百分位数)与第一个四分位数(第25半分位数)差的一半。 百分位距是指两个百分位数之差。常用的有两种:一为第90与第10百分位数之差;一为第93与第7百分位数之差。 3,标准差越大,表明离散程度越大,即数据越参差不齐,分布范围越广。

0282《教育统计学》

1、标准分数的数值大小和正负,可以反映其原始数据在团体中的位置。 A.√ 2、通过计算所搜集数据的算术平均数来反映变量分布的离散趋势。 B.× 3、点计数据是计算个数所获得的数据。 A.√ 4、假设检验一般有两个相互对立的假设。 A.√ 5、算术平均数是所有观察值的总和除以总频数所得之商。 A.√ 6、标准差是离差平方的算术平均数。 B.× 7、学生某科考试成绩属于随机变量。 A.√ 8、几何平均数是不同比重数据的平均数。 B.× 9、用量尺测得的学生身高数据属于测量数据。 A.√ 10、t分布是一种标准正态分布。 B.× 11、直条图是表示连续变量的统计图。 B.× 12、统计推断包括参数估计和假设检验。 A.√ 13、样本上的数字特征称为样本容量。 B.× 14、用同一测验对同一组被试在实验前后进行两次测验,所获得的两组测验结果属于相关样本。 A.√ 15、在分层抽样中,将总体分层的基本原则是各层内部以及层与层之间差异都要大。 B.× 16、点估计是直接用样本统计量的值估计相应总体参数的值。 A.√ 17、数据60、45、90、66、80的中位数是90。 B.× 18、分层抽样是按照与研究内容有关的因素或指标把总体划分成几部分(即几个层),然后从各层中进行单纯随机抽样或机械抽样的抽样方法。 A.√ 19、机械抽样的基本方法是:排序、确定间隔、抽取个体。 A.√ 20、机械抽样是把总体中所有的个体按一定顺序编号,然后依固定的间隔取样的抽样方法。 A.√ 21、统计图的标题要写在图形上方。 B.× 22、统计表的标题要写在表的下方。 B.× 23、样本内个体数值的分布称为某种统计量的抽样分布。 B.× 24、差异系数是方差与算术平均数的百分比。 B.×

《统计学原理》作业参考答案

《统计学原理》作业(三) (第五~第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×) 5、抽样极限误差总是大于抽样平均误差。(×) 6、相关系数是测定变量之间相关关系的唯一方法(×) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。 8、利用一个回归方程,两个变量可以互相推算(×)。 9、估计标准误指的就是实际值y与估计值y c的平均误差程度(√)。 10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 12、在一定条件下,施肥量与收获率是正相关关系。(√) 二、单项选择题 1、在一定的抽样平均误差条件下(A)。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是(C)。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于(C)时,成数的方差最大。 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C)。 A、等于78% B、大于84% c、在此76%与84%之间D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。 A、甲厂比乙厂大 B、乙厂比甲厂大 C、两个工厂一样大 D、无法确定

教育统计学和答案

《教育统计学》作业 本课程作业由两部分组成。第一部分为“客观题部分”,由15个选择题组成,每题1分,共15分。第二部分为“主观题部分”,由简答题和论述题组成,共15分。作业总分30分,将作为平时成绩记入课程总成绩。 客观题部分: 一、选择题(每题1分,共15题) 1、下列分布中哪一种是单峰对称分布?( ) A. F分布 B. χ2分布 C. t分布 D.二项分布 2、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( ) A.全距 (差异量) B.四分位距(差异量) C.方差(差异量) D.标准差(差异量) 3、总体不呈正态分布,从该总体中随机抽取容量为1000的一切可能样本的平均数的分布接近于:( ) A.二项分布 B. F分布 C.t分布 D.正态分布 4、检验某个频数分布是否服从正态分布时需采用:( ) A. Z检验 B. t检验 C.χ2 检验 D. F检验 5、对两组平均数进行差异的显著性检验时,在下面哪种 情况下不需要进行方差齐性检验?( ) A. 两个独立样本的容量相等且小于30; B. 两个独立样本的容量相等且大于30; C. 两个独立样本的容量不等,n1小于30,n2大于30; D. 两个独立样本的容量不等,n1大于30,n2小于30。 6、下列说法中哪一个是正确的?( )

A.若r1=0.40,r2=0.20,那么r1就是r2的2倍; B.如果r=0.80,那么就表明两个变量之间的关联程度达到80%; C.相关系数不可能是2; D.相关系数不可能是-1。 7、当两列变量均为二分变量时,应计算哪一种相关?( ) A.积差相关(两个连续型变量) B.φ相关 C.点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D.二列相关 (两个连续型变量,其中之一被人为地划分成二分变量。) 8、对多组平均数的差异进行显著性检验时需计算:( ) A.F值 B. t值 C. χ2 值 D.Z值 9、比较不同单位资料的差异程度,可以采用何种差异量?() A.差异系数 B.方差 C.全距 D.标准差 10、教育统计学科的基本结构是() A. 描述统计学、量化统计学 B. 描述统计学、推断统计学、量化统计学 C. 描述统计学、推断统计学、多元统计 D. 描述统计学、多元统计、量化统计学 11、统计分析包括() A. 多元分析与方差分析 B. 回归分析与区间分析 C. 方差分析与区间分析 D. 回归分析与方差分析 12、从自变量的一个取值去估计因变量的相应取值的完整分析与计算过程称为() A. 多元分析 B. 回归分析 C. 方差分析 D. 区间分析 13、回归分析的基本原理是() A. 最小二乘法 B. 点二列相关 C. 二列相关 D. 标准差 14、当一个测验多次测量的结果一致时,它就被认为是可靠的,这一个概念指是统计学中的() A. 信度 B. 效度 C. 一致性 D. 准确性 15、估计测量一致性程度的指标指的是() A.效度 B.一致性

相关文档
相关文档 最新文档