文档库 最新最全的文档下载
当前位置:文档库 › 教育统计学考试复习资料资料

教育统计学考试复习资料资料

教育统计学考试复习资料资料
教育统计学考试复习资料资料

第一章:1、何谓心理与教育统计学?学习它有何意义?

教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。

意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。

(3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。

2、教育科学研究数据的特点

(1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。

3、思考题:选用统计方法有哪几个步骤?

①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方

法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。②要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。

4、教育统计学的分类

(1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。

5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性

质。

具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。

6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。

具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。(2)总体参数的估计方法。(3)各种非参数的统计方法等。

7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系?

教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。

8、教育统计与心理统计的异同

相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。

9、数据的类型

(一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。

计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。

(二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。

称名数据只说明某一事物与其它事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小。

顺序数据是指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。

等距数据是具有相等单位,但无绝对零点的数据。

比率数据既表明量的大小,也有相等单位,同时还具有绝对零点的数据。

(三)按照数据是否具有连续性,把数据划分为离散数据和连续数据。

离散数据一般取整数,在两个单位之间不能再划分细小单位。

连续数据的单位可以划得很细微,细微的程度能达到只可想象而不能看见的程度。

10、思考题:统计量与参数之间有何区别和联系?

区别:①参数是从整个总体中计算得到的量数,通常是通过相应样本特征值来预测得到;统计量是从一个样本中计算出来的一些量数,它可以描述一组数据的情况。②参数代表总体的特性,它是一个常数;统计量代表样本的特性,它是一个变量,随着样本的变化而变化。③参数与统计量之间最明显的区别是参数常用希腊字母表示,而统计量常用英文字母表示。联系:从数值计算上讲,当总体大小已知并与实验观测的总次数相同时,统计量与参数是同一统计指标;当总体为无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。通过样本统计量,对总体参数做出预测和估计。

第二章:1、统计分组应注意的事项

(1)统计分组前的准备。将数据进行分组前,先要对观测数据做进一步的核对和校验。校核数据的目的是为了尽可能地消去记录误差,以便后续的统计分析建立在一个坚实的基础上。

(2)统计分组时应注意的问题。①分组要以被研究对象的本质特性为基础;②分类标志要明确,要能包括所有的数据。

2、分组次数分布表的意义与缺点

意义:编制分组次数分布表,可将一堆杂乱无序的数据排列成序。从表中可以发现各个数据的出现次数是多少,其分布的状态如何。

缺点:分组次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。根据这样的统计表提供的数据资料计算得到的平均值,会与用原始数据计算的值有一定的出入。

3、思考题:直方图、条形图、圆形图、线性图、散点图等这些常用的统计图,根据它们表现的作用和内容,

把它们可分为哪几类?

根据它们表现的作用和内容,把它们可分为五类。第一种是表现分布的图,比如直方图。第二种是表现内容的图,如条形图和圆形图。第三种是表现变化的图,这种图形的代表是线性图。第四种是表现比较的图,这几种图形都能采用。第五种是表现相关的图,如散点图。

4、条形图和直方图的区别。

(1)描述的数据类型不同。(2)表示数据多少的方式不同。(3)坐标轴上的标尺分点意义不同。(4)图形直观形状不同。

第三章:1、算术平均数的优缺点

算术平均数具备一个良好的集中量数所应具备的一些条件:

①反应灵敏;②严密确定;③简明易懂;④计算简单;⑤适合代数运算;⑥较少受抽样

变动的影响。除此之外,算术平均数还有以下一些特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数;②用加权法可以求出几个平均数的总平均数;③用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的真值,它是总体平均数的最好估计值;④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。

缺点:①易受极端数据的影响;②若出现模糊不清的数据时,无法计算平均数。

2、算术平均数的意义、适用条件及应用原则

意义:算术平均数是应用最普遍的集中量数,它是“真值”渐近、最佳的估计值。

适用的条件:一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,这时就需要用算术平均数表示其集中趋势。

原则:①同质性原则;②平均数与个体数值相结合的原则;③平均数与标准差、方差相结合的原则。

3、中数适用的情况

(1)当一组观测结果中出现两极端数目时;(2)当次数分布的两端数据或个别数据不清楚时;(3)当需要

快速估计一组数据的代表值时。

4、众数适用的情况

(1)当需要快速而粗略地寻求一组数据的代表值时;(2)当一组数据出现不同质的情况时;

(3)当次数分布中有两极端的数目时;4)当粗略估计次数分布的形态时。

第四章:1、思考题:为什么要引入差异量数来描述一组数据的特征?

在教育研究中,要全面描述数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。因此,只有集中量数不可能真实地反映它们的分布情况。为了全面反映数据的总体情况,除了使用集中量数外,还需要引入差异量数。

2、思考题:为什么说标准差是重要而完善的差异量?

(1)标准差具有简单明了,反映灵敏,严密确定,容易计算,适合代数运算,受抽样变动的影响较少等优点。

(2)标准差在避免两极端数值影响方面大大超过全距、百分位差和四分位差;在避免绝对值方面,优于平均差;在考虑单位方面,优于方差。

3、差异系数的应用

(1)同一团体不同观测值离散程度的比较(即不同单位资料差异程度的比较);(2)对于水平相差较大,但进行的是一种观测的各种团体,进行观测值离散程度的比较(即单位相同而平均数相差较大的两组资料差异程度的比较)。

应用差异系数比较相对差异大小时,应注意以下几点:

①测量的数据要保证具有等距尺度;②观测工具应具备绝对零;③差异系数只能用于一般的相对差异量的

描述,至今尚无有效的假设检验方法。

第五章:1、思考题:如何理解相关系数?

相关系数是两列变量间相关程度的数字表现形式。对于这一概念,我们可以从以下几个方面来理解:

(1)相关系数的取值在-1.00和+1.00之间;(2)相关系数的绝对值表示两个变量之间的相关强度,绝对值越接近1表示相关越强,越接近0表示相关越弱;(3)相关系数的正负号表示相关的方向,相关系数为正的表示正相关,相关系数为负的表示负相关;(4)相关系数可以比较大小,但不能进行加减乘除运算。

2、如何选择合适的相关系数?

选择计算相关系数的方法主要取决于要处理的数据的性质类别以及某一相关系数需要满足的假设条件。具体来说,为了选择一个合适的相关系数进行相关分析,要分以下几个步骤考虑:

(1)考虑每种测量所产生的数据属于什么类别,测查被试的哪种心理属性,是分类,还是排序,还是评定等级?是否给出确定的分数?(2)要对第一种测量数据和第二种测量数据的类别做出判断。是二分数据、等级数据,还是等距数据?(3)确定采用哪一种相关系数。

3、积差相关的适用资料

(1)要求成对的数据,即若干个体中每个个体都有两种不同的观测值。(2)计算相关的成对的数据的数目不宜少于30对。(3)两列变量各自总体的分布都是正态分布,至少两个变量服从的分布是接近正态的单峰分布。

(4)两个相关的变量是连续变量,也即两列数据都是测量数据。(5)两列变量之间的关系应是直线性的

第六章:1、测验分数的正态化步骤如下:

(1)将原始分数整理成次数分布表;(2)计算各分组上限以下的累加次数cf ;(3)计算每组中点的累加次数,即前一组上限以下的累加次数加上该组次数的一半;(4)各组中点以下的累加次数除以总数求累积比率;(5)将各组中点以下的累积比率视为正态分布的概率,查正态表,将概率转化为Z 分数;(6)将正态化的Z 值利用公式( T=10Z+50 )加以直线转化。

2、概率分布的类型

(1)按随机变量是否具有连续性来分类,可分为离散分布与连续分布。

(2)按分布函数的来源来分类,可分为经验分布(是指根据观察或实验所获得的数据而编制的次数分布或相对频数分布)与理论分布(一是指随机变量概率分布的函数—数学模型,二是指按某种数学模型计算出的总体的次数分布)。

(3)按概率分布所描述的数据特征来分类,可分为基本随机变量分布与抽样分布。

第七章:1、总体参数估计(简称参数估计)是指根据样本统计量对相应总体参数所作的估计。总体参数估计可分为点估计和区间估计。

2、点估计是指用样本统计量的值来估计相应总体参数的值。点估计的优点在于它能够提供总体参数的估计值;

缺点在于它总是以误差的存在为前提,但又不能提供正确估计的概率。

良好估计量的标准:无偏性、有效性、一致性、充分性

区间估计是指以样本统计量的样本分布为理论依据,按一定的概率要求,由样本统计量的值估计总体参数值的所在范围。优点是不仅给出一个估计的范围,是总体参数包含在这个范围之内,而且还能给出估计精度并说明估计结果的有把握的程度。缺点是无法具体指出总体参数等于什么。

第八章

1、思考题:假设检验这种反证法与一般的数学反证法有什么不同?

(1)数学反证法最终推翻假设的依据一定是出现了百分之百的谬误,因此推翻假设的决策无论是决策逻辑还是从决策内容看都是百分之百正确的。而假设检验的反证法最终推翻零假设的依据是一个小概率事件,从决策逻辑角度看是百分之百正确的,但其决策的内容却是有可能出错的。(2)数学中使用反证法,其最终结果一定是推翻原假设,而假设检验这种反证法的最终结果却有可能无充分理由推翻零假设。

2、在统计学中,通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异,这种推论过

程称作假设检验。

第九章:1、思考题:为什么不能用t检验对多个平均数的差异进行比较?

这是因为在假设检验中作统计决策冒有犯错误的风险。在对两个总体平均数作检验时,我们犯拒真错误的概率为α,结论正确的概率为1-α。而在对多个总体平均数作检验时,采用两两比较的方法,比较的次数会随总体的增多而迅速增多,假设共要比N次,那么连续次结论都正确的概率就是(1-α)N ,结论出错的概率为1-(1-α)N ,这个值会随着N的增大而迅速增大,这就不符合我们希望在一次检验中犯拒真错误的概率为α的要求了。所以,在对多个平均数作显著性检验时,不能用t检验对多个平均数的差异进行比较。

第十一章:1、非参数检验的特点

(1)非参数检验一般不需要严格的前提条件;(2)非参数检验特别适用于顺序资料(等级变量);(3)非参数检验很适合于小样本,且方法简单;(4)非参数检验最大的不足是未能充分利用资料的全部信息;(5)非参数检验目前还不能处理“交互作用”。

2、适用资料

秩和检验法与参数检验中独立样本的t 检验相对应。当“总体正态”这一前提不成立,不能使用t检验时以秩和检验法代替t 检验。当两个样本都为顺序变量时,也需使用秩和检验法来进行差异检验。

中数检验法与秩和检验法的适用条件基本相同,而且在非参数检验法中的地位也同秩和检验法相当,对应着参数检验中两独立样本平均数之差的t 检验。

所谓符号检验法是以正负号作为资料的一种非参数方法,它适用于相关样本的差异检验,与参数检验中相关样本差异显著性t 检验相对应。符号检验法也是将中数作为集中趋势的度量,主要用来检验与某些差值的中数有关的零假设。

符号等级检验法又称添号秩和检验法,其适条件与符号检验法相同,也适合配对比较,但它的精确度比符号法高。

克—瓦氏单向方差分析也称H 检验,作为非参数方法,它与参数方法中的完全随机资料方差分析相对应。

弗里德曼双向等级方差分析可解决随机区组实验设计的一些非参数检验问题。适合于配对组(随机区组)设计的多个样本进行比较。

第十二章:1、回归分析与相关分析的区别和联系是什么?

联系:它们通常都是基于两正态连续变量的假设,都是处理两变量间相互关系的统计方法,通常两种方法不同时出现在文章中。

区别:作为相互关系分析的方法,相关分析师通过提供一个相关系数来考察两变量间的联系程度,二回归分析则是重在建立两变量间的函数关系式,因此通常可以先考察相关系数的显著型,如果显著则可以进一步考虑建立变量间的回归方程。此外,相关分析和回归分析又各有一些具体方法用于处理不同的情况,如相关分析还包括等级相关、质量相关和品质相关,回归分析还包括非线性回归等。

2、线性回归的基本假设:(1)线性关系假设(2)正态性假设(3)独立性假设(4)误差等分散性假设

3、回归分析与相关分析的综合应用的具体步骤:(1)将成对资料绘制散点图,从散点图中点子的分布形状判

断和是否有线性关系;(2)建立回归方程;(3)回归方程显著性检验;(4)计算回归估计标准误差;(5)根据建立的回归模型进行预测,估计真值预测区。

4、回归分析与相关分析的关系:回归分析和相关分析均为研究及度量两个或两个以上变量之间关系的方法。

从广义上说,相关分析包括回归分析,但严格地讲,二者有区别。当旨在分析变量之间关系的密切程度时,一般使用相关系数,这个过程叫相关分析。倘若研究的目的是确定变量之间数量关系的可能形式,找出表达它们

之间依存关系的合适的数学模型,并用这个数学模型来表达这种关系形式,则叫做回归分析。

第十三章:1、因子分析的类别:(1) R型因子分析和Q型因子分析(2)探索性因子分析与验证性因子分析

2、多重回归方程中自变量的选择

(1)最优方程选择法(2)同时多重回归法(3)逐步多重回归法(4)层次多重回归法

第十四章:1、思考题:两阶段随机抽样与分层抽样有何区别?

从形式上看,两阶段抽样与分层抽样似乎都分成两步:第一步将总体分成若干部分,第二步再分别从部分中抽取个体,但二者在第一步中有着根本区别。在分层抽样中,对于每一个部分总体(即“层”)均需从中抽取个体,因而没有第一阶段样本的问题;而在两阶段抽样中,将总体分成若干个“集团”后,并不是对每一个集团都再进行第二阶段抽样,而是从所有的“集团”中先抽取一部分“集团”,这里实际上进行了第一阶段的抽样,构成了第一阶段样本,然后再对所选“集团”作第二阶段抽样。

2、抽样研究的特点和作用

(1)节省人力及费用;(2)节省时间,提高研究的时效性;(3)保证研究结果的准确性。

3、随机化是抽样研究的基本原则。最主要的抽样方法:简单随机抽样、分层抽样、等距抽样。

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

【精品】2019年大学专业课程★★教育统计学考试试题

【精品】2019年大学专业课程★★ 1.(方差已知区间估计) 某中学二年级语文同一试卷测验分数历年来的标准差为10.6,现从今年测验中随机抽取10份考卷,算得平均分为72,求该校此次测验平均成绩的95%置信区间。 解 72,10.610,10.95X n σα===-= [] 112 2 :72 1.96 1.9665.43,78.57x x α αμμ μ - - ? ?? -+=-?+????= 2(方差未知区间估计). 已知某校高二10名学生的物理测验分数为92、94、96、66、84、71、45、98、94、67,试求全年级平均分数的95%置信区间。 92949666847145989467 80.710 x +++++++++= = ()()1010222 21111310.999i i i i S x x x n x ==?? =-=-= ??? ∑∑ 17.632S = ( ( [] 112 2:1180.7 2.2622 2.262268.09,93.31x t n x t n ααμ--? ? --+-?? ?=-?+??= 3. 3.(方差未知单样本t 检验) 某区中学计算机测验平均分数为70.3,该区甲校15名学生此次测验平均分数为67.2,标 准差为11.4,问甲校此次测验成绩与全区是否有显著性差异? 01:70.3:70.3H H μμ=≠ 1.053x t = ==- ()()()0.97512 1114 2.1448t n t n α- -=-= 由于()0.9751.05314 2.1448t t =<=,接受0H ,甲校此次测验成绩与全区无显著性差异. 4(方差已知的单样本均值检验).某区某年高考化学平均分数为72.4,标准差为12.6,该区实验学校28名学生此次考试平均分数为74.7,问实验学校此次考试成绩是否高于全区平均水平? 01:72.4:72.4H H μμ=> 0.966x t == =

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

广东省2011年07月高等教育自学考试 00974《统计学原理》试题及答案

2011年7月高等教育自学考试 统计学原理试卷 (课程代码00974) 一、单项选择题(本大题共15小题,每小题1分,共15分)在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.统计的基本方法包括 A.调查法、汇总发、预测法B.调查法、整理法、分析法 C.大量观观察法、综合分析法、归纳推断法D.时间数列法、统计指数法、回归分析法 2.对统计数据建立某种物理的度量单位的亮度层次是 A.定类尺度B.定序尺度 C.定距尺度D.定比尺度 3.调查单位是 A.调查对象的全部单位B.负责向上报告调查内容的单位 C.调查项目和指标的承担者D.基层企事业单位 4.对连续变量分组,最大值所在组下限为1000,又知其相邻组的组中值为750,则最大值所在组的组中值为 A.1100 B.1200 C.1250 D.1500 5.某商场2006年彩电销量为10000台,年末库存100台,这两个绝对指标是 A.时期指标B.时点指标 C.前者是时点指标,后者是时期指标D.前者是时期指标,后者是时点指标 6.下列属于比较相对指标的是 A.我国人口密度为135人/平方公里B.某年我国钢产量为日本的80% C.2006年我国GDP比上年增长9% D.2006你我国城镇职工平均工资为12000元 7.在抽样调查中,抽取样本单位必须遵循 A.可比性原则B.同质性原则 C.准确性原则D.随机性原则 8.样本容量与抽样误差的关系是 A.样本容量越大,抽样误差越大B.样本容量越大,抽样误差越小 C.样本容量越小,抽样误差越小D.两者没有关系 9.对500名大学生抽取15%的比例进行不重置抽样调查,其中优等生为20%,概率为95.45%(t=2),则优等生比重的抽样极限误差为 A.4.26% B.4.61% C.8.52% D.9.32% 10.当一个变量变化幅度与另一个变量的变化幅度基本上是同等比例时,这表明两个变量之间存在着 A.函数关系B.复相关关系 C.线性相关关系D.非线性相关关系

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

教育统计学考试复习资料

第一章:1、何谓心理与教育统计学?学习它有何意义? 教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。 (3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。 2、教育科学研究数据的特点 (1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。 3、思考题:选用统计方法有哪几个步骤? ①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方 法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。②要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。 4、教育统计学的分类 (1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。 5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性 质。 具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。 6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。 具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。(2)总体参数的估计方法。(3)各种非参数的统计方法等。 7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系? 教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。 8、教育统计与心理统计的异同 相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。 9、数据的类型 (一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。 计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。 (二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

教育统计学试题库

教育统计学 一、选择题 1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B ) A. 全距( 差异量) B. 四分位距(差异量) C. 方差(差异量) D. 标准差(差异量) 2、总体不呈正态分布,从该总体中随机抽取容量为1000 的一切可能样本的平均数的分布接近于:( D ) A. 二项分布 B.F 分布 C. t 分布 D. 正态分布 3、检验某个频数分布是否服从正态分布时需采用:( C ) A. Z检验 B. t 检验 C. X 2检验 D. F 检验 4、对两组平均数进行差异的显著性检验时,在下面哪种情况下不需要进行方差齐性检验?( B ) A. 两个独立样本的容量相等且小于30; B. 两个独立样本的容量相等且大于30; C. 两个独立样本的容量不等,n1小于30, n2大于30; D. 两个独立样本的容量不等,n1大于30, n2小于30。 5、下列说法中哪一个是正确的?( C ) A. 若r1=0.40 , r2=0.20,那么r1 就是r2 的2 倍;

B. 如果r=0.80 ,那么就表明两个变量之间的关联程度达到80%; C. 相关系数不可能是2; D. 相关系数不可能是-1 。 6、当两列变量均为二分变量时,应计算哪一种相关?( B ) A. 积差相关(两个连续型变量) B. ?相关 C. 点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D. 二列相关(两个连续型变量,其中之一被人为地划分成二分变量。) 7、对多组平均数的差异进行显著性检验时需计算:( A ) A.F值 B. t 值 C. x 2 值 D.Z 值 8、比较不同单位资料的差异程度,可以采用何种差异量?( A ) A. 差异系数 B. 方差 C. 全距 D. 标准差 二、名词解释 1. 分层抽样:按与研究内容有关的因素或指标先将总体划分成几个部分,然后从各部分(即各层)中进行单纯随机抽样或机械抽样,这种抽样方法称为分层抽样。 2. 描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法称为描述统计。 3. 集中量:集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

教育统计学考试试题

1.(方差已知区间估计) 某中学二年级语文同一试卷测验分数历年来的标准差为10.6,现从今年测验中随机抽取10份考卷,算得平均分为72,求该校此次测验平均成绩的95%置信区间。 解 72,10.610,10.95X n σα===-= [] 112 2 :72 1.96 1.9665.43,78.57x x α αμμ μ - - ? ? ?-+=-?+????= 2(方差未知区间估计). 已知某校高二10名学生的物理测验分数为92、94、96、66、84、71、45、98、94、67,试求全年级平均分数的95%置信区间。 92949666847145989467 80.710 x +++++++++= = ()()1010222 21111310.999i i i i S x x x n x ==?? =-=-= ??? ∑∑ 17.632S = ( ( [] 112 2:1180.7 2.2622 2.262268.09,93.31x t n x t n ααμ- -? ? --+-?? ?=-?+??= 3. 3.(方差未知单样本t 检验) 某区中学计算机测验平均分数为70.3,该区甲校15名学生此次测验平均分数为67.2,标 准差为11.4,问甲校此次测验成绩与全区是否有显著性差异? 01:70.3 :70.3H H μμ=≠ 1.053t = ==- ()()()0.97512 1114 2.1448t n t n α- -=-= 由于()0.9751.05314 2.1448t t =<=,接受0H ,甲校此次测验成绩与全区无显著性差异. 4(方差已知的单样本均值检验).某区某年高考化学平均分数为72.4,标准差为12.6,该区实验学校28名学生此次考试平均分数为74.7,问实验学校此次考试成绩是否高于全区平均水平? 01:72.4 :72.4H H μμ=> 0.966x t == = ()()10.95127 1.7033t n t α--==???

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

《统计学原理》作业参考答案

《统计学原理》作业(三) (第五~第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×) 5、抽样极限误差总是大于抽样平均误差。(×) 6、相关系数是测定变量之间相关关系的唯一方法(×) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。 8、利用一个回归方程,两个变量可以互相推算(×)。 9、估计标准误指的就是实际值y与估计值y c的平均误差程度(√)。 10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 12、在一定条件下,施肥量与收获率是正相关关系。(√) 二、单项选择题 1、在一定的抽样平均误差条件下(A)。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是(C)。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于(C)时,成数的方差最大。 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C)。 A、等于78% B、大于84% c、在此76%与84%之间D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。 A、甲厂比乙厂大 B、乙厂比甲厂大 C、两个工厂一样大 D、无法确定

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

相关文档
相关文档 最新文档