文档库 最新最全的文档下载
当前位置:文档库 › 第五讲 心理学研究的信度和效度

第五讲 心理学研究的信度和效度

第五讲 心理学研究的信度和效度
第五讲 心理学研究的信度和效度

第五讲心理学研究的信、效度

长江大学教育科学系严磊

研究设计的主要目标是特高整个研究的科学性水平,即保证研究结果、结论能真实的反映人的心理活动规律和教育规律。信度与效度不但是研究设计应当遵循的标准,而且也是评价研究设计质量乃至整个研究结果科学水平。信度、效度源于心理与教育测验领域,现在心理学者将诶用了测量领域的信度与效度概念,并把研究的信度和效度作为设计与评价各种研究的标准,以提高心理与教育科学中各类研究的客观性、可靠性和科学性。如今,有关研究信度和效度的理论和方法已经为心理、教育研究者普遍接受,成为研究和实验设计的关键,也成为心理、教育研究方法发展的里程碑。

一心理测量的信度和效度射击打靶

1.真分数假设

假设一:在所讨论的问题范围内,真分数不变,亦即个体具有恒定的特质,其分量一定,取值是常数。

假设二:误差是完全随机的。这里有二层意思,一是测量误差是平均数(期望值)为零的正态随机变量;二是测量误差跟被测心理特质即真分数间相互独立。

假设三:观察分数是真分数与误差分数的和。

2.测量的信度

信度(reliability)是指测量结果的稳定性和可靠性程度。

重测信度、复本信度、分半信度、评分者一致性信度

3.测量的效度

一研究的信度

二研究的信度

1.研究信度的概念

研究的信度指研究所的事实、数据的一致性和稳定性程度。一向好的心理与教育研究,其结果必须稳定可靠,即重复研究的结果要保持稳定、一致,否则便可不信。

根据影响信度的误差来源,信度可分为两大类:稳定性和同质性。稳定性指研究结果跨时间、跨情境的一致性。同质性指研究工具本身各项目内容的一致性。举例:用同一思维研究工具在前后相隔较短的时间内测查某一年级的儿童两次,结果发现两次测查结果不一致,第一次测查结果表明被试未达到逻辑思维水平,第二次结果发现他们已经达到逻辑思维水平。

2.判定研究信度的方法

重复法运用重复测量、重复研究的方法,在相同条件下用相同方

法进行两次以上的研究,然后考察它们是否取得相同结果。

重测信度

相似法通过比较同质或类似研究工作、或同类研究的结果的一致

性程度,来判断研究工具或研究结果的可靠性。

复本信度

独立评判法即两个或两个以上的研究者同时对一组被试的行为、操作

水平等各种表现进行独立判断或评价,然后比较它们之间

的一致性,此法可以判定研究者之间一致性的程度。

评分者一

致信度

举例:

相似法:将某一特定研究的结果与国内外同类研究的结果进行比较,是判定研究的信度的常用方法。新编智力量表与韦克斯勒智力量表的比较。

独立评定法:采用观察法、问卷法、访谈法、测验法、实验法等方法进行的研究中,日益注重观察者、评定者和计分者之间的信度。攻击性行为,助人行为。二研究的效度

研究中的自变量与因变量之间的关系属于内部效度问题。

在变量之间判定因果关系,这是统计结论效度的问题。

因果关系的构思性质,涉及到研究的构思效度。

变量之间关系的普遍意义,则是研究的外部效度问题。

可见研究效度在研究的设计、实施与评价等活动中的关键意义。

(1)所研究的两个或多个变量之间是否存在一定的关系?尤其是,研究的自变量与因变量之间是否有关系?

(2)如果所研究的变量之间存在一定关系,这种关系是否因果关系?

(3)如果变量之间可能存在因果关系,它所包含的具体的因果关系构思是什么?

(4)如果变量之间的因果关系构思明确,这种因果关系对于其他的成员、背景条件和时间的普遍意义如何?

以上四类问题相互关联,都涉及到研究的有效性,即研究的效度。1957年,社会心理学家坎贝尔,第一次明确的提出研究的效度问题。研究的自变量与因变量之间的关系属于内部效度的问题;在变量之间判断因果关系,这是统计结论效度的问题;因果关系的构思性质,涉及到研究的构思效度;变量之间关系的普遍意义,则是研究的外部效度问题。在一项心理学研究中,一般都设计研究的理论构思、设计、实施和统计推论环节。

1.构思效度皮亚杰认知发展理论

(1)构思效度的定义和条件:研究的构思效度涉及到研究方案和测量指标的理论构思及其操作化的问题,即理论构思及其转换的有效性。为了使研究具有较高的构思效度:

步骤举例

要求研究的理论构思结构严谨、层次分明,形成某种构思网络,并对研究中的自变量和因变量作出严格的定义(抽象定义)。研究自我意识发展,理论上将自我意识分为自我认识、自我体验和自我控制三方面,然后再将自我认识区分为对生理自我的认识、对心理我自我的认识和自我控制三方面。

针对研究构思的特点,给予明确的操作定义,并确定相应的测量指标。研究“发散思维”和“集中思维”的关系,首先要明确这两个概念、变量的内涵。

给变量下明确的操作定义,并指定相应的、客观的测量指标。

消除或控制影响构思效度的其他因素。

首先,其次,

(2)影响构思效度的因素

A 对于研究构思的解释。

B 单一操作的偏向:心理特征具有系统与层次的特点,因此,心理学研究的构思一般都具有多维性,当研究中只用一种尺度和样本来表示这种多为复杂构思时,就会产生--。

C 单一方法的偏向。理论构思的多维性,要求一种复合的测量。比如分别用访谈法、问题卷法和观察法研究群体心理结构,就容易取得比较理想的结果。

D 实验者期望和被试猜测。

E 构思水平之间的混淆。

F 不同实验处理的交互作用。

2.内部效度气温与犯罪率的关系

(1)内部效度:效度常常是指一项测验测到所要测量的东西或达到某种目的的程度,也有人叫作真实性。研究的内部效度是指在研究的自变量和因变量之间存在关系的明确程度。

研究中的自变量与因变量之间是否真正存在关系?

因变量的变化是否一定是否自变量的变化引起的?

(2)内部效度的条件:首先是由于正确的选择了研究的自变量和因变量;内部效度的另一个重要条件是周密的实验和研究设计。

(3)影响内部效度的因素:

A 历史因素,包括前摄历史因素(被试固有或习得的差异,如性别、态度、个性)和后摄历史因素(研究测量之外可能影响自变量和因变量之间差异的因素)。举例:检验某项工作丰富化方案对于提高职工积极性的作用研究。在方案试行期间,一部分职工增加了工资,因此混淆了工作丰富化方案对于工作积极性的影响。

B 选择因素。

C 未随机取样和随机分配。

D 成熟因素。E研究被试的更换和淘汰。 F测量和测试手段。 G 统计回归效应。H实验处理和程序。 I多种研究条件和因素的交互作用。

上述8种主要因素,都是在研究中应特别注意控制的,最有效的途径是采用随机化程序。在心理学研究中具有较高内部效度的设计之一,是著名的“所罗门四组设计”。

3.外部效度

(1)外部效度:是指实验和研究的结果能够一般化和普遍化到其他的总体、变量条件、时间和背景中去的程度,即研究结果和实验效果的普遍性和可应用性。一般认为,内部效度是外部效度的必要条件,但不是充分条件。

总体效度:指研究结果能够使用于被时所来自的总体的程度和能力。

生态效度:指研究结果能够概括化和适用于其他研究条件和情境的程度能力。(2)外部效度的条件:外部效度的要求是使研究能够代表真实世界的情况。这种多重实验手段,是获得外部效度、提高研究结果可应用性的重要条件。(3)影响外部效度的因素:

A总体效度,这是指研究结果对于研究者最终感兴趣的总体的普遍意义。B 自变量和因变量的定义和测试方式。C对测量的敏感化。D 多重实验的干扰E 特异性效应。F 试验者效应。G 研究与实际情景的相似性。H 被试选择和实验处理的交互作用。

4.统计结论效度

(1)统计结论效度的定义和条件:统计结论效度是有关决定实验处理效应的数据分析程序的效度检验,它并不涉及系统性偏向的来源的问题,而是研究差误变异源和如何适当运用统计显著性检验的问题。研究的统计结论效度取决于两个方面的条件:

一是数据的质量,数据分析程度的效度是以数据的质量作为基础的。二是统计检验的假设,数据分析中所采用的各种统计方法,都有其明确的统计检验假设。举例:当研究样本较小时,由于样本成分与测量的波动性较大,具有不稳定性,此时若依赖于统计显著性水平做结论是不可靠的。在这种情况下,就应该运用功效分析,看看一定的样本大小、变异程度和α水平上能够检验出多大的效应。

大学新生SCL-90中三因子分析讨论,27742,1200,性别比率对统计结果的影响。

(2)影响统计结论效度的因素: A 统计功效低。B 违反统计检验的假设。C 测量信度低。D 实验处理实施的可靠性。E 研究背景中随机的无关因素。F 被试的随机异质性。

四种研究效度之间的关

研究的内部效度、外部效度、统计结论效度和构思效度,是相互联系和相互影响的。统计结论效度实际上是内部效度的特例,它们都涉及研究本身的因果关系

和统计检验的可靠性。构思效度则与外部效度有一致之处,即它们的基本点都在于作出概括性和结果的普遍性。构思效度与外部效度之间的主要差异是:前者所指的目标总体较难具体确定,而后者则往往要求一般化到实际上存在的特定总体、背景和时间等条件。影响研究效度的因素多种多样,但大致可以分成四类(1)与被试有关的因素;

(2)测量与具体研究方法方面的因素;

(3)研究构思与程序设计因素;

(4)实验条件与不同因素的交互作用。

信度与效度的关系

研究信度与效度的关系 一、信度与效度的定义 信度即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度,或者说,信度是指测量结果的一致性或稳定性。 效度即准确度,它是指测量工具或测量手段能够准确测出所要测量的变量的程度,或者说能够准确、真实地度量事物属性的程度.二、信度与效度的关系 (一)教育科学研究中信度与效度的关系 信度是研究结果所显示的一致性、稳定性程度,也是对研究结果一致性和稳定性的评价标准。一个具有信度的研究程序,不论其过程是由谁操作,或进行多少次同样的操作,其结果总是非常一致的.效度是一个研究程序的性质和功能,也是对研究结果正确性的评价标准,一个有效度的研究程序,不仅能够明确地回答研究的问题和解释研究结果,而且能够保证研究结果在一定规模的领域中推广。把两者的作用结合起来看,信度和效度是一项教育科学研究活动和结果具有科学价值和意义的保证。研究的信度是研究的效度的一个必要的前提,没有信度,效度不可能单独存在,也就是说,一项研究不可能没有信度却具有效度。 (二)人力资源招聘信度与效度的关系 影响测评信度的因素有很多,主要是系统误差和随机误差.包括测评者的专业性和素质、被测评者本人的心理、侧评工具的稳定性、

环境的稳定性等都会影响测评的可信度。影响测评的效度因素也有很多,如测评工具、测评过程及测评者因素、被测评者状态、效标因素和信度因素等。在实际招聘与录用评估过程中要把握各相关方面,不仅要有专业的测评人员,同时也要在稳定的环境中为被测评者提供一个放松真实的氛围。信度和效度是人才侧评与选拔质量的重要指标.图形形式表现分析得出的信度和效度的三种关系,则会是以下这些样式,如图8—l .图8-2和图8—3所示。所以,:高信度是高效度的必要条件,但非充分条件.即信度高不一定其效度就高,但要想获得较高的测评效度,其信度必定要高, (三)用结构式问卷来测量家长“溺爱孩子”的行为中信度与效

量表的信度效度检验

第六章量表的信度效度检验 我们采用含有多个项目的量表来测量人们的意见、态度、看法等、这样得到的结果是否准确、可靠,是否有适用性?这就需要评价量表的信度和效度。从理论的观点来看,一个良好的测量工具(量表)应具有足够的效度和信度。 一、信度检验 信度(Reliability)即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。信度指标多以相关系数表示,具体评价方法大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性\替换形式)和内在一致性系数(跨项目的一致性)。信度表示的方法主要有以下四种: 1、稳定性系数 稳定性系数是采用同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间内进行两次测量,用两次测量结果间的相关分析来评价量表信度的高低,连皮尔逊积差相关系数即是信度系数,也称为重测信度,或再测信度。 两次测量,如果间隔时间过长,调查对象容易受环境和个人经历的影响而发生态度的转变,如果间隔时间过短,则受到上次调查记忆的影响。适当的间隔时间是既不能让调查对象记住上一次测验的内容,也不能让其被测的主观特征在两次测验之间没有发生较大的变化。适合的间隔时间要视调查对象和测量内容不同而不同,一般来说,年幼儿童,间隔时间要小,年长者,间隔时间可以延长。并且调查对象在两次测量期间没有发生于相关的重大事件。在最后提交调研报告时,要对间隔时间加以说明,报告间隔的时间。 2、等值系数(复本信度) 用两个复本在最短时间内对同一组调查对象进行测量所得结果的一致性程度,复本信度系数等于两个复本测量所得分数的皮尔逊积差相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度,是等值系数。复本类似于考试中得A、B卷,如果一个人在A卷和B卷的得分相同,就说明考题具有信度;如果两者差异很大,则缺乏信度。 复本信度的使用前提是测量所用的两个复本必须是等效的,两个复本要满足以下几个条件:两个复本测量的是同一种特征。两个复本具有相同的内容和形

心理学中的各种信度和效度

心理学中的各种信度和效度 一、信度 所谓信度,指的是测量结果的稳定性程度,其操作定义是,信度乃是一个测验X与它的任意一个“平行测验X'的相关系数。无关因素、测验的长度、测验试题的区分度、被试团体的代表性都会影响信度。 (一)重测信度 1、定义:利用同一量表,让同一被试群体在不同时间两次施测之后的相关值。这一信度值表示的是测验结果的稳定性,故也称之为稳定性系数。 2、形式:施测——经过适当时间——再施测 3、举例:假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如下表所示,求该测验的重测信度。 4、使用的前提条件 (1)所测量的心理特质必须是稳定的。 (2)遗忘和练习的效果基本上互相抵消。 (3)在两次施测的间隔期内,被试在所要测查的心理特质方面没有更多的学习和训练。5、注意事项 (1)有些测验不宜采用重测法估计信度,如测量推理和创造力的测验。那些不易受重复使用影响的测验才能用再测法估计信度。如感觉运动测验、人格测验。 (2)两次测验间隔的时间要适当,并注意提高被试的积极性 (3)测验手册中报告重测信度时应说明两次施测的间隔,以及在此期间内被试的有关经历(4)时间间隔的把握:适宜时间间隔依照测验目的、性质及被试特点而定,可以是几分钟甚至几年。例如对于年幼儿童的间隔要小;年长群体的间隔可大。但智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月,既不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘。 6、重测信度的评价: (1)优点:能够提供有关测验结果是否随时间而变异的资料,可作为预测受测者将来行为表现的依据。 (2)缺点:易受练习和记忆的影响,前后两次施测间隔的长短必须要适度。 (二)复本信度

第五讲 心理学研究的信度和效度

第五讲心理学研究的信、效度 长江大学教育科学系严磊 研究设计的主要目标是特高整个研究的科学性水平,即保证研究结果、结论能真实的反映人的心理活动规律和教育规律。信度与效度不但是研究设计应当遵循的标准,而且也是评价研究设计质量乃至整个研究结果科学水平。信度、效度源于心理与教育测验领域,现在心理学者将诶用了测量领域的信度与效度概念,并把研究的信度和效度作为设计与评价各种研究的标准,以提高心理与教育科学中各类研究的客观性、可靠性和科学性。如今,有关研究信度和效度的理论和方法已经为心理、教育研究者普遍接受,成为研究和实验设计的关键,也成为心理、教育研究方法发展的里程碑。 一心理测量的信度和效度射击打靶 1.真分数假设 假设一:在所讨论的问题范围内,真分数不变,亦即个体具有恒定的特质,其分量一定,取值是常数。 假设二:误差是完全随机的。这里有二层意思,一是测量误差是平均数(期望值)为零的正态随机变量;二是测量误差跟被测心理特质即真分数间相互独立。 假设三:观察分数是真分数与误差分数的和。 2.测量的信度 信度(reliability)是指测量结果的稳定性和可靠性程度。 重测信度、复本信度、分半信度、评分者一致性信度 3.测量的效度

一研究的信度 二研究的信度 1.研究信度的概念 研究的信度指研究所的事实、数据的一致性和稳定性程度。一向好的心理与教育研究,其结果必须稳定可靠,即重复研究的结果要保持稳定、一致,否则便可不信。 根据影响信度的误差来源,信度可分为两大类:稳定性和同质性。稳定性指研究结果跨时间、跨情境的一致性。同质性指研究工具本身各项目内容的一致性。举例:用同一思维研究工具在前后相隔较短的时间内测查某一年级的儿童两次,结果发现两次测查结果不一致,第一次测查结果表明被试未达到逻辑思维水平,第二次结果发现他们已经达到逻辑思维水平。 2.判定研究信度的方法 重复法运用重复测量、重复研究的方法,在相同条件下用相同方 法进行两次以上的研究,然后考察它们是否取得相同结果。 重测信度 相似法通过比较同质或类似研究工作、或同类研究的结果的一致 性程度,来判断研究工具或研究结果的可靠性。 复本信度 独立评判法即两个或两个以上的研究者同时对一组被试的行为、操作 水平等各种表现进行独立判断或评价,然后比较它们之间 的一致性,此法可以判定研究者之间一致性的程度。 评分者一 致信度 举例: 相似法:将某一特定研究的结果与国内外同类研究的结果进行比较,是判定研究的信度的常用方法。新编智力量表与韦克斯勒智力量表的比较。 独立评定法:采用观察法、问卷法、访谈法、测验法、实验法等方法进行的研究中,日益注重观察者、评定者和计分者之间的信度。攻击性行为,助人行为。二研究的效度

SPSS与测验信度、效度、及项目分析

SPSS在测验信度、效度、及项目分析中的应用 李鹏 云南师范大学教育科学与管理学院 在SPSS中,专门用来进行测验信度分析的模块为Scale下的Reliability Analysis;使用Data Reduction之下的Factor模块,可以利用因素分析的方法来进行测验的建构效度检验;至于项目分析则没有专门的模块可以之间进行计算分析,但是却可以利用Summarize下的Frequencies、Correlate下的Bivariate 和Compare Mean下的Independent-Samples T Test来计算几个常用的项目分析指标。 一、信度分析 Reliability Analysis模块主要功能是检验测验的信度,主要用来检验分半信度、库李及a系数以及Hoyt信度系数值。至于重测信度和复本信度,只需将样本在二次(份)测验的分数的数据合并到同一数据文件之后,利用Correlate 之下的Bivariate求其相关系数,即为重测或复本信度;而评分者信度则就是使用的Spearman等级相关及Kendall和谐系数。 表1 Reliability Analysis模块的Model选项的参数及对应中文术语 关键字功能 Alpha Cronbach a系数 Split-half 分半信度,n是第二分量表的题数 Guttman Guttman最低下限真实信度法 Parallel 各题目变异数同质时的最大概率(maximum-likelihood)信度Strict parallel 各题目平均数与变异数均同质时的最大概率信度 表2 Reliability Analysis模块的Statistics部分选项的参数及对应中文术语 关键字功能 F test Hoyt信度系数 Friedman Chi Friedman等级变异数分析及Kendall和谐系数 Cochran Chi Cochran’s Q检验,适用于答案为二分(如是非题)的量表

信度与效度的关系

信度与效度的关系 信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。 信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。 信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。 效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。 效度高,信度也必然高。 信度:测量的数据准确性

效度:结果的符合程度 1请问为什么随机分派前后测就可以控制选择、被试缺失的干扰了。而随即分派后侧就不能对被试缺失加以控制了。它们的不同只是多了一次前侧,怎么会对被试产生影响呢? 2消除无关变量的方法平衡法和恒定法,有何区别呢,我总是有点弄混,能各举个例子吗? 1、在一个延续时间较长的研究中,被试的更换、淘汰或者中途退出可能会对研究结果产生深刻的影响。所以如果只有后测,两组或多组相等的假设就无法保证,很难控制被试的情况。而前后测可以解决这个问题。 2、恒定法。恒定法就是采取一定措施,使某些无关变量在整个研究过程中保持恒定不变。它也是控制无关变量的基本方法。平衡法。平衡法就是对某些不能被消除,又不能或不便被恒定的无关变量,通过采取某些综合平衡的措施或方式,使其影响通过平衡而抵消,达到控制它们的方法。平衡法主要采用对比组方法和循环法。

先体会一下两者定义。简单的说: 恒定法:前后不变,比如上课时间、学生作业 平衡法:分组实验中,各组作用相同,比如教师水平,学生数目,知识基础。 在实验设计主要格式中,带有随机分配的优点是可以控制选择与成熟的交互作用,是什么意思啊?这里的成熟是指的被试身心的成熟程度吗? 支持(0) 中立(0) 反对(0) 单帖管理 举报帖子 使用道具 | 引用| 回复 zdjy 小大2楼个性首页| 博客| 信息| 搜索| 邮箱| 主页| UC

信度与效度分析报告报告材料步骤

如何用spss做问卷的结构效度分析? 问:因子分析里面Descriotives里面KMO和巴特利检验就可以了吗?除此之外,还要做什么啊?请高手赐教点简单易懂又能说明效度问题的,谢谢啦! 问题补充: 提取因子的个数怎么确定?是选特征值大于1的吗?还有,因子载荷怎么算?是在输出结果中直接可以看到吗?本人刚接触spss,请多多指教! 答: 首先必须要做KMO和Bartlett球形检验,这个你应该会了吧,如果这两个检验合格的话说明数据是适合做因子分析的。 然后提取因子后,看主因子解释总变异的百分比和个因子的因子载荷,主因子解释总变异一般若大于60%的和因子载荷大于0.6的话说明结构效度很好。 pS: ,如果题目没有规定就是选特征值大于1的,如果题目事先要提取几个因子,那么在操作的时候,用SPSS那个因子分析的选项里面有一个地方可以著名,因子载荷在输出的结果直接可以看到(rotated compoment matrpx),一定要是旋转后的因子载荷 用spss进行效度分析? 我要对我的问卷调查数据做一个信度和效度分析。信度分析我会了,就是看Cronbach’s Alpha 系数。效度分表面效度、准则效度和构建效度,前面两项只要说明一下,但是构建效度要用SPSS分析,我想是在因子分析里面吧?就是不知道哪个值代表效度。 答: 因子分析的效度分析主要的指标可以看,因子提取的方差累积贡献率,如果因子提取的越少且方差累积率又不低的话(一般如果2个因子达到40%以上的贡献率就算可以的了),就可以认为因子分析的效度还可以。 除此之外,你可以用因子分析里面Descriotives里面KMO和巴特利检验(battele,不知道是不是这样写的),KMO的值如果>0.5,则说明因子分析的效度还行,可以进行因子分析;另外,如果巴特利检验的P<0.001,说明因子的相关系数矩阵非单位矩阵,能够提取最少的因子同时又能解释大部分的方差,即效度可以。 问:问卷效度测验如何应用于SPSS 问卷效度测验如何应用于SPSS,然后因为做效度检验貌似要用皮尔逊相关还是因子分析,所以不懂如何把这些应用于SPSS,不想要变量,想要整体,一个整体。 用因子分析,就已经是在检验变量的整体了 因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计方法。三、因子分析的SPSS过程 第一步:准备数据文件,打开对话框,加载观测变量。数据文件主要是由较多的(一般在10个以上)可观测变量组成,个案数应比较大。然后点击“Analyze” ,选择“Data Reduction” 中的“Factor”打开因子分析对话框,将参与分析的所有观测变量加载到“Variables”下边的方框中。

spss数据分析教程之spss信度分析和效度分析

信度分析和效度分析数据计分方法说明

讲问卷调查的数据进行如上表的数据预处理后,接下来再进行如下分析。 1 信度分析 这里有63份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时,对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如果问卷的信度系数达到0.9以上,该问卷调查的信度就较好;信度系数在0.8以上,是不错的;一般认为试卷信度在0.5至0.9以内是合理的,如果信度系数低于0.5,则此问卷的调查结果就不可信了。 将以上63份问卷的数据用SPSS21.0先进行标准化处理,再进行信度分析,其结果如表一所示: 表一信度分析表

表一显示,整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于0.6,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用SPSS21.0对其进行效度分析。 2.1 因子模型适应性分析 效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。 .657 Bartlett 的球形 度检验近似卡方 1187.63 6 df465 Sig..000

如何保证人才测评的信度和效度

如何保证人才测评的信度和效度 人才测评的主要工作是通过各种方法对被试者加以了解,从而为企业组织的人力资源管理决策提供参考和依据。经过长期的发展和适应不同情况的需要,形成了多种人才测评方法。而人才素质测评作为一项重要的人事技术,已经为越来越多的企业人力资源部门所接受,而如何保证能力素质测评中的信度和效度,也越来越受到关注。下面,就具体案例讲讲如何保证能力素质测评的信度和效度。 一、案例背景 N公司是一家外资工程管理公司,成立于1998年,总部设在上海。随着WTO的开放和工程项目的增多,工程公司在国内如雨后春笋般成长起来,就此拉开了人才竞争的序幕。尤其是上海,工程项目管理人才的争夺十分激烈,N公司老总越来越感觉到市场的压力和人才的短缺。为了应对市场压力,保留现有中高层骨干人才,并让他们“适人适位”,N公司请来了北大纵横管理咨询公司,希望通过专业评估解决这个问题。 二、建立人才能力素质模型并实施测评 (一)中高层能力素质模型及测评方法的确定 鉴于本次测评的对象是N公司的中高层管理人才和精英人物,测评的目的是为了保留人才、适人适岗,因此经过双方共同探讨,项目组在北大纵横经理人能力素质指标体系的基础上,结合N公司的实际情况,选择个人驱动力、判断能力、分析能力、决策能力和水准、创新能力、客户服务能力、影响力、项目管理能力、任务分配能力等作为测评因素。同时,采用广泛用于企业人员素质测评、方案比较、科学技术成果评比等方面的层次分析法,来确定各测评因素在管理素质和业务素质上的权重。 通过向N公司老总介绍人才测评的方法及工具,大家一致选定评价中心技术进行本次人才测评,并主要运用三类测评工具:心理测验、深度面谈和情景模拟测验。 (二)测评实施程序 1、设计测评题目。咨询顾问和N公司相关人员一起,围绕测评因素,结合N公司实际情况进行测试题目的设计,并给出评分标准和评分参考。本次心理测试采取16PF人格要素测试,人机对话;深度面谈设计了20个题目,涵盖了测评的各个维度;情景模拟采用案例分析和主题演讲两种测评工具,其中案例分析题库包含12题,主题演讲题库包含15题,被测人员可以从各题库中抽取一题进行测试。 2、成立测评小组。其中,测评小组成员由N公司内部专家、外部专家,以及北大纵横项目组组成。在测评实施前,对测评小组进行培训,使大家能全面了解测评的程序、评分标准及方法。 3、实施测评。深度面谈和情景模拟测试是由测评小组根据测试题目对被测评人进行提问,被测评人根据提问回答问题,与测评小组进行双向沟通后,由测评小组根据评分标准对被测评人的表现现场打分,填入评分表;16PF人格要素测试要求被测试人进行40分钟的人机对话,由测评小组保存有效答卷。 由于不同的测评者其衡量的尺度会存在差异,为保证各个被试者成绩排序的正确性,在测评时,向测评者提供“成绩比较表”,供其记载各个被试者的各项测试的评分,便于他们进行比较。 4、分析测评结果并统计成绩。采用肯德尔和谐系数法对每个被测评者在各个测评要素上的得分进行评分者信度分析,并结合各测评要素在管理素质和业务素质方面的权重,计算出被测评人在业务素质和管理素质上的得分。测评结束后,测评小组对被测人员进行了问卷调查,了解他们对测评效果的看法。 三、测评为保证信度和效度所采取的措施 (一)保证测评信度采取措施分析 1、16PF测试采取的是计算机标准化题目的方式,计算机答题、计算机处理结果。被测试人员全部独立进行测试,并在规定时间内完成了测试。 2、深度面谈使用了20个题目,围绕测评因素的各个维度对被测评者进行考察。面谈进行顺利,被测人员都能较积极配合回答问题,和主试人进行较好的双向交流。 3、情景模拟采用案例分析和主题演讲两种测评工具,被测人员从两个题库中各抽取1题,测评小组根据其表现进行现场评估。测评得到了被测人员的积极配合,都能就问题提出自己的见解。 4、为增加评分者信度,本次测评工作专门成立了测评小组,并在测评前熟悉了整个测评程序和操作;各类能力素质附有评分标准,各类试题附有评分参考,力图对被测试者的表现进行量化分析;测评中,向测评者提供“成绩比较表”,

SPSS测量问卷信效度分析

测量问卷信效度分析 信度和效度分析是问卷分析的第一步,也是检验该问卷是否合格的标准之一,所以,我们在做问卷调查的时候第一步就要进行信度和效度的分析,才能确保我们的问卷有意义。 信度(Reliability)即可靠性,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的一致性程度。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才可信。例如,我们用一把尺子测量一张桌子的高度,今天测量得高度与明天测量的高度不同,那么我们就会对这把尺子产生怀疑。因此,一张设计合理的调查问卷应该具有它的可靠性和稳定性。 目前最常用的是Alpha信度系数,一般情况下我们主要考虑量表的内在信度——项目之间是否具有较高的内在一致性。通常认为,信度系数应该在0~1之间,如果量表的信度系数在0.9以上,表示量表的信度很好;如果量表的信度系数在0.8~0.9之间,表示量表的信度可以接受;如果量表的信度系数在0.7~0.8之间,表示量表有些项目需要修订;如果量表的信度系数在0.7以下,表示量表有些项目需要抛弃。 信度分析是:“分析”——“度量”——“可靠性分析”,把所有主观题选到:“项目”中,确定即可,得出总的信度。把统一维度的题目选中,得出先关维度的信度。 具体步骤:分析——度量——可靠性分析 模型选择a,点击确定即可。 结果分析: 分析各个维度和总量的信度后,将它们列出一个表格,其中每个维度的a信度系数都大于0.7,说明该量表信度较好,符合问卷调查。 效度(Validity)即有效性,是衡量综合评价体系是否能够准确反映评价目的和要求。是指测量工具能够测出其所要测量的特征的正确性程度。效度越高,即表示测量结果越能显示其所 要测量的特征,反之,则效度越低。常用于调查问卷效度分析的方法主要有以下几种。 1、单项与总和相关效度分析 这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项

(完整word版)SPSS信度和效度检验全套资料

关于调查问卷的信度和效度检验 (一)信度 1 、信度的含义 测验的信度又称测验的可靠性 , 是指同一个测验对同一组被试施测两次或多次 , 所得结果一致形程度。一个好的测验必须是稳定可靠的 , 多次使用所获得的结果是前后一致的。例如 , 用直尺测量长度 , 其结果是稳定可靠的 ; 用橡皮筋测长度则是不可靠的 , 前后测量结果缺乏一致性。在测量理论中 , 信度被定义为 : 某次测验分数的真变异数与总变异数 ( 即实测分数 ) 之比 : 2 2 S R x xx ST = 式中 Rxx 表示测量的信度 ,ST 2 代表真分数的变异数 ( 方差 ),Sx 2 表示实得分数的变异数 ( 方差 ) 。 从上式可看出 , ( 1 )信度是指实测值和真值相差的程度 , 实测值是指对某物实际进行测量时所获得值 , 也称实测分数 (X); 真值是指被测事物的真实规模取值 , 也称真分数 (T) 。由于各种原因 , 实得分数常不等于真分数 , 两者之差称为测量误差或误差分数 (E) 。从理论上看 , 实得分数由真分数和误差分数两部分组成即 :X=T+E Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。 ( 2 )信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次测验中 , 受测者所得分数或所处等级前后一致 , 则说明测验结果的信度较高 ; 反之 , 两次测验结果一致性低 , 说明测验结果的信度低。 信度是任何一种测量的必要条件 ( 但不是唯一条件 ), 只有测量值接近或等于真值 , 用同一工具多次测量同一特性获得相同或相近的结果 , 才能认为这个测量结果是可靠的。信度对于教育测量尤其重要 , 只有信度高的教育测验才能成为教育工作者有用的工具 , 才能为教育工作者提供可靠的信息 , 为教育预测和决策提供客观依据。 2 、信度的估计方法 测验的信度是用信度系数的大小来表示的 , 根据测量理论 , 信度系数 2 2 S R x xx ST = 但是在实际测量中 , 一般只能获得实得分数 (X) 及实得变异数 (Sx 2 ), 而真分数 (T) 及真变异数 (ST 2 ) 是不知道的 , 因此 , 依据上述公式还无法机算信度系数。在统计上 , 主要采用相关分析的方法即机算两列变量的相关系数 , 用相关系数的大小来表示信度的高低。主要用以下方法来求得信度 : ( 1 )再测法 : 用同一测验对同一被试 , 前后施测两次 , 根据两次测验分数计算相关系数 , 即是再测信度。该信度反映了测验的稳定性程度 , 故又称稳定性系数 , 是用皮尔逊积差相关公式计算的 : 2 12 1/21S S M M N X X R xx ?-= ∑ 式中 X 1 .X 2 为同一被试的两次测验得分 ,M1.M2 为两次测验的平均分数 ,S 1 .S 2 是两次测验的标准 差 ,N 是被试人数。 用再测法估计信度 , 可以得到有关测验结果是否随时间而变化及变化程度的资料 , 可以作为预测被测者将来行为表现的依据。但也存在明显的局限性 : 前后两次测验结果易受到练习和记忆的影响 , 前后两次施测的时间间隔影响稳定性系数 , 特别是对学绩测验的影响较大。如果时间间隔太长 , 被测者的身心因受环境影响将发生大的变化 , 从而对第二次施测结果产生较大影响 , 使稳定性系数降低 ; 如果间隔太短 , 则被试第一次完成测验时练习和记忆会对第二次测验产生较大影响 , 使第二次测验性质发生变化。另外 , 有些测验不宜用再测法估计信度 , 如测量创造力测验 , 被试一旦掌握了解决问题的办法、原则 , 重测时 , 他将很容易作出反应 , 这样测验的性质就发生了改变。因此 , 只有在没有复本可用 , 测验不易受重复使用影响 , 现实条件又允许重复施测的情况下才使用重测法估计信度。 用重测法估计信度 , 间隔时间长短没有严格的规定 , 一般说 , 间隔时间越长 , 稳定性系数越低 , 最适

关于调查问卷的信度和效度检验

关于调查问卷的信度和效度检验 (一)信度 1、 信度的含义 测验的信度又称测验的可靠性 ,是指同一个测验对同一组被试施测两次或多次 ,所得结果 一致形程度。一个好的测验必须是稳定可靠的 ,多次使用所获得的结果是前后一致的。例 如,用直尺测量长度,其结果是稳定可靠的 ;用橡皮筋测长度则是不可靠的 ,前后测量 结果缺乏一致性。在测量理论中 ,信度被定义为:某次测验分数的真变异数与总变异数 ST2 (即实测分数)之比:R xx - S x 2 式中Rxx 表示测量的信度,ST -代表真分数的变异数 (方差),Sx -表示实得分数的变异 数(方差)。 For pers onal use only in study and research; not for commercial use 从上式可看出,(1)信度是指实测值和真值相差的程度 ,实测值是指对某物实际进行测 量时所获得值 ,也称实测分数 (X );真值是指被测事物的真实规模取值 ,也称真分数 (T )。由于各种原因,实得分数常不等于真分数 ,两者之差称为测量误差或误差分数 (E )。从理论上看,实得分数由真分数和误差分数两部分组成即 :X=T+E Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。 (2 )信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次 测验中,受测者所得分数或所处等级前后一致 ,则说明测验结果的信度较高 ;反之,两 次测验结果一致性低 ,说明测验结果的信度低。 For pers onal use only in study and research; not for commercial use 信度是任何一种测量的必要条件 (但不是唯一条件 ),只有测量值接近或等于真值 ,用同 一工具多次测量同一特性获得相同或相近的结果 ,才能认为这个测量结果是可靠的。 信度 对于教育测量尤其重要,只有信度高的教育测验才能成为教育工作者有用的工具 ,才能为 教育工作者提供可靠的信息,为教育预测和决策提供客观依据。 2、 信度的估计方法 测验的信度是用信度系数的大小来表示的 ,根据测量理论,信度系数 For pers onal use only in study and research; not for commercial use ST2 R xx S 2 但是在实际测量中,一般只能获得实得分数 (X )及实得变异数 (Sx 2 ),而真分数(T )及 真变异数(ST 2 )是不知道的,因此,依据上述公式还无法机算信度系数。在统计上 ,主 要采用相关分析的方法即机算两列变量的相关系数 ,用相关系数的大小来表示信度的高 低。主要用以下方法来求得信度 :

什么是测试的信度和效度,如何保证测试的信度和效度

什么是测试的信度和效度,如何保证测试的信度和效度 棋盘中小张倩倩 在教育研究中,信度与效度是很常见的两个概念。但每次看到或听到这两个名词,我的脑袋老反应不过来,看来基础就是不扎实。我在这里就谈谈我浅显的认识。 一、信度 所谓的信度,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的可能性。如果说某个指标或测量工具的信度高,那它提供的测量结果就不会因为指标、测量工具或测量设计本身的特性而发生变化;反之亦然。根据测量过程中不同的误差来源,可分为再测信度、复本信度和折半信度。 再测信度,是用同一测量工具在不同的时间对同一群受试者前后测量两次,然后计算两次测量分数的相关系数,相关系数越大说明两次测量的一致性越高。相隔的时间不应该太长。 复本信度,是用两个完全等值的(平行的)复本对同一群受试者进行测试,计算两种复本测量分数的相关系数,相关系数越大说明两个复本构成带来的变异越小。如考试中使用的A、B卷 折半信度,只用一个测量工具对同一群受试者实施一次测量,但将奇数题和偶数题分开计分,再计算奇数试题和偶数试题分数之间的相关系数。 二、效度 所谓的效度,是指测量工具能够测出其所要测量的特征的正确性程

度。效度越高,即表示测量结果越能显示其所要测量的特征。如果说根据某项特征能够区分人、物或事件,那么说某个测量该特征的测量工具是有效的,就是指它的测量结果能把具有不同特征的人、物或事件进行有效的区分。常用的有变面效度、内容效度和效标效度。 表面效度是指测量效果和人们头脑中的印象或学术界形成的共识之间的吻和程度,吻合程度高,表面效度就高。 内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵,测量工具代表概念定义的内容越多,内容效度就越高。 效标效度是指测量结果与一些标准之间的一致性程度,这些标准能够精确表示被测概念。 三、信度与效度的关系 信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。 信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。 信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。 效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。 效度高,信度也必然高。

如何进行问卷效度与信度分析

如何进行问卷信效度分析 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 重测信度法:这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 复本信度法:复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 折半信度法:折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式,求出整个量表的信度系数(ru)。 α信度系数法:Cronbach α信度系数是目前最常用的信度系数。其中,K为量表中题项的总数,为第i题得分的题内方差,为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。 二、效度分析 效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型:内容效度、准则效度和结构效度。效度分析有多种方法,其测量结果反映效度的不同方面。常用于调查问卷效度分析的方法主要有以下几种: 单项与总和相关效度分析:这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项总分的相关系数,根据相关是否显著判断是否有效。若量表中有反意题项,应将其逆向处理后再计算总分。 准则效度分析:准则效度又称为效标效度或预测效度。准则效度分析是根据已经得到确定的某种理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准则的联系,若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显著

问卷调查的信度与效度分析图解

问卷调查的信度与效度分析图解 蒋智钢 前几天有朋友要我帮忙算下调查问卷的信度和效度,看了一下后才发现原来这个问题是很多人都会碰到的,似乎有必要写那么一丁点东东。 对于从医还要涉及那么点科研的人来说,问卷调查是许多人都不可避免要做的一项工作,无论你是要做毕业课题,还是要完成一项基金项目,甚至好多人的课题的核心就是做一个问卷调查,那么,你把问卷设计好了,也发出去了,或者结果也统计出来了,但是,问你一句:你的结果可靠吗?你的问卷合格吗?怎么回答? 判断一份用于调查的问卷是否合格是有指标的,也就是我今天要提到的这2个:信度和效度。顾名思义,信度嘛,当然是指调查问卷的可信程度;效度呢,就是指问卷的有效性,二者各取一字成其名。好了,闲话到此打住,直接进入正题,怎么个算法。 1. 先算信度,这个指标是用Cronbach α信度系数来评价的,其实信度系数还有好多个,但是,我们一般就考虑量表的内在信度【这里的量表也就是调查表啦】,简言之,就是项目之间是否具有较高的内在一致性,所以,就算这个Cronbach α就好了。再啰嗦一句:这个α在0~1之间,α>0.8时,表示量表信度很好;0.7~0.8之间,表示量表的信度可以接受;如果是在0.6~0.7范围内,表示量表也可以接受但需改进。 计算的方法很简单,打开SPSS,把你的数据都输入进去即可,当然,数据的输入也是有技巧的,你可以在excel里面先输入数据然后再导入,我比较喜欢这种方式。但是要记住,一列代表一个指标或者称之为“维度”,换言之也就是你的问卷里面的一个具体的题目,有多少个问题就对应多少列,一行代表一个调查对象。数据都弄好之后,在SPSS中点“Analyze-Scale-Reliability Analysis…”进行计算,剩下的不打字了,自己看图吧。 你的问卷调查表的数据可能与下面的类似:【这些数据是我随便弄的,这里只讲方法,不论结果好坏!】

心理测量考研问题(含答案)

1.等距量表的特点是( B )(2007年) A.无绝对零点,无相同单位 B.无绝对零点,有相同单位 C.有绝对零点,无相同单位 D.有绝对零点,有相同单位 2.下列量表中,具有绝对零点的是(D )(2008年) A.称名量表 B.顺序量表 C.等距量表 D.比率量表 3.简述测验标准化的含义及提高测验标准化程度的方法。 4.教师的职称和薪水这两个变量的数据类型分别是( D)(2009年) A.命名数据和等比数据 B.等距数据和等比数据 C.顺序数据和等距数据 D.顺序数据和等比数据 5. 下列心理测验中,属于速度测验的有(AC)(2010年多选题) A.文书能力测验中的校对测验 B. 梅尔艺术鉴赏测验中的审美知觉测验 C. 一般能力倾向成套测验中的装配测验 D. 西肖尔音乐能力测验中的音高辨别测验 6. 在评价中心技术中,无领导小组、文件筐等测验属于(A)(2010年单选题) A. 情境测验 B.评定量表 C. 投射测验 D.自陈测验 7. 1937年,施瑞奥克将我国三国时期刘邵关于人的能力研究的著作翻译成英文版。该著作是(A)(2010年单选题) A. 人物志 B. 心书 C. 吕氏春秋 D.学记 8. 下列数据类型属于比率数据的是(A)(2011年单选题) A.智商分数 B. 反应时 C. 年级 D.数学成绩 9. 某初中招收600名新生后,进行了一次分班考试。按照考试的功能,这次考试属于(C)(2011单选题)

A.诊断性评估 B.形成性评估 C.安置性评估 D.终结性评估 10. 1937年,施瑞奥克将我国三国时期刘邵关于人的能力研究的著作翻译成英文版。该著作是(A)(2010年单选题) A. 人物志 B. 心书 C. 吕氏春秋 D.学记 11. 要求被试回答有关自己的感受和信念的测验属于(B)(2011年大选题) A.最高作为测验 B. 典型作为测验 C. 非文字测验 D. 投射测验 12.在下列测验中,属于文字测验的是(A)(2012年单选题) A、16PF B、TAT C、罗夏墨迹测验 D、瑞文推理测验 13.从心理测量学角度看,中国古代的“七巧板”可视为(B )(2013年单选) A、兴趣测验 B、创造力测验 C、态度测验 D、投射测验 14.为了规范和维护心理测验工作的发展,中国心理学会于1992年颁布(B)(2014年单选题) A《计算机化测验学解释指南》B《心理学家的道德准则与行为规范》 C《心理测验管理》 D《教育和心理测验标准》 1.真分数模型X=T+E中,E表示的是(B)(2007年) A. 系统误差 B.随机误差 C.抽样误差 D.标准误差 2下列关于测量结果受测量误差影响的叙述,正确的是(D)(2008年) A.系统误差影响稳定性,不影响准确性; B.系统误差影响准确性,也影响稳定性; C.随机误差影响稳定性,不影响准确性; D.随机误差影响稳定性,也影响准确性。 3.简述测量误差的含义、类别及控制测量误差的方法。(2009 在一切测量中,由于各种因素的影响,测量所得的观测值并不准确地等于被测之量的真值。二者之差称为测量误差。根据测量误差的性质来来源,测量误差可分为系统误差和随机误差。 常见的影响测验误差的因素主要有三方面:测验自身、施测过程、受测者。(1)测验自身 测验自身的误差主要来源于测验的编制过程,其中项目取样影响最大。测验所要测量的内容是什么,测验的项目能否代表这些内容,是至关重要的。当测验的项

信度、效度分析、统计检验

信度、效度分析、统计检验&软件操作 一、构念的维度: 可以用验证性因子分析(CFA)检验因子(维度)与测项之间的从属关系是否正确。检验指标是各个拟合优度指数和路径系数。 二、量表的信度: 信度包括重测信度、复本信度和内部一致性信度。在一次测量中,只能检验内部一致性信度,通常是用α系数。SPSS可以进行信度检验,一般要求α>0.7。每个测项的item-totalcorrelation(项对总项相关系数)>0.4。同时还要看每个测项“αifite m de le te d ”的值,它表示的是当删除该测项时,量表的α系数的值。如果 αifitemdeleted>原来的α,则应该删除该测项。 三、构念的效度 1.. 构念的收敛效度(convergentvalidity)收敛效度指的是量表与同一 构念的其他指标确实相互关联的程度。收敛效度 可通过CFA检验,观察测量项目在构念上的负载(loading),如果标准化估计值(standardizesestimate)大于0.5,且t值大于 1.96,平均提取方差(Averagevarianceextracted,AVE)大于0.6,组合信度(constructreliability,CR)大于0.7,通常认为收敛效度较高。 平均提取方差(AVE):表示的是潜变量的变异量中有多大比例能用指标 变异量来解释(即指标解释潜变量的程度);组合信度(CR):模型内在 质量的判别准则之一,反映了每个潜变量中所有测项是否一致性地解释该 潜变量。 2.. 构念的判别效度(discriminantvalidity)判别效度指的是一个测量值 与其他应该有所不同的构念之间不相互关联的 程度。判别效度可通过CFA检验,如果各个测量对因子的平均提取方差(Average varianceextracted,AVE)大于该因子与任何其他因子的共同方差(highest sharedvariance),则判别效度较高(或者说AVE的平方根大于该构念与任何其他构念的相关系数,则判别效度较高)。另外一种检验判别效度的方法是检验修正指数(modificationindex,MI)的显著性。MI指的是模型中某个受限制的参数(通常是固定为0的参数),若允许自由估计,模型会因此改良,整个模型卡方值的减少量,称为此参数的修正指数。Ml小于 3.84(P<0.05)或6.63(P<001),表明测量模型有较好的判别效度。 3.. 构念的法则效度(nomologicalvalidity)法则效度指的是量表以在理 论上可以预测的方式,与不同但相关的构念的测 量值之间相互关联的程度。 收敛效度、判别效度、法则效度并称为建构效度(constructvalidity);另外两种效度是内容效度(contentvalidity)和标准效度(criterionvalidity)。内容效度是对量表的内容表现特定测量项目任务的优劣程度的一个主观而系统的评价。标准效度指一个量表是否像预期的那样反映与选作标准的其他变

相关文档