文档库 最新最全的文档下载
当前位置:文档库 › 因子分析的一般原理概述

因子分析的一般原理概述

因子分析的一般原理概述
因子分析的一般原理概述

因子分析的一般原理概述

简才永

因子分析是处理多变量数据的一种统计方法,它可以揭示多变量之间的关系,其主要目的是从众多的可观测得变量中概括和综合出少数几个因子,用较少的因子变量来最大程度地概括和解释原有的观测信息,从而建立起简洁的概念系统,揭示出事物之间本质的联系。

一、因子分析的种类

(一)、R型因子分析与Q型因子分析

这是最常用的两种因子分析类型。R型因子分析,是针对变量所做的因子分析,其基本思想是通过对变量的相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量去描述多个随机变量之间的相关关系。然后再根据相关性的大小把变量分组,使同组内的变量之间的相关性较高,不同组变量之间的相关性较低。Q型因子分析,是针对样品所做的因子分析。它的思路与R因子分析相同,只是出发点不同而已。它在计算中是从样品的相似系数矩阵出发,而R型因子分析在计算中是从样品的相关系数矩阵出发的。

(二)、探索性因子分析与验证性因子分析

探索性因子分析(EFA),主要适用于在没有任何前提预设假定下,研究者用它来对观察变量因子结构的寻找、对因子的内容以及变量的分类。通过共变关系的分解,进而找出最低限度的主要成分,让你后进一步探讨这些主成分或共同因子与个别变量之间的关系,找出观察变量与其对应因子之间的强度,即所谓的因子负荷值,以说明因

子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。

验证性因子分析(CFA),要求研究者对研究对象潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观测变量的组成模式,进行因子分析的目的是为了检验这一先前提出的因子结构的适合性。这种方法也可以应用于理论框架的检验,它在结构方程模型中占据相当重要的地位,有着重要的应用价值,也是近年来心理测量中相当重要的内容。

二、因子分析基本思想、模型与条件

(一)、因子与共变结构

因子分析的基本假设是那些不可观测的“因子”隐含在许多现实可观察的事物背后,虽然难以直接测量,但是可以从复杂的外在现象中计算、估计或抽取得到。它的数学原理是共变抽取。也就是说,受到同一个因子影响的测量分数,共同相关的部分就是因子所在的部分,这可以用“因子”的共变相关部分来表示。

(二)、因子分析的条件

第一、因子分析以变量之间的共变关系作为分析的依据,凡影响共变的因子都要先行确认无误。首先,因子分析的变量都必须是连续变量,符合线性关系的假设。其他顺序与类别型的数据不能用因子分析简化结构。

第二、抽样过程必须随机,并具有一定规模。一般样本量不得低于100,原则上是越大越好。此外,一般还要求样本量与变量数之间

的比例不得低于5:1。

第三、变量之间要具有一定程度的相关,对于一群相关太高或太低的变量,不太适合进行因子分析。相关程度太高了,多重共线性明显,区分效度不够,获得的因子结构价值也不太高,可以通过巴特莱(Bartett’s)球形检验、KMO检验以及检查共同性指数(共同度系数)来确定这一问题。

1、巴特莱球形检验可以用来检验样本内各变量之间的相关系数是否不同且大于0。若球形检验结果显著,表示相关系数可以用于因子分析抽取因子。

2、使用偏相关矩阵来判断。在因子分析中,可以得到一个反映像矩阵,呈现出偏相关的大小,在该矩阵中,若有多数系数偏高,则应放弃使用因子分析。对角线的系数除外,该系数称为取样适切性量数(KMO),代表与该变量有关的所有相关系数与净相关系数的比例,该系数越大,表示相关情形越良好。一般:大于0.9最佳,0.8至0.9较好,0.7至0.8尚可,0.6至0.7较差,0.6以下放弃。

3、检查共同性指数。指某一变量与其他所有变量的复相关系数的平方,这个数值表示该变量的变异量被共同因子解释的比例。其计算方式为在一变量上各因子负荷量平方值的总和,变量的共同性越高,因子分析的结果就越理想。

(二)、因子抽取的方法

因子抽取的目的在于决定测量变量当中存在着多少个潜在的成分或因子数。当然,除了人为可以设定因子个数外,决定因子个数的

具体方法还有:

1、主成分法(principal component analysis)。主成分法以线性方程式将所有变量加以合并,计算所有变量共同解释的变异量,该线性组合成为主成分。第一次线性组合建立后,计算出的第一个主成分估计值,可以解释全体变异量的一大部分,其解释的变异量即属于第一个主成分所有。然后再将剩余的变异量,经过第二次方程式线性合并,抽取出第二个主成分,其涵盖的变异量即属于第二个主成分所有。以此类推,直到无法再抽取为止,最后保留解释量比较大的那几个变量。主成分法分析一般适用于单纯为简化大量变量为少数的成分时,以及作为因子分析的预备工作。

2、主因子法。主因子法是分析变量间的共同变异量而非全体变异量。它的计算方法与主成分法有差异,主因子法用共同性取代了相关矩阵中的对角线1.00,目的在于抽出一系列互相独立的因子。第一个因子解释最多的原来变量间共同变异量;第二个因子解释除去第一个因子解释后剩余共同变异量的最大变异,其余因子依次解释剩下的变异量中最大部分,直到所有的共同变异被分割完毕为止。此法符合因子分析模式的假设,亦即分析变量间共同变异,而非分析变量间的总变异,因子的内容较易了解。

除此之外还有两种比较常见的因子抽取方法,即最小平方法和最大似然法。

(三)因子数目

因子数目的决定主要是依据特征值,一般都是提取特征值大于1

的因子,此外还可以直接定义,就是直接向计算机输入你所需要的因子个数。

(四)、因子旋转

因子旋转的目的,就是在于理清因子与原始变量间的关系,以确立因子间最简单的结构,达到简化的目的,使心因子具有更鲜明的实际意义,更好地解释因子分析结果。所谓简单结构,就是使每一个变量仅在一个公共因子上有较大的载荷,而在其他公共因子上的载荷比较小。

因子旋转可分为正交旋转和斜交旋转。所谓正交旋转就是指旋转过程中因子之间的轴线夹角为90度,即因子之间的相关设定为0,如最大变异法(varimax)、四方最大发(quartimax)、均等变异法(equimax rotation)。另一种旋转法叫着斜交旋转,这种方法允许因子与因子之间具有一定相关性,在旋转过程中同时对于因子的关联情形进行估计,例如最小斜交法(oblimin rotation)、最大斜交法(oblimax rotation)、四方最小法(quartimin)等。

正交旋转是基于各因子间是相互独立的前提,它能够最大限度地对各因子进行区分,但也容易扭曲潜在特质在现实生活中的真实关系,容易造成偏差。因此,一般进行研究时,除非研究者具有特定的理论作为支持,或有强有力的实证证据,否则,为了精确地估计变量与因子关系,使用斜交旋转是较为贴近真实的一种做法。

实验2层次分析法

项目六矩阵的特征值与特征向量 实验2 层次分析法 实验目的 通过应用层次分析法解决一个实际问题,学习层次分析法的基本原理与方法;掌握用层次 分析法建立数学模型的基本步骤;学会用Mathematica解决层次分析法中的数学问题. 基本原理 层次分析法是系统分析的重要工具之一,其基本思想是把问题层次化、数量化, 并用数学 方法为分析、决策、预报或控制提供定量依据. 它特别适用于难以完全量化, 又相互关联、相互制约的众多因素构成的复杂问题. 它把人的思维过程层次化、数量化,是系统分析的一中 新型的数学方法. 运用层次分析法建立数学模型, 一般可按如下四个基本步骤进行. 1.建立层次结构 首先对所面临的问题要掌握足够的信息, 搞清楚问题的范围、因素、各因素之间的相互关系,及所要解决问题的目标. 把问题条理化、层次化, 构造出一个有层次的结构模型. 在这 个模型下,复杂问题被分解为元素的组成部分. 这些元素又按其属性及关系形成若干层次.层 次结构一般分三层: 第一层为最高层, 它是分析问题的预定目标和结果, 也称目标层; 第二层为中间层, 它是为了实现目标所涉及的中间环节, 如: 准则、子准则, 也称准则层; 第三层为最底层, 它包括了为实现目标可供选择的各种措施、决策方案等, 也称方案层.

图2-1 决策目标 准则1准则2准则n 方案1方案2方案m …… …… 注:上述层次结构具有以下特点:(1) 从上到下顺序地存在支配关系, 并用直线段表示;(2) 整个层次结构中层次数不受限制. 2.构造判断矩阵 构造判断矩阵是建立层次分析模型的关键. 假定以上一层的某元素y 为准则,它所支配 的下一层次的元素为n x x x ,,,21 ,这n 个元素对上一层次的元素y 有影响,要确定它们在y 中的比重. 采用成对比较法. 即每次取两个元素i x 和j x , 用ij a 表示i x 与j x 对y 的影响之比, 全部比较的结果可用矩阵A 表示,即 .,,2,1,,)(n j i a A n n ij ==? 称矩阵A 为判断矩阵. 根据上述定义,易见判断矩阵的元素ij a 满足下列性质: )(,1),(1 j i a j i a a ii ij ji ==≠= 当0>ij a 时,我们称判断矩阵A 为正互反矩阵. 怎样确定判断矩阵A 的元素ij a 的取值呢? 当某层的元素n x x x ,,,21 对于上一层某元素 y 的影响可直接定量表示时, i x 与j x 对y 的影响之比可以直接确定, ij a 的值也可直接确定. 但对于大多数社会经济问题, 特别是比较 复杂的问题, 元素i x 与j x 对y 的重要性不容易直接获得, 需要通过适当的量化方法来解决. 通常取数字1~9及其倒数作为ij a 的取值范围. 这是因为在进行定性的成对比较时, 通常采用 5级制(表1),在每两个等级之间各有一个中间状态, 共1~9个尺度, 另外心理学家认为进行成 对比较的因素太多, 将超出人们的判断比较能力, 降低精确. 实践证明, 成对比较的尺度以 27±为宜, 故ij a 的取值范围是9,,2,1 及其倒数.

因子分析理论与案例

因子分析理论与案例 一、 因子分析原理 因子分析是一种将多变量化简的多元统计方法,它可以看作是主成份分析的推广。因子分析的目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的变量归为一类,不同类间的变量的相关性则较低。每类变量代表了一个“共同因子”,即一种内在结构(联系)。因子分析就是寻找这种内在结构(联系)的方法。 从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析。 (一)模型 主要模型形式: (2)矩阵型式 (二)相关概念解释 ?????? ? ???????+??????????????????????????=??????????????p m pm p p m m p F F F a a a a a a a a a X X X εεε 21212 1 2222111211 21?????? ?++++=++++=++++=p m pm p p m m m m F a F a F a X F a F a F a X F a F a F a X εε ε 222112 22221212112121111)1(展开式m 1m X A F + p 1p m m 1p 11m p 2 Cov F 01 03D F I F F =1. 01ε ε= ????≤?? ? = ? ??? 简记为:() ()() ()且满足:)) (,)=) ()=即不相关且方差

1、因子载荷 a ij 称为因子载荷(实际上是权数)。 因子载荷的统计意义:就是第i 个变量与第j 个公共因子的相关系数,即表示变量xi 依赖于Fj 的份量(比重),心理学家将它称为载荷。 2、变量共同度 3、方差贡献率 方差贡献率指的是公因子对于自变量的每一分量所提供的方差总和,它是衡量公因子相对重要程度的指标。通常情况下,我们将因子载荷矩阵的所有方差贡献率计算出来并按照大小排序,从而提炼出最具影响力的因子。 二、 主要计算方法及步骤 (一)方法说明 1、因子载荷矩阵估计方法 因子载荷的求解方法主要有主成分法,主轴因子旋转法和极大似然法。主成分法指在进行因子分析之前先对数据进行主成分分析,把前几个主成分作为未旋转的公因子,但是此种方法得到的特殊因子间并不相互独立,当变量的共同度较大时,特殊因子所起的作用较小,它们之间的相关性可以忽略。 主轴因子法与主成分分析方法类似,都是都分析矩阵的结构入手,主轴因子 i m 22 i ij j 1i i11i22im m i 22 i i11im m i 222 2 i1i2im i 22 i i 22i i i X A i h a i 1,,p X a F +a F ++a F +Var X a Var F a Var F Var a a a h X 1h εεσσσ====++++=+=+∑ 变量的共同度——因子载荷阵中第行元素的平方和,即:为了说明他的统计意义,将下式两边求方差,即()=()++()+() =由于已经标准化了,所以有:

SAS学习系列34.-因子分析

SAS学习系列34.-因子分析

34.因子分析 (一)基本原理 一、概述 因子分析,是用少数起根本作用、相互独立、易于解释通常又是不可观察的因子来概括和描述数据,表达一组相互关联的变量。通常情况下,这些相关因素并不能直观观测。 因子分析是从研究相关系数矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。简言之,即用少数不可观测的隐变量来解释原始变量之间的相关性或协方差关系。 因子分析的作用是减少变量个数,根据原始变量的信息进行重组,能反映原有变量大部分的信息;原始部分变量之间多存在较显著的相关关系,重组变量(因子变量)之间相互独立;因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 主成分分析是因子分析的特例。主成份分析的目标是降维,而因子分析的目标是找出公共因素及特有因素,即公共因子与特殊因子。 因子分析模型在形式上与线性回归模型相似,但两者有着本质的区别:回归模型中的自变量是可观测到的,而因子模型中的各公因子是不可观测的隐变量,而且两个模型的参数意义也不相同。 二、原理

假设样品检测p 个指标(变量)X 1, …, X p ,得到观测矩阵X ,这p 个指标变量可能受m (m

因子分析的一般原理概述

因子分析的一般原理概述 简才永 因子分析是处理多变量数据的一种统计方法,它可以揭示多变量之间的关系,其主要目的是从众多的可观测得变量中概括和综合出少数几个因子,用较少的因子变量来最大程度地概括和解释原有的观测信息,从而建立起简洁的概念系统,揭示出事物之间本质的联系。 一、因子分析的种类 (一)、R型因子分析与Q型因子分析 这是最常用的两种因子分析类型。R型因子分析,是针对变量所做的因子分析,其基本思想是通过对变量的相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量去描述多个随机变量之间的相关关系。然后再根据相关性的大小把变量分组,使同组内的变量之间的相关性较高,不同组变量之间的相关性较低。Q型因子分析,是针对样品所做的因子分析。它的思路与R因子分析相同,只是出发点不同而已。它在计算中是从样品的相似系数矩阵出发,而R型因子分析在计算中是从样品的相关系数矩阵出发的。 (二)、探索性因子分析与验证性因子分析 探索性因子分析(EFA),主要适用于在没有任何前提预设假定下,研究者用它来对观察变量因子结构的寻找、对因子的内容以及变量的分类。通过共变关系的分解,进而找出最低限度的主要成分,让你后进一步探讨这些主成分或共同因子与个别变量之间的关系,找出观察变量与其对应因子之间的强度,即所谓的因子负荷值,以说明因

子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。 验证性因子分析(CFA),要求研究者对研究对象潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观测变量的组成模式,进行因子分析的目的是为了检验这一先前提出的因子结构的适合性。这种方法也可以应用于理论框架的检验,它在结构方程模型中占据相当重要的地位,有着重要的应用价值,也是近年来心理测量中相当重要的内容。 二、因子分析基本思想、模型与条件 (一)、因子与共变结构 因子分析的基本假设是那些不可观测的“因子”隐含在许多现实可观察的事物背后,虽然难以直接测量,但是可以从复杂的外在现象中计算、估计或抽取得到。它的数学原理是共变抽取。也就是说,受到同一个因子影响的测量分数,共同相关的部分就是因子所在的部分,这可以用“因子”的共变相关部分来表示。 (二)、因子分析的条件 第一、因子分析以变量之间的共变关系作为分析的依据,凡影响共变的因子都要先行确认无误。首先,因子分析的变量都必须是连续变量,符合线性关系的假设。其他顺序与类别型的数据不能用因子分析简化结构。 第二、抽样过程必须随机,并具有一定规模。一般样本量不得低于100,原则上是越大越好。此外,一般还要求样本量与变量数之间

因子分析理论与案例

因子分析理论与案例 因子分析原理 因子分析是一种将多变量化简的多元统计方法,它可以看作是主成份分析的 推广。因子分析的目的是分解原始变量,从中归纳出潜在的“类别” ,相关性较 强的变量归为一类,不同类间的变量的相关性则较低。 每类变量代表了一个“共 同因子”,即一种内在结构(联系)。因子分析就是寻找这种内在结构(联系)的 方法。 从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过 出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观 测数据,可以根据其所要求的目的决定用哪一类型的因子分析。 (一)模型 (二)相关概念解释 主要模型形式: X 2 二 a 2i F 1 a 22F 2 ⑴展开式 ■■ a F t 1mm 1 亠 a F 亠丄 (2)矩阵型式 X p 二 a pi F i a 22F 2 a pm F m ;p 简记为:X 二 (p 1)( p 且满足: 1) 2) m _ p Cov( F, ;)=0 a 12 a 1 m a 22 a 2 m a a p2 --- a pm A F + m)( m 1) (1 3) D(F)= Tm 即Fi …F m 不相关且方差=1. p1 p 1) F 1 ; 1 F 2

1、因子载荷 a j称为因子载荷(实际上是权数)。 因子载荷的统计意义:就是第i个变量与第j个公共因子的相关系数,即表示变量xi依赖于Fj的份量(比重),心理学家将它称为载荷。 2、变量共同度 变量人的共同度一一因子载荷阵A中第行元素的平方和, m 即:h:=為a i =1, ,p j4 为了说明他的统计意义,将下式两边求方差,即 X i =a ii F+a2F2+ +a im F m+勺 Var (X)二a:Var (F) + +3討8「(FJ +Var (;) 二a: +a2> +…+a2代2 11 12 im i .2 2 二h i G 由于X i已经标准化了,所以有:1二h2 = 3、方差贡献率 方差贡献率指的是公因子对于自变量的每一分量所提供的方差总和,它是衡 量公因子相对重要程度的指标。通常情况下,我们将因子载荷矩阵的所有方差贡献率计算出来并按照大小排序,从而提炼出最具影响力的因子。 二、主要计算方法及步骤 (一)方法说明 1、因子载荷矩阵估计方法 因子载荷的求解方法主要有主成分法,主轴因子旋转法和极大似然法。主成分法指在进行因子分析之前先对数据进行主成分分析,把前几个主成分作为未旋转的公因子,但是此种方法得到的特殊因子间并不相互独立,当变量的共同度较大时,特殊因子所起的作用较小,它们之间的相关性可以忽略。 主轴因子法与主成分分析方法类似,都是都分析矩阵的结构入手,主轴因子

SPSS因子分析法

因子分析 ? 因子分析(Factor analysis ):用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。 主成分分析(Principal component analysis ):是因子分析一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。 两者关系:主成分分析(PCA )和因子分析(FA )是两种把变量维数降低以便于描述、理解和分析的方法。 ? 特点 (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。 (2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。 ? 类型 根据研究对象的不同,把因子分析分为R 型和Q 型两种。 当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。 但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 ? 分析原理 假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 : 当p 较大时,在p 维空间中考察问题比较麻烦。这就需要进行降维处理,即用较少几个综合指标代替原来指标,而且使这些综合指标既能尽量多地反映原来指标所反映的信息,同时它们之间又是彼此独立的。 线性组合:记x1,x2,…,xP 为原变量指标,z1,z2,…,zm (m ≤p )为??????????????=np n n p p x x x x x x x x x X 212222111211

AHP层次分析法计算原理

AHP层次分析法计算原理 一般地,可以选用三层结构对发展战略作出整体评价。 第一层为目标层,它是企业要实现的战略目标,第二层是评价因素层,它包括战略目标实现进行评价的所考虑的各种因素以及各因素之间的相对比值,并求出各要素实现总体目标所占的权重。第三层是指标层,即个评价因素需考虑的具体指标。 首先,根据总目标确定各要素之间的相对重要关系,构建两两比较判断矩阵,其基本形式为: 其中,a j表示对于C来说,A对A相对重要性的数值体现,通常a j可取1、2、3……、9以及它们的倒数作为标度。其中, 1――表示两个元素相比,具有同样的重要性; 3――表示两个元素相比,一个元素比另一个元素稍微重要; 5――表示两个元素相比,一个元素比另一个元素明显重要; 7――表示两个元素相比,一个元素比另一个元素强烈重要; 9――表示两个元素相比,一个元素比另一个元素极端重要。 2、4、6、8为上述相邻判断的中值。 矩阵中的元素具有以下特征:①a j >0,②a j二丄,③a H=1o a ji 然后,根据判断矩阵计算相对于战略目标各评价元素的相对重要 性次序的权重,首先计算判断矩阵A的最大特征根入max和其对应的经归一化后的特征向量W=[W i, W2 , W3, , W n ]T,计算的公式为:(8 - 1)

归一化后的特征向量W=[W i, W2, W3, , W n]T即为各评价因素对于总目标的权重。 (8 - 2)W i - n W i i J 其 1 n 中,W = a j (8 - 3) 入max为判断矩阵A的最大特征根,计算公式为: (8 - 4) 其中,(AW)i表示AW的第i个元素。 最后,对矩阵A进行一致性检验。当a q二空时,称判断矩阵为a jk 致性矩阵。判断一致性的指标为C.R.的取值。 C.R.嚅 (8 - 5) (8 - 6) R丄为随机一致性指标,其值是通过多次重复进行随机判断矩阵特征值的计算后得到的。随机一致性指标R丄的取值见表8-2。 表8-2随机一致性指标R.I?的取值表 维数12 345 6 7 8 9 10 J (AW)i i吕nw

(完整版)因子分析法基本原理

1.因子分析法基本原理 在对某一个问题进行论证分析时,采集大量多变量的数据能为我们的研究分析提供更为丰富的信息和增加分析的精确度。然而,这种方法不仅需要巨大的工作量,并且可能会因为变量之间存在相关性而增加了我们研究问题的复杂性。因子分析法就是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。这样我们就可以对原始的数据进行分类归并,将相关比较密切的变量分别归类,归出多个综合指标,这些综合指标互不相关,即它们所综合的信息互相不重叠。这些综合指标就称为因子或公共因子。 因子分析法的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。这样,就能相对容易地以较少的几个因子反映原资料的大部分信息,从而达到浓缩数据,以小见大,抓住问题本质和核心的目的。 因子分析法的核心是对若干综合指标进行因子分析并提取公共因子,再以每个因子的方差贡献率作为权数与该因子的得分乘数之和构造得分函数。因子分析法的数学表示为矩阵:B AF X +=,即: ????? ?? ??++++=++++=++++=++++=p k pk p p p p k k k k k k f f f f x f f f f x f f f f x f f f f x βααααβααααβααααβααααΛΛΛΛΛΛ332211333332321313223232221212113132121111 (k ≤p)………………(1式) 模型中,向量X ()p x x x x ,,,,321Λ是可观测随机向量,即原始观测变量。F ()k f f f f ,,,,321Λ是X ()p x x x x ,,,,321Λ的公共因子,即各个原观测变量的表达式中共同出现的因子,是相互独立的不可观测的理论变量。公共因子的具体含义必须结合实际研究问题来界定。A ()ij α是公共因子F ()k f f f f ,,,,321Λ的系数,称为因子载荷矩阵,ij α(i=1,2,.....,p;j=1,2,....,k)称为因子载荷,是第i 个原有变量在第j 个因子上的负荷,或可将ij α看作第i 个变量在第j 公共因子上的权重。ij α是x i 与f j

方法:因子分析法

因子分析基础理论知识 1 概念 因子分析(Factor analysis ):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。 主成分分析(Principal component analysis ):是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。 两者关系:主成分分析(PCA )和因子分析(FA )是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。 2 特点 (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。 (2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在显着的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显着的相关关系。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。 3 类型 根据研究对象的不同,把因子分析分为R 型和Q 型两种。 当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。 但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 4分析原理 假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 : ?????? ????? ???=np n n p p x x x x x x x x x X ΛM M M M ΛΛ212222111211

(完整版)因子分析法基本原理.docx

1.因子分析法基本原理 在 某一个 行 分析 , 采集大量多 量的数据能 我 的研究分析提供更 丰富的信息和增加分析的精确度。 然而, 种方法不 需要巨大的工 作量,并且可能会因 量之 存在相关性而增加了我 研究 的复 性。 因子分析法就是从研究 量内部相关的依 关系出 , 把一些具有 复 关系的 量 少数几个 合因子的一种多 量 分析方法。 我 就可以 原始的数据 行分 并,将相关比 密切的 量分 , 出多个 合指 , 些 合指 互不相关, 即它 所 合的信息互相不重叠。 些 合指 就称 因子或公共因子。 因子分析法的基本思想是将 量 行分 , 将相关性 高, 即 系比 密的分在同一 中, 而不同 量之 的相关性 低, 那么每一 量 上就代表了一个基本 构, 即公共因子。 于所研究的 就是 用最少个数的不可 的所 公共因子的 性函数与特殊因子之和来描述原来 的每一分 量。 ,就能相 容易地以 少的几个因子反映原 料的大部分信息, 从而达到 数据,以小 大,抓住 本 和核心的目的。 因子分析法的核心是 若干 合指 行因子分析并提取公共因子, 再以每个因子的方差 献率作 数与 因子的得分乘数之和构造得分函数。 因子分析法的数学表示 矩 : X AF B ,即 : x 1 11 f 1 1 2 f 2 1 3 f 3 1k f k 1 x 2 21 f 1 22 f 2 23 f 3 2 k f k 2 x 3 31 f 1 32 f 2 33 f 3 3k f k 3 (k ≤p)?????? (1 式) x p p1 f 1 p 2 f 2 p 3 f 3 pk f k p 模型中,向量 X x 1, x 2 , x 3 , , x p 是可 随机向量,即原始 量。 F f 1 , f 2, f 3 , , f k 是X x 1, x 2 , x 3, , x p 的公共因子,即各个原 量的表达式中 共同出 的因子, 是相互独立的不可 的理 量。 公共因子的具体含 必 合 研究 来 界定。 A ij 是公共因子 F f 1, f 2 , f 3, , f k 的系数,称 因子 荷矩 , ij (i=1,2,.....,p;j=1,2,....,k)称 因子 荷,是第 i 个原有 量在第 j 个 因子上的 荷,或可将 ij 看作第 i 个 量在第 j 公共因子上的 重。 ij 是 x i 与 f j

(完整版)层次分析法步骤

层次分析法实例与步骤 结合一个具体例子,说明层次分析法的基本步骤和要点。 【案例分析】市政工程项目建设决策:层次分析法问题提出 市政部门管理人员需要对修建一项市政工程项目进行决策,可选择的方案是修建通往旅游区的高速路(简称建高速路)或修建城区地铁(简称建地铁)。除了考虑经济效益外,还要考虑社会效益、环境效益等因素,即是多准则决策问题,考虑运用层次分析法解决。 1. 建立递阶层次结构 应用AHP解决实际问题,首先明确要分析决策的问题,并把它条理化、层次化,理出递阶层次结构。 AHP要求的递阶层次结构一般由以下三个层次组成: ●目标层(最高层):指问题的预定目标; ●准则层(中间层):指影响目标实现的准则; ●措施层(最低层):指促使目标实现的措施; 通过对复杂问题的分析,首先明确决策的目标,将该目标作为目标层(最高层)的元素,这个目标要求是唯一的,即目标层只有一个元素。 然后找出影响目标实现的准则,作为目标层下的准则层因素,在复杂问题中,影响目标实现的准则可能有很多,这时要详细分析各准则因素间的相互关系,即有些是主要的准则,有些是隶属于主要准则的次准则,然后根据这些关系将准则元素分成不同的层次和组,不同层次元素间一般存在隶属关系,即上一层元素由下一层元素构成并对下一层元素起支配作用,同一层元素形成若干组,同组元素性质相近,一般隶属于同一个上一层元素(受上一层元素支配),不同组元素性质不同,一般隶属于不同的上一层元素。 在关系复杂的递阶层次结构中,有时组的关系不明显,即上一层的若干元素同时对下一层的若干元素起支配作用,形成相互交叉的层次关系,但无论怎样,上下层的隶属关系应该是明显的。 最后分析为了解决决策问题(实现决策目标)、在上述准则下,有哪些最终解决方案(措施),并将它们作为措施层因素,放在递阶层次结构的最下面(最低层)。 明确各个层次的因素及其位置,并将它们之间的关系用连线连接起来,就构成了递阶层次结构。 【案例分析】市政工程项目进行决策:建立递阶层次结构 在市政工程项目决策问题中,市政管理人员希望通过选择不同的市政工程项目,使综合效益最高,即决策目标是“合理建设市政工程,使综合效益最高”。 为了实现这一目标,需要考虑的主要准则有三个,即经济效益、社会效益和环境效益。但问题绝不这么简单。通过深入思考,决策人员认为还必须考虑直接经济效益、间接经济效益、方便日常出行、方便假日出行、减少环境污染、改善城市面貌等因素(准则),从相互关系上分析,这些因素隶属于主要准则,因此放在下一层次考虑,并且分属于不同准则。 假设本问题只考虑这些准则,接下来需要明确为了实现决策目标、在上述准则下可以有哪些方案。根据题中所述,本问题有两个解决方案,即建高速路或建地铁,这两个因素作为措

因子分析的基本概念和步骤

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

层次分析法的基本步骤和要点(20210228093222)

层次分析法的基本步骤和要点

层次分析法的基本步骤和要点 结合一个具体例子,说明层次分析法的基本步骤和要点。 【案例分析】市政工程项目建设决策:层次分析法问题提出 市政部门管理人员需要对修建一项市政工程项目进行决策,可选择的方案是修建通往旅游区的高速路(简称建高速路)或修建城区地铁(简称建地铁)。除了考虑经济效益外,还要考虑社会效益、环境效益等因素,即是多准则决策问题,考虑运用层次分析法解决。 1. 建立递阶层次结构 应用AHP军决实际问题,首先明确要分析决策的问题,并把它条理化、层次化,理出递阶层次结构。 AHP要求的递阶层次结构一般由以下三个层次组 成: 目标层(最高层):指问题的预定目标; 准则层(中间层):指影响目标实现的准则; 措施层(最低层):指促使目标实现的措施;通

过对复杂问题的分析,首先明确决策的目标,将该目标作为目标层(最高层)的元素,这个目标要求是唯一的,即目标层只有一个元素。 然后找出影响目标实现的准则,作为目标层下的准则层因素,在复杂问题中,影响目标实现的准则可能有很多,这时要详细分析各准则因素间的相互关系,即有些是主要的准则,有些是隶属于主要准则的次准则,然后根据这些关系将准则元素分成不同的层次和组,不同层次元素间一般存在隶属关系'即上一层元素由下一层元素构成并对下一层元素起支配作用,同一层元素形成若干组,同组元素性质相近,一般隶属于同一个上一层元素(受上一 层元素支配),不同组元素性质不同,一般隶属于不同的上一层元素。 在关系复杂的递阶层次结构中,有时组的关系不明显,即上一层的若干元素同时对下一层的若干元素起支配作用,形成相互交叉的层次关系,但无论怎样,上下层的隶属关系应该是明显的。 最后分析为了解决决策问题(实现决策目标)、在上述准则下,有哪些最终解决方案(措施),并将它们作为措施层因素,放在递阶层次结构的最下面(最低层)。 明确各个层次的因素及其位置,并将它们之间的关系用连线连接起来,就构成了递阶层次结构。 【案例分析】市政工程项目进行决策:建立递阶层次结构

spss学习系列31.因子分析

31. 因子分析 一、基本原理 因子分析,是用少数起根本作用、相互独立、易于解释通常又是不可观察的因子来概括和描述数据,表达一组相互关联的变量。通常情况下,这些相关因素并不能直观观测。 因子分析是从研究相关系数矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。简言之,即用少数不可观测的隐变量来解释原始变量之间的相关性或协方差关系。 因子分析的作用是减少变量个数,根据原始变量的信息进行重组,能反映原有变量大部分的信息;原始部分变量之间多存在较显著的相关关系,重组变量(因子变量)之间相互独立;因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 主成分分析是因子分析的特例。主成份分析的目标是降维,而因子分析的目标是找出公共因素及特有因素,即公共因子与特殊因子。 因子分析模型在形式上与线性回归模型相似,但两者有着本质的区别:回归模型中的自变量是可观测到的,而因子模型中的各公因子是不可观测的隐变量,而且两个模型的参数意义也不相同。 得到估计的因子模型后,还必须对得到的公因子进行解释。即对每个公共因子给出一种意义明确的名称,用来反映在预测每个可观察变量中这个公因子的重要性。该公因子的重要程度就是在因子模型矩

阵中相应于这个因子的系数。 由于因子载荷阵不惟一,故可对因子载荷阵进行旋转。目的是使因子载荷阵的结构简化,使载荷矩阵每列或行的元素平方值向0和1两极分化,这样的因子便于解释和命名。 每个样本都可以计算其在各个公因子上的得分,利用因子得分以及该公因子的方差贡献比例,又可以计算每个样本的综合得分。 二、因子分析实例 例1(综合评价问题)对我国30个省市经济发展的8个指标进行分析和排序。数据文件如下: x1=GDP;x2=居民消费水平;x3=固定资产投资; x4=职工平均工资;x5=货物周转量;x6=居民消费价格; x7=商品价格指数;x8=工业总产值。 1. 【分析】——【降维】——【因子分析】,打开“因子分析”窗口,将变量“x1-x8”选入【变量】框;

因子分析法(自己整理)

因子分析法 1.因子分析法简介: 1)因子分析法的提出 “因子分析”的名称于1931年由Thurstone 首次提出,但它的概念起源于二十世纪初Karl Pearson 和Charles Spearmen 等人关于智力测验的统计分析。近年来,随着电子计算机的高速发展,人们将因子分析方法成功地应用于各个领域,使得因子分析的理论和方法更加丰富。 2)因子分析的定义 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 3)与主成分分析的联系 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变

层次分析方法基本原理

层次分析方法基本原理 层次分析法简单的说就是运用多因素分级处理来确定因素权重的方法。它是一种定性分析和定量分析相结合的评价决策方法,它将评价者对复杂系统的评价思维过程数学化。 层次分析法基本思路是评价者通过将复杂问题分解为若干层次和若干要素,并在同一层次的各要素之间简单地进行比较、判断和计算。就可以得出不同替代案的重要度,从而为选择最优方案提供决策依据。 层次分析法特点是:能将人们的思维过程数学化、系统化,便于人们接受;所需定量数据信息较少。 ⑵层次分析法图解: 评估每一层针对上一层的因素的重要程度,通过传递性,最后确定因素层的指标相对于目标层的重要程度,从而确定全部指标的权重系数 ⑶应用层次分析法进行综合评价其主要步骤有: 第一步:对构成评价问题的目标(准则)及因素等要素建立多级递阶结构模型。 第二步:在多级递阶结构模型中,对属同一级的要素,用上一级的要素为准则进行两两比较后,根据判断尺度确定其相对重要度,并据此建立判断矩阵。 对于递阶层次结构中各层上的元素可以依次相对于与之有关的上一层元素,进行两两比较,从而建立一系列的判断矩阵。判断矩阵 A = (aij)n×n 具有下述性质: 其中, aij(i,j = 1,2,…,n) 代表元素 Ui 与 Uj 相对于其上一层元素重要性的比例标度。判断矩阵的值反映了人们对各因素相对重要性的认识,一般采用

1-9 比例标度对重要性程度赋值。标度及其含义如下表所示。 第三步:通过一定计算后,确定各要素的相对重要度:四个步骤如下 ①计算单一层次下元素的相对权重并进行一致性检验 1矩阵 A 的最大特征根为λmax ,其相应的特征量为 W ,解判断矩阵 A 的特征根问题 最大特征根及其对应的特征向量通常应用方根法来求解,具体计算步骤如下: 所得 W 经归一化后,即(1)计算判断矩阵每一行元素的乘积M I 为同一层次相应元素对于上一层次某一因素相对重要性的权重向量。 2用估计得到的排序向量左乘判断矩阵得到一个新的向量,依次用你排序向量的每个分量去除这个新向量的每个对应分量,得到了另一个向量,对这个向量的分量求和然后除以分量的个数,得到了关于特征根λmax的近似值 由于客观事物的复杂性以及人们对事物认识的模糊性和多样性,所给出的判断矩阵不可能完全保持一致,有必要进行一致性检验,计算一致性指标 CI 其中, n 为判断矩阵阶数。 若随机一致性比率 CR = CI / RI < 0.10 ,则判断矩阵具有满意的一致性,否则需要调整判断矩阵的元素取值。随机一致性指标 RI 取值见表 -2 。

因子分析法基本原理

1?因子分析法基本原理 在对某一个问题进行论证分析时,采集大量多变量的数据能为我们的研究分析提供更为丰富的信息和增加分析的精确度。然而,这种方法不仅需要巨大的工作量,并且可能会因为变量之间存在相关性而增加了我们研究问题的复杂性。因子分析法就是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。这样我们就可以对原始的数据进行分类归并,将相关比较密切的变量分别归类,归出多个综合指标,这些综合指标互不相关,即它们所综合的信息互相不重叠。这些综合指标就称为因子或公共因子。 因子分析法的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。这样,就能相对容易地以较少的几个因子反映原资料的大部分信息,从而达到浓缩数据,以小见大,抓住问题本质和核心的目的。 因子分析法的核心是对若干综合指标进行因子分析并提取公共因子,再以每个因子的方差贡献率作为权数与该因子的得分乘数之和构造得分函数。因子分析法的数学表示为矩阵:X AF B,即: X i11 f l12 f213 f31k f k1 X221 f l22 f 223 f32k f k 2 X331 f132 f233 f33k f k3(k < p) .......... .. (1) X p pl f l p2 f2 p3 f3 pk f k p 模型中,向量X X!,X2,X3,, X p是可观测随机向量,即原始观测变量。 F f l,f2, f3, , f k是X X!,X2,X3, ,X p的公共因子,即各个原观测变量的表达式中共同出现的因子,是相互独立的不可观测的理论变量。公共因子的具体含义必须结合实际研究问题来界定。A j是公共因子F九f2, f3, , f k的系数,称为因子 载荷矩阵,j (i=1,2,.?…,p;j=1,2,....,k)称为因子载荷,是第i个原有变量在第j个 因子上的负荷,或可将j看作第i个变量在第j公共因子上的权重。j是X i与f j

相关文档
相关文档 最新文档