文档库 最新最全的文档下载
当前位置:文档库 › 因子分析的基本思想、基本步骤、数学模型及求解

因子分析的基本思想、基本步骤、数学模型及求解

因子分析的基本思想、基本步骤、数学模型及求解
因子分析的基本思想、基本步骤、数学模型及求解

一、因子分析

1因子分析的基本思想

1.1因子分析的基本出发点

将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大部分信息(方差),这些综合指标之间没有相关性。

1.2因子变量的特点

(1)这些综合指标称为因子变量,是原变量的重造;

(2)个数远远少于原变量个数,但可反映原变量的绝大部分方差;

(3)不相关性;

(4)可命名解释性。

2因子分析的基本步骤

(1)确认待分析的原始变量是否适合作因子分析;

(2)构造因子变量;

(3)利用旋转方法使因子变量具有可解释性;

(4)计算每个样本的因子变量得分。

3因子分析的数学模型

数学模型3为标准化的原始变量;F|为因子变量;k

X x=a wf\ +知£ +如£ + …+ 勻工2 =%/ +%£ +%3, +…+ %九 +

勺工3 = %乂+%£+。3拱+???+改九+£3

Xp =%Ji + Q 应 +七」3 +??? + %/ +「p

也可以矩阵的形式表示为:

X=AF+£

F:因子变量;

A:因子载荷阵;

佝:因子载荷; £ :特殊因子。

4因子分析的相关概念

(1)因子载荷

在因子变量不相关的条件下,,就是第i个原始变量与第j个因子变量的相关系数。询绝对值越大,则X与R的关系越强。

(2)变量的共同度(Communality)

也称公共方差。\的变量共同度为因子载荷矩阵A中第i行元素的平方和。

? = 2站可见:K的共同度反应了全部因子变量对为总方差的解释能力。

(3)因子变量Fj的方差贡献

因子变量Fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和

P

S产£站可见:因子变量Fj的方差贡献体现了同一因子Fj对原始所有变量f=l 总方差的解释能力,Sj/p表示了第j个因子解释原所有变量总方差的比例。

5原有变量是否适合作因子分析

计算原有变量的相关系数矩阵,一般小于0.3就不适合作因子分析。

6确定因子变量-■主成份分析

6.1主成份分析法的数学模型

凹=外西+"】2工2 +岡3另+…卩料

夕2 =+“22工2 +“23毛+—/Z2p X p

外=,3』+〃32工2 +〃33毛+??/3p"

丹=,「祈+卩pg +卩p3…,,卩ppXp

将原有的P个相关变量Xi作线性变换后转成另一组不相关的变量Yi

该方程组要求:身;+间+活=1。= 1,2,3…〃)

系数与依照两个原则来确定:

1、吊与方(同,侦=1,2,3,??叩)互不相关;

2、y i是XU2,X3,…,冲的一切线性组合(系数满足上述方程组)中方差最大的;y2是与yi不相关的乂叫叫,…,冲的一切线性组合中方差次大的;yp是与yi, y2, y3,…孙都不相关的Xi,X2,X3,…,%的一切线性组合中方差最小的;

yi 在总方差中所占比例最大,它综合原有变量的能力最强,其余变量在总方 差中所占比例依次递减,即:其余变量综合原有变量的能力依次减弱。

6.2主成份分析的基本步骤

(1) 将原始数据标准化;

(2) 计算变量间简单相关系数矩阵R ;

(3) 求R 的特征值入孩及日企…灼NO 及对应的单位特征向量〃丄02,

但,…旳;

(4) 得到:

6.3确定因子变量一计算因子载荷 / 、 ⑶ … Z 版 "2】。…%1將、

A = 。22 … ? ?? ??? ??? ???

"1姻屿2压…与2再 ■ — ■ — b

■ 二 W — — —

??? ??? ??? ???

/成y 厄??.〃所任 ( a \\ "12 …a \k

'll 皿 "2】我… A =

。21 a 22 a 2k U 22*J^2 … 纯 2*7^7 . .. ... ... ...

、% a p2 …a pk y ... ... ... ... Blp\^ U 2p\[^2 …

7确定因子变量个数

确定k 个因子变量

(1) 根据特征值入i 确定:取特征值大于1的特征根;

(2) 根据累计贡献率:一般累计贡献率应在四%以上;

% =S ;/p = 4/£4

j=l

p

% = (s ;+s ;)/〃 =(4 +%)/£&

/-I

‘ k p

&=£?/〃=/ £九

I-l >1 /-I

(3)通过观察碎石图的方式确定因子变星的个数。

8因子变量的命名解释

(1) 发现:

aij 的绝对值可能在某一行的许多列上都有较大的取值,或au 的绝对值可

能 在某一列的许多行上都有较大的取值。

(2) 表明:

某个原有变量为可能同时与几个因子都有比较大的相关关系,也就是说,某 个原有变量为的信息需要由若干个因子变量来共同解释;同时,虽然一个因子变 量可能能够解释许多变量的信息,但它却只能解释某个变量的一少部分信息,不 是任何一个变量的典型代表。

(3) 结论:因子变量的实际含义不清楚

通过某种手段使:每个变量在尽可能少的因子上又比较高的载荷,艮卩:在埋 想状态下,让某个变量在某个因子上的载荷趋于1,而在其他因子上的载荷趋于 0。这样:一个因子变量:就能够成为某个变量的典型代表,它的实际含义也就清 楚了。

9计算因子得分

因子得分是因子变量构造的最终体现。

基本思想:是将基本变量表示为原有变量的线性组合,艮卩:通过因子得分函

数计算因子得分。

因子得分可看作各变量值的权数总和,权数的大小表示了变量对因子的重要 Tf ? Scree Plot

Component Number

程度。

Fji=?丿无+弓2七+弓,3£ +??? + ?帀%(/ = 1,2,3,…人)10因子分析的基本步骤

(1)菜单选项:analyze->Data Reduction->Factor;

(2)选择参与因子分析的变量到Wriables框;

(3)Discriptive:分析是否适合做因子分析;

(4)Extraction:选择构造因子变量的方法,默认主成分分析法。

Extract框:指定确定因子个数的标准;

(5)Rotation:择因子载荷矩阵的旋转方法。默认是不进行旋转。一般可以选择Wimax选项釆用方差极大法旋转。

(6)Scores:Save as variables:将因子得分存成一个名为FACn m的SPSS变量中,其中:n是因子变量的名,以数字序号的形式表示;m表示是第几次作的。Display fee tor score coefficient matrix项表示:以矩阵的形式输出因子得分函数。Method框中提供了估计因子得分的几种方法。

第二讲数学建模的基本方法和步骤

第二讲 数学建模的基本方法与步骤 数学建模面临的实际问题就是多种多样的,建模的目的不同、分析的方法不同、采用的数学工具不同,所得模型的类型也不同,我们不能指望归纳出若干条准则,适用于一切实际问题的数学建模方法。下面所谓基本方法不就是针对具体问题而就是从方法论的意义上讲的。(注:用最初等的方法解决,越受人尊重) 一 数学建模的基本方法 一般说来数学建模的方法大体上可分为机理分析与测试分析两种。 ????????????? 机理分析: 是根据对客观事物特性的认识,找出反映内部机理的数 量规律,建立的数学模型常有明确的物理或现实意义。 建模方法测试分析: 将研究对象看作一个“黑箱”(意思是内部机理看不清 楚),通过对测量数据的统计分析,找出与数据拟合最 好的模型。 面对于一个实际问题用哪一种方法建模,主要取决于人们对研究对象的了解程度与建模目的。如果掌握了一些内部机理的知识,模型也要求具有反映内部特征的物理意义,建模就应以机理分析为主。而如果对象的内部机理规律基本上不清楚,模型也不需要反映内部特征,那么可以用测试分析。对于许多实际问题也常常将两种方法结合起来,用机理分析建立模型结构,用测试分析确定模型的参数。 二 数学建模的一般步骤 建模要经过哪些步骤并没有一定的模式,通常与问题性质与建模的目的等有关。下面给出建模的一般步骤,如图1、2所示。 ⑴ 模型准备:了解实际背景,明确建模目的,搜索必要信息,弄清对象的主要特征,形成一个比较清晰的“问题”(即问题的提出)。情况明才能方法对,在这个阶段要深入调查研究,虚心向实际工作者请教,尽量掌握第一手资料。

⑵模型假设:根据对象的特征与建模目的,抓住问题的本质,忽略次要因素,作出必要的、合理的简化假设。对于建模的成败这就是非常重要与困难的一步。假设不合理或太简单,会导致错误的或无用的模型;假设作得过分详细,试图把复杂对象的众多因素都考虑进去,会使您很难或无法继续下一步的工作。常常需要在合理与简化之间作出恰当的折衷,要不段积累经验,并注意培养与充分发挥对事物的洞察力与判断力。 ⑶模型的建立:根据假设,用数学的语言、符号描述对象的内在规律,得到一个数学结构。这里除了需要一些相关的专门知识外,还常常需要较为广阔的应用数学方面的知识,要善于发挥想象力,注意使用类比法,分析对象与熟悉的其她对象的共性,借用已有的数学模型。建模时还应遵循的一个原则就是尽量采用简单数学工具,因为您的模型总希望更多的人了解与使用,而不就是只供少数专家欣赏。 ⑷模型求解:使用各种数学方法、数学软件与计算机技术对模型求解。 ⑸模型分析:对求解结果进行数学上的分析,如对结果进行误差分析,分析模型对数据的稳定性或灵敏性等。 ⑹模型检验:把求解与分析结果翻译回到实际问题,与实际现象、数据进行比较,检验模型的合理性与适用性。如果结果与实际不符,问题常常出现在模型假设上,应该修改或补充假设,重新建模。这一步对于模型就是否真的有用就是非常关键的,要以严肃认真的态度对待。 ⑺模型应用:这与问题的性质、建模的目的以及最终结果有关,一般不属于本书讨论的范围。 应该指出,并不就是所有问题的建模都要经过这些步骤,有时各步骤之间的界限也不那么分明,建模时不要拘泥于形式上的按部就班。 三数学建模的全过程 数学建模的全过程可分为表述、求解、解释、验证几个阶段,并且通过这些阶段完成从现实对象到数学模型,再从数学模型回到现实对象的循环,如图1、3所示。 表述就是根据建模目的与信息将实际问题“翻译”成数学问题,即将现实问题“翻译”成抽象的数学问题,属于归纳法。数学模型的求解选择适当的数学方

第1节 数学建模与数学探究

第1节数学建模与数学探究 【内容要求】 数学建模活动是对现实问题进行数学抽象,用数学语言表达问题、用数学方法构建模型解决问题的过程.主要包括:在实际情境中从数学的视角发现问题、提出问题,分析问题、构建模型,确定参数、计算求解,检验结果、改进模型,最终解决实际问题.数学建模活动是基于数学思维运用模型解决实际问题的一类综合实践活动,是高中阶段数学课程的重要内容. 【基本过程】 数学建模活动的基本过程如下: 数学探究活动是围绕某个具体的数学问题,开展自主探究、合作研究并最终解决问题的过程.具体表现为:发现和提出有意义的数学问题,猜测合理的数学结论,提出解决问题的思路和方案,通过自主探索、合作研究论证数学结论.数学探究活动是运用数学知识解决数学问题的一类综合实践活动,也是高中阶段数学课程的重要内容. 【过程解读】 掌握建模基本过程,会对实际问题进行问题分析,善于合理假设. ·问题分析也常称为模型准备或问题重述.由于数学模型是建立数学与实际现象之

间的桥梁,因此,首要的工作是要设法用数学的语言表述实际现象.所谓问题重述是指把实际现象尽量地使用贴近数学的语言进行重新描述.为此,要充分了解问题的实际背景,明确建模的目的,尽可能弄清对象的特征,并为此搜集必需的各种信息或数据.要善于捕捉对象特征中隐含的数学因素,并将其一一列出.至此,我们便有了一个很好的开端,而有了这个良好的开端,不仅可以决定建模方向,初步确定用哪一类模型,而且对下面的各个步骤都将产生影响. ·模型假设(即合理假设)是与问题分析紧密衔接的又一个重要步骤.根据对象的特征和建模目的,在问题分析基础上对问题进行必要的、合理的取舍简化,并使用精确的语言作出假设,这是建模至关重要的一步.这是因为,一个实际问题往往是复杂多变的,如不经过合理的简化假设,将很难于转化成数学模型,即便转化成功,也可能是一个复杂的难于求解的模型从而使建模归于失败.当然,假设作得不合理或过分简单也同样会因为与实际相去甚远而使建模归于失败.一般地,作出假设时要充分利用与问题相关的有关学科知识,充分发挥想象力和观察判断力,分清问题的主次,抓住主要因素,舍弃次要因素. 【实际意义】 数学建模的实际意义 1.在一般工程技术领域,数学建模仍然大有用武之地. 在以声、光、热、力、电这些物理学科为基础的诸如机械、电机、土木、水利等工程技术领域中,数学建模的普遍性和重要性不言而喻,虽然这里的基本模型是已有的,但是由于新技术、新工艺的不断涌现,提出了许多需要用数学方法解决的新问题;高速、大型计算机的飞速发展,使得过去即便有了数学模型也无法求解的课题(如大型水坝的应力计算,中长期天气预报等)迎刃而解;建立在数学模型和计算机模拟基础上的CAD技术,以其快速、经济、方便等优势,大量地替代了传统工程设计中的现场实验、物理模拟等手段. 2.在高新技术领域,数学建模几乎是必不可少的工具. 无论是发展通讯、航天、微电子、自动化等高新技术本身,还是将高新技术用于传统工业去创造新工艺、开发新产品,计算机技术支持下的建模和模拟都是经常使用的有效手段.数学建模、数值计算和计算机图形等相结合形成的计算机软件,已经被固化于产品中,在许多高新技术领域起着核心作用,被认为是高新技术的特征之一.

数学建模的基本步骤

数学建模的基本步骤 一、数学建模题目 1)以社会,经济,管理,环境,自然现象等现代科学中出现的新问题为背景,一般都有一个比较确切的现实问题。 2)给出若干假设条件: 1. 只有过程、规则等定性假设; 2. 给出若干实测或统计数据; 3. 给出若干参数或图形等。 根据问题要求给出问题的优化解决方案或预测结果等。根据问题要求题目一般可分为优化问题、统计问题或者二者结合的统计优化问题,优化问题一般需要对问题进行优化求解找出最优或近似最优方案,统计问题一般具有大量的数据需要处理,寻找一个好的处理方法非常重要。 二、建模思路方法 1、机理分析根据问题的要求、限制条件、规则假设建立规划模型,寻找合适的寻优算法进行求解或利用比例分析、代数方法、微分方程等分析方法从基本物理规律以及给出的资料数据来推导出变量之间函数关系。 2、数据分析法对大量的观测数据进行统计分析,寻求规律建立数学模型,采用的分析方法一般有: 1). 回归分析法(数理统计方法)-用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式。 2). 时序分析法--处理的是动态的时间序列相关数据,又称为过程统计方法。 3)、多元统计分析(聚类分析、判别分析、因子分析、主成分分析、生存数据分析)。 3、计算机仿真(又称统计估计方法):根据实际问题的要求由计算机产生随机变量对动态行为进行比较逼真的模仿,观察在某种规则限制下的仿真结果(如蒙特卡罗模拟)。 三、模型求解: 模型建好了,模型的求解也是一个重要的方面,一个好的求解算法与一个合

适的求解软件的选择至关重要,常用求解软件有matlab,mathematica,lingo,lindo,spss,sas等数学软件以及c/c++等编程工具。 Lingo、lindo一般用于优化问题的求解,spss,sas一般用于统计问题的求解,matlab,mathematica功能较为综合,分别擅长数值运算与符号运算。 常用算法有:数据拟合、参数估计、插值等数据处理算法,通常使用spss、sas、Matlab作为工具. 线性规划、整数规划、多元规划、二次规划、动态规划等通常使用Lindo、Lingo,Matlab软件。 图论算法,、回溯搜索、分治算法、分支定界等计算机算法, 模拟退火法、神经网络、遗传算法。 四、自学能力和查找资料文献的能力: 建模过程中资料的查找也具有相当重要的作用,在现行方案不令人满意或难以进展时,一个合适的资料往往会令人豁然开朗。常用文献资料查找中文网站:CNKI、VIP、万方。 五、论文结构: 0、摘要 1、问题的重述,背景分析 2、问题的分析 3、模型的假设,符号说明 4、模型的建立(局部问题分析,公式推导,基本模型,最终模型等) 5、模型的求解 6、模型检验:模型的结果分析与检验,误差分析 7、模型评价:优缺点,模型的推广与改进 8、参考文献 9、附录 六、需要重视的问题 数学建模的所有工作最终都要通过论文来体现,因此论文的写法至关重要:

因子分析模型的建立

基于因子分析模型的居民消费价格指数影响因素分 析 摘要:由于目前对居民消费价格变动原因的分析指标很多,且指标体系中各指标之间存在着多重共线性,从而影响了分析模型的稳定性,使所得模型中出现了不符合经济学原理的现象。本文采用多元统计分析方法,以2010年居民消费物价水平为例,建立了关于居民消费价格分类指数变动的因子分析模型,研究发现影响居民消费价格指数的主要因素为食品、衣着和家用设备等生活必需品的价格水平,其次为健身等娱乐设施价格和房价水平。 关键词:消费价格指数;影响因素;因子分析 一、研究背景 随着社会主义市场经济体制的确立和逐步完善,我国经济总量和综合实力迅速上升,居民的生活水平显着提高,经济和社会都有了较大的发展。相对于过去而言,居民食品方面的消费支出比重在逐渐下降,而在文化娱乐等方面的消费支出比重越来越大。国家发改委在全国物价局长会议上指出,明年要围绕促进经济平稳较快发展这一主线,积极稳妥地推进价格改革,切实改进价格监管,保持价格总水平基本稳定。同时由于影响价格变动的因素日益复杂,价格异常波动的可能性增加。分析影响居民消费价格指数的主要影响因素,改进价格监管,保持价格总水平基本稳定有着重要意义;同时也为产业政策的制定和宏观经济的调控提供了参考。 居民消费价格指数(CPI)是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标,在一定程度上也反映出我国居民消费结构的变化。本文通过对2010年全国居民消费价格指数的变化进行因子分析,从而确定出影响全国居民消费物价水平和消费结构变化的主导因素。 二、因子分析模型的建立 因子分析最初是由英国心理学家C.Spearman提出的,是多元统计分析的一个重要分支,其主要目的是浓缩数据。通过对诸多变量的相关性研究,来表示原来变量的主要信息。假设有n个样本,对于多指标问题X=(X1,X2,...Xk),形成的背景原因是多种多样的,其中共同原因称为公共因子,假设用Fj表示,它们之间是两两正交的;每一个分量Xi又有其特定的原因,称为特殊因子,假设用ei表示,其两两之间互不相关,且只对相应的Xi起作用。同时,F与e相互独立。于是因子分析的数学模型可表示为: Fi叫做公共因子(也称主因子),它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。

数学建模常用方法

数学建模常用方法 建模常用算法,仅供参考: 1、蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必 用的方法) 2、数据拟合、参数估计、插值等数据处理算法(比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用M a t l a b作为工具) 3、线性规划、整数规划、多元规划、二次规划等规划类问题(建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通 常使用L i n d o、L i n g o软件实现) 4、图论算法(这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备) 5、动态规划、回溯搜索、分治算法、分支定界等计算机算法(这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中) 6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法(这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用) 7、网格算法和穷举法(网格算法和穷举法都是暴力搜索最优点的算法,在很多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种 暴力方案,最好使用一些高级语言作为编程工具) 8、一些连续离散化方法(很多问题都是实际来的,数据可以是连续的,而计 算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的) 9、数值分析算法(如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用) 10、图象处理算法(赛题中有一类问题与图形有关,即使与图形无关,论文 中也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用M a t l a b进行处理) 一、在数学建模中常用的方法: 1.类比法 2.二分法 3.量纲分析法 4.差分法 5.变分法 6.图论法 7.层次分析法 8.数据拟合法 9.回归分析法 10.数学规划(线性规划、非线性规划、整数规划、动态规划、目标规划) 11.机理分析 12.排队方法

(完整版)SPSS因子分析法-例子解释

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

数学建模模拟题,图论,回归模型,聚类分析,因子分析等 (48)

第11章第2题 摘要 本题分析4 种化肥和3 个小麦品种对小麦产量的影响,以及二者交互作用对小麦产量的影响,可视为两因素方差分析,即化肥和小麦品种两个因素,4种化肥可看作是化肥的四个不同水平,3个小麦品种也可以看作是小麦品种的三个不同水平。 试验的目的是分析化肥的四个不同水平以及小麦品种的三个不同水平对小麦产量有无显着性影响。 关键词:方差分析显着性化肥种类小麦品种

一.问题重述 为了分析4 种化肥和3 个小麦品种对小麦产量的影响,把一块试验田等分成36个小块,分别对3种种子和四种化肥的每一种组合种植3 小块田,产量如表1所示(单位公斤),问不同品种、不同种类的化肥及二者的交互作用对小麦产量有无显着影响。 二.问题分析 本题意在分析四种化肥和三种小麦品种对小麦产量的影响,以及二者交互作用对小麦产量的影响,为两因素方差分析问题,即化肥和小麦品种两个因素,4种化肥可看作是化肥的四个不同水平,3个小麦品种也可以看作是小麦品种的三个不同水平。通过对这两种因素的不同水平及交互作用的分析,从而分析 4 种化肥和3 个小麦品种对小麦产量的影响。 三.模型假设 1.假设只有化肥种类和小麦品种两个因素,其他因素对试验结果不构成影响。 2.假设不存在数据记录错误。 3.假设每一块试验田本身各项指标相同,不会影响结果。 四.符号说明 数字1,2,3,4——不同的化肥种类 数字1,2,3——不同的小麦品种 五.模型建立 将化肥种类和小麦品种视为两个因素,四种化肥种类看作是化肥种类的四个不同水平,三个小麦品种看作是小麦品种的三个不同水平,将表1的数据进行整理,如表2所示。

六.模型求解 将表2数据导入到spss软件中,进行两因素方差检验,得到结果如下:表3

因子分析例题

因子分析例题 公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-

因子分析 因子分析(Factor Analysis )是主成分分析的推广,它也是从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合变量的一种多变量统计分析方法。 第一节 因子分析的基本思想 首先我们看下面两个实际例子: 例1. 例1. 某企业招聘人才,对每位应聘者进行外貌、申请书的形式、专业能力、 讨人喜欢的能力、自信心、洞察力、诚实、推销本领、经验、积极性、抱负、理解能力、潜在能力、实际能力、适应性等15个方面的考核。这15个方面可归结为应聘者的外露能力、讨人喜欢的能力、经验、专业能力4个方面,每一方面称之为一个公共因子。企业可根据这4个公共因子的情况来衡量应聘者的综合水平。 例2. 例2. 在企业经济效益的评价中,有经济效益的指标体系。通常这个指标体系 有八项指标:固定资产利税率、资金利税率、销售收入利税率、资金利税率、固定资产产值率、流动资金周转天数、万元产值能耗、全员劳动生产率等。这八项指标可概括为盈利能力、资金和人力利用、产值能耗三个方面。这三个方面在企业的生产经营活动中为主要因子,起着支配作用,企业要提高经济效益就要在这三个公共因子方面下功夫。 因子分析的基本思想:是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间的相关(相似)关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。 因子分析分为两类,即R 型因子分析(对变量作因子分析),Q 型因子分析(对样品作因子分析)。 第二节 第二节 因子分析的数学模型 1.1. 模型(R 型) 设),,,(21p x x x X =为观察到的随机向量,),,,(21m F F F F =是不可观测的向量。 有 即 其中)',,(1p εεε =称作误差或特殊因子。 满足假设: 1)p m ≤ 2)0),cov(=εF , 3)m I F =)var(,),,()var(2 21p diag σσε =。 称i F 为第i 个公共因子,ij a 为因子载荷。 因子分析与主成分的关系:

数学建模方法和步骤

数学建模的主要步骤: 第一、模型准备 首先要了解问题的实际背景,明确建模目的,搜集必需的各种信息,尽量弄清对象的特征. 第二、模型假设 根据对象的特征和建模目的,对问题进行必要的、合理的简化,用精确的语言作出假设,是建模至关重要的一步.如果对问题的所有因素一概考虑,无疑是一种有勇气但方法欠佳的行为,所以高超的建模者能充分发挥想象力、洞察力和判断力,善于辨别主次,而且为了使处理方法简单,应尽量使问题线性化、均匀化. 第三、模型构成 根据所作的假设分析对象的因果关系,利用对象的内在规律和适当的数学工具,构造各个量间的等式关系或其它数学结构.这时,我们便会进入一个广阔的应用数学天地,这里在高数、概率老人的膝下,有许多可爱的孩子们,他们是图论、排队论、线性规划、对策论等许多许多,真是泱泱大国,别有洞天.不过我们应当牢记,建立数学模型是为了让更多的人明了并能加以应用,因此工具愈简单愈有价值. 第四、模型求解 可以采用解方程、画图形、证明定理、逻辑运算、数值运算等各种传统的和近代的数学方法,特别是计算机技术.一道实际问题的解决往往需要纷繁的计算,许多时候还得将系统运行情况用计算机模拟出来,因此编程和熟悉数学软件包能力便举足轻重. 第五、模型分析 对模型解答进行数学上的分析."横看成岭侧成峰,远近高低各不?quot;,能否对模型结果作出细致精当的分析,决定了你的模型能否达到更高的档次.还要记住,不论那种情况都需进行误差分析,数据稳定性分析. 数学建模采用的主要方法有: (一)、机理分析法:根据对客观事物特性的认识从基本物理定律以及系统的结构数据来推导出模 型. 1、比例分析法:建立变量之间函数关系的最基本最常用的方法. 2、代数方法:求解离散问题(离散的数据、符号、图形)的主要方法. 3、逻辑方法:是数学理论研究的重要方法,对社会学和经济学等领域的实际问题,在决策,对策等学科中得到广泛应用. 4、常微分方程:解决两个变量之间的变化规律,关键是建立“瞬时变化率”的表达式. 5、偏微分方程:解决因变量与两个以上自变量之间的变化规律. (二)、数据分析法:通过对量测数据的统计分析,找出与数据拟合最好的模型 1、回归分析法:用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式,由于处理的是静态的独立数据,故称为数理统计方法. 2、时序分析法:处理的是动态的相关数据,又称为过程统计方法. 3、回归分析法:用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式,由于处理的是静态的独立数据,故称为数理统计方法.

方法:因子分析法

因子分析基础理论知识 1 概念 因子分析(Factor analysis ):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。 主成分分析(Principal component analysis ):是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。 两者关系:主成分分析(PCA )和因子分析(FA )是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。 2 特点 (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。 (2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在显着的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显着的相关关系。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。 3 类型 根据研究对象的不同,把因子分析分为R 型和Q 型两种。 当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。 但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 4分析原理 假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 : ?????? ????? ???=np n n p p x x x x x x x x x X ΛM M M M ΛΛ212222111211

数学建模各种分析报告方法

现代统计学 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 2.主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 主成分分析和因子分析的区别 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。 和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,

数学建模多元统计分析

实验报告 一、实验名称 多元统计分析作业题。 二、实验目的 (一)了解并掌握主成分分析与因子分析的基本原理和简单解法。 (二)学会使用matlab编写程序进行因子分析,求得特征值、特征向量、载荷矩阵等值。(三)学会使用排序、元胞数组、图像表示最后的结果,使结果更加直观。 三、实验内容与要求

四、实验原理与步骤 (一)第一题: 1、实验原理: 因子分析简介: (1) 1.1 基本因子分析模型 设p维总体x=(x1,x2,....,xp)'的均值为u=(u1,u2,....,u3)',因子分析的一般模型为 x1=u1+a11f1+a12f2+........+a1mfm+ε 1 x2=u2+a21f1+a22f2+........+a2mfm+ε 2 ......... xp=up+ap1f1+fp2f2+..........+apmfm+εp 其中,f1,f2,.....,fm为m个公共因子;εi是变量xi(i=1,2,.....,p)所独有的特殊因子,他们都是不可观测的隐变量。称aij(i=1,2,.....,p;j=1,2,.....,m)为变量xi的公共因子fi上的载荷,它反映了公共因子对变量的重要程度,对解释公共因子具有重要的作用。上式可以写为矩阵形式 x=u+Af+ε

其中A=(aij)pxm 称为因子载荷矩阵;f=(f1,f2,....,fm)'为公共因子向量;ε=(ε1,ε2,.....εp)称为特殊因子向量 (2) 1.2 共性方差与特殊方差 xi的方差var(xi)由两部分组成,一个是公共因子对xi方差的贡献,称为共性方差;一个是特殊因子对xi方差的贡献,称为特殊方差。每个原始变量的方差都被分成了共性方差和特殊方差两部分。 (3) 1.3 因子旋转 因子分析的主要目的是对公共因子给出符合实际意义的合理解释,解释的依据就是因子载荷阵的个列元素的取值。当因子载荷阵某一列上各元素的绝对值差距较大时,并且绝对值大的元素较少时,则该公共因子就易于解释,反之,公共因子的解释就比较困难。此时可以考虑对因子和因子载荷进行旋转(例如正交旋转),使得旋转后的因子载荷阵的各列元素的绝对值尽可能量两极分化,这样就使得因子的解释变得容易。 因子旋转方法有正交旋转和斜交旋转两种,这里只介绍一种普遍使用的正交旋转法:最大方差旋转。这种旋转方法的目的是使因子载荷阵每列上的各元素的绝对值(或平方值)尽可能地向两极分化,即少数元素的绝对值(或平方值)取尽可能大的值,而其他元素尽量接近于0. (4) 1.4 因子得分 在对公共因子做出合理解释后,有时还需要求出各观测所对应的各个公共因子的得分,就比如我们知道某个女孩是一个美女,可能很多人更关心该给她的脸蛋、身材等各打多少分,常用的求因子得分的方法有加权最小二乘法和回归法。 注意:因子载荷矩阵和得分矩阵的区别: 因子载荷矩阵是各个原始变量的因子表达式的系数,表达提取的公因子对原始变量的影响程度。因子得分矩阵表示各项指标变量与提取的公因子之间的关系,在某一公因子上得分高,表明该指标与该公因子之间关系越密切。简单说,通过因子载荷矩阵可以得到原始指标变量的线性组合,如X1=a11*F1+a12*F2+a13*F3,其中X1为指标变量1,a11、a12、a13分别为与变量X1在同一行的因子载荷,F1、F2、F3分别为提取的公因子;通过因子得分矩阵可以得到公因子的线性组合,如F1=a11*X1+a21*X2+a31*X3,字母代表的意义同上。 (5) 1.5 因子分析中的Heywood(海伍德)现象 如果x的各个分量都已经标准化了,则其方差=1。即共性方差与特殊方差的和为1。也就是说共性方差与特殊方差均大于0,并且小于1。但在实际进行参数估计的时候,共性方差

数学建模之因子分析法

因子分析 因子分析就是一种降维、简化数据的技术。它通过研究众多变量之间的部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。 1.因子分析法的应用 ①汽车行业业绩评价研究(下载文档), ②上市公司盈利能力及资本结构实证分析, ③生育率影响因素分析。 2.步骤 ①对原始数据进行标准化处理 用12,, ,m x x x 表示因子分析指标的m 个变量,评价对象有n 个,ij a 表示第i 个评价对象对应于第j 个指标的取值。将每个指标值ij a 转化为标准化指标ij a ,即 ,(1,2, ,;1,2, ,)ij j ij j a a i n j m s μ-= == 式中:11n j ij i a n μ==∑,21 1()1n j ij j i s a n μ==--∑ 相应地,标准化指标变量为 ,(1,2, ,)j j j j x x j m s μ-= = ②计算相关系数矩阵R ()ij m m R r ?= 1 ,(,1,2, ,)1 n ki kj k ij a a r i j m n =?= =-∑ 式中:1,ii ij ji r r r ==,ij r 是第i 个指标和第j 指标之间的相关系数。

③计算初等载荷矩阵 解特征方程0=-R I λ,得到特征值(1,2,,)i i m λ=12,0m λλλ≥≥≥≥,再 求出相对应的特征值i λ的特征向量(1,2,,)i u i m =,其中12(,,,)T j j j mj u u u u =, 得到初等载荷矩阵为 11, ,m m u λ?Λ=? ④ 确定主因子的个数()k k m ≤ 一般选取使得累计贡献率11 85%k m i i i i λλ ==≥∑∑的这k 个主因子,对k 个因子载 荷矩阵作旋转,用() 1k Λ表示1Λ的前k 列,T 表示正交矩阵,则得矩阵()21k T Λ=Λ,建立因子模型,即 1111111, . k k m m mk k x F F x F F αααα=++?? ??=++? ⑥计算因子得分,作出综合评价 求出单个因子的得分函数?j F ,用?ij F 表示第i 个样本对第j 个因子的得分估计值,Y 表示原始数据标准化后的矩阵,则总得分为 1??()ij n k k F F YR -?== Λ 例题 我国上市公司赢利能力与资本结构的实证分析已知上市公司的数据见表1 表1 上市公司数据

因子分析数学模型说课材料

因子分析数学模型

因子分析数学模型 1、因子分析看基本思想 因子分析是一种旨在寻找隐藏在多变量数据中,无法直接观察到却影响或支配可观测变量的潜在因子,并估计潜在因子对可观测变量的影响程度,以及潜在因子之间的相关性的一种多元统计分析方法。其基本思想是从分析多变量数据的相关关系入手,找到支配这种相关关系的少数几个相关独立的潜在因子,并通过建立起这些潜在因子与原变量之间的数量关系来预测潜在因子的状态,帮助发现隐藏在原变量之间的某种客观规律性。因子分析和主成分分析都能起到清理多个原始变量内在结构关系的作用,但主成分分子重在综合原始变量信息,而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法。 因子分析法就是这些潜在因子的数学模型方法,它是在主成分的基础上构筑若干个意义较为明确的潜在因子,以它们为框架分析原变量,以考察原变量间的联系与区别。 2、因子分析的基本原理 3、因子分析的数学模型 假设对n例样品观测了p个指标,即,,…,,得到观测数据。我们的任务就是从一组观测数据出发,通过分析各指标,,…,之间的相关性,找出支配作用的潜在因子,使得这些因子可以解释各个指标之间的相关性。 因子分析模型描述如下: (1)X=(,,…,)是可观测随机变量,均值向量E(X)=0,协方差Cov(X)与相关矩阵R相等,(只要将变量标准化即可实现)。 (2)F=(,,…,)(m<=p)是不可测的向量,其均值E(F)=0,协方差矩阵Cov(F)=1,即向量的各分量是独立的。 (3)e=(,,…,)与F相互独立,且E(e)=0,e的协方差矩阵是对角矩阵,即各分量e之间是相互独立的。 则因子分析的数学模型如下:

建立数学模型方法步骤特点及分类

建立数学模型的方法、步骤、特点及分类 [学习目标] 1.能表述建立数学模型的方法、步骤; 2.能表述建立数学模型的逼真性、可行性、渐进性、强健性、可转移性、非 预制性、条理性、技艺性和局限性等特点;; 3.能表述数学建模的分类; 4.会采用灵活的表述方法建立数学模型; 5.培养建模的想象力和洞察力。 一、建立数学模型的方法和步骤 —般说来建立数学模型的方法大体上可分为两大类、一类是机理分析方法,一类是测试分析方法.机理分析是根据对现实对象特性的认识、分析其因果关系,找出反映内部机理的规律,建立的模型常有明确的物理或现实意义.测试分折将研究对象视为一个“黑箱”系统,内部机理无法直接寻求,可以测量系统的输人输出数据、并以此为基础运用统计分析方法,按照事先确定的准则在某一类模型中选出一个与数据拟合得最好的模型。这种方法称为系统辨识(System Identification).将这两种方法结合起来也是常用的建模方法。即用机理分析建立模型的结构,用系统辨识确定模型的参数. 可以看出,用上面的哪一类方法建模主要是根据我们对研究对象的了解程度和建模目的决定的.如果掌握了机理方面的一定知识,模型也要求具有反映内部特性的物理意义。那么应该以机理分析方法为主.当然,若需要模型参数的具体数值,还可以用系统辨识或其他统计方法得到.如果对象的内部机理基本上没掌握,模型也不用于分析内部特性,譬如仅用来做输出预报,则可以系统辩识方法

为主.系统辨识是一门专门学科,需要一定的控制理论和随机过程方面的知识.以下所谓建模方法只指机理分析。 建模要经过哪些步骤并没有一定的模式,通常与实际问题的性质、建模的目的等有关,从 §16.2节的几个例子也可以看出这点.下面给出建模的—般步骤,如图16-5所示. 图16-5 建模步骤示意图 模型准备首先要了解问题的实际背景,明确建模的目的搜集建模必需的各种信息如现象、数据等,尽量弄清对象的特征,由此初步确定用哪一类模型,总之是做好建模的准备工作.情况明才能方法对,这一步一定不能忽视,碰到问题要虚心向从事实际工作的同志请教,尽量掌握第一手资料. 模型假设根据对象的特征和建模的目的,对问题进行必要的、合理的简化,用精确的语言做出假设,可以说是建模的关键一步.一般地说,一个实际问题不经过简化假设就很难翻译成数学问题,即使可能,也很难求解.不同的简化假设会得到不同的模型.假设作得不合理或过份简单,会导致模型失败或部分失败,于是应该修改和补充假设;假设作得过分详细,试图把复杂对象的各方面因素都考虑进去,可能使你很难甚至无法继续下一步的工作.通常,作假设的依据,一是出于对问题内在规律的认识,二是来自对数据或现象的分析,也可以是二者的综合.作假设时既要运用与问题相关的物理、化学、生物、经济等方面的知识,又要充分发挥想象力、洞察力和判断力,善于辨别问题的主次,果断地抓住主要因素,舍弃次要因素,尽量将问题线性化、均匀化.经验在这里也常起重要作用.写出假设时,语言要精确,就象做习题时写出已知条件那样.

数学建模的一般步骤

数学建模的一般步骤 数学建模要经过哪些步骤并没有一定的模式,通常与问题的性质、建模目的等有关,下面简要介绍数学建模的一般步骤,如下图所示. 一、模型准备 了解问题的实际背景,明确建模目的,搜集必需的各种信息如数据,尽量弄清研究对象的主要特征,形成一个比较清晰的“问题”. 二、模型假设 根据对象的特征和建模目的,抓住问题的本质,忽略次要因素,对问题进行必要的、合理的简化假设,是关乎建模成败至关重要的一步。假设作得不合理或太简单,会导致错误或无用的模型;假设作得过分详细,试图将复杂对象的众多因素都考虑进去,会使得模型建立或求解等无法进行下去. 三、模型构成 根据所作的假设,用数学语言、符号描述对象的内在规律,建立包含常量、变量等的数学模型,如优化模型、微分方程模型等等。这里需要注意的是,建立数学模型是为了让更多的人明了并能加以应用,因此尽量采用简单的数学工具。 四、模型求解 可以采用解方程、画图形、优化方法、逻辑运算、数值运算等各种传统的和近代的数学方法,特别是数学软件和计算机技术。一些实

际问题的解决往往需要纷繁的计算,许多时候还得将系统运行情况用计算机模拟出来,因此计算机编程和熟悉数学软件能力举足轻重。五、模型分析 对模型求解结果进行数学上的分析。如结果的误差分析、统计分析、模型对数据的灵敏性分析、对假设的强健性分析等。 六、模型检验 将求解和分析结果翻译回到实际问题,与实际的现象、数据比较,检验模型的合理性和适用性.如果结果与实际不符,问题常常出现在模型假设上,应该修改、补充假设,重新建模,如上图中的虚线所示.这一步对于模型是否真的有用非常关键.有些模型要经过几次反复,不断完善,直到检验结果获得某种程度上的满意. 七、模型应用 将所建立的模型用来解决实际问题.

因子分析例题

因子分析例题标准化管理部编码-[99968T-6889628-J68568-1689N]

因子分析 因子分析(Factor Analysis )是主成分分析的推广,它也是从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合变量的一种多变量统计分析方法。 第一节 因子分析的基本思想 首先我们看下面两个实际例子: 例1. 例1. 某企业招聘人才,对每位应聘者进行外貌、申请书的形式、专业能力、讨人喜 欢的能力、自信心、洞察力、诚实、推销本领、经验、积极性、抱负、理解能力、潜在能力、实际能力、适应性等15个方面的考核。这15个方面可归结为应聘者的外露能力、讨人喜欢的能力、经验、专业能力4个方面,每一方面称之为一个公共因子。企业可根据这4个公共因子的情况来衡量应聘者的综合水平。 例2. 例2. 在企业经济效益的评价中,有经济效益的指标体系。通常这个指标体系有八项 指标:固定资产利税率、资金利税率、销售收入利税率、资金利税率、固定资产产值率、流动资金周转天数、万元产值能耗、全员劳动生产率等。这八项指标可概括为盈利能力、资金和人力利用、产值能耗三个方面。这三个方面在企业的生产经营活动中为主要因子,起着支配作用,企业要提高经济效益就要在这三个公共因子方面下功 夫。 因子分析的基本思想:是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间的相关(相似)关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。 因子分析分为两类,即R 型因子分析(对变量作因子分析),Q 型因子分析(对样品作因子分析)。 第二节 第二节 因子分析的数学模型 1.1. 模型(R 型) 设),,,(21p x x x X =为观察到的随机向量,),,,(21m F F F F =是不可观测的向量。 有 即 其中)',,(1p εεε =称作误差或特殊因子。 满足假设: 1)p m ≤ 2)0),cov(=εF , 3)m I F =)var(,),,()var(2 21p diag σσε =。 称i F 为第i 个公共因子,ij a 为因子载荷。 因子分析与主成分的关系: 联系:两者都可以看作逼近协方差矩阵∑。

相关文档