文档库 最新最全的文档下载
当前位置:文档库 › 基于主成分分析法的城市土地利用潜力评价

基于主成分分析法的城市土地利用潜力评价

基于主成分分析法的城市土地利用潜力评价
基于主成分分析法的城市土地利用潜力评价

第33卷第1期湖南农业大学学报(自然科学版) Vol.33 No.1 2007年2月Journal of Hunan Agricultural University (Natural Sciences) Feb.2007

文章编号:1007-1032(2007)01-0113-04

基于主成分分析法的城市土地利用潜力评价

张晓玲,戴吉开,关 欣,文 倩

(湖南农业大学资源环境学院,湖南长沙 410128)

摘要:城市土地利用潜力水平与城市现实的集约水平密切相关,并且直接关系到城市未来的综合发展.分别从社会、经济、环境三个层面选取12个指标建立城市土地利用潜力评价体系,以中国20个城市为地域研究单元,对其进行全面测度和比较;运用主成分分析法,分析因子的贡献率和各因子载荷量,并进一步利用主成分分析的分类功能,根据所提取的主成分因子对评价单元进行潜力水平分类.结果表明,中国城市的土地利用潜力分为3个大类,6个细类,其中,北京、重庆归类为土地潜力利用水平较好;沈阳、武汉、太原、西安、昆明、天津、南京、哈尔滨、长春、大连、郑州、成都、济南、石家庄归类为土地利用潜力水平一般;青岛、杭州、广州、上海归类为土地利用潜力水平较差.

关键词:城市土地利用潜力水平;主成分分析法;分类

中图分类号:F293.2 文献标识码:A

The classification of land use potentials in cities of China based on

principal component analysis

ZHANG Xiao-ling,DAI Ji-kai,GUAN Xin,WEN Qian

(College of Resources and Environment,HNAU,Changsha 410128,China) Abstract:Urban land use potential level which is closely related to the intensive level is directly relevant with the comprehensive development of China cities.This paper develops an assessment system of the urban land use potentials (ASULUP) which includes 12 indicators settled in three layers:social,economical and environmental perspectives.The indexes of the ASULUP,including 20 cities in China mainland,are evaluated and compared thoroughly by developing the assessment system.The principal component analysis (PCA) is applied to rotate them by the method of varimax.Analyzing the component matrix,the principal components are extracted and named according to the comprehensive meaning of indexes.Moreover,utilizing the classification function of PCA method,the appraisement units are classified and ordered.The study shows that the ASULUP of the cities display with three kinds of levels.Beijing and Chongqing are divided into the better potential level;Shenyang,Wuhan,Taiyuan,Xi’an,Kunming,Tianjin,Nanjing,Haerbin,Changchun,Dalian,Zhengzhou,Chengdu,Jinan and Shijiazhuang are categorized into the common potential level;

Qingdao,Hangzhou,Guangzhou and Shanghai are subscribed to the less potential level of China.

Key words:urban land utilization potentials;principal component analysis;classification

城市土地集约利用水平是现有城市土地利用效率的表征,许多学者从不同角度和不同范围对城市土地集约利用进行了概念解释和界定[1-9],而城市土地利用潜力水平则可揭示城市未来发展水平,同时也是城市土地集约利用水平研究的一个重要方向.笔者认为,土地利用潜力的内涵可从提高城市土地经济利用效率、增加社会利用潜力和改善城市生态环境这三个角度来界定.

随着城市化的推进,经济的发展和人口的急剧增长,中国的城市规模呈现无序蔓延的趋势,因此定量研究城市土地的潜力水平是一个必然的趋势,到目前为止,诸多学者已经做了大量的研究,章其祥等[10]在分析南京市土地利用结构特征的基础上,从城市土地利用的强度潜力、结构潜力和经济潜力三方面分析并提出若干建议和措施;郭爱请等[11]以河北省为例,从宏观层面对省域范围内不同规模等级城市(地级市、县级市、县城)土地进行集约利用潜力评价,从全省城市土地利用的共性和整体性出发,

收稿日期:2006-11-13

基金项目:湖南农业大学人才科学基金(690502)

作者简介:张晓玲(1982-),女,江苏徐州人,硕士研究生.

114 湖南农业大学学报(自然科学版) 2007年2月

设计了一套全方位、多目标、可量化、适合省域范围的城市土地潜力评价指标体系;洪增林等[12]在实践的基础上,提出城市土地集约利用潜力评价应包括总体评价、区域评价、开发区评价及地块评价四部分,并提出了一套完整的城市土地集约利用潜力评价指标体系.笔者拟考虑通过系统的主成分分析方法对中国城市的土地利用潜力进行综合全面测度,在此基础上展开具体的分类工作.

1 城市土地利用潜力评价指标体系的建立 1.1 研究方法和案例选取

城市土地利用潜力评价可以揭示出城市土地利用的未来发展潜力.主成分分析的目的主要有两个,一是用有限个不可观测的潜在变量来直接解释原变量的相关性,二是对变量或样本进行分类[13].由于城市土地利用潜力水平是一个潜在的隐性指标体系,该体系必须从已知的因子体系中推论得出.因而这是一种简单高效的衡量城市土地利用潜力的方法.综上所述,笔者选取主成分分析法作为主要的研究方法.采取选择标准城市的方法,在中国选取北京、重庆、青岛、杭州、广州、上海、沈阳、武汉、太原、西安、昆明、天津、南京、哈尔滨、长春、大连、郑州、成都、济南、石家庄等20个城市作为本研究的案例分析源.

1.2 指标选取的原则

(1) 导向性原则:指标体系的建立必须突出土地利用集约水平的导向作用,通过评价体系的建立,激励、引导各级政府及相关产业的用地策略紧扣集约的内涵,提高单位面积土地的产出效率.

(2) 可比性原则:选择涵义明确、口径一致的评价指标,采用相对合理的核算和综合方法,建立横向可比评价系统的基础.即在求出各大城市土地利用潜力水平评价结果基础之上,反映、分析各土地利用潜力水平现状及各地区之间的差距.

(3) 面与重点相结合的原则:对城市的土地利用潜力水平进行分析评价,要尽可能完整、全面、系统地揭示土地利用潜力.从总目标层次出发进行要素分解,逐层建立完整的分析评价指标体系.同时在综合评价指标体系设置中,既要全面系统、公正客观,又要力求抓住重点、突出重点,有所侧重.1.3 城市土地利用潜力指标体系的建立

城市土地是否具备足够的潜力取决于诸多方面的因素,要对城市土地进行定量评价,而建立相应的评价指标体系是评价的首要工作.城市土地潜力利用评价指标体系是一个有机的动态复合系统,不仅可以全面反映城市土地利用的潜力和可持续发展的能力,而且可以比较客观地体现城市土地集约利用的内在功能[14].笔者根据对城市土地利用潜力内涵和目的的理解,结合城市发展现状,拟从社会利用潜力评价、经济利用效率评价和环境利用潜力评价三个方面设定评价指标体系(表1).这些指标之间可能具有一定的相关性,而主成分分析法既可将众多指标综合起来,又能克服指标间的相关性,同时进一步根据主成分的得分情况,对城市土地利用潜力水平进行分类.

表1 城市土地利用潜力评价指标体系 Table 1 Assessment index system of city land use potential

可利用潜力指标

Var1——人均用地面积(hm2/人)

Var3——人均住房使用面积(m2/人)

Var7——居住用地构成(%)

社会利用潜力

Var9——城市规模(104)

Var2——地均GDP(104/ hm2)

Var4——人均拥有城市建设维护金(104/ hm2)

Var5——地均固定资产投资(104/ hm2)

Var6——工业用地构成(%)

经济利用效率

Var10——人均年末储蓄余额(元)

环境利用潜力 Var8——道路广场用地比例(%)

Var11——人均道路面积(m2/人)

Var12——建成区绿化覆盖率(%)

1.4 基于主成分分析的城市土地利用潜力评价

对原始数据标准化处理以后,将数据导入Statistica统计分析软件,运用主成分和分类分析功能,得到合成因子的特征根和贡献率,如图1所示.因子1,因子2和因子3的累计贡献率已接近80%,这意味着因子1,因子2和因子3所携带的数据信息已经基本包括了原来12个变量所携带的数据信息,这就使数据结构大为简化.因此选取因子1,因子2和因子3作为主成分进行分析.

第33卷第1期 张晓玲等 基于主成分分析法的城市土地利用潜力评价 115

因子数

图1 因子特征根和贡献率

Fig.1 Factor eigenvalue and communalities

把原来评价指标(变量)与所合成的主成分的相关性投影到因子1-因子2的荷载图(同理可以得到因子1-因子3的荷载图),由图2可见,因子1与工业用地构成比例、居住用地构成比例、道路广场用地比例呈密切正相关,与地均固定资产投资额、人均住房用地面积、人均道路面积呈负相关,从图上也可直观地看出城市土地利用结构的合理性程度,可以反映出土地已经被开发使用和闲置状况的对比度,对比度越高,土地可以开发调整利用的潜力程度越高,因此命名因子1为城市土地利用发展潜力因子;因子2与人均用地面积、城市规模、地均GDP 及建成区绿化覆盖率等指标呈密切正相关,与工业用地结构、居住用地结构等呈负相关,这表明城市人口的多少、土地利用投资的多寡以及土地的经济产出效益直接代表了城市土地被施加的强度与力度,进而揭示出城市土地利用的充分化和土地利用效率的最优化,因此命名因子2为城市土地利用效率因子;同理,因子3与建成区绿化覆盖率、人均

-1.0-0.50.00.5 1.0

因子 1

图 2 各变量在因子1-

因子2上的投影

Fig.2 Projection of the variables on the factor-plane(1-2)

道路用地存在强烈的正向荷载关系,而这两个子因

子主要反映城市土地开发过程中的生态环境约束程度,可以使得土地在合理的生态阈值范围内得到可持续利用,因此命名因子3为城市土地利用生态环境约束因子.

2 中国城市土地利用潜力水平分类

运用Statistica 统计软件进一步计算各个评价单元的主成分得分,根据各城市的得分投影到因子1-因子2的二维坐标上,并根据因子1和因子2的得分大小分为9个区(图3).

-101

S-M

图 3 各评价单元在因子1-因子2上的投影

Fig.3 Projection of the cases on the factor-plane(1-2)

图3中选取3大主成分中的主成分1和主成分2的得分大小分为大(L)、中(M)、小(S)3个区,L 表示分值大于1.5,S 表示分值小于-1.5,M 表示分值介于-1.5到1.5之间.

如M-L 区,表示因子1的得分为中间值,介于-1.5到1.5之间,而因子2的得分为最高值,分值大于1.由于因子1代表城市土地利用发展潜力因子,因子2代表城市土地利用效率因子,因此落在M-L 区的评价单元,表示该城市的土地利用

结构尚存在问题,而土地利用效率较高,因此如果进一步开展内涵挖潜,其集约利用水平必然提高.

根据图3中各个评价单元的位置,对选取的20个城市的土地利用潜力水平进行分类,由于S-L ,L-L ,L-S 这3个区缺少对应的城市,因此可分成6个大类,3个细类.

第Ⅰ类是首都北京,归类为土地潜力利用水平较

好的类型,城市未来发展潜力较高,同时土地利用效率也较好.由于其特殊的政治、经济、文化地位,该城市的土地利用渐趋饱和,而由于2008年北京奥运会

贡献率/%

因子2 因子2

因子1 因子数

116 湖南农业大学学报(自然科学版) 2007年2月

的召开,国家正在并将持续投入大量资金改善城市土地内部结构,在城市周边寻找后备土地资源.第Ⅱ类是重庆,归类为土地利用潜力一般的类型.城市土地利用发展潜力一般,利用效率较高.重庆因其特殊的山城地形,可利用开发的土地后备资源较少,该城市今后土地利用的重点应侧重于提高土地利用的产出效益.

第Ⅲ类是沈阳、武汉、太原、西安、昆明、天津、南京、哈尔滨、长春、大连、郑州、成都、济南、石家庄,归类为土地利用潜力、土地利用效率都很一般的类型.这14个城市密集分布于M-M区,代表着中国城市土地利用潜力的平均水平,这些城市土地利用潜力和利用效率都亟待提高,内部结构需要调整,同时应展开适当的内部挖潜工作.第Ⅳ类是青岛,归类为土地利用潜力较差的类型.该城市位于胶东半岛沿海地区,经济发达,但土地利用程度很大,偏于粗放利用土地,近海地区土地内部挖潜工作较为困难.

第Ⅴ类是杭州、广州,归类同第Ⅳ类.这两个城市是中国房地产炒作的热点地区,房价居高不下,商服居住用地占绝大部分,土地利用结构失衡,可利用的后备土地资源极少.

第Ⅵ类是上海,归类同第Ⅳ类.近年来上海市不断开发城市内部潜力,因其过度利用而导致的土地容量越来越小,表现为城市的基础设施超负荷运转,城市环境质量下降,用地结构偏重于商业用地,长期下去,必然影响城市经济和居民生活的正常运转.

3 结论与建议

通过建立一套涵盖三大层次12个指标的主要城市土地利用潜力评价体系,运用主成分分析法对全国20个城市的土地利用潜力的综合程度进行了全面测度,研究表明中国城市的土地利用潜力水平不均衡,土地利用潜力水平一般的沈阳、武汉、太原、西安等城市代表了中国城市土地利用发展潜力的平均水平.从分析中可以发现诸多问题,对于如何提高城市土地利用潜力的水平,笔者拟提出如下建议供参考:

一是调整土地利用结构,充分挖掘土地利用及产出能力,通过灵活的土地资产处置政策,实行“退二进三”、“活地兴企”等工程,将一些经济效益差、技术设备落后的企业搬出市区,腾出大量土地用于二次开发利用,以减少占用耕地,弥补新增建设用地不足.

二是注重城市内涵挖潜,加强城市内部土地的开发,探索城市土地立体化利用模式,比如通过利用地下和地上空间发展公用设施、生活服务以及交通、水电、煤气等基础设施,加大高层建筑的建设力度,以增加城市的建筑容积率,而最终增加土地的有效供给.

在论文完成过程中得到浙江大学东南土地管理学院吴宇哲老师的悉心指导,深表感谢.

参考文献:

[1] 肖梦.城市微观宏观经济学[M].北京:人民出版社,

1993:393.

[2] 丘金峰.房地产法辞典[K].北京:法律出版社,1992:

61.

[3] 宋春华.房地产大辞典[K].北京:红旗出版社,1993:

46.

[4] 马克伟.土地大辞典[K].长春:长春出版社,1991:

838-839.

[5] 成舜,白冰冰,李兰维,等.包头市城市土地集约

利用潜力宏观评价研究[J].内蒙古师范大学学报(自然

科学版),2003,32(3):271-277.

[6] 陈莹,刘康,郑伟元,等.城市土地集约利用潜力

评价的应用研究[J].中国土地科学,2002,16(4):26-29.[7] 甄江红,成舜,郭永昌,等.包头市工业用地土地集

约利用潜力评价初步研究[J].经济地理,2004,24(2):250-253.

[8] 龚义,吴小平,欧阳安蛟.城市土地集约利用内涵

界定及评价指标体系设计[J].浙江国土资源,2002(1):46-49.

[9] 何芳,魏静.城市化与城市土地集约利用[J].理

论探讨,2001(3):24-26.

[10] 章其祥,孙在宏,沈剑荣,等.城市土地集约利用潜

力评价——以南京市为例[J].南京师范大学学报(自然

科学版),2004(3):101-105.

[11] 郭爱请,葛京凤,于江海.河北省城市土地集约利用

潜力研究[J].安徽农业科学,2005(12):2452-2453.[12] 洪增林,薛惠锋.城市土地集约利用潜力评价指标体

系[J].地球科学与环境学报,2006(3):106-110.[13] 易丹辉.Statistica6.0应用指南[M].北京:中国统计

出版社,2002:183-189.

[14] 宋戈.中国城镇化过程中土地利用问题研究[M].北

京:中国农业出版社,2005.

责任编辑:罗慧敏

英文编辑:胡东平

主成分分析法运用

统计学简介及在实践中的应用 --以主成分分析法分析影响房价因素为例 姓名:阳飞 学号:2111601015 学院:经济管理学院 指导教师:吴东武 时间:二〇一七年一月六日

1 简介 统计语源最早出现于中世界拉丁语的Status,意思指各种现象的状态和状况。后来由这一语根组成意大利语Stato,有表示“国家”的概念,也含有国家结构和 国情知识的意思。根据这一语根,最早作为学名使用的“统计”的是在十八世纪德国政治学教授亨瓦尔(G.Achenwall)。他在1749年所著《近代欧洲各国国家学纲要》一书的绪言中,就把国家学名定义为“Statistika”(统计)这个词。原意是 指“国家显著事项的比较和记述”或“国势学”,认为统计是关于国家应注意事项的学问。自此以后,各国就相继沿用“统计”这个词,更把这个词译成各国的文字,其中,法国译为Statistique;意大利译为Statistica;英国译为Statistics;日本最初译为“政表”、“政算”、“国势”、“形势”等,直到1880年在太政官中设立了统计院,这个时候才确定以“统计”二字正名。 在我国近代史上首次出现是在1903年(清光绪廿九年)由钮永建、林卓南等翻译了四本由横山雅南所著的《统计讲义录》一书,这个时候才把“统计”这个词从日本传到我国。1907年(清光绪卅三年),由彭祖植编写的《统计学》在日本出版,同时在国内发行。这本书是我国最早的一本“统计学”书籍。自此以后“统计”一词就成了记述国家和社会状况的数量关系的总称。 关于“统计”这个词,后来又引申到了各种各样的组合,包括:统计工作、统计资料、统计科学。 统计工作是指利用科学的方法搜集、整理、分析和提供关于社会经济现象数量资料的工作的总称,它是统计的基础,也称统计实践或统计活动。是在一定统计理论指导下,采用科学的方法,搜集、整理、分析统计资料的一系列活动过程。

主成分分析法精华讲义及实例

主成分分析 类型:一种处理高维数据的方法。 降维思想:在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。 一、总体主成分 1.1 定义 设 X 1,X 2,…,X p 为某实际问题所涉及的 p 个随机变量。记 X=(X 1,X 2,…,Xp)T ,其协方差矩阵为 ()[(())(())], T ij p p E X E X X E X σ?∑==-- 它是一个 p 阶非负定矩阵。设 1111112212221122221122T p p T p p T p p p p pp p Y l X l X l X l X Y l X l X l X l X Y l X l X l X l X ?==+++? ==+++?? ??==+++? (1) 则有 ()(),1,2,...,, (,)(,),1,2,...,. T T i i i i T T T i j i j i j V ar Y V ar l X l l i p C ov Y Y C ov l X l X l l j p ==∑===∑= (2) 第 i 个主成分: 一般地,在约束条件 1T i i l l =

及 (,)0,1,2,..., 1.T i k i k C ov Y Y l l k i =∑==- 下,求 l i 使 Var(Y i )达到最大,由此 l i 所确定的 T i i Y l X = 称为 X 1,X 2,…,X p 的第 i 个主成分。 1.2 总体主成分的计算 设 ∑是12(,,...,) T p X X X X =的协方差矩阵,∑的特征值及相应的正交单位化特 征向量分别为 120p λλλ≥≥≥≥ 及 12,,...,, p e e e 则 X 的第 i 个主成分为 1122,1,2,...,,T i i i i ip p Y e X e X e X e X i p ==+++= (3) 此时 (),1,2,...,,(,)0,. T i i i i T i k i k V ar Y e e i p C ov Y Y e e i k λ?=∑==??=∑=≠?? 1.3 总体主成分的性质 1.3.1 主成分的协方差矩阵及总方差 记 12(,,...,) T p Y Y Y Y = 为主成分向量,则 Y=P T X ,其中12(,,...,)p P e e e =,且 12()()(,,...,),T T p Cov Y Cov P X P P Diag λλλ==∑=Λ= 由此得主成分的总方差为 1 1 1 ()()()()(),p p p T T i i i i i i V ar Y tr P P tr P P tr V ar X λ ==== =∑=∑=∑= ∑∑∑ 即主成分分析是把 p 个原始变量 X 1,X 2,…,X p 的总方差

主成分分析-实例

§8 实例 实例1 计算得 1x =71.25,2x =67.5 分析1:基于协差阵∑ 求主成分。 369.6117.9117.9214.3S ?? = ??? 特征根与特征向量(S无偏,用SPSS ) Factor 1 Factor 2 11x x - 0.880 -0.474 22x x - 0.474 0.880 特征值 433.12 150.81 贡献率 0.7417 0.2583 注:样本协差阵为无偏估计11(11)1n n n S X I X n n ''= --, 所以,第一、二主成分的表达式为 112212 0.88(71.25)0.47(67.5) 0.47(71.25)0.88(67.5)y x x y x x =-+-?? =--+-? 第一主成分是英语与数学的加权和(反映了综合成绩),且英语的权数要大于数学的权数。1y 越大,综合成绩越好。(综合成分) 第二主成分的两个系数异号(反映了两科成绩的均衡性)。不妨将英语称为文科,数学称为理科。2y 越大,说明偏科(文、理成绩不均衡),2y 越小,越接近于零,说明不偏科(文、理成绩均衡)。(结构成分)

问题:英语的权数为何大?如何解释? 分析2: 基于相关阵R 求主成分。因为 1x =71.25,2x =67.5 所以相关阵 11R ? =? ? ? 解得R 的特征根为:1λ=1.419,2λ=0.581,对应的单位特征向量分别为: Factor 1 Factor 2 11 1x x s - 0.707 0.707 22 2 x x s - 0.707 -0.707 特征根 1.419 0.581 贡献率 0.709 0.291 所以,第一、二主成分的表达式为 12112271.2567.50.7070.70717.9813.6971.2567.50.7070.70717.9813.69x x y x x y --? =+=+?? ? --?=-=-?? 1122120.039(71.25)0.052(67.5) 0.039(71.25)0.052(67.5)y x x y x x =-+-?? =---? 112212 0.0390.052 6.273 0.0390.0520.671y x x y x x =+-?? =-+? * 2*11707.0707.0x x y += *2*12707.0707.0x x y -= 基于相关阵的更说明了: 第一主成分是英语与数学的加权总分。 第二主成分是对两科成绩均衡性的度量。 此例说明:基于协差阵与基于相关阵的主成分分析的结果不一致。结合此例的实际背景,经对比分析可知,基于协差阵的主成分分析更符合实际。

主成分分析法matlab实现,实例演示

利用Matlab 编程实现主成分分析 1.概述 Matlab 语言是当今国际上科学界 (尤其是自动控制领域) 最具影响力、也是 最有活力的软件。它起源于矩阵运算,并已经发展成一种高度集成的计算机语言。它提供了强大的科学运算、灵活的程序设计流程、高质量的图形可视化与界面设计、与其他程序和语言的便捷接口的功能。Matlab 语言在各国高校与研究单位起着重大的作用。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。 1.1主成分分析计算步骤 ① 计算相关系数矩阵 ?? ? ???? ???? ?? ?=pp p p p p r r r r r r r r r R 2 122221 11211 (1) 在(3.5.3)式中,r ij (i ,j=1,2,…,p )为原变量的xi 与xj 之间的相关系数,其计算公式为 ∑∑∑===----= n k n k j kj i ki n k j kj i ki ij x x x x x x x x r 1 1 2 2 1 )() () )(( (2) 因为R 是实对称矩阵(即r ij =r ji ),所以只需计算上三角元素或下三角元素即可。

② 计算特征值与特征向量 首先解特征方程0=-R I λ,通常用雅可比法(Jacobi )求出特征值 ),,2,1(p i i =λ,并使其按大小顺序排列,即0,21≥≥≥≥p λλλ ;然后分别求 出对应于特征值i λ的特征向量),,2,1(p i e i =。这里要求i e =1,即112 =∑=p j ij e ,其 中ij e 表示向量i e 的第j 个分量。 ③ 计算主成分贡献率及累计贡献率 主成分i z 的贡献率为 ),,2,1(1 p i p k k i =∑=λ λ 累计贡献率为 ) ,,2,1(11 p i p k k i k k =∑∑==λ λ 一般取累计贡献率达85—95%的特征值m λλλ,,,21 所对应的第一、第二,…,第m (m ≤p )个主成分。 ④ 计算主成分载荷 其计算公式为 ) ,,2,1,(),(p j i e x z p l ij i j i ij ===λ (3)

主成分分析法的原理应用及计算步骤..

一、概述 在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。主成分分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点: ↓主成分个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓主成分能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓主成分之间应该互不相关 通过主成分分析得出的新的综合指标(主成分)之间互不相关,因子参与数据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题。 ↓主成分具有命名解释性 总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。 二、基本原理 主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标X1,X2,…,XP (比如p 个指标),重新组合成一组较少个数的互不相关的综合指标Fm 来代替原来指标。那么综合指标应该如何去提取,使其既能最大程度的反映原变量Xp 所代表的信息,又能保证新指标之间保持相互无关(信息不重叠)。 设F1表示原变量的第一个线性组合所形成的主成分指标,即 11112121...p p F a X a X a X =+++,由数学知识可知,每一个主成分所提取的信息量可 用其方差来度量,其方差Var(F1)越大,表示F1包含的信息越多。常常希望第一主成分F1所含的信息量最大,因此在所有的线性组合中选取的F1应该是X1,X2,…,XP 的所有线性组合中方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来p 个指标的信息,再考虑选取第二个主成分指标F2,为有效地反映原信息,F1已有的信息就不需要再出现在F2中,即F2与F1要保持独立、不相关,用数学语言表达就是其协方差Cov(F1, F2)=0,所以F2是与F1不

主成分分析PCA(含有详细推导过程以及案例分析matlab版)

主成分分析法(PCA) 在实际问题中,我们经常会遇到研究多个变量的问题,而且在多数情况下,多个变量之间常常存在一定的相关性。由于变量个数较多再加上变量之间的相关性,势必增加了分析问题的复杂性。如何从多个变量中综合为少数几个代表性变量,既能够代表原始变量的绝大多数信息,又互不相关,并且在新的综合变量基础上,可以进一步的统计分析,这时就需要进行主成分分析。 I. 主成分分析法(PCA)模型 (一)主成分分析的基本思想 主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法就叫做主成分分析或主分量分析。 主成分分析所要做的就是设法将原来众多具有一定相关性的变量,重新组合为一组新的相互无关的综合变量来代替原来变量。通常,数学上的处理方法就是将原来的变量做线性组合,作为新的综合变量,但是这种组合如果不加以限制,则可以有很多,应该如何选择呢?如果将选取的第一个线性组合即第一个综合变量记为1F ,自然希望它尽可能多地反映原来变量的信息,这里“信息”用方差来测量,即希望)(1F Var 越大,表示1F 包含的信息越多。因此在所有的线性组合中所选取的1F 应该是方差最大的,故称1F 为第一主成分。如果第一主成分不足以代表原来p 个变量的信息,再考虑选取2F 即第二个线性组合,为了有效地反映原来信息,1F 已有的信息就不需要再出现在2F 中,用数学语言表达就是要求 0),(21=F F Cov ,称2F 为第二主成分,依此类推可以构造出第三、四……第p 个主成分。 (二)主成分分析的数学模型 对于一个样本资料,观测p 个变量p x x x ,,21,n 个样品的数据资料阵为: ??????? ??=np n n p p x x x x x x x x x X 21 222 21112 11()p x x x ,,21=

主成分分析法的步骤和原理

(一)主成分分析法的基本思想 主成分分析(Principal Component Analysis)是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部分信息,且所含的信息互不重叠。[2] 采用这种方法可以克服单一的财务指标不能真实反映公司的财务情况的缺点,引进多方面的财务指标,但又将复杂因素归结为几个主成分,使得复杂问题得以简化,同时得到更为科学、准确的财务信息。 (二)主成分分析法代数模型 假设用p个变量来描述研究对象,分别用X1,X2…X p来表示,这p个变量构成的p维随机向量为X=(X1,X2…X p)t。设随机向量X的均值为μ,协方差矩阵为Σ。对X进行线性变化,考虑原始变量的线性组合: Z=μX+μX+…μX Z=μX+μX+…μX ……………… Z=μX+μX+…μX 主成分是不相关的线性组合Z1,Z2……Z p,并且Z1是X,X…X的线性组合中方差最大者,Z2是与Z1不相关的线性组合中方差最大者,…,Z是与Z1,Z2……Z p-1都不相关的线性组合中方差最大者。 (三)主成分分析法基本步骤 第一步:设估计样本数为n,选取的财务指标数为p,则由估计样本的原始数据可得矩阵X=(x ij)m×p,其中x ij表示第i家上市公司的第j项财务指标数据。 第二步:为了消除各项财务指标之间在量纲化和数量级上的差别,对指标数据进行标准化,得到标准化矩阵(系统自动生成)。 第三步:根据标准化数据矩阵建立协方差矩阵R,是反映标准化后的数据之间相关关系密切程度的统计指标,值越大,说明有必要对数据进行主成分分析。其中,R ij(i,j=1,2,…,p)为原始变量X i与X j的相关系数。R为实对称矩阵

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 公司销售净利率(X1)资产净利率(X2)净资产收益率(X3)销售毛利率(X4) 歌华有线五粮液用友软件太太药业浙江阳光烟台万华方正科技红河光明贵州茅台中铁二局红星发展伊利股份青岛海尔湖北宜化雅戈尔福建南纸43.31 17.11 21.11 29.55 11.00 17.63 2.73 29.11 20.29 3.99 22.65 4.43 5.40 7.06 19.82 7.26 7.39 12.13 6.03 8.62 8.41 13.86 4.22 5.44 9.48 4.64 11.13 7.30 8.90 2.79 10.53 2.99 8.73 17.29 7.00 10.13 11.83 15.41 17.16 6.09 12.97 9.35 14.3 14.36 12.53 5.24 18.55 6.99 54.89 44.25 89.37 73 25.22 36.44 9.96 56.26 82.23 13.04 50.51 29.04 65.5 19.79 42.04 22.72 第一,将EXCEL中的原始数据导入到SPSS软件中; 注意: 导入Spss的数据不能出现空缺的现象,如出现可用0补齐。 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。 所做工作: a. 原始数据的标准化处理

2020年整理土地评价与土地管理复习提纲.pdf

1土地:是地球陆地表面由地貌、土壤、岩石、水文、气候、生物及社会经济要素等组成的自然、经济和历史的综合体,包括人类过去和现在的种种活动结果。 土地基本特性: ·自然特性: 面积有限性;位置固定性;质量差异性;永续利用的相对性 ·社会经济特性: 供给稀缺性;用途多样性;增值性;区位性;权属性;政策法规性等社会经济特性 2国土地资源共分类: 耕地,园地,林地,牧草地,居民点及工矿用地,交通用地,水域,未利用土地 3 土地评价:为合理利用土地和调整土地收益分配,进行利用规划和科学管理土地,根据土地的自然生产能力或其它方面利用潜力的高低对土地的质量作出评估。 土地管理:国家为保护和开发土地资源,合理利用土地而采取的行政的、经济的、法律的和工程技术的综合性的手段和措施。 二者关系: 1)都是土地科学研究的重要内容 2)土地评价作为土地资源调查的组成部分,为土地利用规划提供依据,为土地管理服务3)土地评价是进行土地管理的基本前提和基础, 4)土地的管理和利用是土地评价的主要目的 1、简述《土地评价纲要》中土地评价的原则。 (1)要将土地利用对土地的要求与土地的质量进行比较(不同土地利用对土地质量要求不同) (2)要将土地利用的效益和所需的投入进行比较(投入水平相同) (3)因地制宜,根据研究区域的具体情况进行评价(风景林地资源的评定依赖不同区域;土地的适宜性在不同经济条件地区有所不同) (4)要对不同土地利用方式作出比较(一般为单一土地利用方式评价,不宜比较和优化;在改变土地利用方式时,应作多种土地利用方式评价) (5)要以土地的持久利用为前提(评价时应确保不因这种利用而导致生态环境退化或恶化,一般要进行经济、社会和生态的综合评价) 2、简述土地性状和土地质量的异同和关系。 土地特性:可以直接量测或估测的土地属性。 坡度、等 气候特性:总辐射、短波辐射、日照时数、年降雨、蒸散量、温度等。 土壤特性:土壤质地、有效深度、 pH值、土壤容重等。 水文及地质:洪害频率、洪水量、地下水埋深、地下水矿化度 地貌、地形:海拔、坡度、坡向、坡长、相对起伏 土地质量:由一种以上土地特性构成的、反映一定方面土地性质的综合属性。 土壤水分有效性:土壤质地、土壤孔隙度、降雨量、土壤水分蒸散量 扎根条件:土壤有效厚度、石砾含量、土壤质地 不同土地利用方式需要不同的土地质量 农地:水分有效性、扎根条件,养分有效性 草地:牧草生产能力、牧草营养价值、草地退化状况、饮水条件 土地质量与土地特性 (1)一种或几种土地特性决定某种土地质量,例如土壤水分有效性是由降雨量、土壤质地、

主成分分析法实例

1、主成分法: 用主成分法寻找公共因子的方法如下: 假定从相关阵出发求解主成分,设有p 个变量,则可找出p 个主成分。将所得的p 个主成分按由大到小的顺序排列,记为1Y ,2Y ,…,P Y , 则主成分与原始变量之间存在如下关系: 11111221221122221122....................p p p p p p p pp p Y X X X Y X X X Y X X X γγγγγγγγγ=+++?? =+++??? ?=+++? 式中,ij γ为随机向量X 的相关矩阵的特征值所对应的特征向量的分量,因为特征向量之间彼此正交,从X 到Y 得转换关系是可逆的,很容易得出由Y 到 X 得转换关系为: 11112121212122221122....................p p p p p p p pp p X Y Y Y X Y Y Y X Y Y Y γγγγγγγγγ=+++?? =+++??? ?=+++? 对上面每一等式只保留钱m 个主成分而把后面的部分用i ε代替,则上式变为: 111121211 2121222221122................. ...m m m m p p p mp m p X Y Y Y X Y Y Y X Y Y Y γγγεγγγεγγγε=++++??=++++????=++++? 上式在形式上已经与因子模型相一致,且i Y (i=1,2,…,m )之间相互独立,且i Y 与i ε之间相互独立,为了把i Y 转化成合适的公因子,现在要做的工作只是把主成分i Y 变为方差为1的变量。为完成此变换,必须将i Y 除以其标准差,由主成分分析的知识知其标准差即为特征根的平方根 i λ/i i i F Y λ=, 1122m m λγλγλγ,则式子变为:

主成分分析法概念及例题

主成分分析法 [ 编辑 ] 什么是主成分分析法 主成分分析也称 主分量分析 ,旨在利用降维的思想,把多 指标 转化为少数几个综合指标。 在 统计学 中,主成分分析( principal components analysis,PCA )是一种简化数据集的技 术。它是一个线性变换。 这个变换把数据变换到一个新的坐标系统中, 使得任何数据投影的第一 大方差 在第一个坐标 (称为第一主成分 )上,第二大方差在第二个坐标 (第二主成分 )上,依次类推。 主成分分析经常用减少数据集的维数, 同时保持数据集的对 方差 贡献最大的特征。 这是通过保留 低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是, 这也不是一定的,要视具体应用而定。 [ 编辑 ] , PCA ) 又称: 主分量分析,主成分回归分析法 主成分分析( principal components analysis

主成分分析的基本思想 在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。 [ 编辑] 主成分分析法的基本原理 主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 [ 编辑] 主成分分析的主要作用

土地类型与土地评价整理

绪论 土地的概念:土地是地球表面的特定地域,包括:地质,地貌,气候,水文,土壤,植被,动物以及人类活动结果组成的综合体。 土地是指地球陆地表面及其上下一定范围内的空间。具体地讲,土地由以下三个方面组成:①地球表面;②地球表面以上一定范围内的空间(简称地上空间);③地球表面以下一定范围内的空间(简称地下空间)。 第二章土地类型概述 土地类型:狭义的土地类型是指在土地分级所划分出的同一等级的土地单位,按照一定的原则和指标,将具有相同等级的土地单位按其相似性进行类群归并的产物。 土地分级:是指在对土地组成要素进行综合分析的基础上,通过自上而下的划分或自下而上的合并所产生的一系列等级有高低、复杂程度有差异的土地单位。 前苏联土地分级系统:地方县区相 土地分类:是对一个自然区域或行政区域范围内的土地进行类型的划分。按照一定的原则和方法以及分类标准将具有共同性或相似性的土地单位作不同程度的抽象概括与归并。从而获得分类级别高低不同的各类土地分类单位。 土地分类的原则:1.综合性原则;2.主导因素原则;3.实用性原则;(简答) 土地分类的方法:景观法,参数法,过程法。(概念以及优缺点)(简答)土地类型的命名: 第一种方法,是采用植被,土壤,地貌的三名法,针叶林漂灰土山地;灰褐色森林土针阔叶混交低山地 第二种方法,采用群众习用的名称,例如北京山区的活山、死山、软山以及深山、浅山; 第三种方法,用地名命名土地类型。 我国土地:一级:农用地;二级:建筑用地;三级:未利用土地; 土地分类的原则(简答) 土地分类的方法 第三章土地类型的结构与演替 土地类型结构的概念: 土地类型结构,简称土地结构,是指在某一个区域内,各种土地类型在质和量上的对比

R语言主成分分析的案例

R 语言主成分分析的案例
R 语言也介绍到案例篇了,也有不少同学反馈说还是不是特别明白一些基础的东西,希望能 够有一些比较浅显的可以操作的入门。其实这些之前 SPSS 实战案例都不少,老实说一旦用 上了开源工具就好像上瘾了,对于以前的 SAS、clementine 之类的可视化工具没有一点 感觉了。本质上还是觉得要装这个、装那个的比较麻烦,现在用 R 或者 python 直接简单 安装下,导入自己需要用到的包,活学活用一些命令函数就可以了。以后平台上集成 R、 python 的开发是趋势,包括现在 BAT 公司内部已经实现了。 今天就贴个盐泉水化学分析资料的主成分分析和因子分析通过 R 语言数据挖掘的小李 子: 有条件的同学最好自己安装下 R,操作一遍。 今有 20 个盐泉,盐泉的水化学特征系数值见下表.试对盐泉的水化学分析资料作主成分分 析和因子分析.(数据可以自己模拟一份)
其中 x1:矿化度(g/L);

x2:Br?103/Cl; x3:K?103/Σ 盐; x4:K?103/Cl; x5:Na/K; x6:Mg?102/Cl; x7:εNa/εCl.
1.数据准备
导入数据保存在对象 saltwell 中 >saltwell<-read.table("c:/saltwell.txt",header=T) >saltwell
2.数据分析

1 标准误、方差贡献率和累积贡献率
>arrests.pr<- prcomp(saltwell, scale = TRUE) >summary(arrests.pr,loadings=TRUE)
2 每个变量的标准误和变换矩阵
>prcomp(saltwell, scale = TRUE)
3 查看对象 arests.pr 中的内容
>> str(arrests.pr)

主成分法及其应用

【作者简介】 苏键(1985-),男,广西钦州人,助理工程师,研究方向:食品科学。1主成分分析法 何谓主成分分析,就是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析[1]。主成分分析的中心思想是缩减一个包括很多相互联系着的变量的数量集,在数量集中保留尽可能多的有用的变量。 主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。主成分分析是设法将原来众多具有一定相关性(比如P 个指标 ),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P 个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var (F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的, 故称F1为第一主成分。如果第一主成分不足以代表原来P 个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov (F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P 个主成分[2]。 主成分分析首先是由K.皮尔森对非随机变量引入的,而后H.霍特林将此方法推广到随机向量的情形[2]。信息的大小通常用离差平方和或方差来衡量。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。但是,在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。 2主成分分析法在食品领域的应用 2.1主成分分析在食品风味方面的应用 目前,主成分分析应用还是比较广泛的,但是就食品风味方面,关于该分析方法的文献鲜见报道。戴素贤等[3]人对七种高香型乌龙茶中的香气成分进行了主成分分析,他们尝试用主成分分析法来研究茶业香型的变化,并进而找到影响这些香型变化的主要化合物,同时还发现了不同的茶别中香气化合物变化的趋势并进行了模拟量化,直观地表现了各种香气化合物对香气的贡献程度。李华等[4]运用多元统计分析确定葡萄酒感官特性,多元统计分析中的主成分分析等数学工具能够把大量的描述葡萄酒感官特性的描述语精简成较少的综合性更强的描述语,这些精简后的描述语不但能够反映精简前描述语的信息,还可以筛选出科学合理的描述符,描述符是描述分析的语言和工具,根据描述符可以分类不同的葡萄酒。邵威平等[5]应用主成分分析法完成了不同品牌啤酒风味差异性的评价,同一品牌啤酒风味一致性的评价,同一品牌不同生产厂之间一致性的评价以及同一生产厂啤酒一致性的评价这些工作。 啤酒是个多指标的风味食品,主成分分析法可以帮助我们更好地研究啤酒理化指标和啤酒风格之间的相关性,从而达到更好地理解啤酒风味的目的。岳田利等[6]人则通过利用主成分分析的方法建立了苹果酒香气质量的评价模型,并以此来对苹果酒样品香气组分进行客观的统计分析。S.Kallithraka 等[7]采用高效液相色谱法和气相色谱法研究了希腊国内不同产地葡萄酒的化合物成分和感官特性,并运用了PCA 法(主成分分析法)对所得参数进行多元分析,最终达到给葡萄酒评价和分类的目的。2.2主成分分析在食品品质方面的应用 食品品质的评价往往是非常复杂的过程。因为影响食品品质的因素大量存在,非人为因素如食品环境中的微生物,温度及pH 等的变化带来的影响。另一方面,由于人为的因素掺假也会造成食品品质的低劣,进而损害广大销售者和消费者的利益。如黎海红等[8]人运用主成分分析法对掺伪芝麻油的检测方法进行研究分析。根据主成分分析的实验原理,可以选择芝麻油的折光率、酸价、色泽、水分及挥发物、皂化值和碘价等理化指标作为变量,将这些变量的所测数据做矩阵处理最后分析就 轻工科技 LIGHT INDUSTRY SCIENCE AND TECHNOLOGY 2012年9月第9期(总第166期) 食品与生物 主成分分析法及其应用 苏键,陈军,何洁 (广西轻工业科学技术研究院,广西南宁530031) 【摘要】 介绍了主成分分析法的定义、原理,概述了该法在食品及一些仪器分析领域的应用,目的是为其他还未应用该分 析方法的学术领域提供一种参考和借鉴,使得主成分分析法能够在越来越多的学术领域中得以推广和应用。 【关键词】主成分分析;应用;概述【中图分类号】TS262【文献标识码】A 【文章编号】2095-3518 (2012)09-12-02

土地类型与评价(高起专)阶段性作业4

土地类型与评价(高起专)阶段性作业4 总分: 100分考试时间:分钟 单选题 1. _____是通过对影响土地生产力的地形、土壤和其他环境要素的数值化,去进行土地质量的评价。(5分) (A) 主观因素法土地质量评价 (B) 加法土地质量评价 (C) 数值法土地质量评价 (D) 减法土地质量评价 您的回答:C正确 2. _____是根据经验去判断参评因素权重并进行土地评价的一种方法。(5分) (A) 经验判断指数和法 (B) 层次分析法 (C) 主成分分析法 (D) 特尔斐测定法 您的回答:A正确 3. _____是一个抽象的概念,它是自然界和人类社会中一切事物的表征。(5分) (A) 地方 (B) 土地 (C) 信息 (D) 土壤 您的回答:C正确 4. _____是指可达到某种目的的若干相互联系的事物。(5分) (A) 类 (B) 系统 (C) 信息 (D) 数据 您的回答:B正确 5. _____是指数据记录和编排格式以及数据间关系的描述。(5分) (A) 数据结构 (B) 数据量化 (C) 硬盘 (D) 矢量数据 您的回答:A正确

多选题 6. 层次分析法的特点有_____。(5分) (A) 逻辑性 (B) 系统性 (C) 简洁性 (D) 实用性 您的回答:A,B,C,D正确 7. 土地资源信息系统的数据源主要有_____。(5分) (A) 图件 (B) 遥感资料 (C) 统计资料 (D) 文字报告资料 您的回答:A,B,C,D正确 8. 数据结构主要包括_____。(5分) (A) 栅格数据结构 (B) 遥感资料 (C) 编码系统 (D) 矢量数据结构 您的回答:A,D正确 9. 常用的栅格数据压缩方法有_____。(5分) (A) 游程长度压缩编码法 (B) 层次分析法 (C) 四叉树压缩编码法 (D) 主成分分析法 您的回答:A,C正确 10. 在土地信息系统中,任何一种地理实体在平面上均可通过_____基本图形描述。(5分) (A) 点 (B) 线 (C) 面 (D) 地方 您的回答:A,B,C正确 判断题 11. 多边形是向量数据的一种图形要素。(5分) 正确错误 您的回答:正确正确

主成分分析法的步骤和原理

主成分分析法的步骤和原理 (总2页) -CAL-FENGHAI.-(YICAI)-Company One1 -CAL-本页仅作为文档封面,使用请直接删除

(一)主成分分析法的基本思想 主成分分析(Principal Component Analysis)是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部分信息,且所含的信息互不重叠。[2] 采用这种方法可以克服单一的财务指标不能真实反映公司的财务情况的缺点,引进多方面的财务指标,但又将复杂因素归结为几个主成分,使得复杂问题得以简化,同时得到更为科学、准确的财务信息。 (二)主成分分析法代数模型 假设用p个变量来描述研究对象,分别用X 1,X 2 …X p 来表示,这p个变量构 成的p维随机向量为X=(X 1,X 2 …X p )t。设随机向量X的均值为μ,协方差矩阵 为Σ。假设 X 是以 n 个标量随机变量组成的列向量,并且μk 是其第k个元素的期望值,即,μk= E(xk),协方差矩阵然后被定义为: Σ=E{(X-E[X])(X-E[X])}=(如图 对X进行线性变化,考虑原始变量的线性组合: Z1=μ11X1+μ12X2+…μ1p X p Z2=μ21X1+μ22X2+…μ2p X p ……………… Z p=μp1X1+μp2X2+…μpp X p 主成分是不相关的线性组合Z 1,Z 2 ……Z p ,并且Z 1 是X1,X2…X p的线性组合 中方差最大者,Z 2是与Z 1 不相关的线性组合中方差最大者,…,Z p是与Z 1 , Z 2……Z p-1 都不相关的线性组合中方差最大者。 (三)主成分分析法基本步骤 第一步:设估计样本数为n,选取的财务指标数为p,则由估计样本的原始 数据可得矩阵X=(x ij ) m×p ,其中x ij 表示第i家上市公司的第j项财务指标数 据。 第二步:为了消除各项财务指标之间在量纲化和数量级上的差别,对指标数据进行标准化,得到标准化矩阵(系统自动生成)。 第三步:根据标准化数据矩阵建立协方差矩阵R,是反映标准化后的数据之间相关关系密切程度的统计指标,值越大,说明有必要对数据进行主成分分 析。其中,R ij (i,j=1,2,…,p)为原始变量X i 与X j 的相关系数。R为实对 称矩阵(即R ij =R ji ),只需计算其上三角元素或下三角元素即可,其计算公式 为:

《土地类型与评价》试题参考答案及评分标准.docx

《土地类型与评价》试题参考答案及评分标准 2012级资源环境与城乡规划管理本科 一、简答(总分50分,每小题10分,共5个小题) 1、简述在土地类型研究中多阶抽样解译法的含义和步骤。 答:多阶抽样解译法,简称多阶抽样法,是指先进行大范用的土地分异概略性研究,再进行小范 围的十地类型详细研究。(1分)更明确地说,是先在卫星影像或小比例尺航空像片的镶嵌图上 辨别和划分自然区域单位和高级土地类型单位,再在较大比例尺航空像片上识别和划分岀较低级 的土地类型单位。(2分) 多阶抽样法的步骤包括: ①利用小比例尺遥感影像(如陆地卫星影像)识别和划分出灰阶或色调一致的“影像形态区”。这类卫星影像可以是单波段的黑白影像或其镶嵌图,也可以是多波段合成的假彩色影像。在影像上识别和划分出的“影像形态区”,有时代表比十?地系统级别更高的自然地理区域,有时则肓接代表土地系统或复杂土地系统,这取决于研究区的具体情况。(3 分)②在一卫星影像上划定的“影像形态区”内,采用空间分辨率较大的影像(如航空像片)进行抽样解译。(2分)③在单幅航空像片范伟I内进行地面抽样调查。(2分) 2、编制土地类型图的基本要求是什么? 答:①要体现科学性、系统性、完整性及制图表现的精确性。(1分) ②要正确反映研究区域土地类型结构的规律性。土地类世制图要注意反映不同地区 土地类型结构的差异性。(2分) ③要将底图的儿何精度与土地类型的界线紧密结合起来,力求使乞土地类型的图斑在图上定位准确。(2分) ④图例系统要简明扼要,层次清楚,设色要鲜明协调而又有一定科学含义,线划符号要力求精致、易读。(2分) ⑤编图屮要尽量采用年代较新和科学性较强的参考性图件资料。所编制的土地类型图在内容上要与同一区域的地貌图、土壤图、植被图、土地利用图和土地评价图等有关专业图件相协调。(2分) ⑥要尽可能采用遥感、地理信息系统等新技术讲行土地类型制图。(1分) 3、简述土地类型演替的概念和类别。 答:十?地类型不仅表现出空间上不同的组合关系和结构格局,而且也表现出时间上的发 生和发展过稈。当乞种H然因索和人为因索作用的强度达到一定稈度或作用的时间到达某一时段时,十-地系统就会发生“涨落”,土地属性随Z发生变化,即土地类型发生演替。(2分)①按演替性质分为时间演替和空河演替;(2分)②按演替原因可分为自然演替和人为演替;(2分)③按演替方向分为正向演替和逆向演替;(2分)④按演替过程可分为节律性演替和非节律性演替。(2分) 4、简述编绘土地类型图时图斑的面积量算原则。 答:面积量算的原则是:以图幅为基木控制,分幅进行量算,按面积比例平弟,白下而

相关文档
相关文档 最新文档