空间内插可以分为几何方法?统计方法?空间统计方法?函" />
文档库 最新最全的文档下载
当前位置:文档库 › 空间内插方法比较

空间内插方法比较

空间内插方法比较
空间内插方法比较

第!"卷第#期$%%%年&月

地球科学进展

’()’*+,-*,’./01+-,*+,1

)234!"*24#

5

55555555555555555555555555555555555555555555555555555555555555555567849$%%%

55555555

55

5555555

5学术论文空间内插方法比较

:

新9程国栋9卢

;

中国科学院寒区旱区环境与工程研究所9甘肃兰州

<#%%%%=

摘要>空间内插可以分为几何方法?统计方法?空间统计方法?函数方法?随机模拟方法?物理模型

模拟方法和综合方法@介绍了每一种方法的适用范围?算法和优缺点@指出没有绝对最优的空间内插方法9必须对数据进行空间探索分析9根据数据的特点9选择最优方法A 同时9应对内插结果做严格的检验@开发通用空间内插软件?智能化内插以及加强相关基础研究将是空间内插研究的重点@

词>空间内插A 空间数据探索分析A 地理信息系统

中图分类号>B $%C 文献标识码>’文章编号>

!%%!DC !&&;$%%%=%#E %$&%E %&!空间内插

根据已知地理空间的特性探索未知地理空间的特性是许多地理研究的第一步9也是地理学的基本问题@常规方法无法对空间中所有点进行观测9但是我们可以获得一定数量的空间样本9这些样本反映了空间分布的全部或部分特征9并可以据此预测未知地理空间的特征@在这一意义上9空间内插可以被定义为根据已知的空间数据估计;预测=未知空间的数据值@其目标可以归纳为>F 缺值估计>估计某一点缺失的观测数据9以提高数据密度A G 内插等值线>以等值线的形式直观地显示数据的空间分布A H 数据格网化>把无规则分布的空间数据内插为规则分布的空间数据集9

如规则矩形格网?三角网等@空间内插对于观测台站十分稀少9而台站分布又非常不合理的地区具有十分重要的实际意义@这些地区的常规观测常常不能满足要求9在这种情况下9

利用有限的常规观测估计合理的空间分布9或尽可能地提高数据密度就成为迫切要求@在这些方面9缺值估计和数据格网化将发挥重要的作用@;!=缺值估计@各种科学考察中形式多样的短

期观测是提高数据观测密度的重要方式9无形中起

到了加密台站的作用A 而且由于这些考察常常到达人迹罕至的高海拔和极地等区域9有助于了解区域内观测变量的完整空间分布@但是9这些观测序列往往很短9短则数十天9长不过几年@如何利用周围台站的长序列观测资料和短期观测本身的信息9将观测变量插补到长序列是一个重要问题@

;$=数据格网化@规则格网能够更好地反映连

续分布的空间现象9并对他们的变化作出模拟@现代地球科学模型和气候模型9如I +J ;一般环流模型=9都要求与I -1数据模型和遥感数据高度兼容的空间数据集@格网化的数据9尤其是规则矩形格网9已成为目前地学模型的主要数据形式@因此9对已知观测台站的观测数据进行空间内插9得到格网化数据是模型的第一步@

空间内插一般包括这样几个过程K !L

>F 内插方

法;模型=的选择A G 空间数据的探索分析9包括对数据的均值?方差?协方差?独立性和变异函数的估计等A H 内插方法评价A M 重新选择内插方法9直到合理A N 内插@

因此9通过比较而选择一个合用的?适合于数据空间分布特点的内插方法是空间内插的关键@本文将空间内插分类为几何方法?统计方法?空间统计方

:中国科学院特别经费支持领域项目O 冰冻圈基础研究P;编号>Q 6E R

E $E !%$=资助@第一作者简介>李新9男9!S &S 年!%月生于甘肃酒泉9副研究员9主要从事地理信息系统和遥感在冰冻圈和水资源研究中的应用@收稿日期>!S S S E %C E !S A 修回日期>!S S S E !!E %#@

法!函数方法!随机模拟方法!物理模型模拟方法和综合方法"通过比较研究"指出每一种方法的适用范围!算法和优缺点#

$空间内插方法比较

空间内插可依据%&确定或随机’(点与面’)全局或局部等标准分类*$+,-#本文依据内插方法的基本假设和数学本质"把空间内插分类为以下几种方法#

./0几何方法

是最简单的空间内插方法#几何方法基于1地理学第一定律2*3-的基本假设"即邻近的区域比距离远的区域更相似#几何方法的优点是计算开销少"具有普适性"不需要根据数据的特点对方法加以调整#当样本数据的密度足够大时"几何方法一般能达到满意的精度#几何方法的最大问题是"无法对误差进行理论估计#最常用的几何方法有泰森多边形4最近距离法5和反距离加权方法#

$/6/6泰森多边形4最近距离法5

泰森多边形用于生成1领地2或控制区域#实际上"尽管泰森多边形产生于气候学领域"它却特别适合于专题数据的内插"因为它生成专题与专题之间明显的边界"不会有不同级别之间的中间现象#泰森多边形的算法非常简单"未采样点的值等于与它距离最近的采样点的值#

$/6/$反距离加权方法

反距离加权法是最常用的空间内插方法之一#它认为与未采样点距离最近的若干个点对未采样点值的贡献最大"其贡献与距离成反比#可用下式表示%

789

:

;86

6

4<;5=

7;

9

:

;86

6

4<;5=

465

式中"7是估计值"7

;是第;4;86">":5个样本"<

;

是距离"=是距离的幂"它显著影响内插的结果"它的选择标准是最小平均绝对误差#?@A B C等*D-的研究结果表明"幂越高"内插结果越具有平滑的效果# ./.统计方法

其基本假设是"一系列空间数据相互相关"预测值的趋势和周期是与它相关的其它变量的函数#统计方法的优点是计算开销不大"有一定的理论基础"能够对误差作出整体上的估计#但是"其前提是一定要有好的采样设计"如果采样过程不能反映出表面变化的重要因素"如周期性和趋势"则内插一定不能取得好的效果*6"E-#常用的统计方法有趋势面方法和多元回归方法#

$/$/6趋势面

趋势面根据有限的观测数据拟合曲面"进行内插#它适用于%&能以空间的视点诠释趋势和残差’(观测有限"内插也基于有限的数据#当趋势和残差分别能与区域和局部尺度的空间过程相联系时"趋势面分析最有用*F-#

趋势面方法可以被定义为%

G8H I J K4$5式中"G是:L6维矩阵"对应于:个样本’H是:个样本的坐标矩阵’I是趋势面参数矩阵#H和I依赖于趋势面的次数#趋势面的次数是它最重要的特征# K是残差"通常是一个独立随机变量#当残差是随机独立时"统计检验有效’但实际上"趋势面中的残差常是自相关4特别是趋势面的次数较低时5"因此"检验是显著有偏差的#残差的空间自相关可以用随机过程模型模拟#由于趋势面的以上特性"它的目标有时并非最佳拟合"而是把数据分成区域趋势组分和局部的残差#

$/$/$多元回归

在各种统计方法中"使用较多的是回归分析"其特点是不需要分布的先验知识#

多元回归在数学形式上与趋势面很相似"但是"它们又有着显著的不同#首先"在趋势面分析中"H 是坐标矩阵"而在回归分析中"它可以是任意变量#其次"在趋势面方法中"模型的拟合严格地遵从自常数!一次!二次!立方等的顺序"主要的问题是确定模型的次数"因此"趋势面分析有内在的多重共线性问题’而在多元回归中"尽管也存在多重共线性"但它并非内在的"可以通过逐步回归解决"因此"相对于趋势面的选择次数"多元回归的核心问题是选择变量4主成分分析等方法有助于选择变量5和区分模型#

./M空间统计4N O P A Q B Q R A Q R S A5方法

空间统计又称地质统计学"于$T世纪3T年代初开始形成"D T年代在法国统计学家UB Q V O C P W的大量理论研究工作基础上逐渐趋于成熟*X"6T-#其基本假设是建立在空间相关的先验模型之上的#假定空间随机变量具有二阶平稳性"或者是服从空间统计的本征假设4R W Q C R W A R S V Y Z P Q V O A R A5*6"66+63-#则它具有这样的性质%距离较近的采样点比距离远的采样点更相似"相似的程度!或空间协方差的大小"是通过点对的平均方差度量的#点对差异的方差大小只与采样点间的距离有关"而与它们的绝对位置无关#空间统计内插的最大优点是以空间统计学作为其坚

6

D

$

第[期李新等%空间内插方法比较

实的理论基础!可以克服内插中误差难以分析的问题!

能够对误差做出逐点的理论估计"它也不会产生回归分析的边界效应#缺点是复杂!计算量大!尤其是变异函数$%&’()*’&+,是几个标准变异函数模型的组合时!计算量很大"另一个缺点是变异函数需要根据经验人为选定#空间统计方法以-’(*(.*及其各种变种$/)0’(*(.*等,为代表#12324-’(*(.*内插

$4,-’(*(.*内插的公式

-’(*(.*内插由南非地质学家-’(*5

发明!并因此而命名#6&785’).94:;

给出了-’(*(.*的一般公式#-’(*(.*内插的公式为<

=>

$?@,A B C D A 4

E D =$?D ,$3,

式中!=$?D ,为观测值!它们分别位于区域内?D 位

置"?@是一个未采样点"E D 为权!

并且其和等于4#即B C D A 4

E D A 4

$F ,

选取E D !使=>

$?@,的估计无偏!并且使方差G >

1

H 小于任意观测值线形组合的方差#

最小方差由下式给定<

G >1H

A B C D A 4

E D I $?D !?@,J K $L ,

它由下式得到<

B C D A 4

E D I $?D !?M ,J K A I $?M !?@,NM $:,

式中!I $?D !?M ,是=在采样点?D 和?M 之间的半方差

$O 5+(P %&’(&.Q 5,!I $?M !?@,是=在采样点?D 和未知点?@之间的半方差!

这些量都从适宜的变异函数得到#K 是极小化处理时的拉格朗日乘数#

估计半方差是一个较为复杂的过程!这一过程称为空间数据探索分析$R S T U ,

#$1,空间数据探索分析$R S T U ,

对于-’(*(.*内插而言!空间数据探索分析的目标是建立半方差I $V ,和点对之间的空间距离V 之间的关系!即变异函数#

由于空间统计的本征假设可以表示为以下两个公式<

W 任意两个距离为V 的两点间的差值的数学期望为@<

R 9X $?,Y X $?J V ,;A @$Z ,

W 任意两个距离为V 的两点间的差值的方差最小<

[&’9X $?,Y X $?

J V ,;A R \9]^$?,Y ]^$?J V ,;1

_A1I $V

,$‘,

因此!由下式估计半方差a $V

,

b C D A 49=$?D J V ,;1

$c ,这一关系即变异函数#它提供了内插d 优化采样的有用信息#-’(*(.*内插的第一步是根据样本找到适

合的变异函数理论模型#最常用的变异函数模型有<

.e **57d 球面d 指数d 高斯d 阻尼正弦d 幂和线形模型#其中!前几种模型在一定的范围内达到极大方差!而线形模型的方差增长没有极限#以下是几种基本变

异函数的形式94!4Z ;!

这些变异函数的特性分别是

模型缺乏空间相关#W 球面模型空间相关随距离的增长逐渐衰减!当距离g h 后!空间相关消失#

W 指数模型空间相关随距离的增长以指数形式衰减!相关性消失于无穷远#h 表示距离!在此距离上c L i 的变量的可变性趋于稳定#

W 高斯模型空间相关随距离的增长而衰减!

相关性消失于无穷远#曲线起始一段的形状是抛物线!表示变量的空间变化非常平滑#

W 阻尼正弦模型阻尼正弦模型适宜于周期性变化的空间变量!但其变化强度随距离的增长而衰减#h

表示周期#W 线性模型空间可变性随距离的增长而呈线性地增长!不会在某一距离稳定下来#

变异函数的形式是内插质量的关键#需要注意的是!

由于不同的区域有不同的空间模式!因而也就有不同的变异函数#而空间内插都有一个隐含的假定!即空间是连续的!因此!在选择变异函数模型之前!检查数据以确定空间连续性是十分必要的#12321/)0’(*(.*内插

/)0’(*(.*$共协0’(*(.*,内插的基本原理与-’(*(.*相同!

但它通过考虑一个以上变量而优化估计"内插由于考虑了变量之间的关系而得到改善#例如!在估计温度d 降水等气候变量时!海拔高度是附加的重要变量#/)0’(*(.*内插包括以下过程

除公式$Z ,d $‘,外!/)0’(*(.*引入一个新的假定!即两个变量之间差值的方差最小#

[&’9X $?,Y X m $?,;A 1I m

$V ,$4@,式中!X m

$?,是与估计值X $?

,相关的第m 个变量#/)0’(*(.*中引入交叉变异函数!

它是两个不同变量之间的相关随距离变化的函数#它与简单变异函数不同!前者的形式是方差!因此总为正或零"而

1

:1地球科学进展

第4L 卷

后者的形式为协方差!因此可以为正"负或零#如果两个变量向相反的方向变化!交叉变异函数为负$如果两个变量的变化相独立!交叉变异函数为零#交叉变异函数的形式为%

&’()*+

,

-.

/

.

0+,

12(30*42(305)*6

12’(30*42’(305)*6(,,*

789:;<;=<内插的关键是估计交叉变异函数!以分析变量自身以及变量之间的空间相关#789:;<;=<的其它过程都是与>:;<;=<一致的#

?@A函数方法

是使用函数逼近曲面的一种方法#函数方法在空间内插领域大多用于一些特殊场合!如利用高密度的高程数据产生等高线"为提高格网数据的空间分辨率而内插数据等#对于利用有限的观测数据进行缺值预测和内插格网!函数方法多不适合!因为它难以满足内插的精度!也难以估计误差#函数方法的特点是不需要对空间结构的预先估计"不需要做统计假设#缺点是难以对误差进行估计!点稀时效果不好#常用的函数方法有%傅里叶级数"样条函数"双线性内插"立方卷积法等#

-@B@,傅里叶级数

对于周期性的数据序列!如海浪!可以利用傅里叶级数将它们分解为正弦波和余弦波#

-@B@-样条函数方法

样条函数是使用函数逼近曲面的一种方法#样条函数易操作!计算量不大!它与空间统计方法相比具有以下特点!不需要对空间方差的结构做预先估计$不需要做统计假设!而这些假设往往是难以估计和验证的$同时!当表面很平滑时!也不牺牲精度#样条函数适合于非常平滑的表面!一般要求有连续的一阶和二阶导数$它适合于根据很密的点内插等值线!特别是从不规则三角网(C D E*内插等值线#样条函数的缺点是难以对误差进行估计!点稀时效果不好#

样条函数的种类很多!最常用的有F样条"张力样条1,G6和薄盘样条等1,H6#

-@B@I双线性内插

双线性内插和立方卷积法都主要用于网格数据的内插(重采样*!一般很少用于根据离散数据内插空间分布#它使用与待估计网格距离最近的B个网格值!线性内插获得新的网格值#双线性内插方法的优点是数据重采样后的结果较为平滑!没有阶跃效应!同时具有较高的精度#缺点是网格被平均化!具有低频滤波的效果$边缘被平滑!有些极值丢失了#

-@B@B立方卷积法

是最常使用的网格数据内插方法之一#它使用与待估计网格距离最近的,J个网格值!根据立方卷积公式计算输出1-K6#立方卷积公式有几个不同版本!有的产生低通滤波的效果!有的产生高通滤波的效果!较好的方法应该在高频信息和低频信息的取舍间取得平衡#立方卷积法的优点是采样结果的统计信息(均值和方差*与原数据的相似程度比其他采样方法高#缺点是数据值被改变!因此不能用于类型数据(专题图*的内插#立方卷积法特别适宜于显著改变了网格尺寸!但要保持原数据统计特性的数据内插!如数字高程数据的重采样#

?@L随机模拟方法

其基本假设与空间统计方法不同!随机模拟认为地理空间具有非平稳性1-,6!是空间异质的#它通过空间分布现象的可选的"等概率的"数值表达(地图*来对空间不确定性建模1--6#对应不确定性!可以接受可选的多个答案#与空间统计方法不同!随机模拟方法不是产生唯一的估计结果!它产生一系列可选的结果!它们都与实际数据一致!而且相关模型将它们联系起来#随机模拟方法的最大优点是定义了各种随机变量之间的空间相关!这类相关可以根据相邻数据把高度不确定性的先验分布更新为低不确定性的后验分布#缺点是建模困难!计算量大#常用的随机模拟方法有高斯过程"马尔科夫过程"蒙特卡罗方法"人工神经网络方法等#

?@M确定性模拟

其基本假设是变量的空间分布受物理定律控制!因此!可以使用物理模型或半经验"半物理的模型模拟空间分布#对于这一类内插!常常是使用有限的观测值获得一些必须的经验参数!再把这些参数代入到物理模型之中#典型的例子是!N7O是一个纯物理模型!但它的参数化使用了经验方法1-I6#在山区气候变量的内插过程中!也大量使用这种方法1-B!-J6#确定性模拟的最大优点即它的确定性!它不依赖或很少依赖观测样本#但空间现象是否可以被确定性地预测以及我们是否可以持这一乐观的信念十分值得怀疑#

?@P综合方法

是以上几种方法的综合#对于空间变量!一般能够用不同的方法分别对结构化变量"随机变量和观测误差(残差*建模#王劲峰1-Q6把空间变量分解为%空间变量+趋势5周期5随机5噪声(,-*

I

J

-

第I期李新等%空间内插方法比较

并分别用统计方法!谱函数!人工神经网络和随机过程建模描述相应的成分"

综合方法还适宜于能够得到辅助性数据#如遥感数据的场合"

通过从辅助性数据中提取空间模式#在合理的数据结构#如四叉树的支持下#划分空间同

质的区域#从而逼近最佳的预测值$%&’"

(结论与建议

)*+结论

,-.空间内插可依据其基本假设和数学本质分类为/几何方法!统计方法!空间统计方法!函数方法!随机模拟方法!物理模型模拟方法和综合方法",%.空间内插是极为重要的012空间分析方法"对于观测台站稀少#而测点分布又极不合理的地区#空间内插是研究这些区域空间变量空间分布的基本方法#是建立空间模型的前提之一"

,(.空间数据探索分析是分析地理数据的重要工具#它的一个重要目标是估计空间变量的变异函数"变异函数反映空间相关随距离变化的特征#可以用几个基本变异函数模型描述"根据变异函数#可以判断数据是否具有平稳性#是否符合空间统计的本征假设"

,3.本文比较了主要的空间内插方法#分析了各种方法的假设!适用范围!算法和优缺点#并且重点介绍了空间统计方法"必须指出#对于众多的空间内插方法而言#

没有绝对最优的空间内插方法#只有特定条件下的最优方法"因此#必须依据数据的内在特征#依据对数据的空间探索分析#经过反复实验#选择最优的空间内插方法"同时#应对内插结果做严格的检验"

)*4对空间内插研究的建议

,-.开发通用空间内插软件"空间内插是地理学的基本问题#也是012重要的空间分析方法"但现有的012软件中包括的空间内插方法都很少#如567819:;中只有趋势面!<=>?>@?和一些特定用途的函数方法#而且它们的界面不友好#难以使用"因此#应开发具有以下特点的通用空间内插软件/A 包括尽可能多的空间内插例程B C 智能化的人机界面#提供友好的人机界面#通过一系列有关用户意图!目标和数据特性的问题#引导用户#使用户选择最适宜的方法B D 良好的数据库接口#与012的兼容性"利用;E F 7,开放数据库互联.等技术手段从各种关系数据库中析取所需数据#生成与012兼容的空间数据和属性,表.数据"

,%.智能化"智能化的一个目标是减少内插中

的主观性"

例如#变异函数模型的选择具有很大的经验成分#变异函数的拟合往往是依据经验#反复实验的结果"应通过人机交互减少这种主观性"智能化的另一个目标是通过人为干预#在内插中考虑非地带性因素的影响"如地下水等埋深线是与河流平行的#地质现象的内插必须考虑断层#人为干预可以对这些非区域化的因子建模"

,(.加强基础研究"空间内插方法都建立在一

定的假设基础上#

这些假设都有一定的局限性"在这些假设中#我们往往回避的是空间不连续性和空间异质两个问题#如何将地理空间分解为不同区域G 分区后是否存在界面处的不连续现象G 如何对空间异质的区域建模都是亟需回答的重要问题"

参考文献

$-’H I >@>@?6*2J I K >I L E I K I 5@I L M N >N >@K O P 2Q R >I L I @ST @U >=Q @

V W P @K I L 2R >P @R P N $X ’*0=P I KF =>K I >@/7I W Y =>S ?PZ @>U P =N >K M [=P N N

#-\\]*%\-^(-%*$%’7Q L L >@N :7*5R Q W J I =>N Q @Q _N J I K >I L >@K P =J Q L I K >Q @K P R O @>‘a P N

>@K P W J P =I K a =P P N K >W I K >Q @$T F 8;b ’*O K K J /88c c c *@R ?>I

*a R N Y *P S a 8R Q @_8259d 5:T 7E V 6;X 8N _J I J P =N 8R Q L L >@N_=P S 8R Q L L >@N *O K W L

#-\\\V ]-V -(8-\\\V -]V %e *$(’fI K P =N 9X *Z @>K 3]V N J I K >I L >@K P =J Q L I K >Q @-$T F 8;b

’*O K K J /88c c c *?>N R I *I S P L I >S P *P S a *I a 8g P I 8?>N =N 8@R ?>I 8a 3]*O K W L

#-\\\V ](V -%8-\\\V -]V %e *$3’fI K P =N 9X *Z @>K 3-V N J I K >I L >@K P =J Q L I K >Q @%$T F 8;b

’*O K K J /88c c c *?>N R I *I S P L I >S P *P S a *I a 8g P I 8?>N =N 8@R ?>I 8a 3-*O K W L

#-\\\V ](V -%8-\\\V -]V %e *$e ’F a @?P f *d O P Q =P K >R I L 0P Q ?=I J O M $X ’*b a @S /b a @S 2K a S >P N >@

0P Q ?=I J O M

#-\h h *$h ’H a N I =6F #:I L g P 26*Z @R P =K I >@K M >@K O P N J I K >I L >@K P =J Q L I K >Q @

Q _[X -]W Q @>K Q =>@?S I K I>@2Q a K O P =@7I L >_Q =@>I $T F 8;b ’

*O K K J /88R I J >K I *c a N K L *P S a 875[1d 587I J >K I 6P J Q =K N 87I 1@K P =J 87I 19d T 6[*H d Xb

#-\\i V ](V ](8-\\\V -]V %e *$i ’XI =gE X *2Q W P J =Q Y L P W N c >K OK O P a N P Q _=P ?=P N N >Q @I @I L M N >N

>@?P Q ?=I J O M $5’*1@/0I >L P 0b *2J I K >I L 2K I K >N K >R N I @SXQ S V

P L N $7’*9P K O P =L I @S N /E 6P >S P L [a Y L >N O >@?7Q W J I @M #-\&3*-\-^-\\*

$&’5?K P =Y P =?:[*d =P @SN a =_I R PI @I L M N >N $5’*1@/0I >L P0b

*2J I K >I L 2K I K >N K >R NI @S XQ S P L N $7’*9P K O P =L I @S N /E 6P >S P L [a Y L >N O >@?7Q W J I @M

#-\&3*-3i ^-i -*$\’j Q a =@P L 50#H a >k Y =P ?K N 7O

*矿业地质统计学$X ’*侯景儒#黄竞先#译*北京/冶金工业出版社#-\&%*

$-]’王政权*地质统计学及在生态学中的应用$X ’

*北京/科学出版社#-\\\*

$--’E P a K N R O7l #j Q a =@P L 50*02b 1F #0P Q N K I K >N K >R I L 2Q _K c I =P

b >Y =I =MI @SZ N P =m N 0a >S P $X ’*9P

c n Q =g /;o _Q =SZ @>U P =N >V K M[=P N N

#-\\&*3

h %地球科学进展

第-e 卷

!"#$%&&’()*+,-.%)&,+(+/,+/0,1&*2(+3*(45),&3*0)6’(43(+/&7

!8$.2)9:&*;<=>1&*?@7/’)*,/+A-*),,

B"C C D .!"E $=4/’)*8F .%)&,+(+/,+/0,B *(*)?/,)(,)(7?+G ))7’/*&7H )7+

!F $.I 7

B"C C T .T D UV W .!"X $%377/7;MR B Y 3**&3Z G-F .I 7+)*(0+/’),O (+/(4(7(4A ,/,&1

,&/4(++*/[3+)O (++)*7,3,/7Z)>O 4&*(+&*A ?(+((7(4A ,/,\6N F ](7?%I K !F $.I 7

B"C C T .V D U"^^.!"W $5/O 4)AYN .K O (+/(4K +(+/,+/0,!8$.2)9:&*;<_/4)A B "C V ".!"T $8(+G )*&7%.-*/70/O 4),&1Z )&,+(+/,+/0,!M $.60&7&H /0%)&4&P

Z A

B"C T E BW V <"#X T U"#T T .!"D $Y &Z ()*+-B 8(G (3-B Y )0;)*,J .S G ),O (+/(4/7+)*O &4(+/&7&1

(Z *&P 04/H (+/0?(+(B Q &;*/Z /7Z ,&1+9(*)(7?,&3*0)0&?)3,)*‘,H (73(4!5$.F Z *&H )+)&*&4&Z AK )*/),_&*;/7Z-(O )*B 23H P [)*"#.J F =B 5&H )B I +(4A

B"C C W .!"V $黄杏元B 汤勤.地理信息系统概论!8$

.北京<高等教育出版社B "C C ^.

!"C $L 3+0G /7,&78J .I 7+)*O &4(+/7ZH )(7*(/71(44+G /7O 4(+)

,H &&+G /7Z,O 4/7),!M $.I 2S M %)&Z *(O G /0(4I 71&*H (+/&7K A ,P +)H ,

B"C C W BC\X ]

B"C C X .!#"$J &+G )*/7Z G (H F K B Q G (*4+&78B Y *37,?&7Q .S G )Z )&Z *(P

O G A&1O (*(H )+)*,O (0)<(7/7’),+/Z (+/&7&1,O (+/(47&7P ,+(P +/&7(*/+A !M $.I 2S M %)&Z *(O G /0(4I 71&*H (+/&7K A ,+)H ,

B "

C C T B"^\W ]

D .

!##$M &3*7)4F %.8&?)4/7Z370)*+(/7+A(7?,O (+/(4?)O )7?)70)

+)H ,

B"C C T B"^\W ]

[*/?Z )

$.气象学报B "C V V B X T \E ]

!#W $傅抱璞B 虞静明B 卢其尧.山地气候资源与开发利用!8$

.南京<南京大学出版社B "C C T .

!#T $汤懋苍.祁连山区降水的地理分布特征!M

$.地理学报B "C V W B X ^\X ]

!#D $王劲峰B 李全林B J /,0G )*88.

地震趋势区划结构自适应模型!M

$.中国地震B "C C T B "#\增刊]

&1G )+)*&Z )7)&3,,3*1(0),

+)H ,

B"C C T B"^\D ]

R I u /7B Q L 62%%3&?&7Z B R @R /7Z

\v w x yz {y|}~y !"#~w {$%{&~}w {’"{(z {y %{#~{""}~{#!"$"z })*+{$(~(,("

B v *~{"$"|)z y "’-w ./)~"{)"$B 0z {1*w ,D E ^^^^B v *~{z

]j 2345674

H (+/0(47(+3*),(,

H )+G &?B O G A ,/0(4H &?)4,/H 34(+/&7H )+G &?(7?0&H [/7)?H )+G &?.S G )(O O 4/0(+/&7(*)(,B ,O )0/(4(4Z &P

*/+G H B (?’(7+(Z ),(7??/,(?’(7+(Z ),&1)(0G/7+)*O &4(+/&7H )+G &?(*)/7+*&?30)?(7?0&H O (*)?/7+G )O (P

O )*.S G )0&H O (*/,&7,G &9,+G (++G )*)/,7&([,&43+)4A&O +/H (4,O (+/(4/7+)*O &4(+/&7H )+G &?8+G )*)/,&74A

*)4(+/’)4A&O +/H (4/7+)*O &4(+/&7H )+G &?/7,O )0/(4,/+3(+/&7.L )70)B +G )[),+,O (+/(4/7+)*O &4(+/&7H )+G &?

,G &34?[),)4)0+)?/7(00&*?(70)9/+G+G )93(4/+(+/’)(7(4A ,/,&1+G )?(+(B )>O 4&*(+&*A,O (+/(4?(+((7(4A ,/,

(7?*)O )(+)?)>O )*/H )7+,.I 7(??/+/&7B +G )*),34+&1,O (+/(4/7+)*O &4(+/&7,G &34?[),+*/0+4A )>(H /7)?1&*/+,’(4/?/+A .N )’)4&O H )7+&1Z )7)*(4,&1+9(*)1&*,O (+/(4/7+)*O &4(+/&7(7?,+*)7Z +G )7/7Z+G )[(,/0+G )&*A*)P

,)(*0G(*);)A/,,3),/7+G )13+3*)

.:;<=>5?3O 4&*(+&*A,O (+/(4?(+((7(4A ,/,8%)&Z *(O G /0I 71&*H (+/&7K A ,+)H @

W

T #第E 期

新等<空间内插方法比较

空间数据挖掘工具浅谈_汤海鹏

第28卷第3期2005年6月 测绘与空间地理信息 G E O M A T I C S &S P A T I A LI N F O R M A T I O NT E C H N O L O G Y V o l .28,N o .3 J u n .,2005 收稿日期:2004-09-14 基金项目:国家重点基础研究发展规划(973)资助项目(2001C B 309404) 作者简介:汤海鹏(1979-),男,湖南沅江人,本科,主要从事信息化管理和信息化建设等方面的研究。 空间数据挖掘工具浅谈 汤海鹏1 ,毛克彪 2,3 ,覃志豪2,吴 毅 4 (1.公安部出入境管理局技术处,北京100741;2.中国农业科学院自然资源与农业区划研究所农业遥感实验室, 北京100081;3.中国科学院遥感所,北京100101;4.黑龙江乌苏里江制药有限公司,黑龙江哈尔滨150060) 摘要:数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,这些模型和关系可以 用来做出预测。空间数据挖掘有十分广阔的应用范围和市场前景,目前已出现大量的数据挖掘工具用于企业决策、科学分析等各个领域。文中对2个数据挖掘工具进行讨论,介绍它们的功能、所使用的技术以及如何使用它们来进行数据挖掘。 关键词:数据挖掘;空间数据挖掘;数据立方体;知识库引擎 中图分类号:P 208 文献标识码:A 文章编号:1672-5867(2005)03-0004-02 AS u r v e y o f D a t a Mi n i n g T o o l s T A N GH a i -p e n g 1 ,M A OK e -b i a o 2,3 ,Q I NZ h i -h a o 2 ,W UY i 4 (1.B u r e a uo f E x i t a n dE n t r y A d m i n i s t r a t i o n ,M i n i s t r y o f P u b l i c S e c u r i t y ,B e i j i n g 100741,C h i n a ;2.T h e K e y L a b o r a t o r y o f R e m o t e S e n s i n g a n d D i g i t a l A g r i c u l t u r e ,C h i n a A c a d e m y o f A g r i c u l t u r e R e m o t e S e n s i n g L a b o r a t o r y ,B e i j i n g 100081,C h i n a ; 3.I n s t i t u t eo f R e m o t e S e n s i n g A p p l i c a t i o n s ,C h i n e s e A c a d e m y o f S c i e n c e s ,B e i j i n g 100101,C h i n a ; 4.H e i l o n g j i a n g Wu s u l i j i a n g P h a r m a c e u t i c a l C o .L t d .,H a r b i n 150060,C h i n a ) A b s t r a c t : B e c a u s e o f c o m m e r c i a l d e m a n d s a n dr e s e a r c hi n t e r e s t ,a l l k i n d s o f s p a t i a l d a t a m i n i n g s o f t w a r e t o o l s e m e r g e .I n o r d e r t o g e t u s e o f t h e d a t a m i n i n g t o o l s ,t w o o f t h e ma r e i n t r o d u c e d i n t h i s p a p e r a n d m a k e p r o s p e c t o f i n t e g r a t i o n o f G I S ,R S ,G P S a n d d a t a m i n -i n g .K e yw o r d s :d a t a m i n i n g ;s p a t i a l d a t a m i n i n g ;d a t a c u b e ;d a t a b a s e e n g i n e 0 引 言 随着数据获取手段(特别是对地观测技术)及数据库 技术的快速发展,科研机构、政府部门在过去的若干年里都积累了大量的数据,而且,目前这些数据仍保持迅猛的增长势头。如此大量的数据已远远超过传统的人工处理能力,怎样从大量数据中自动、快速、有效地提取模式和发现知识显得越来越重要。数据挖掘与知识发现作为一个新的研究领域和新的技术正方兴未艾,用于从巨量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式[1~2],很好地满足了海量数据处理的需要。 具体应用中,数据挖掘工具很多。它们在功能和方法等方面差别很大。如何选择适合具体挖掘需求的工具,是进行挖掘工作必须考察的前提。选择某一工具时,应考虑数据类型,主要是考察工具能处理的数据:①关系 数据库的数据。包括数据仓库数据、文本文档、空间数据、 多媒体数据、W e b 数据等;②功能和方法。数据挖掘功能是数据挖掘工具(或系统)的核心,一些数据挖掘工具仅提供一种功能(如分类),另一些工具可能支持另外的挖掘功能(如描述、关联、分类、预测和聚类等);③其他考虑的方面如:系统问题、数据源、可伸缩性、可视化、数据挖掘查询语言和图形用户接口、工具和数据库或数据仓库系统等。 在众多的数据中,有近80%的数据可以通过空间关系表达。现在,通过卫星扫描地球,每天都能获得大量的关于地表的遥感图像。要从大量的数据中判读出每一个图片所潜藏的信息,就必然要用到数据挖掘技术。本文将通过介绍专业的航空遥感图像处理系统E r d a s 和D B -M i n e r 来阐述处理空间数据和关系数据的这一过程及这2种软件的特点。

arcgis空间内插教程(实例教程,超详细)

GIS空间插值(局部插值方法)实习记录 一、空间插值的概念和原理 当我们需要做一幅某个区域的专题地图,或是对该区域进行详细研究的时候,必须具备研究区任一点的属性值,也就是连续的属性值。但是,由于各种属性数据(如降水量、气温等)很难实施地面无缝观测,所以,我们能获取的往往是离散的属性数据。例如本例,我们现有一幅山东省等降雨量图,但是最终目标是得到山东省降水量专题图(覆盖全省,统计完成后,各地均具有自己的降雨量属性)。 空间插值是指利用研究区已知数据来估算未知数据的过程,即将离散点的测量数据转换为连续的数据曲面。利用空间插值,我们就可以通过离散的等降雨量线,来推算出山东省各地的降雨量了。 二、空间插值的几种方法及本次实习采用的原理和方法 –整体插值方法 ?边界内插方法 ?趋势面分析 ?变换函数插值 –局部分块插值方法 ?自然邻域法 ?移动平均插值方法:反距离权重插值 ?样条函数插值法(薄板样条和张力样条法) ?空间自协方差最佳插值方法:克里金插值 ■局部插值方法的控制点个数与控制点选择问题 局部插值方法用一组已知数据点(我们将其称为控制点)样本来估算待插值点(未知点)的值,因此控制点对该方法十分重要。 为此,第一要注意的是控制点的个数。控制点的个数与估算结果精确程度的关系取决于控制点的分布与待插值点的关系以及控制点的空间自相关程度。为了获取更精确的插值结果,我们需要着重考虑上述两点因素(横线所示)。 第二需要注意的是怎样选择控制点。一种方法是用离估算点最近的点作为控制点;另一种方法是通过半径来选择控制点,半径的大小必须根据控制点的分布来调整。 结合上述分析,在本次实习过程中,我们采用局部分块内插的这4种方法(上文中划横线的方法)进行插值,首先,我们按照默认参数进行插值,目的是粗略比较各种方法的优劣;然后选择出最好的一种方法,对该方法再尝试用不同的权重和点数参数来插值,得出最佳的效果。 三、目标 1、根据带坐标的山东省县域矢量地图(sd_county.shp),完成山东年平均降水量与矢量图的

空间数据管理系统概论复习

《空间数据库管理系统概论》期末复习考试 第一章绪论 1、空间数据库:是指在地球表面某一范围内与空间地理相关,反映某一主题信息的数据集合,是一类以空间目标作为存储对象的专业数据库,是GIS的核心 和基础。 2、空间数据:是指以地球表面空间位置为参照的自然、社会和人文经济景观数据。它包括文字、数字、图形、影像、声音、图像等多种表现形式,如地名地址、数字高程、矢量地图、遥感影像、地理编码数据、多媒体地图等。 3、矢量数据:是一种用点、线、面等基本空间要素表示人们赖以生存的自然世界的数据。 4、栅格数据:是把地理空间中的事物和现象作为连续的变量或体来看待,如大气污染、植被覆盖、土壤类型、地表温度等。 5、空间数据的特征:1)空间特征2)非结构化特征3)空间关系特征 4)时态特征5)多尺度特征 6、空间数据库:在地球表面某一范围内与空间地理相关,反映某一主题信息的数据集合。 7、空间数据库的特点:1)数据量大2)空间数据与属性数据的集3)应用广泛 8、空间数据库管理系统:位于用户与操作系统之间的一层数据管理软件。对空间数据库的所有操作都是在空间数据库管理系统的统一管理和控制下进行的。9、空间数据库管理系统的特点:1)空间数据的定义和操纵 2)空间数据的组织、存储和管理 3)后台的事务管理和运行管理 4)数据库的建立和维护 10、空间数据系统的一般由四部分组成:1)空间数据库 2)空间数据库管理系统 3)数据库管理员 4)用户和应用程序 11、现有的两个空间数据标准简介: (1)简单要素的SQL实现规范(SFA SQL):第一部分定义的是几何对象的不 同表达方式和空间参考系统的表达方式;这个规范不是针对某个特定平台定义的,具有平台独立性。第二部分定义了第一部分定义的简单要素模型在数据库中的实现,给出了内模式下几何类型的定义及相关实现。 (2)SQL多媒体及应用包的第三部分:1)空间定义了矢量数据存储于检索的 相关标准;2)静态图像定义了静态图像数据存储于检索的相关标准。 总结:这两个标准公共部分的接口已经相互兼容,但是这两个标准无论是在内容覆盖面,还是从某些概念的界面上还是有一定的差别。例如,SFA SQL在注记文本类型、空间数据存储实现方式上比SQL/MM定义的内容更广泛,而SQL/MM 涉及了SFA SQL尚未涉及的拓扑数据结果、网络模型等方面的内容。没有统一 的空间数据库标准,自然导致现有空间数据库管理系统有所差异。例如,posGIS 更符合OGC标准,而Oracle Spatial更兼容SQL/MM的标准。

第三章 空间数据采集与处理练习资料

一、单选题 1、对于离散空间最佳的内插方法 是: A.整体内插法 B.局部内插法 C.移动拟合法 D.邻近元法 2、下列能进行地图数字化的设备 是: A.打印机 B.手扶跟踪数字化仪 C.主 机 D.硬盘 3、有关数据处理的叙述错误的 是: A.数据处理是实现空间数据有序化的必要过程 B.数据处理是检验数据质量的关键环节 C.数据处理是实现数据共享的关键步骤 D.数据处理是对地图数字化前的预处理 4、邻近元法 是: A.离散空间数据内插的方法 B.连续空间内插的方法 C.生成DEM的一种方法 D.生成DTM的一种方法 5、一般用于模拟大范围内变化的内插技术是: A.邻近元法 B.整体拟合技术 C.局部拟合技术 D.移动拟合法 6、在地理数据采集中,手工方式主要是用于录入: A.属性数据 B.地图数据 C.影象数 据 D.DTM数据

7、要保证GIS中数据的现势性必须实时进行: A.数据编辑 B.数据变换 C.数据更 新 D.数据匹配 8、下列属于地图投影变换方法的 是: A.正解变换 B.平移变换 C.空间变 换 D.旋转变换 9、以信息损失为代价换取空间数据容量的压缩方法是: A.压缩软件 B.消冗处理 C.特征点筛选 法 D.压缩编码技术 10、表达现实世界空间变化的三个基本要素是。 A. 空间位置、专题特征、时间 B. 空间位置、专题特征、属性 C. 空间特点、变化趋势、属性 D. 空间特点、变化趋势、时间 11、以下哪种不属于数据采集的方式: A. 手工方式 B.扫描方式 C.投影方 式 D.数据通讯方式 12、以下不属于地图投影变换方法的是: A. 正解变换 B.平移变换 C.数值变 换 D.反解变换 13、以下不属于按照空间数据元数据描述对象分类的是: A. 实体元数据 B.属性元数据 C.数据层元数据 D. 应用层元数据 14、以下按照空间数据元数据的作用分类的是: A. 实体元数据 B.属性元数据 C. 说明元数据 D. 分类元数据 15、以下不属于遥感数据误差的是: A. 数字化误差 B.数据预处理误差 C. 数据转换误差 D. 人工判读误差

空间数据库建库复习资料

第一章 1.GIS的名词分析与推论 GIS概念:具有地理数据的采集、管理、分析、表达能力,能为决策者提供有用地理信息的系统。 推论1:地理信息系统采集的数据为空间数据,即具有空间位置,又具有属性特征。地理信息系统的数据库因此又称为空间数据库。 推论二:地理信息系统具有采集、管理、分析地理数据和表达地理信息的能力。包括空间数据库建设和空间数据库的应用两个层次。 推论三:地理信息系统包括计算机硬件、软件、数据、系统开发人员和用户,但由于处理和分析的是地理数据,因此,在通用的硬件、软件基础上,还有体现专业特点的硬、软件。 2.GIS空间数据体系 空间数据库:空间数据和属性数据的组织 矢量有混合式、扩展式和开放式

矢量数据的空间数据组织:空间坐标数据的非结构化和属性数据的结构化 栅格数据:像元阵列 3.GIS数据模型 矢量数据模型:简单数据结构(面条结构):如Shapefile、拓扑数据结构:如Coverge、面向对象的数据模型:如Geodatabase 栅格数据模型:栅格文件常用格式:*.tif,*.jpg,*.bmp等。GIS中的栅格格式:ESRI 的Grid、Geodatabase的栅格数据集等。遥感图像的格式:PCI的* .pix,Erdas 的*.img等。 4.空间数据库设计核心 将现实世界抽象为GIS数据模型,这是数据库设计的核心。 5.名词解释: 面条结构:数据按点、线、面为单元进行组织,点、线、面都有自己的坐标数据。最典型的是面条结构。 拓扑数据结构:不仅存储空间位置,同时存储空间关系。 拓扑关联:指存在于空间图形的不同类型元素之间的拓扑关系。如结点与弧段、弧段与多边形。 第二章 1.名词解释: 数据词典:以词典的方式描述和定义E-R模型设计中出现和形成的实体、关系。数据模型匹配:实现将实体类型和特征类型(Coverage、Shapefile、Grid等)的匹配。 区:基于现有的面特征来描述复杂的区域如多个独立的多边形组成的区域、相互

大数据时代的空间数据挖掘综述

第37卷第7期测绘与空间地理信息 GEOMATICS &SPATIAL INFORMATION TECHNOLOGY Vol.37,No.7收稿日期:2014-01-22 作者简介:马宏斌(1982-),男,甘肃天水人,作战环境学专业博士研究生,主要研究方向为地理空间信息服务。 大数据时代的空间数据挖掘综述 马宏斌1 ,王 柯1,马团学 2(1.信息工程大学地理空间信息学院,河南郑州450000;2.空降兵研究所,湖北孝感432000) 摘 要:随着大数据时代的到来,数据挖掘技术再度受到人们关注。本文回顾了传统空间数据挖掘面临的问题, 介绍了国内外研究中利用大数据处理工具和云计算技术,在空间数据的存储、管理和挖掘算法等方面的做法,并指出了该类研究存在的不足。最后,探讨了空间数据挖掘的发展趋势。关键词:大数据;空间数据挖掘;云计算中图分类号:P208 文献标识码:B 文章编号:1672-5867(2014)07-0019-04 Spatial Data Mining Big Data Era Review MA Hong -bin 1,WANG Ke 1,MA Tuan -xue 2 (1.Geospatial Information Institute ,Information Engineering University ,Zhengzhou 450000,China ; 2.Airborne Institute ,Xiaogan 432000,China ) Abstract :In the era of Big Data ,more and more researchers begin to show interest in data mining techniques again.The paper review most unresolved problems left by traditional spatial data mining at first.And ,some progress made by researches using Big Data and Cloud Computing technology is introduced.Also ,their drawbacks are mentioned.Finally ,future trend of spatial data mining is dis-cussed. Key words :big data ;spatial data mining ;cloud computing 0引言 随着地理空间信息技术的飞速发展,获取数据的手 段和途径都得到极大丰富,传感器的精度得到提高和时空覆盖范围得以扩大,数据量也随之激增。用于采集空间数据的可能是雷达、红外、光电、卫星、多光谱仪、数码相机、成像光谱仪、全站仪、天文望远镜、电视摄像、电子 显微镜、CT 成像等各种宏观与微观传感器或设备,也可能是常规的野外测量、人口普查、土地资源调查、地图扫描、 地图数字化、统计图表等空间数据获取手段,还可能是来自计算机、 网络、GPS ,RS 和GIS 等技术应用和分析空间数据。特别是近些年来,个人使用的、携带的各种传感器(重力感应器、电子罗盘、三轴陀螺仪、光线距离感应器、温度传感器、红外线传感器等),具备定位功能电子设备的普及,如智能手机、平板电脑、可穿戴设备(GOOGLE GLASS 和智能手表等),使人们在日常生活中产生了大量具有位置信息的数据。随着志愿者地理信息(Volunteer Geographic Information )的出现,使这些普通民众也加入到了提供数据者的行列。 以上各种获取手段和途径的汇集,就使每天获取的 数据增长量达到GB 级、 TB 级乃至PB 级。如中国遥感卫星地面站现在保存的对地观测卫星数据资料达260TB ,并以每年15TB 的数据量增长。比如2011年退役的Landsat5卫星在其29年的在轨工作期间,平均每年获取8.6万景影像,每天获取67GB 的观测数据。而2012年发射的资源三号(ZY3)卫星,每天的观测数据获取量可以达到10TB 以上。类似的传感器现在已经大量部署在卫 星、 飞机等飞行平台上,未来10年,全球天空、地空间部署的百万计传感器每天获取的观测数据将超过10PB 。这预示着一个时代的到来,那就是大数据时代。大数据具有 “4V ”特性,即数据体量大(Volume )、数据来源和类型繁多(Variety )、数据的真实性难以保证(Veracity )、数据增加和变化的速度快(Velocity )。对地观测的系统如图1所示。 在这些数据中,与空间位置相关的数据占了绝大多数。传统的空间知识发现的科研模式在大数据情境下已经不再适用,原因是传统的科研模型不具有普适性且支持的数据量受限, 受到数据传输、存储及时效性需求的制约等。为了从存储在分布方式、虚拟化的数据中心获取信息或知识,这就需要利用强有力的数据分析工具来将

(完整word版)空间内插方法比较

一、空间数据的插值 用各种方法采集的空间数据往往是按用户自己的要求获取的采样观测值,亦既数据集合是由感兴趣的区域内的随机点或规则网点上的观测值组成的。但有时用户却需要获取未观测点上的数据,而已观测点上的数据的空间分布使我们有可能从已知点的数据推算出未知点的数据值。 在已观测点的区域内估算未观测点的数据的过程称为内插;在已观测点的区域外估算未观测点的数据的过程称为外推。 空间数据的内插和外推在GIS中使用十分普遍。一般情况下,空间位置越靠近的点越有可能获得与实际值相似的数据,而空间位置越远的点则获得与实际值相似的数据的可能性越小。下面介绍一些常用的内插方法。 1、边界内插 使用边界内插法时,首先要假定任何重要的变化都发生在区域的边界上,边界内的变化则是均匀的、同质的。 边界内插的方法之一是泰森多边形法。泰森多边形法的基本原理是,未知点的最佳值由最邻近的观测值产生。如图4-6-1所示。 泰森多边形的生成算法见§5.7。 2、趋势面分析 趋势面分析是一种多项式回归分析技术。多项式回归的基本思想是用多项式表示线或面,按最小二乘法原理对数据点进行拟合,拟合时假定数据点的空间坐标X、Y为独立变量,而表示特征值的Z坐标为因变量。 当数据为一维时,可用回归线近似表示为: 其中,a0、a1为多项式的系数。当n个采样点方差和为最小时,则认为线性回归方程与被拟合曲线达到了最佳配准,如图4-6-2左图所示,即: 当数据以更为复杂的方式变化时,如图4-6-2右图所示。在这种情况下,需要用到二次或高次多项式: (二次曲线) 在GIS中,数据往往是二维的,在这种情况下,需要用到二元二次或高次多项式:

空间数据管理平台解决方案

空间数据管理平台解决方案

1.引言 1.1方案概述 空间数据管理平台解决方案主要是针对我国各级测绘院、信息中心建设区域地理信息基础框架的迫切需求,开发的一套专业性强、具有高可扩展性的基础地理信息数据库管理平台。 整个方案从管理多源、多尺度、多类型的基础地理信息数据的角度出发,开发了一些列软件系统,包括空间数据入库更新子系统、空间数据质量检查子系统以及空间数据管理平台等,可以实现对现有基础地理信息数据的整合、转换与集成管理,为政府、企业、公众等提供空间信息服务。 1.2系统特点 ●“多源、多尺度、多时相”基础地理数据的集成管理 由于基础地理数据具有多源、多尺度、多时相的特点,基础地理数据管理平台必须具有集成不同数据类型、不同比例尺、不同时间的各种基础地理数据的能力。 ●多比例尺数据集成 对于不同尺度的基础地理数据,其集成通过统一空间参考系(WGS84、西安80、北京54)或动态投影技术来实现。不同比例尺的

基础地理数据可以叠加一起显示,通过控制其显示比例实现地图的逐层显示效果。 ●多类型数据集成 对于不同类型的数据(如DLG与DRG)的集成采用按空间坐标范围或图幅索引实现。 ●多时序数据集成 对于不同时间段的基础地理数据,采用历史数据库来实现。根据数据更新周期的不同,采用按数据集、图幅、对象级别的历史数据库机制。 ●基础地理数据管理全过程支持 SuperMap D-Manager特别针对我国各级测绘院、信息中心设计开发,系统支持数据加工、数据入库管理、数据共享、数据发布的整个业务过程,可以快速为用户打造完备的基础地理数据中心,满足各种用户对基础地理信息的需求,为数字城市建设服务。 ●基础性与平台性 SuperMap D-Manager从设计到实现,充分考虑了其作为基础性、平台性等支撑性要求。SuperMap D-Manager在设计思路、软件开发实现上都具有高可扩展性的特点。

GIS空间分析复习提纲及答案

空间分析复习提纲 一、基本概念(要求:基本掌握其原理及含义,能做名词解释) 1、空间分析:是基于地理对象的位置和形态的空间数据的分析技术,其目的在于提取和传输空间信息。 2、空间数据模型:以计算机能够接受和处理的数据形式,为了反映空间实体的某些结构特性和行为功能,按一定的方案建立起来的数据逻辑组织方式,是对现实世界的抽象表达。分为概念模型、逻辑模型、物理模型。 3、叠置分析:是指在同一地区、同一比例尺、同一数学基础、不同信息表达的两组或多组专题要素的图形或数据文件进行叠加,根据各类要素与多边形边界的交点或多边形属性建立多重属性组合的新图层,并对那些结构和属性上既互相重叠,又互相联系的多种现象要素进行综合分析和评价;或者对反映不同时期同一地理现象的多边形图形进行多时相系列分析,从而深入揭示各种现象要素的内在联系及其发展规律的一种空间分析方法。 4、网络分析:网络分析是通过研究网络的状态以及模拟和分析资源在网络上的流动和分配情况,对网络结构及其资源等的优化问题进行研究的一种空间分析方法。 5、缓冲区分析:即根据分析对象的点、线、面实体,自动建立它们周围一定距离的带状区,用以识别这些实体或主体对邻近对象的辐射范围或影响度,以便为某项分析或决策提供依据。其中包括点缓冲区、线缓冲区、面缓冲区等。 6、最佳路径分析:也称最优路径分析,以最短路径分析为主,一直是计算机科学、运筹学、交通工程学、地理信息科学等学科的研究热点。这里“最佳”包含很多含义,不仅指一般地理意义上的距离最短,还可以是成本最少、耗费时间最短、资源流量(容量)最大、线路利用率最高等标准。 7、空间插值:空间插值是指在为采样点估计一个变量值的过程,常用于将离散点的测量数据转换为连续的数据曲面,它包括内插和外推两种算法。,前者是通过已知点的数据计算同一区域内其他未知点的数据,后者则是通过已知区域的数据,求未知区域的数据。 8、空间量算:即空间量测与计算,是指对GIS数据库中各种空间目标的基本参数进行量算与分析,如空间目标的位置、距离、周长、面积、体积、曲率、空间形态以及空间分布等,空间量算是GIS获取地理空间信息的基本手段,所获得的基本空间参数是进行复杂空间分析、模拟与决策制定的基础。 9、克里金插值法:克里金插值法是空间统计分析方法的重要内容之一,它是建立在半变异函数理论分析基础上,对有限区域内的区域变化量取值进行无偏最优估计的一种方法,不仅考虑了待估点与参估点之间的空间相关性,还考虑了各参估点间的空间相关性,根据样本空间位置不同、样本间相关程度的不同,对每个参估点赋予不同的权,进行滑动加权平均,以估计待估点的属性值。 二、分析类(要求:重点掌握其原理及含义,能结合本专业研究方向做比较详细的阐述) 1、空间数据模型的分类? 答:分为三类: ①场模型:用于表述二维或三维空间中被看作是连续变化的现象; ②要素模型:有时也称对象模型,用于描述各种空间地物; ③网络模型:一种某一数据记录可与任意其他多个数据记录建立联系的有向图结构的数据模型,可 以模拟现实世界中的各种网络。

空间内插方法比较

第15卷第3期2000年6月 地球科学进展 ADV ANCE IN EARTH SCIEN CES V ol.15 No.3 Jun., 2000 学术论文 空间内插方法比较 李 新,程国栋,卢 玲 (中国科学院寒区旱区环境与工程研究所,甘肃 兰州 730000) 摘 要:空间内插可以分为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法。介绍了每一种方法的适用范围、算法和优缺点。指出没有绝对最优的空间内插方法,必须对数据进行空间探索分析,根据数据的特点,选择最优方法;同时,应对内插结果做严格的检验。开发通用空间内插软件、智能化内插以及加强相关基础研究将是空间内插研究的重点。 关 键 词:空间内插;空间数据探索分析;地理信息系统 中图分类号:P208 文献标识码:A 文章编号:1001—8166(2000)03-0260-06 1 空间内插 根据已知地理空间的特性探索未知地理空间的特性是许多地理研究的第一步,也是地理学的基本问题。常规方法无法对空间中所有点进行观测,但是我们可以获得一定数量的空间样本,这些样本反映了空间分布的全部或部分特征,并可以据此预测未知地理空间的特征。在这一意义上,空间内插可以被定义为根据已知的空间数据估计(预测)未知空间的数据值。其目标可以归纳为:①缺值估计:估计某一点缺失的观测数据,以提高数据密度;②内插等值线:以等值线的形式直观地显示数据的空间分布;③数据格网化:把无规则分布的空间数据内插为规则分布的空间数据集,如规则矩形格网、三角网等。 空间内插对于观测台站十分稀少,而台站分布又非常不合理的地区具有十分重要的实际意义。这些地区的常规观测常常不能满足要求,在这种情况下,利用有限的常规观测估计合理的空间分布,或尽可能地提高数据密度就成为迫切要求。在这些方面,缺值估计和数据格网化将发挥重要的作用。 (1)缺值估计。各种科学考察中形式多样的短期观测是提高数据观测密度的重要方式,无形中起到了加密台站的作用;而且由于这些考察常常到达人迹罕至的高海拔和极地等区域,有助于了解区域内观测变量的完整空间分布。但是,这些观测序列往往很短,短则数十天,长不过几年。如何利用周围台站的长序列观测资料和短期观测本身的信息,将观测变量插补到长序列是一个重要问题。 (2)数据格网化。规则格网能够更好地反映连续分布的空间现象,并对他们的变化作出模拟。现代地球科学模型和气候模型,如GCM(一般环流模型),都要求与GIS数据模型和遥感数据高度兼容的空间数据集。格网化的数据,尤其是规则矩形格网,已成为目前地学模型的主要数据形式。因此,对已知观测台站的观测数据进行空间内插,得到格网化数据是模型的第一步。 空间内插一般包括这样几个过程〔1〕:①内插方法(模型)的选择;②空间数据的探索分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;③内插方法评价;④重新选择内插方法,直到合理;⑤内插。 因此,通过比较而选择一个合用的、适合于数据空间分布特点的内插方法是空间内插的关键。本文将空间内插分类为几何方法、统计方法、空间统计方 中国科学院特别经费支持领域项目“冰冻圈基础研究”(编号:KJ-B-2-102)资助。 第一作者简介:李新,男,1969年10月生于甘肃酒泉,副研究员,主要从事地理信息系统和遥感在冰冻圈和水资源研究中的应用。收稿日期:1999-08-19;修回日期:1999-11-03。

空间数据查询和空间数据分析的具体功能分类

空间数据查询和空间数据分析的具体功能分类? 空间定位查询 由图形查询到属性 按点定位查询 按矩形区域查询 按椭圆区域查询 按多边形区域查询 如查询在某个面内有几个点 、 空间关系查询 通过拓扑关系和空间运算进行的查询 邻接查询:查询目标邻接的点、线、面目标 含查询:查询面目标所包含的点、线、面目标 穿越查询:查询线目标所相交的点、线、面目标 缓冲区查询:查询目标一定距离范围内的点、线、面目标 如面面查询,查询与某个多边形相邻的多边形的个数 空间属性查询 由属性查询到图形 支持标准的SQL查询语言 Select 属性项集合From 属性表集合Where 条件集合 如查询地块面积为1.5的业主名字 select 业主名字,面积 from Parcel, Qwner where Parcel.PIN= Owner.PIN and Parcel.Area= 1.5 空间组合查询 定位与属性组合查询 关系与属性组合查询 定位与关系组合查询 定位、关系和属性组合查询 如查询某地块中有几个面积为1.5的点 空间数据分析 形态分析 形态特征是空间物体的重要特征之一,在空间分析中,对空间物体的形态分析随空间物体维数的改变而不同 一般地说,空间物体可以简单地分为零维、一维、二维、三维,形态分析是对物体的几何特征的分析 零维物体的形态是没有意义的 一维物体的形态分析指长度、曲率、方向特征 二维物体的形态分析指面积、周长、重心及平面延展性等 三维物体的形态分析主要有表面积、体积、坡度、坡向等 叠加分析

叠加分析是GIS最重要的功能之一 是将各种不同的地理要素分类(层)存储和表述,由计算机自动将它们迭置起来进行分析如在叠加区域内,只有参与迭加的地理要素都为真时,该区域才为真;若参与迭加的地理要素中有一个为假,则该区域为假 点与多边形叠加、线与多边形叠加、多边形与多边形叠加 邻域分析 邻域分析包括两个方面的内容:一是通过给定位置查询其邻域中的有关要素情况,这在GIS 中通常归结为“缓冲区”分析,有点、线、面缓冲区分析 其二是从给定位置的某现象“值”去推算其给定邻域相关变量的值,在这GIS中通常归结为“插值式逼近” 连接分析 连接分析涉及的内容较多,主要就是通视分析、径流分析、日照分析和多边形合并 通视分析简单地说就是在地面上给定一点,计算出位于该点可以见到的全部区域 径流分析就是地表谷地、水流的路径 日照分析就是太阳照射的影子分析 多边形合并单地说就是将若干个小多边形合并成一个大多边形 网络分析 将地理空间抽象成一个二维欧氏平面,以一定的规则和连线分布其间,就构成了地理网络现实地理空间中许多地理事物都可以直接或经过适当的变换形成地理网络 例如铁路、公路、通讯线路、生产过程、经济的流量、人口迁移路线、自然系统中的物质流、能量流和信息流等,都可以表示成相应的点之间的连线 由此构成现实世界中多种多样的地理网络。对地理网络进行分析,就可得到一些很有意义的结果 网络分析的应用主要包括三个方面:路径分析和资源分配 分布分析 分布分析就是空间统计分析,基于空间数据进行非空间数据(专题)的分类 将地图要素划分成一些简单的连通区域,如行政区划,每个区域用一个简单的数学函数表示一种专题主要属性的变化 根据所表示地理现象的不同,区域可以对应不同类型的属性函数,如人口分布图、经 济状况分布图、工业分布图、文化分布图、历史分布图等

可视化空间数据挖掘研究综述

可视化空间数据挖掘研究综述 贾泽露1,2 刘耀林2 (1. 河南理工大学测绘与国土信息工程学院,焦作,454000;2. 武汉大学资源与环境科学学院,武汉,430079)摘要:空间数据挖掘针对的是更具有可视化要求的地理空间数据的知识发现过程,可视化能提供同用户对空间目标心理认知过程相适应的信息表现和分析环境,可视化与空间数据挖掘的结合是该领域研究发展的必然,并已成为一个研究热点。论文综述了空间数据挖掘和可视化的研究现状,重点阐述了空间数据挖掘中的可视化化技术及其应用,并对可视化空间数据挖掘的发展趋势进行了阐述。 关键词:数据挖掘;空间数据挖掘;数据可视化;信息可视化;GIS; 空间信息获取技术的飞速发展和各种应用的广泛深入,多分辨率、多时态空间信息大量涌现,以及与之紧密相关的非空间数据的日益丰富,对海量空间信息的综合应用和处理技术提出了新的挑战,要求越来越高。空间数据挖掘技术作为一种高效处理海量地学空间数据、提高地学分析自动化和智能化水平、解决地学领域“数据爆炸、知识贫乏”问题的有效手段,已发展成为空间信息处理的关键技术。然而,传统数据挖掘“黑箱”作业过程使得用户只能被动地接受挖掘结果。可视化技术能为数据挖掘提供直观的数据输入、输出和挖掘过程的交互探索分析手段,提供在人的感知力、洞察力、判断力参与下的数据挖掘手段,从而大大地弥补了传统数据挖掘过程“黑箱”作业的缺点,同时也大大弥补了GIS重“显示数据对象”轻“刻画信息结构”的弱点,有力地提高空间数据挖掘进程的效率和结果的可信度[1]。空间数据挖掘中可视化技术已由数据的空间展现逐步发展成为表现数据内在复杂结构、关系和规律的技术,由静态空间关系的可视化发展到表示系统演变过程的可视化。可视化方法不仅用于数据的理解,而且用于空间知识的呈现。可视化与空间数据挖掘的结合己成为必然,并已形成了当前空间数据挖掘1与知识发现的一个新的研究热点——可视化空间数据挖掘(Visual Spatial Data Mining,VSDM)。VSDM技术将打破传统数据挖掘算法的“封闭性”,充分利用各式各样的数据可视化技术,以一种完全开放、互动的方式支持用户结合自身专业背景参与到数据挖掘的全过程中,从而提高数据挖掘的有效性和可靠性。本文将对空间数据挖掘、可视化的研究概况,以及可视化在空间数据挖掘中的应用进行概括性回顾总结,并对未来发展趋势进行探讨。 一、空间数据挖掘研究概述 1.1 空间数据挖掘的诞生及发展 1989年8月,在美国底特律市召开的第一届国际联合人工智能学术会议上,从事数据库、人工智能、数理统计和可视化等技术的学者们,首次出现了从数据库中发现知识(knowledge discovery in database,KDD)的概念,标志着数据挖掘技术的诞生[1]。此时的数据挖掘针对的 作者1简介:贾泽露(1977,6-),男,土家族,湖北巴东人,讲师,博士,主要从事空间数据挖掘、可视化、土地信息系统智能化及GIS理论、方法与应用的研究和教学工作。 作者2简介:刘耀林(1960,9- ),男,汉族,湖北黄冈人,教授,博士,博士生导师,武汉大学资源与环境科学学院院长,现从事地理信息系统的理论、方法和应用研究和教学工作。

空间数据基本理论

1.空间地理数据的基本特征 要完整地描述空间实体或现象的状态,一般需要同时有空间数据和属性数据。如果要描述空间实体或的变化,则还需记录空间实体或现象在某一个时间的状态。所以,一般认为空间数据具有三个基本特征: ⑴空间特征表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示。 ⑵属性特征表示现象的特征,例如变量、分类、数量特征和名称等等。 ⑶时间特征指现象或物体随时间的变化。 位置数据和属性数据相对于时间来说,常常呈相互独立的变化,即在不同的时间,空间位置不变,但是属性类型可能已经发生变化,或者相反。因此,空间数据的管理是十分复杂的。 有效的空间数据管理要求位置数据和非位置数据互相作为单独的变量存放,并分别采用不同的软件来处理这两类数据。这种数据组织方法,对于随时间而变化的数据,具有更大的灵活性。 2.如何在计算机内部用数字形式描述客观事物或现象 对地理信息进行数字化描述,就是要使计算机能够识别地理事物的形状,为此,必须精确地指出空间模式如何处理,如何显示等。在计算机内描述空间实体有两种形式:显式描述和隐式描述。在计算机中的显式表示,就是栅格中的一系列像元。隐式表示是由一系列定义了始点和终点的线及某种连接关系来描述。 计算机对地理实体的显式描述也称栅格数据结构,计算机对地理实体的隐式描述也称矢量数据结构。栅格和矢量结构是计算机描述空间实体的两种最基本的方式。 在栅格数据结构中,整个地理空间被规则地分为一个个小块(通常为正方形),地理实体的位置是由占据小块的横排与竖列的位置决定,小块的位置则由其横排竖列的数码决定,每个地理实体的形态是由栅格或网格中的一组点来构成。

空间内插方法分析

摘要 本文首先对空间插值的的理论基础包括空间插值的必要性以及目标等几个方面进行了介绍;在此基础上,对空间插值的几种方法包括反距离加权法、克里格法、泰森多边形法、样条函数法等进行了探讨和研究,对方法的适用范围、优缺点、插值精度等方面进行了总结;对反距离加权法和克里格法等的实现方法进行了研究;论文最后对空间内插的方法选择进行了归纳总结,并对空间内插今后有待进一步研究的方面以及发展应用方向进行了展望。 关键词:空间内插克里格反距离加权 Abstract Firstly,theoretical basis,including the necessity of spatial interpolation, aim etc., is specifically introduced in this paper. Beside this, we have done studies and researches on several methods of spatial interpolation, e.g.Inverse Distance Weighted、Kriging、Thiesen、Spline, concluded on the range、merit and shortcoming,interpolation accuracy and so on. The thesis it makes research on the programming process of Inverse Distance Weighted and Kriging etc, The end of the paper gives a summary to the methods selection of spatial interpolation, and outlooks the further research and probable application to be developed in spatial interpolation. Keywords:Spatial Interpolation Kriging Inverse Distance Weighted 0 前言:在地理信息系统(GlS)中,我们获得的空间数据往往是离散点的形式,或者是分区数据的形式。由于观测到的数据往往不能满足要求,最理想的方法就是调查地理空间所有样本的信息,以穷尽样本属性值的方式来获得详尽的地理信息。但这种方法从时间、经济角度上来说是行不通的,也是不现实的。我们可以从离散分布的数据开始来构造一个连续的表面,但是问题在于如何构建一个连续的数据表面。GIS空间内插方法为实现这个目的提供了有效的手段,它利用有限的观测数据,估计合理的空间分布、提高数据密度,获得完整空间信息分布,以填补缺失的数据,得到密集的数据分布。此外,由于数据集的来源、采样点的数据类型不同,如何选择适当的内插方法成为迫切需要解决的问题,如若选择了不适当的内插方法将会直接导致对数据的错误内插,从而造成了对实际情况错误的认识。每种内插方法都有各自的应用范围和优缺点,它们很大程度上依赖于采样数据原始的数学特征,不同的研究目的对内插都有特殊的要求。针对某一特定的数据集,如何来选择最有效的内插方法,是一个重要的、极富挑战性的任务。 本文试图从GIS空间内插方法的理论基础、实际效果两个方面比较几种常用的内插方法的实现原理及其基本的适用条件,并对空间内插今后有待进一步研究的方面进行了展望。 1空间内插方法的划分和分析 空间插值方法可以分为全局方法和局部方法两类。全局方法用研究区每个可利用的控制点来构建一个方程或一个模型,而后该模型可用于估算未知点的数值;局部方法是用控制点的样本来估计未知点的值。

空间内插方法比较

空间内插方法比较-CAL-FENGHAI.-(YICAI)-Company One1

一、空间数据的插值 用各种方法采集的空间数据往往是按用户自己的要求获取的采样观测值,亦既数据集合是由感兴趣的区域内的随机点或规则网点上的观测值组成的。但有时用户却需要获取未观测点上的数据,而已观测点上的数据的空间分布使我们有可能从已知点的数据推算出未知点的数据值。 在已观测点的区域内估算未观测点的数据的过程称为内插;在已观测点的区域外估算未观测点的数据的过程称为外推。 空间数据的内插和外推在GIS中使用十分普遍。一般情况下,空间位置越靠近的点越有可能获得与实际值相似的数据,而空间位置越远的点则获得与实际值相似的数据的可能性越小。下面介绍一些常用的内插方法。 1、边界内插 使用边界内插法时,首先要假定任何重要的变化都发生在区域的边界上,边界内的变化则是均匀的、同质的。 边界内插的方法之一是泰森多边形法。泰森多边形法的基本原理是,未知点的最佳值由最邻近的观测值产生。如图4-6-1所示。 泰森多边形的生成算法见§。 2、趋势面分析 趋势面分析是一种多项式回归分析技术。多项式回归的基本思想是用多项式表示线或面,按最小二乘法原理对数据点进行拟合,拟合时假定数据点的空间坐标X、Y为独立变量,而表示特征值的Z坐标为因变量。 当数据为一维时,可用回归线近似表示为: 其中,a0、a1为多项式的系数。当n个采样点方差和为最小时,则认为线性回归方程与被拟合曲线达到了最佳配准,如图4-6-2左图所示,即: 当数据以更为复杂的方式变化时,如图4-6-2右图所示。在这种情况下,需要用到二次或高次多项式: (二次曲线) 在GIS中,数据往往是二维的,在这种情况下,需要用到二元二次或高次多项式: (二次曲面)

相关文档