文档库 最新最全的文档下载
当前位置:文档库 › GIS空间索引

GIS空间索引

GIS空间索引
GIS空间索引

索引方法:

网格索引——点要素(图元),线、面要素,有冗余

四叉树索引——线、面要素,有冗余

改进的四叉树索引——线、面要素

R树——空间重叠

一、网格索引,四叉树索引

在介绍空间索引之前,先谈谈什么叫“索引“。对一个数据集做”索引“,是为了提高对这个数据集检索的效率。书的”目录“就是这本书内容的”索引“,当我们拿到一本新书,想查看感兴趣内容的时候,我们会先查看目录,确定感兴趣的内容会在哪些页里,直接翻到那些页,就OK了,而不是从第一章节开始翻,一个字一个字地找我们感兴趣的内容,直到找到为止,这种检索内容的效率也太低了,如果一本书没有目录,可以想象有多么不方便…可见书的目录有多重要,索引有多重要啊!

现在大家对索引有了感性认识,那什么是“空间索引“呢?”空间索引“也是”索引“,是对空间图形集合做的一个”目录“,提高在这个图形集合中查找某个图形对象的效率。比如说,我们在一个地图图层上进行矩形选择,确定这个图层上哪些图元被这个矩形所完全包含呢,在没有”空间索引“的情况下,我们会把这个图层上的所有图元,一一拿来与这个矩形进行几何上的包含判断,以确定到底哪些图元被完全包含在这个矩形内。您是不是觉得这样做很合理呢?其实不然,我们先看一个网格索引的例子:

我们对这个点图层作了网格索引,判断哪些点在这个矩形选择框内,是不需要把这个图层里所有的点都要与矩形进行几何包含运算的,只对 a,b,c,d,e,f,g这七个点做了运算。可以推想一下,如果一个点图层有十万个点,不建立空间索引,任何地图操作都将对整个图层的所有图元遍历一次,也就是要For循环10万次;建立索引将使得For循环的次数下降很多很多,效率自然提高很多!

呵呵…想必大家都知道空间索引的好处了,也不知不觉向大家介绍了点图层的网格索引,还有哪些常用的空间索引呢?这些空间索引又该如何实现呢?带着这样的问题,下面介绍几种常用的空间索引。

网格索引

网格索引就是在一个地图图层上,按每个小网格宽△w,高△h打上均匀的格网,计算每个图元所占据的网格或者所经过的网格单元集合,

在这些网格单元中,记录下图元对象的地址或者引用,比如:声明一个对象二维数组List grid[m][n]; m代表网格的行数,n代表网格的列数,每个数组元素为一个“集合对象”,用于存储这个网格单元所关联的所有图元的地址或引用,这样网格索引就建立好了。下一步,我们该怎么用这个网格索引呢?所有的图形显示和操作都可以借助于“空间索引”来提高效率。举几个例子来说明“空间索引“的使用:

一、放大开窗显示,正如上一节介绍的,当我们在地图上画一个矩形想放大地图的时候,首先得确定放大后的地图在屏幕上需要显示哪些图元?所以,我们需要判断这个地图中有哪些图元全部或者部分落在这个矩形中。判断步骤:

1,确定所画矩形左上角和右下角所在的网格数组元素;即可得到这个矩形所关联覆盖的所有网格集合;

2,遍历这个网格集合中的元素,取到每个网格元素List中所记录的图元;

3,画出这些图元即可。(当然整个过程涉及到两点:1,屏幕坐标和地图坐标的互相变换;2,窗口裁减,也可以不裁减)

二、包含判断,给出一个点point和一个多边形polygon,判断点是否在面内,首先判断这个点所在的网格,是否同时关联这个polygon,如果不是, 表明点不在面内,如果是,可以下一步的精确解析几何判断,或者精度允许的情况下,即判断polygon是包含point的。

另外,Google Map应该也是采用地理网格的方式,对地图图象进行索引的,可见一斑,网格索引在图形显示,选择,拓扑判断上的广泛应用。但同时也存在很严重的缺陷:当被索引的图元对象是线,或者多边形的时候,存在索引的冗余,即一个线或者多边形的引用在多个网格中都有记录。随着冗余量的增大,效率明显下降。所以,很多学者提出了各种方法来改进网格索引,这个将在下面的章节中介绍。而点图元非常适合网格索引,不存在冗余问题。

四叉树索引(Quadtree)

类似于前面介绍的网格索引,也是对地理空间进行网格划分,对地理空间递归进行四分来构建四叉树,本文将在普通四叉树的基础上,介绍一种改进的四叉树索引结构。首先,先介绍一个GIS(Geographic Information System)或者计算机图形学上非常重要的概念——最小外包矩形(MBR-Minimum Bounding Rectangle):

最小外包矩形MBR就是包围图元,且平行于X,Y轴的最小外接矩形。MBR到底有什么用处呢,为什么要引入这个概念呢?因为,图元的形状是不规则的,而 MBR是平行于X,Y轴的规则图形,设想一下,如果所有的图元都是平行于X,Y轴的矩形,那针对这样的矩形进行几何上的任何判断,是不是要简单很多呢?不管我们人自己写公式算法或者编写程序运行,是不是都要比原本复杂的图形几何运算要简洁很多呢?答案很显然。

然后,我们再介绍一下GIS空间操作的步骤(这个步骤,在前面忘记向大家说明了,在这里补充一下)

可见,过滤阶段,通过空间索引可以排除掉一些明显不符合条件的图元,得到后选集合,然后对后选图元集合进行精确几何运算,得到最终结果。大家可能会有这样的疑问,这样有必要吗?是不是反而把问题复杂化了?合适的空间索引只会提高计算机的效率,没有空间索引,我们无疑要对集合中的每个图元进行精确几何运算, 而这样的运算是复杂的,是非常占用CPU的,所以需要空间索引,采取少量的内存和简单的CUP运算,来尽量减少那种高耗CUP

的精确运算的次数,这样做是完全值得的。至于精确的几何运算到底复杂在哪里,该如何进行精确的几何运算,将在下面的章节中详细描述,这里主要介绍过滤阶段的空间索引。

现在,让我们来具体了解一下“四叉树索引”。

四叉树索引就是递归地对地理空间进行四分,直到自行设定的终止条件(比如每个节点关联图元的个数不超过3个,超过3个,就再四分),最终形成一颗有层次的四叉树。图中有数字标识的矩形是每个图元的MBR,每个叶子节点存储了本区域所关联的图元标识列表和本区域地理范围,非叶子节点仅存储了区域的地理范围。大家可以发现,同样存在一个图元标识被多个区域所关联,相应地存储在多个叶子节点上,比如“6“所代表的图元,分别存储在四个分枝上。这样,就存在索引的冗余,与网格索引存在同样的弊端。下面我们介绍一种改进的四叉树索引,或者说是分层的网格索引。

改进的四叉树索引,就是为了避免这种空间索引的冗余,基本改进思路是:让每个图元的MBR被一个最小区域完全包含。

可以看出,3和13分别都跨越了两个区域,要被一个最小区域完全包含,就只能是根节点所代表的区域,2,5跨越了两个区域,6跨越了四个区域,要被一个最小区域完全包含,就只能是

NW区域。怎么判断一个图元被哪个最小区域完全包含呢?从直观上看,递归地对地理空间进行四分,如果图元与一个区域四分的划分线相交,则这个图元就归属于这个区域,或者直到不再划分了,那就属于这个不再划分的区域。呵呵。。。可能有点绕口,看图,结合“最小”“完全包含”这两个字眼,您就明白了。这颗四叉树中,图元的标识不再仅仅存储在叶子节点上,而是每个节点都有可能存储,这样也就避免了索引冗余。同时每个节点存储本节点所在的地理范围。

有了四叉树索引,下面又该如何利用这颗树来帮助检索查找呢?还是矩形选择为例吧!(为什么我总是拿这个例子来说事呢?因为这个例子简单,容易理解, 有代表性!)我们在地图上画一个矩形,判断地图上哪些图元落在这个矩形里或者和这个所画矩形相交。方法很多,这里介绍一种简单的检索步骤,如下:

1,首先,从四叉树的根节点开始,把根节点所关联的图元标识都加到一个List里;

2,比较此矩形范围与根节点的四个子节点(或者叫子区域)是否有交集(相交或者包含),如果有,则把相应的区域所关联的图元标识加到List集合中,如果没有,则以下这颗子树都不再考虑。

3,以上过程的递归,直到树的叶子节点终止,返回List。

4,从List集合中根据标识一一取出图元,先判断图元MBR与矩形有无交集,如果有,则进行下面的精确几何判断,如果没有,则不再考虑此图元。(当然,这里只说了一个基本思路,其实还有其他一些不同的方法,比如,结合空间数据磁盘的物理存储会有一些调整)

总结:改进的四叉树索引解决了线,面对象的索引冗余,具有较好的性能,而被大型空间数据库引擎所采用,如ArcSDE,Oracle Spatial等,同时这种结构也适用于空间数据的磁盘索引,配合空间排序聚类,基于分形的Hilbert算法数据组织,将在空间数据格式的定义中发挥重要作用。

二、R-Tree空间索引算法的研究历程和最新进展分析

摘要:本文介绍了空间索引的概念、R-Tree数据结构和R-Tree空间索引的算法描述,并从R-Tree 索引技术的优缺点对R-Tree的改进结构——变种R-Tree进行了论述。最后,对R-Tree的最新研究进展进行了分析。

关键词:空间索引技术;R-Tree;研究历程;最新进展

当前数据搜索的一个关键问题是速度。提高速度的核心技术是空间索引。空间索引是由空间位置到空间对象的映射关系。当前的一些大型数据库都有空间索引能力,像Oracle,DB2。

空间索引技术并不单是为了提高显示速度,显示速度仅仅是它所要解决的一个问题。空间索引是为空间搜索提供一种合适的数据结构,以提高搜索速度。

空间索引技术的核心是:根据搜索条件,比如一个矩形,迅速找到与该矩形相交的所有空间对象集合。当数据量巨大,矩形框相对于全图很小时,这个集合相对于全图数据集大为缩小,在这个缩小的集合上再处理各种复杂的搜索,效率就会大大提高。

所谓空间索引,就是指依据空间实体的位置和形状或空间实体之间的某种空间关系,按一定顺序排列的一种数据结构,其中包含空间实体的概要信息如对象的标识、外接矩形及指向空间实体数据的指针。简单的说,就是将空间对象按某种空间关系进行划分,以后对空间对象的存取都基于划分块进行。

1 引言

空间索引是对存储在介质上的数据位置信息的描述,用来提高系统对数据获取的效率。空间索引的提出是由两方面决定的:其一是由于计算机的体系结构将存贮器分为内存、外存两种,访问这两种存储器一次所花费的时间一般为

30~40ns,8~10ms,可以看出两者相差十万倍以上,尽管现在有“内存数据库”的说法,但绝大多数数据是存储在外存磁盘上的,如果对磁盘上数据的位置不加以记录和组织,每查询一个数据项就要扫描整个数据文件,这种访问磁盘的代价就会严重影响系统的效率,因此系统的设计者必须将数据在磁盘上的位置加以记录和组织,通过在内存中的一些计算来取代对磁盘漫无目的的访问,才能提高系统的效率,尤其是GIS涉及的是各种海量的复杂数据,索引对于处理的效率是至关重要的。其二是GIS 所表现的地理数据多维性使得传统的B树索引并不适用,因为B树所针对的字符、数字等传统数据类型是在一个良序集之中,即都是在一个维度上,集合中任给两个元素,都可以在这个维度上确定其关系只可能是大于、小于、等于三种,若对多个字段进行索引,必须指定各个字段的优先级形成一个组合字段,而地理数据的多维性,在任何方向上并不存在优先级问题,因此B树并不能对地理数据进行有效的索引,所以需要研究特殊的能适应多维特性的空间索引方式。

1984年Guttman发表了《R树:一种空间查询的动态索引结构》,它是一种高度平衡的树,由中间节点和页节点组成,实际数据对象的最小外接矩形存储在页节点中,中间节点通过聚集其低层节点的外接矩形形成,包含所有这些外接矩形。其后,人们在此基础上针对不同空间运算提出了不同改进,才形成了一个繁荣的索引树族,是目前流行的空间索引。

R树是B树向多维空间发展的另一种形式,它将空间对象按范围划分,每个结点都对应一个区域和一个磁盘页,非叶结点的磁盘页中存储其所有子结点的区域范围,非叶结点的所有子结点的区域都落在它的区域范围之内;叶结点的磁盘页中存储其区域范围之内的所有空间对象的外接矩形。每个结点所能拥有的子结点数目有上、下限,下限保证对磁盘空间的有效利用,上限保证每个结点对应一个磁盘页,当插入新的结点导致某结点要求的空间大于一个磁盘页时,该结点一分为二。R树是一种动态索引结构,即:它的查询可与插入或删除同时进行,而且不需要定期地对树结构进行重新组织。

2 R-Tree数据结构

R-Tree是一种空间索引数据结构,下面做简要介绍:

(1)R-Tree是n 叉树,n称为R-Tree的扇(fan)。

(2)每个结点对应一个矩形。

(3)叶子结点上包含了小于等于n 的对象,其对应的矩为所有对象的外包矩形。

(4)非叶结点的矩形为所有子结点矩形的外包矩形。

R-Tree的定义很宽泛,同一套数据构造R-Tree,不同方可以得到差别很大

的结构。什么样的结构比较优呢?有两标准:

(1)位置上相邻的结点尽量在树中聚集为一个父结点。

(2)同一层中各兄弟结点相交部分比例尽量小。

R树是一种用于处理多维数据的数据结构,用来访问二维或者更高维区域对象组成的空间数据.R树是一棵平衡树。树上有两类结点:叶子结点和非叶子结点。每一个结点由若干个索引项构成。对于叶子结点,索引项形如(Index,

Obj_ID)。其中,Index表示包围空间数据对象的最小外接矩形MBR,Obj_ID标识一个空间数据对象。对于一个非叶子结点,它的索引项形如(Index,

Child_Pointer)。 Child_Pointer 指向该结点的子结点。Index仍指一个矩形区域,该矩形区域包围了子结点上所有索引项MBR的最小矩形区域。一棵R树的示例如图所示:

3 R-Tree算法描述

算法描述如下:

对象数为n,扇区大小定为fan。

(1)估计叶结点数k=n/fan。

(2)将所有几何对象按照其矩形外框中心点的x值排序。

(3)将排序后的对象分组,每组大小为 *fan,最后一组可能不满员。

(4)上述每一分组内按照几何对象矩形外框中心点的y值排序。

(5)排序后每一分组内再分组,每组大小为fan。

(6)每一小组成为叶结点,叶子结点数为nn。

(7)N=nn,返回1。

4 R-Tree空间索引算法的研究历程

1 R-Tree

多维索引技术的历史可以追溯到20世纪70年代中期。就在那个时候,诸如Cell算法、四叉树和k-d树等各种索引技术纷纷问世,但它们的效果都不尽人意。在GIS和CAD系统对空间索引技术的需求推动下,Guttman于1984年提出了R树索引结构,发表了《R树:一种空间查询的动态索引结构》,它是一种高度平衡的树,由中间节点和页节点组成,实际数据对象的最小外接矩形存储在页节点中,中间节点通过聚集其低层节点的外接矩形形成,包含所有这些外接矩形。其后,人们在此基础上针对不同空间运算提出了不同改进,才形成了一个繁荣的索引树族,是目前流行的空间索引。

2 R+树

在Guttman的工作的基础上,许多R树的变种被开发出来, Sellis等提出了R+树,R+树与R树类似,主要区别在于R+树中兄弟结点对应的空间区域无重叠,这样划分空间消除了R树因允许结点间的重叠而产生的“死区域”(一个结点内不含本结点数据的空白区域),减少了无效查询数,从而大大提高空间索引

的效率,但对于插入、删除空间对象的操作,则由于操作要保证空间区域无重叠而效率降低。同时R+树对跨区域的空间物体的数据的存储是有冗余的,而且随着数据库中数据的增多,冗余信息会不断增长。Greene也提出了他的R树的变种。

3 R*树

在1990年,Beckman和Kriegel提出了最佳动态R树的变种——R*树。R*树和R树一样允许矩形的重叠,但在构造算法R*树不仅考虑了索引空间的“面积”,而且还考虑了索引空间的重叠。该方法对结点的插入、分裂算法进行了改进,并采用“强制重新插入”的方法使树的结构得到优化。但R*树算法仍然不能有效地降低空间的重叠程度,尤其是在数据量较大、空间维数增加时表现的更为明显。R*树无法处理维数高于20的情况。

4 QR树

QR树利用四叉树将空间划分成一些子空间,在各子空间内使用许多R树索引,从而改良索引空间的重叠。QR树结合了四叉树与R树的优势,是二者的综合应用。实验证明:与R树相比,QR树以略大(有时甚至略小)的空间开销代价,换取了更高的性能,且索引目标数越多,QR树的整体性能越好。

5 SS树

SS树对R*树进行了改进,通过以下措施提高了最邻近查询的性能:用最小边界圆代替最小边界矩形表示区域的形状,增强了最邻近查询的性能,减少将近一半存储空间;SS树改进了R*树的强制重插机制。当维数增加到5是,R树及其变种中的边界矩形的重叠将达到90%,因此在高维情况(≧5)下,其性能将变的很差,甚至不如顺序扫描。

6 X树

X树是线性数组和层状的R树的杂合体,通过引入超级结点,大大地减少了最小边界矩形之间的重叠,提高了查询效率。X树用边界圆进行索引,边界矩形的直径(对角线)比边界圆大,SS树将点分到小直径区域。由于区域的直径对最邻近查询性能的影响较大,因此SS树的最邻近查询性能优于R*树;边界矩形的平均容积比边界圆小,R*树将点分到小容积区域;由于大的容积会产生较多的覆盖,因此边界矩形在容积方面要优于边界圆。SR树既采用了最小边界圆(MBS),也采用了最小边界矩形(MBR),相对于SS树,减小了区域的面积,提高了区域之间的分离性,相对于R*树,提高了邻近查询的性能。

5 R-Tree空间索引算法的最新研究

信息的膨胀使数据库检索需要面对的问题越来越多。在构建索引方面,最主要面临的则是如何构造高效的索引算法来支持各种数据库系统(比如:多媒体数据库、空间数据库等),特别是如何有效的利用算法来实现加速检索。概括地说,R-Tree空间索引算法的研究要做到:支持高维数据空间;有效分割数据空间,来适应索引的组织;高效的实现多种查询方式系统中的统一。R-Tree的索引结构最新研究不能是单纯为了加速某种查询方式或提高某个方面的性能,忽略其他方面的效果,这样可能会造成更多不必要的性能消耗。

XML作为可扩展的标记语言,其索引方法就是基于传统的R-Tree索引技术的XR-Tree索引方法。该方法构造了适合于XML数据的索引结构。XR-Tree索引方法是一种动态扩充内存的索引数据结构,针对XISS(XML Indexing and Storage System:XML索引和存储体系)中结构连接中的问题,设计了基于XR-Tree索引

树有效地跳过不参与匹配的元素的连接算法。但这种索引方法在进行路径的连接运算中仍然存储大量的中间匹配结果,为此一种基于整体查询模式的基于索引的路径连接算法提出,即利用堆栈链表来临时压栈存储产生的部分匹配结果,并且随着匹配的动态进行出栈操作。这样在查询连接处理完成以后,直接输出最终结果,既节省了存储空间又提高了操作效率。

GIS空间分析复习提纲及答案

空间分析复习提纲 一、基本概念(要求:基本掌握其原理及含义,能做名词解释) 1、空间分析:就是基于地理对象得位置与形态得空间数据得分析技术,其目得在于提取与传输空间信息。 2、空间数据模型:以计算机能够接受与处理得数据形式,为了反映空间实体得某些结构特性与行为功能,按一定得方案建立起来得数据逻辑组织方式,就是对现实世界得抽象表达。分为概念模型、逻辑模型、物理模型。 3、叠置分析:就是指在同一地区、同一比例尺、同一数学基础、不同信息表达得两组或多组专题要素得图形或数据文件进行叠加,根据各类要素与多边形边界得交点或多边形属性建立多重属性组合得新图层,并对那些结构与属性上既互相重叠,又互相联系得多种现象要素进行综合分析与评价;或者对反映不同时期同一地理现象得多边形图形进行多时相系列分析,从而深入揭示各种现象要素得内在联系及其发展规律得一种 空间分析方法。 4、网络分析:网络分析就是通过研究网络得状态以及模拟与分析资源在网络上得流动与分配情况,对网络结构及其资源等得优化问题进行研究得一种空间分析方法。 5、缓冲区分析:即根据分析对象得点、线、面实体,自动建立它们周围一定距离得带状区,用以识别这些实体或主体对邻近对象得辐射范围或影响度,以便为某项分析或决策提供依据。其中包括点缓冲区、线缓冲区、面缓冲区等。 6、最佳路径分析:也称最优路径分析,以最短路径分析为主,一直就是计算机科学、运筹学、交通工程学、地理信息科学等学科得研究热点。这里“最佳”包含很多含义,不仅指一般地理意义上得距离最短,还可以就是成本最少、耗费时间最短、资源流量(容量)最大、线路利用率最高等标准。 7、空间插值:空间插值就是指在为采样点估计一个变量值得过程,常用于将离散点得测量数据转换为连续得数据曲面,它包括内插与外推两种算法。,前者就是通过已知点得数据计算同一区域内其她未知点得数据,后者则就是通过已知区域得数据,求未知区域得数据。 8、空间量算:即空间量测与计算,就是指对GIS数据库中各种空间目标得基本参数进行量算与分析,如空间目标得位置、距离、周长、面积、体积、曲率、空间形态以及空间分布等,空间量算就是GIS获取地理空间信息得基本手段,所获得得基本空间参数就是进行复杂空间分析、模拟与决策制定得基础。 9、克里金插值法:克里金插值法就是空间统计分析方法得重要内容之一,它就是建立在半变异函数理论分析基础上,对有限区域内得区域变化量取值进行无偏最优估计得一种方法,不仅考虑了待估点与参估点之 间得空间相关性,还考虑了各参估点间得空间相关性,根据样本空间位置不同、样本间相关程度得不同,对每个参估点赋予不同得权,进行滑动加权平均,以估计待估点得属性值。 二、分析类(要求:重点掌握其原理及含义,能结合本专业研究方向做比较详细得阐述) 1、空间数据模型得分类? 答:分为三类: ①场模型:用于表述二维或三维空间中被瞧作就是连续变化得现象; ②要素模型:有时也称对象模型,用于描述各种空间地物; ③网络模型:一种某一数据记录可与任意其她多个数据记录建立联系得有向图结构得数据模型,可以 模拟现实世界中得各种网络。

GIS空间分析复习提纲及答案

空间分析复习提纲 一、基本概念(要求:基本掌握其原理及含义,能做名词解释) 1、空间分析:是基于地理对象的位置和形态的空间数据的分析技术,其目的在于提取和传输空间信息。 2、空间数据模型:以计算机能够接受和处理的数据形式,为了反映空间实体的某些结构特性和行为功能,按一定的方案建立起来的数据逻辑组织方式,是对现实世界的抽象表达。分为概念模型、逻辑模型、物理模型。 3、叠置分析:是指在同一地区、同一比例尺、同一数学基础、不同信息表达的两组或多组专题要素的图形或数据文件进行叠加,根据各类要素与多边形边界的交点或多边形属性建立多重属性组合的新图层,并对那些结构和属性上既互相重叠,又互相联系的多种现象要素进行综合分析和评价;或者对反映不同时期同一地理现象的多边形图形进行多时相系列分析,从而深入揭示各种现象要素的内在联系及其发展规律的一种空间分析方法。 4、网络分析:网络分析是通过研究网络的状态以及模拟和分析资源在网络上的流动和分配情况,对网络结构及其资源等的优化问题进行研究的一种空间分析方法。 5、缓冲区分析:即根据分析对象的点、线、面实体,自动建立它们周围一定距离的带状区,用以识别这些实体或主体对邻近对象的辐射范围或影响度,以便为某项分析或决策提供依据。其中包括点缓冲区、线缓冲区、面缓冲区等。 6、最佳路径分析:也称最优路径分析,以最短路径分析为主,一直是计算机科学、运筹学、交通工程学、地理信息科学等学科的研究热点。这里“最佳”包含很多含义,不仅指一般地理意义上的距离最短,还可以是成本最少、耗费时间最短、资源流量(容量)最大、线路利用率最高等标准。 7、空间插值:空间插值是指在为采样点估计一个变量值的过程,常用于将离散点的测量数据转换为连续的数据曲面,它包括内插和外推两种算法。,前者是通过已知点的数据计算同一区域内其他未知点的数据,后者则是通过已知区域的数据,求未知区域的数据。 8、空间量算:即空间量测与计算,是指对GIS数据库中各种空间目标的基本参数进行量算与分析,如空间目标的位置、距离、周长、面积、体积、曲率、空间形态以及空间分布等,空间量算是GIS获取地理空间信息的基本手段,所获得的基本空间参数是进行复杂空间分析、模拟与决策制定的基础。 9、克里金插值法:克里金插值法是空间统计分析方法的重要内容之一,它是建立在半变异函数理论分析基础上,对有限区域内的区域变化量取值进行无偏最优估计的一种方法,不仅考虑了待估点与参估点之间的空间相关性,还考虑了各参估点间的空间相关性,根据样本空间位置不同、样本间相关程度的不同,对每个参估点赋予不同的权,进行滑动加权平均,以估计待估点的属性值。 二、分析类(要求:重点掌握其原理及含义,能结合本专业研究方向做比较详细的阐述) 1、空间数据模型的分类? 答:分为三类: ①场模型:用于表述二维或三维空间中被看作是连续变化的现象; ②要素模型:有时也称对象模型,用于描述各种空间地物; ③网络模型:一种某一数据记录可与任意其他多个数据记录建立联系的有向图结构的数据模型,可 以模拟现实世界中的各种网络。

gis空间数据的编辑

实验二空间数据处理(三) ——ArcGIS的数据编辑目的 (1)掌握矢量数据的编辑 内容 (1)掌握矢量数据的编辑方法; (2)几何数据和属性数据两部分内容的编辑; (3)练习数据属性表的基本编辑、表连接等。 基本概念介绍 1.ArcMap中的数据编辑 数据编辑是纠正数据错误的重要手段,包括几何数据和属性数据的 编辑。几何数据的编辑主要是针对图形的操作(图形编辑),包括平行 线复制、缓冲区生成、镜面反射、图层合并、结点操作和拓扑修改等。 属性数据的编辑包括图形要素属性的添加、删除、修改、复制、粘贴、 属性表导出等。 在ArcMap中,编辑操作由编辑器工具条来控制。该工具条有几个重 要的控件: (1)编辑器下拉菜单:菜单中有用于启动、停止和存储编辑对话过程的一些 命令同时还提供了几种编辑操作、捕捉选项以及编辑选项。 (2)编辑工具:这一工具用于选择要编辑的要素。 (3)草图工具:这是编辑空间要素的主要工具。允许数字化新的要素或修改 已有要素的形状。该工具进行的实际操作由编辑草图属性列表所控制。 (4)编辑草图属性列表:从下拉列表中,选择想要进行的编辑操作。所列出 的任务将根据编辑的要素类的改变而变化。 (5)属性对话框:在这个窗口中可以编辑选中要素的属性值。 2. 理解表格结构 表是数据库的结构物,它包括了行和列。行(或称为记录)代表一

个特征,如高速公路、湖等;列(或称为域),描述了特征的属性,例 如长度、深度等。每个表格的基本格式相同,即有行和列组成。一些表 格,诸如要素类的缺省属性表都有预先设置的字段。例如多边形coverage 有四个标准的字段即面积、周长、coverage#和coverage-id。一个线性 shapefile仅有一列名为shape的缺省列,其他字段完全由用户定义。 每个表格必须有唯一字段名,但字段的数据格式可以有多种。一般 来说,可以存储数字、文字、日期。在ArcCatalog还支持特定格式,包括 短整形、长整形、浮点型、双精度型、日期型、object-id和BLOB。 3.图形编辑 (一)、基本步骤 进入ArcMap工作环境,打开已有的地图文档或新建地图文档后,进 行数据编辑一般需要经过下列5个步骤: (1)加载编辑数据 单击文件菜单下的添加数据命令,选择需要加载的数据层。 (2)打开编辑工具 在工具栏的空白处点击右键,选择编辑器,出现编辑器工具条。 (3)进入编辑状态 单击编辑器下的开始编辑命令,使数据层进入编辑状态。 (4)执行数据编辑 在创建要素窗口中选择当前编辑任务的目标数据层,然后选择编辑 构造工具命令,对要素进行编辑。 (5)结束数据编辑 单击编辑器下的停止编辑命令,选择是否保存编辑结果,结束编辑。 (二)、本编辑练习 (1)加载编辑数据 在开始——打开ArcMap10,单击文件菜单下的添加数据命令, 在data2\Basicedit\下:按shift+左键选择需要加载的数据层(,,,)。

GIS空间数据转换与处理

GIS理论与实践 讲义三 ArcGIS空间数据的转换与处理 目的 z掌握地图投影的定义与转换 z掌握利用build或clean对空间要素建立拓扑 z使用ArcToolbox工具 内容 z介绍地图投影的定义,学习ArcGIS中地图投影转换的方法 z利用build或clean对空间要素建立拓扑 z使用ArcToolbox工具,实现矢量栅格数据的互相转换、数据裁切等操作 一、 地图投影定义与转换 由于数据源的多样性,当数据的空间参考系统(坐标系统,投影方式)与用户需求不一致时,就需要对数据进行投影变换。同样,在完成本身有投影信息的数据采集时,为了保证数据的完整性和易交换性,要定义数据投影。 地球是一个不规则的球体,为了能够将其表面内容显示在平面上,就必须将球面地理坐标系变换到平面坐标系统。因此,运用地图投影方法,建立地球表面和平面上点的函数关系,使地球表面上由地理坐标确定的点,在平面上有一个与它相对应的点。地图投影的使用保证了空间信息的地域上的连续性和完整性。 1.在ArcGIS中显示坐标系统 (1) 显示数据组坐标系统 1)在桌面上打开ArcGIS应用程序 2)鼠标右键单击layers打开properties属性对话框,并单击Coordinate System 来查看Data Frame的坐标系统

图5 Data Frame properties (2) 显示数据层坐标 1)在刚打开的地图文档的Layers中加载一个图层 2)鼠标右键单击该图层打开properties属性对话框,并单击Source来查看该图层的坐标系统 2.对没有坐标系统的图像赋予坐标系统 (1) 对新建图层设置其坐标系统 在ArcMap中打开ArcCatalog,在左侧目录树中选择一个存放新建图层的文件并单击,然后在窗口主菜单中单击File命令,选择New选项在其子选项中选择要新建的图层

GIS和空间分析的基本方法

第一部分GIS和空间分析的基本方法

第一章ArcGIS入门:数据管理及基本的空间分析工具 地理信息系统(GIS)是一种计算机信息系统,用于获取、存储、处理、查询、分析及显示地理数据。在GIS众多功能中,制图一直是它的一项主要功能。本章的首要目的是演示如何借助GIS进行电脑制图。主要技巧包括空间与非空间(属性)数据的管理以及二者之间的联系。但是,GIS远不只是一种制图工具,随着GIS软件功能越来越强大,界面越来越友好,它在空间分析中的应用越来越广。本章第二个目的是介绍GIS的一些基本空间分析工具。 鉴于ArcGIS在教育、商业及政府机构中的广泛应用,本书采用它作为主要的软件平台来完成GIS任务。除非特别说明,本书所有GIS操作都是基于ArcGIS9.0。各章结构的安排类似:先从基本概念着手,介绍GIS方法的基本内容;然后用案例来使者熟悉刚刚介绍的GIS 方法。本章第1.1节简要介绍ArcGIS中的空间及属性数据管理,第1.2节为案例1A,通过绘制库婭霍加县的人口密度分布图来演示基于GIS作图的基本过程。第1.3节介绍ArcGIS中基本的空间分析工具,包括空间查询、空间连接、地图叠加等。第 1.4节为案例1B,演示了一些空间分析工具:提取克里夫兰市的普查小区,生成多边形邻接矩阵。在高级空间统计研究如空间聚类和空间回归分析中,我们常常用多边形邻接矩阵来定义空间权重(参见第九章)。 本书假设读者具有初极GIS知识。本章不会涵盖所有的ArcGIS功能。相反,它只是回顾ArcGIS的主要功能,给读者一个”热身赛”, 以便引导读者继续学习章节中的一些高级空间分析方法。 1.1ArcGIS中的空间和属性数据管理 因为本书选择ArcGIS作为主要的软件平台,所以有必要简单介绍一下它的主要模块及功能。ArcGIS是美国环境系统研究所(ESRI)2001年发布的一种基于图形界面(GUI)的软件平台,用以代替以前基于命令行的ArcInfo。ArcGIS包括3个主要模块:ArcCatalog、ArcMap 和ArcToolbox。ArcCatalog用于查看、管理空间数据文件。ArcMap用于显示、分析、编辑空1 2

GIS空间分析方法

地理信息系统(GIS)具有很强的空间信息分析功能,这是区别于计算机地图制图系统的显著特征之一。利用空间信息分析技术,通过对原始数据模型的观察和实验,用户可以获得新的经验和知识,并以此作为空间行为的决策依据。 空间信息分析的内涵极为丰富。作为GIS的核心部分之一,空间信息分析在地理数据的应用中发挥着举足轻重的作用。 叠置分析(Overlay Analysis) 覆盖叠置分析是将两层或多层地图要素进行叠加产生一个新要素层的操作,其结果将原来要素分割生成新的要素,新要素综合了原来两层或多层要素所具有的属性。也就是说,覆盖叠置分析不仅生成了新的空间关系,还将输入数据层的属性联系起来产生了新的属性关系。覆盖叠置分析是对新要素的属性按一定的数学模型进行计算分析,进而产生用户需要的结果或回答用户提出的问题。 1)多边形叠置 这个过程是将两层中的多边形要素叠加,产生输出层中的新多边形要素,同时它们的属性也将联系起来,以满足建立分析模型的需要。一般GIS软件都提供了三种多边形叠置: (1)多边形之和(UNION):输出保留了两个输入的所有多边形。 (2)多边形之积(INTERSECT):输出保留了两个输入的共同覆盖区域。 (3)多边形叠合(IDENTITY):以一个输入的边界为准,而将另一个多边形与之相匹配,输出内容是第一个多边形区域内二个输入层所有多边形。 多边形叠置是个非常有用的分析功能,例如,人口普查区和校区图叠加,结果表示了每一学校及其对应的普查区,由此就可以查到作为校区新属性的重叠普查区的人口数。 2)点与多边形叠加 点与多边形叠加,实质是计算包含关系。叠加的结果是为每点产生一个新的属性。例如,井位与规划区叠加,可找到包含每个井的区域。 3)线与多边形叠加 将多边形要素层叠加到一个弧段层上,以确定每条弧段(全部或部分)落在哪个多边形内。 网络分析(Network Analysis) 对地理网络(如交通网络)、城市基础设施网络(如各种网线、电力线、电话线、供排水管线等)进行地理分析和模型化,是地理信息系统中网络分析功能的主要目的。网络分析是运筹学模型中的一个基本模型,它的根本目的是研究、筹划一项网络工程如何按排,并使其运行效果最好,如一定资源的最佳分配,从一地到另一地的运输费用最低等。其基本思想则在于人类

(完整word版)GIS空间分析与建模期末复习总结

空间分析与建模复习 名词解释: 空间分析:采用逻辑运算、数理统计和代数运算等数学方法,对空间目标的位置、形态、分布及空间关系进行描述、分析和建模,以提取和挖掘地理空间目标的隐含信息为 目标,并进一步辅助地理问题求解的空间决策支持技术。 空间数据结构:是对空间数据的合理组织,是适合于计算机系统存储、管理和处理地图图形的逻辑结构,是地理实体的空间排列方式和相互关系的抽象描述与表达。 空间量测:对GIS数据库中各种空间目标的基本参数进行量算与分析, 元数据:描述数据及其环境的数据。 空间元数据:关于地理空间数据和相关信息的描述性信息。 空间尺度:数据表达的空间范围的相对大小以及地理系统中各部分规模的大小 尺度转换:信息在不同层次水平尺度范围之间的变化,将某一尺度上所获得的信息和知识扩展或收缩到其他尺度上,从而实现不同尺度之间辨别、推断、预测或演绎的跨越。 地图投影:将地球椭球面上的点映射到平面上的方法,称为地图投影。 地图代数:作用于不同数据层面上的基于数学运算的叠加运算 重分类:将属性数据的类别合并或转换成新类,即对原来数据中的多种属性类型按照一定的原则进行重新分类 滤波运算:通过一移动的窗口,对整个栅格数据进行过滤处理,将窗口最中央的像元的新值定义为窗口中像元值的加权平均值 邻近度:是定性描述空间目标距离关系的重要物理量之一,表示地理空间中两个目标地物距离相近的程度。缓冲区分析、泰森多边形分析。 缓冲区:是指为了识别某一地理实体或空间物体对其周围地物的影响度而在其周围建立的具有一定宽度的带状区域。 缓冲区分析:对一组或一类地物按缓冲的距离条件,建立缓冲区多边形,然后将这一图层与需要进行缓冲区分析的图层进行叠加分析,得到所需结果的一种空间分析方法 泰森多边形:所有点连成三角形,作三角形各边的垂直平分线,每个点周围的若干垂直平分线便围成的一个多边形 网络分析:是通过研究网络的状态以及模拟和分析资源在网络上的流动和分配情况,对网络结构及其资源等的优化问题进行研究的一种空间分析方法。(理论基础:计算机图论和运筹学) 自相关:空间统计分析所研究的区域中的所有的值都是非独立的,相互之间存在相关性。在空间和时间范畴内,这种相关性被称为自相关。

GIS 空间数据的编辑

实验二空间数据处理(三) ——ArcGIS的数据编辑目的 (1)掌握矢量数据的编辑 内容 (1)掌握矢量数据的编辑方法; (2)几何数据与属性数据两部分内容的编辑; (3)练习数据属性表的基本编辑、表连接等。 基本概念介绍 1、ArcMap中的数据编辑 数据编辑就是纠正数据错误的重要手段,包括几何数据与属性数据的 编辑。几何数据的编辑主要就是针对图形的操作(图形编辑),包括平行 线复制、缓冲区生成、镜面反射、图层合并、结点操作与拓扑修改等。 属性数据的编辑包括图形要素属性的添加、删除、修改、复制、粘贴、 属性表导出等。 在ArcMap中,编辑操作由编辑器工具条来控制。该工具条有几个重 要的控件: (1)编辑器下拉菜单:菜单中有用于启动、停止与存储编辑对话过程的一些 命令同时还提供了几种编辑操作、捕捉选项以及编辑选项。 (2)编辑工具:这一工具用于选择要编辑的要素。 (3)草图工具:这就是编辑空间要素的主要工具。允许数字化新的要素或修改 已有要素的形状。该工具进行的实际操作由编辑草图属性列表所控制。 (4)编辑草图属性列表:从下拉列表中,选择想要进行的编辑操作。所列出 的任务将根据编辑的要素类的改变而变化。 (5)属性对话框:在这个窗口中可以编辑选中要素的属性值。 2、理解表格结构 表就是数据库的结构物,它包括了行与列。行(或称为记录)代表一 个特征,如高速公路、湖等;列(或称为域),描述了特征的属性,例

如长度、深度等。每个表格的基本格式相同,即有行与列组成。一些表 格,诸如要素类的缺省属性表都有预先设置的字段。例如多边形coverage 有四个标准的字段即面积、周长、coverage#与coverage-id。一个线性 shapefile仅有一列名为shape的缺省列,其她字段完全由用户定义。 每个表格必须有唯一字段名,但字段的数据格式可以有多种。一般 来说,可以存储数字、文字、日期。在ArcCatalog还支持特定格式,包括 短整形、长整形、浮点型、双精度型、日期型、object-id与BLOB。 3、图形编辑 (一)、基本步骤 进入ArcMap工作环境,打开已有的地图文档或新建地图文档后,进 行数据编辑一般需要经过下列5个步骤: (1)加载编辑数据 单击文件菜单下的添加数据命令,选择需要加载的数据层。 (2)打开编辑工具 在工具栏的空白处点击右键,选择编辑器,出现编辑器工具条。 (3)进入编辑状态 单击编辑器下的开始编辑命令,使数据层进入编辑状态。 (4)执行数据编辑 在创建要素窗口中选择当前编辑任务的目标数据层,然后选择编辑 构造工具命令,对要素进行编辑。 (5)结束数据编辑 单击编辑器下的停止编辑命令,选择就是否保存编辑结果,结束编辑。 (二)、本编辑练习 (1)加载编辑数据 在开始——打开ArcMap10,单击文件菜单下的添加数据命令, 在data2\Basicedit\下:按shift+左键选择需要加载的数据层(routes_hwy、shp,rail、shp,county、shp,cites、shp)。

GIS空间分析复习总结

第一章 空间分析概念:GIS 空间分析是从一个或多个空间数据图层获取信息的过程。空间分析是集 空间数据分析和空间模拟于一体的技术,通过地理计算和空间表达挖掘潜在 空间信息,以解决实际问题。 空间分析在GIS 中的地位与作用:空间分析是GIS 的核心,也是核心功能,是GIS 领域的理 论性和技术性都很强的分支,是提升GIS 的理论性十分重要的突破口,空间 分析是地理信息系统的主要特征,是评价一个地理信息系统的主要指标之一。 第二章 空间分析的基本理论:空间关系理论,空间认知理论,空间推理理论,空间数据模型理论, 地理信息机理理论,地理信息不确定性理论 空间关系分类:顺序关系:主要指目标间的方向关系, 度量关系:主要是指目标间的距离关系, 拓扑关系:指拓扑变换下的拓扑不变量() 度量关系对空间数据的约束最强烈; 顺序关系次之; 拓扑关系最弱。 空间度量关系:分为定量度量(空间指标量算,距离度量)和定性度量 定量度量空间关系分析包括空间指标量算(距离、面积、坡度、人口密度等)和距离度量(距离)两大类 拓扑空间关系:指拓扑变换下的拓扑不变量,如空间目标的相邻和连通关系,以及表示线段 流向的关系。 拓扑变换的条件:在原来图形的点与变换了图形的点之间存在着一一对应的关系,并且邻 近的点还是邻近的点 方向空间关系:源目标相对于参考目标的顺序关系(方位) 度量空间关系描述: 欧氏距离:直线距离 切比雪夫距离:最大距离 马氏距离(曼哈顿距离):垂直距离 大地测量距离:即球面上两点间的大圆距离 曼哈顿距离:纬度差加上经度差 拓扑空间关系描述: 4元组模型:该模型将简单空间实体看作是边界点和内部点。构成的集合,4元组模型为由 两个简单空间实体点集的边界与边界的交集、边界与内部的交集、内部与边 界的交集、内部与内部的交集构成的2×2矩阵。 9元组模型:9元组在4元组的基础上,在空间描述框架中引入空间实体的“补”的概念, 将空间目标A 表示为边界、内部和外部三个部分的集合。通过比较目标A 与 B 的边界、内部、外部之交集(空或非空) ,分析确定A 、B 间的空间拓扑关系。 2 21221)y y (x x )B A (d -+-= |)y ||x x (|max )B A (d 2121y --=

GIS空间数据库综述

GIS空间数据库文献综述 姓名:张磊 摘要:通过分析地理信息系统建设过程中空间数据库的建设内容1 综述空间数据块的划分、图层的分层设计方法、专题图层划分和数据集设计、分析空间数据库的结构,讨论了空间数据库系统建设的方法和需解决的关键技术问题。 关键字:GIS;空间数据库 引言:地理信息系统是集计算机科学、空间科学、信息科学、测绘遥感科学、环境科学等学科于一体的新兴边缘科学1GIS 从20 世纪60 年代出现以来,至今只有短短的40 多年时间,但已成为已成为多学科集成并应用于各领域的基础平台,成为地学空间信息分析的基本手段和工具。目前,地理信息系统不仅发展成为一门较为成熟的技术科学,而且已成为一门新兴产业,在测绘、地质、水利、环境检测、土地管理、城市规划、国防建设等领域发挥越来越重要的作用。目前,国际上在此领域进行深入研究并形成软件产品的有目前,国际上在该领域进行过深入研究并形成软件产品的有:ESRIArcSDE1,MapInfo Spatial Ware2以及Oracle Spatial 3,DB2 Spatial Extender4和Informix Spatial Data Blade 等。 1 . 空间数据库的设计 1.1空间数据库的设计思路 空间数据库由图形数据库和属性数据库两部分组成, 运用地理信息系统技术分别建好图形数据库和属性数据库后, 通过统一的编码来实现滑坡的图形数据库与属性数据库的无缝连接, 最终形成完整的空间数据库5。 1.2 间数据库的主要内容 每个GIS 数据集都提供了对世界某一方面的空间表达,包括: 基于矢量的要素(点、线和多边形) 的有序集合; 诸如数字高程模型和影像的栅格数据集; 网络; 地形和其他地表; 测量数据集; 其他类型数据,诸如地址、地名和制图信息; 描述性的属性。 除了地理表现形式以外,地理数据集还包括传统的描述地理对象的属性表1 许多表和空间对象之间可以通过它们所共有的字段(也常称为“关键字”) 相互关联1 就像它们在传统数据库应用中一样,这些以表的形式存在的信息集和信息关系在GIS 数据模型中扮演着非常关键的角色。 1.3 空间数据表现形式 1.3.1空间关系:拓扑和网络 空间关系,比如拓扑和网络,也是一个GIS 数据库的重要部分1 使用拓扑是为了管理要素间的共同边界、定义和维护数据的一致性法则,以及支持拓扑查询和漫游 1胡金星.空间数据库实现及其集成技术研究[J].计算机应用研究,2003,3:12-15. 2Andrew S Tanenbaum,Albert S.Woodhull :Operating SystemDesign and Implementation[Z]. 3Forta B, Fonte P, Brewer G.Windows2000 开发人员指南[M].杜大鹏,译.北京: 中国水利水电出版 社,2001.144 ,428. 4David J Kruglinski.Visual C++6. 0 技术内幕[M].4 版.希望图书创作室.北京:北京希望电子出版 社.209-426. 5 兰恒星,吴法权,周成虎,等.基于GIS 的滑坡空间数据库研究以云南小江流域为例[ J].中国地质灾害与防治学报, 2002, 13( 4):10-16.

GIS空间数据库建立

ArcView简介 ArcView是美国环境系统研究所(Environmental System Research Institute简称ESRI)开发研制的集成地理信息系统软件它集空间图形、关系型数据库、统计图形、空间分析、网络通讯、面向对象的程序设计于一体。它支持应用程序之间的通讯并提供与其它应用程序之间的接口它支持多种平台:Unix,Microsoft Windows98和Windows NT等并保持用户界面基本相同而且可利用Windows 的各种资源具有强大潜力的桌面GIS系统。 一、ArcView主要优点 1) 数据兼容性好:ArcView可以支持多种格式的空间数据格式并与其它地理信息系统软件或制图软件数据兼容。属性数据库可经SQL Connect 与读取其它类型数据库如Sybase、Excel、Access 等且可以直接读取INFO、DBASE数据及以逗号间隔的文本文件。ArcView生成的数据库是DBF格式也可被其它软件使用。 2)支持汉字汉字处理:ArcView的操作界面是英文的但它支持中文Windows操作系统对汉字的处理极其方便。 3)系统升级容易:ArcView是采用模块组合方式构成如果有新的需求时可配置其它扩展模块如空间分析模块(Spatial analysis 、网格分析模块(Network analysis)、3D(3D analysis)分析模块或可在INTERNET上发布系统信息的IMS模块。 4)系统可跨平台运行:ArcView具有跨平台运行的能力可在常见的操作系统如Windows 95Windows NT以及Unix等上运行。 二、ArcView主要功能 数据采集手段图层管理功能属性库及其管理功能专题图和统计图各类查询功能导出图形(象)功能二次开发功能空间分析功能。 三、ArcView的项目基本结构 ArcViewGIS是以项目(project.apr)为空间图形(像)单位。 项目构成: 1、View: 可以进行地图显示信息查询空间分析它支持多种数据格式主要有shape文件、Arcinfo中的coverage文件和Autocad中的.dxf .dwg 文件以及各种图象文件.image .jpeg .gif. bmp等等。ArcView 所引入的数据格式—SHAPE是一种矢量数据它有属性数据库可以与其它表(Table)相连可和其他主题(Theme)一样进行多种操作。ArcView可以直接建立编辑删除shape文件而且shape格式是开放的用户也可以用各种方法产生shape文件并加入到View中。 此外对点的位置信息可以直接显示和编辑其坐标可由ASCII文件、数据文件和GPS外部数据源输入。 ArcView是通过xy坐标存储地理要素的点被看作一个xy坐标对线是一组有序的xy坐标序列面(多边形)则是由通过xy定义的起始点相同的一组线构成的。ArcView的shape的数据结构扩展了其原有保存图形xy坐标方式增加了存储值(m)和高程值(z)的信息。因此地理要素被保存成(xym)(xyz)(xymz)。高程值(z)的增加可以在二维空间中显示查询在3D Analyst扩展模块中生成的数据。度量值(m)的增加使得ArcView可以支持动态分段。

相关文档