网格gis关键技术 arcgis格网化栅格数据
电子地图系统WEBGIS 关键技术
随着Internet技术的不断发展和人们对地理信息系统(GIS)需求的日益增长,利用Internet在Web上发布空间数据,为用户提供空间数据浏览、查询和分析的功能,已成为地理信息系统(GIS)发展的必然趋势。于是,基于Internet技术的地理信息系统———WEBGIS就应运而生。
专注于为中小企业提供成都网站建设、成都网站设计服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业高港免费做网站提供优质的服务。我们立足成都,凝聚了一批互联网行业人才,有力地推动了上千多家企业的稳健成长,帮助中小企业通过网站建设实现规模扩充和转变。
WEBGIS是一个将地理信息处理和地理信息分布于Web计算平台进行的网络化GIS系统,它是面向对象软件构件技术、信息互操作技术、网络技术发展的产物。系统采用ARCGISServer作为WEBGIS支撑平台实现基础地理空间数据和地质空间数据的网络发布。
1.栅格WEBGIS技术
“栅格WEBGIS”(Grid WEBGIS)这一概念和产品是对传统Web地图服务方式的一种革命。启用这个名称,可谓是一语双关:就是提供地理底图的方式来讲,再也不是传统的方式———服务器端将矢量地图临时生成栅格图发给客户端,而是事先生成好栅格图,用户请求时不必做任何处理就可以即时发给客户端;就客户端的显示方式来讲,摒弃了传统的一张地图的显示方式,客户端采用多幅小图拼接的方式显示,总体看起来像是小图片填充一个大的栅格的效果。
预先制作好所要发布的地理底图、遥感影像不同缩放比例下的静态图像存放于服务器端,待实际发布时根据缩放比例在不同级别图像之间进行切换。这种技术大大提高了地图的Web浏览速度。
2.Web服务器端技术
Web服务器端主要由两部分组成,即IIS(Internet Information Server)和WEBGIS服务器(包括ArcIMS组件、InternetGIS站点设计向导程序Wizard及面向城市地质Web应用的扩展组件)。
其中,IIS主要负责接收普通的用户请求,当其需要空间数据时则向WEBGIS服务器发出请求,WEBGIS服务器接收到浏览器端的请求后,利用ArcIMS组件和城市地质Web应用扩展组件的功能,进行处理、分析、计算等;如果需要数据服务器的数据,则由WEBGIS服务器向数据服务器发出请求。
3.Web客户端相关技术
包括IITML、客户端脚本语言、VML(矢量可标记语言)、XML、DOM(文档对象模型)、CSS(层叠样式表)及Ajax(Asynchronous JavaScript and XML的缩写),这些技术的综合运用大大扩展了系统功能,大幅提高了系统响应速度。
网络gis和网格gis的不同点
1,从概念产生背景及解决的问题来看,云GIS的产生背景是大约在09年末产生的,首先是Esri的ArcGIS 10支持直接安装到亚马逊平台上,通过亚马逊的云平台来实现GIS服务的弹性使用,这种方式的根本目的是GIS资源的集中存储来达到有效利用,必须要有IAAS平台和PAAS平台的支撑。而网格GIS大约提出在2001年左右,主要是GIS技术和网格技术的结合,它是无缝连接不同硬件,软件上应用资源的一种方式,把本来异构的环境搞成一个同构的环境,目的是通过访问网格上的任意的应用节点就能达到所有节点应用。资源是分布在各个节点上的。而非一定是集中式的。
2,从技术上说,云GIS一定会依赖于IAAS平台,是构建其上的服务平台,本质是虚拟化技术,GIS资源和服务集中式管理和发布,要使GIS服务具有按需使用或高弹性等特点。一般要有服务管理运营平台。而网格GIS是依赖于网格技术,技术难点在于异构数据的互操作问题。
3,本质上说二者都是为了解决数据,信息,服务的共享问题,很显然,云GIS不论在理念上还是在解决问题的技术本质上都强于网格GIS,慢慢的网格GIS这种形式的共享最终会推出,而云GIS会胜出。
GIS基本技术有哪些?
引言
地理信息系统(Geographic Information System,简称GIS)是计算机科学、地理学、测量学、地图学等多门学科综合的技术[1]。GIS的基本技术是空间数据库、地图可视化及空间分析,而空间数据库是GIS的关键。空间数据挖掘技术作为当前数据库技术最活跃的分支与知识获取手段,在GIS中的应用推动着GIS朝智能化和集成化的方向发展。
1 空间数据库与空间数据挖掘技术的特点
随着数据库技术的不断发展和数据库管理系统的广泛应用,数据库中存储的数据量也在急剧增大,在这些海量数据的背后隐藏了很多具有决策意义的信息。但是,现今数据库的大多数应用仍然停留在查询、检索阶段,数据库中隐藏的丰富的知识远远没有得到充分的发掘和利用,数据库中数据的急剧增长和人们对数据库处理和理解的困难形成了强烈的反差,导致“人们被数据淹没,但却饥饿于知识”的现象。
空间数据库(数据仓库)中的空间数据除了其显式信息外,还具有丰富的隐含信息,如数字高程模型〔DEM或TIN〕,除了载荷高程信息外,还隐含了地质岩性与构造方面的信息;植物的种类是显式信息,但其中还隐含了气候的水平地带性和垂直地带性的信息,等等。这些隐含的信息只有通过数据挖掘才能显示出来。空间数据挖掘(Spatial Data Mining,简称SDM),或者称为从空间数据库中发现知识,是为了解决空间数据海量特性而扩展的一个新的数据挖掘的研究分支,是指从空间数据库中提取隐含的、用户感兴趣的空间或非空间的模式和普遍特征的过程[2]。由于SDM的对象主要是空间数据库,而空间数据库中不仅存储了空间事物或对象的几何数据、属性数据,而且存储了空间事物或对象之间的图形空间关系,因此其处理方法有别于一般的数据挖掘方法。SDM与传统的地学数据分析方法的本质区别在于SDM是在没有明确假设的前提下去挖掘信息、发现知识,挖掘出的知识应具有事先未知、有效和可实用3个特征。
空间数据挖掘技术需要综合数据挖掘技术与空间数据库技术,它可用于对空间数据的理解,对空间关系和空间与非空间关系的发现、空间知识库的构造以及空间数据库的重组和查询的优化等。
2 空间数据挖掘技术的主要方法及特点
常用的空间数据挖掘技术包括:序列分析、分类分析、预测、聚类分析、关联规则分析、时间序列分析、粗集方法及云理论等。本文从挖掘任务和挖掘方法的角度,着重介绍了分类分析、聚类分析和关联规则分析三种常用的重要的方法。
2.1、分类分析
分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。分类和我们熟知的回归方法都可用于预测,两者的目的都是从历史数据纪录中自动推导出对给定数据的推广描述,从而能对未来数据进行预测。和回归方法不同的是,分类的输出是离散的类别值,而回归的输出则是连续的数值。二者常表现为一棵决策树,根据数据值从树根开始搜索,沿着数据满足的分支往上走,走到树叶就能确定类别。空间分类的规则实质是对给定数据对象集的抽象和概括,可用宏元组表示。
要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由特征(又称属性)值组成的特征向量,此外,训练样本还有一个类别标记。一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示字段值,c表示类别。
分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。统计方法包括贝叶斯法和非参数法(近邻学习或基于事例的学习),对应的知识表示是判别函数和原型事例。机器学习方法包括决策树法和规则归纳法,前者对应的表示为决策树或判别树,后者则一般为产生式规则。神经网络方法主要是反向传播(Back-Propagation,简称BP)算法,它的模型表示是前向反馈神经网络模型(由代表神经元的节点和代表联接权值的边组成的一种体系结构),BP算法本质上是一种非线性判别函数[3]。另外,最近又兴起了一种新的方法:粗糙集(rough set),其知识表示是产生式规则。
不同的分类器有不同的特点。有三种分类器评价或比较尺度:1) 预测准确度;2) 计算复杂度;3) 模型描述的简洁度。预测准确度是用得最多的一种比较尺度,特别是对于预测型分类任务,目前公认的方法是10番分层交叉验证法。计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是海量的数据库,因此空间和时间的复杂度问题将是非常重要的一个环节。对于描述型的分类任务,模型描述越简洁越受欢迎。例如,采用规则归纳法表示的分类器构造法就很有用,而神经网络方法产生的结果就难以理解。
另外要注意的是,分类的效果一般和数据的特点有关。有的数据噪声大,有的有缺值, 有的分布稀疏,有的字段或属性间相关性强,有的属性是离散的而有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数据。
分类技术在实际应用非常重要,比如:可以根据房屋的地理位置决定房屋的档次等。
2. 2 聚类分析
聚类是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,并且对每一个这样的组进行描述的过程。它的目的是使得属于同一个组的样本之间应该彼此相似,而不同组的样本应足够不相似。与分类分析不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪些空间区分规则来定义组。其目的旨在发现空间实体的属性间的函数关系,挖掘的知识用以属性名为变量的数学方程来表示。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。基于聚类分析方法的空间数据挖掘算法包括均值近似算法[4]、CLARANS、BIRCH、DBSCAN等算法。目前,对空间数据聚类分析方法的研究是一个热点。
对于空间数据,利用聚类分析方法,可以根据地理位置以及障碍物的存在情况自动地进行区域划分。例如,根据分布在不同地理位置的ATM机的情况将居民进行区域划分,根据这一信息,可以有效地进行ATM机的设置规划,避免浪费,同时也避免失掉每一个商机。
2.3 关联规则分析
关联规则分析主要用于发现不同事件之间的关联性,即一事物发生时,另一事物也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。其主要依据是:事件发生的概率和条件概率应该符合一定的统计意义。空间关联规则的形式是X->Y[S%,C%],其中X、Y是空间或非空间谓词的集合,S%表示规则的支持度,C%表示规则的置信度。空间谓词的形式有3种:表示拓扑结构的谓词、表示空间方向的谓词和表示距离的谓词[5]。各种各样的空间谓词可以构成空间关联规则。如,距离信息(如Close_to(临近)、Far_away(远离))、拓扑关系(Intersect(交)、Overlap(重叠)、Disjoin(分离))和空间方位(如Right_of(右边)、West_of(西边))。实际上大多数算法都是利用空间数据的关联特性改进其分类算法,使得它适合于挖掘空间数据中的相关性,从而可以根据一个空间实体而确定另一个空间实体的地理位置,有利于进行空间位置查询和重建空间实体等。大致算法可描述如下:(1)根据查询要求查找相关的空间数据;(2)利用临近等原则描述空间属性和特定属性;(3)根据最小支持度原则过滤不重要的数据;(4)运用其它手段对数据进一步提纯(如OVERLAY);(5)生成关联规则。
关联规则通常可分为两种:布尔型的关联规则和多值关联规则。多值关联规则比较复杂,一种自然的想法是将它转换为布尔型关联规则,由于空间关联规则的挖掘需要在大量的空间对象中计算多种空间关系,因此其代价是很高的。—种逐步求精的挖掘优化方法可用于空间关联的分析,该方法首先用一种快速的算法粗略地对一个较大的数据集进行一次挖掘,然后在裁减过的数据集上用代价较高的算法进一步改进挖掘的质量。因为其代价非常高,所以空间的关联方法需要进一步的优化。
对于空间数据,利用关联规则分析,可以发现地理位置的关联性。例如,85%的靠近高速公路的大城镇与水相邻,或者发现通常与高尔夫球场相邻的对象是停车场等。
3 空间数据挖掘技术的研究方向
3.1 处理不同类型的数据
绝大多数数据库是关系型的,因此在关系数据库上有效地执行数据挖掘是至关重要的。但是在不同应用领域中存在各种数据和数据库,而且经常包含复杂的数据类型,例如结构数据、复杂对象、事务数据、历史数据等。由于数据类型的多样性和不同的数据挖掘目标,一个数据挖掘系统不可能处理各种数据。因此针对特定的数据类型,需要建立特定的数据挖掘系统。
3.2 数据挖掘算法的有效性和可测性
海量数据库通常有上百个属性和表及数百万个元组。GB数量级数据库已不鲜见,TB数量级数据库已经出现,高维大型数据库不仅增大了搜索空间,也增加了发现错误模式的可能性。因此必须利用领域知识降低维数,除去无关数据,从而提高算法效率。从一个大型空间数据库中抽取知识的算法必须高效、可测量,即数据挖掘算法的运行时间必须可预测,且可接受,指数和多项式复杂性的算法不具有实用价值。但当算法用有限数据为特定模型寻找适当参数时,有时也会导致物超所值,降低效率。
3.3 交互性用户界面
数据挖掘的结果应准确地描述数据挖掘的要求,并易于表达。从不同的角度考察发现的知识,并以不同形式表示,用高层次语言和图形界面表示数据挖掘要求和结果。目前许多知识发现系统和工具缺乏与用户的交互,难以有效利用领域知识。对此可以利用贝叶斯方法和演译数据库本身的演译能力发现知识。
3.4 在多抽象层上交互式挖掘知识
很难预测从数据库中会挖掘出什么样的知识,因此一个高层次的数据挖掘查询应作为进一步探询的线索。交互式挖掘使用户能交互地定义一个数据挖掘要求,深化数据挖掘过程,从不同角度灵活看待多抽象层上的数据挖掘结果。
3.5 从不同数据源挖掘信息
局域网、广域网以及Internet网将多个数据源联成一个大型分布、异构的数据库,从包含不同语义的格式化和非格式化数据中挖掘知识是对数据挖掘的一个挑战。数据挖掘可揭示大型异构数据库中存在的普通查询不能发现的知识。数据库的巨大规模、广泛分布及数据挖掘方法的计算复杂性,要求建立并行分布的数据挖掘。
3.6 私有性和安全性
数据挖掘能从不同角度、不同抽象层上看待数据,这将影响到数据挖掘的私有性和安全性。通过研究数据挖掘导致的数据非法侵入,可改进数据库安全方法,以避免信息泄漏。
3.7 和其它系统的集成
方法、功能单一的发现系统的适用范围必然受到一定的限制。要想在更广泛的领域发现知识,空间数据挖掘系统就应该是数据库、知识库、专家系统、决策支持系统、可视化工具、网络等技术的集成。
4 有待研究的问题
我们虽然在空间数据挖掘技术的研究和应用中取得了很大的成绩,但在一些理论及应用方面仍存在急需解决的问题。
4.1 数据访问的效率和可伸缩性
空间数据的复杂性和数据的大量性,TB数量级的数据库的出现,必然增大发现算法的搜索空间,增加了搜索的盲目性。如何有效的去除与任务无关的数据,降低问题的维数,设计出更加高效的挖掘算法对空间数据挖掘提出了巨大的挑战。
4.2 对当前一些GIS软件缺乏时间属性和静态存储的改进
由于数据挖掘的应用在很大的程度上涉及到时序关系,因此静态的数据存储严重妨碍了数据挖掘的应用。基于图层的计算模式、不同尺度空间数据之间的完全割裂也对空间数据挖掘设置了重重障碍。空间实体与属性数据之间的联系仅仅依赖于标识码,这种一维的连接方式无疑将丢失大量的连接信息,不能有效的表示多维和隐含的内在连接关系,这些都增加了数据挖掘计算的复杂度,极大地增加了数据准备阶段的工作量和人工干预的程度。
4.3 发现模式的精炼
当发现空间很大时会获得大量的结果,尽管有些是无关或没有意义的模式,这时可利用领域的知识进一步精炼发现的模式,从而得到有意义的知识。
在空间数据挖掘技术方面,重要的研究和应用的方向还包括:网络环境上的数据挖掘、栅格矢量一体化的挖掘、不确定性情况下的数据挖掘、分布式环境下的数据挖掘、数据挖掘查询语言和新的高效的挖掘算法等。
5 小结
随着GIS与数据挖掘及相关领域科学研究的不断发展,空间数据挖掘技术在广度和深度上的不断深入,在不久的将来,一个集成了挖掘技术的GIS、GPS、RS集成系统必将朝着智能化、网络化、全球化与大众化的方向发展。
网格发展的基本背景
当今,信息领域正发生着广泛而深刻的技术变革,新概念和新技术不完善和发展,如地球信息科学的发展,数字地球概念的提出,GIS技术和数据库技术走向集成,信息高速公路和Internet网的发展。Internet网和信息高速公路的飞速发展与广泛应用,带来了分布式应用研究以及共享信息和知识需求的不断增长,必然带来网络GIS的发展。而现在第3代网络技术——网格技术的提出和发展对GIS的发展更带来了长远的影响。特别是1998年1月31日美国前副总统戈尔提出的“数字地球”战略,需要对大量的地理信息进行并行计算处理,此时WebGIS的不足显现出来了,因为它主要通过超链接形成超文本,包括实现并行计算功能,而这一点对数字地球、数字城市需要的快速计算、信息共享是致命的。网格计算的提出和发展使得GIS必将朝着网络化、标准化、大众化方向发展。GridGIS也必将成为“数字地球”的核心平台。
“数字地球”的概念,实际上是网格技术在地球信息科学领域的一种体现形式。一切与位置有关的信息在网络环境下,用数字形式进行描述并存储成为丰富的资源,通过信息共享技术,实现“按需索取”的服务,这种空间信息基础设施成为空间信息网格(SIG)。
空间信息网格是空间信息获取、互操作的基本发展框架。空间信息网格提供了一体化的空间信息获取、处理与应用的基本技术框架,以及智能化的空间信息处理平台和基本应用环境。建立分布式、智能化空间计算环境的基础是建立基于分布式数据库管理的空间网格计算环境,也就是实现支持局域、广域网络环境下空间信息处理和跨平台计算,实现支持多用户数据同步处理,实现支持空间数据的RPC,实现异构系统的互操作,实现支持网络环境下的多级分布式协同工作。
空间信息网格是要利用现有的网络基础设施、协议规范、Web和数据库技术,为用户提供一体化的智能空间信息平台,其目标是创建一种架构在OS和Web Service之上的基于Interent的新一代信息平台和软件基础设施。在这个平台上,信息的处理是分布式、协作和智能化的,用户可以通过单一入口访问所有信息。信息网格追求的最终目标是能够做到服务点播(Service On Demand)和一步到位的服务。
在GIS领域,基于网格计算理念,研究者提出基于服务网格的空间信息网格及Grid GIS;国际标准化组织积极推进Grid GIS相关标准的制订。一些协议及标准得到商业化GIS软件公司,如ESRI,M apInfo的支持并且取得成效。GIS领域采纳互联网标准和协议,如XML,可以将松散结合的GIS网络和地理信息处理服务结合在一起,形成空间信息服务。ESRI积极支持分布式GIS及GIS服务概念的发展,Gnet战略在很多层面都会涉及。在最大的层面是World Wide Web,在最小的层面,是企业化的World Wide Web。通过网格协议的支持,多个部门将可以提供多种的和综合性的服务,同时共享这些服务。可以支持企业化的开发,提供了不同分布式体系环境下构建GISWeb Services的开发组件,可以满足GridGIS的建立,但是不同商业化公司所倡导的开发技术并不相同,呈现出不断发展的态势。
GridGIS是空间信息计算环境和空间信息服务技术体系,其是实现空间信息网格的技术支撑系统,其通过空间信息的标准化,实现空间信息的共享;通过空间分析语义的标准化,实现GIS功能的互操作:通过网格技术体系的支持,实现异构环境下GIS功能的共享。
GridGIS要利用现有的OpenGIS的GML标准,Web地图服务标准以及网格相关技术标准,为用户提供开放的空间信息计算环境技术体系,实现用户分布式、跨平台的空间信息计算集成。空间信息计算环境的研究可以包括空间信息深度计算和空间信息主动计算两个层次。首先,通过时空属性融合下的空间作用规律,建立空间深度计算体系,以获得空间数据分布与模拟;其次,在此基础上提出以空间智能体为核心的空间智能计算策略,实现空间主动计算体系。
目前,我国已将网格GIS作为信息领域的重点方向进行了深入的研究及成果的推广及广泛的应用,形成了网格GIS体系结构、标准规范、关键技术、软件平台、应用示范等一系列成果,并在多个领域进行了应用。
2008年1月,结合国内外网格计算技术的前沿研究成果,科技部设立了“863”计划项目“网格地理信息系统软件及重大应用”,该项目制定了网格环境下异构GIS软件互操作技术,研究了空间信息网格计算技术,突破了网格GIS关键技术,开发出高性能、高可用性的网格GIS应用服务软件和集成应用系统,形成了具有自主知识产权的网格GIS软件平台,实现了网格环境下异构GIS互操作和在线共享服务。
网格GIS相关标准在“中国地质调查信息网格平台”和“天地图”等工程中得到较好的应用;网格GIS平台在地质调查信息网格、数字城市、地理信息公共服务平台、数字流域、数字油田等平台中进行了应用:网格GIS空间分析与处理技术已应用于林业信息化建设、煤矿安全系统、地震应急指挥系统建设中。
可以认为,网格GIS是GIS与网格技术的有机结合,是GIS在网格环境下的一种应用,网格GIS的网格环境必须能够在新近的硬件和软件技术平台上操作,最终实现GIS网格化。GIS通过网格技术使功能得到了延伸和拓展,真正成为大众使用的信息工具,从网格上的任意一个结点,可以访问网格上的各种分布式的、具有超媒体特性的地理空间数据及属性数据,进行地理空间分析、查询,并对复杂空间问题进行并行计算,以辅助和支持决策。
本文题目:网格gis关键技术 arcgis格网化栅格数据
URL标题:http://scyanting.com/article/dojgjjo.html