第一作者简介:张保钢(1965-),男,博士,教授级高工,研究方向为地理信息系统理论与开发。Bg_zhang65@163.com,18611897565
随着地理数据“原始积累”的逐步完成和共享应用,其现势性问题已成为广大用户关注的热点问题[1]。GIS的核心已从数据生产转为数据更新, 数据更新关系着GIS 的可持续发展[2 ]。地理信息的更新方式包括版本式更新和增量式更新。由于版本式更新简单易行,而且新版本数据一般具有较好的统一性和现势性,
因此在地理信息产业发展的初期阶段得到广泛应用,数量众多的地理信息生产供应商仍在使用这种方法。然而由于客户数据库在主数据库基础上新加了专题属性,主数据库的新版数据与用户数据库在数据规格上存在差异,采用版本式更新客户数据库将为用户后续的使用带来相当大的工作量及数据冗余。采用增量式更新可以避免这些不足,同时还可以对历史地理信息进行回溯。因此从国家到地方,开始探索采用矢量地理信息的增量更新方法[3-11],对基础或专业地理信息数据库进行更新。文献[12-14]对地理信息变化的描述、种类、建模进行了研究;文献[15]采用目标差、被差和交的三元组,对目标快照进行了分类,给出了正差、负差的计算及其在增量采集与变化信息发布中的应用方法;文献[16]提出了基于快照-增量的时空索引机制;文献[17]从拓扑更新的角度,提出了5种更新操作;文献[18-20]分析了空间数据库增量更新的实施方法、信息提取与集成及增量更新制图。 矢量地理信息更新增量的传播[21]在客户数据库更新中起着至关重要的作用。文献[21]分析了模式匹配、变化提取、实体识别、更新集成4种更新传播的主要操作,但未能从理论上解决矢量地理信息更新增量传播的必要条件、传播过程及其特殊性问题。本文从矢量地理信息更新增量传播的必要条件、传播过程及其特殊性、最终客户数据库的更新几个方面系统研究了矢量地理信息更新增量的传播,完善了地理信息更新增量传播理论。
1 矢量地理信息更新增量传播的必要条件
要实现传播,传播的三要素传者、受者、信息缺一不可[22]。传者是传播之源;受者是传播的目的地;信息是从传者当中挖掘出来,受者需要但没有的内容,是传播的对象。另外传播介质是信息从传者到受者间连接的通路或桥梁。矢量地理信息更新增量传播是从主数据库传播到客户数据库,传者是主数据库,受者是客户数据库,传播的内容--信息是矢量地理信息增量文件,传播的介质是各种网络或移动设备、光盘、磁盘等数据存储介质。传播的内容将在本文第3部分论述,传播的介质无甚特殊要求,主、客户数据库间的关系一般应满足下列条件:
<!--[if !supportLists]-->(1) <!--[endif]-->主数据库覆盖的空间范围{{x主1,y主1},{x主2,y主2},…,{x主i,y主i},…,{x主1,y主1}}(i)应包含客户数据库的空间范围{{x客1,y客1},{x客2,y客2},…,{x主j,y主j},…,{x客1,y客1}}(j)的全部或一部分,即:{{x主1,y主1},{x主2,y主2},…,{x主i,y主i},…,{x主1,y主1}}∩{{x客1,y客1},{x客2,y客2},…,{x主j,y主j},…,{x客1,y客1}} ≠ Φ。其中{x主1,y主1},{x主2,y主2},…,{x主i,y主i},…,{x主1,y主1}和{x客1,y客1},{x客2,y客2},…,{x主j,y主j},…,{x客1,y客1}分别是主、客户数据库空间覆盖范围边界坐标串,Φ表示空集。客户感兴趣的是其自身空间范围内地理信息的更新,如果主数据库的空间范围不包括客户数据库的空间范围,而且二者没有交叉,也就是说两者空间上不搭边,那么从空间范围的角度来说,主数据库就失去了客户应用的意义。
<!--[if !supportLists]-->(2) <!--[endif]-->主数据库的数据语义分类{Class主1,Class主2,…,Class主i,…,Class主n}(n≥i≥2)应包含客户数据库语义分类{Class客1,Class客2,…,Class客j,…,Class客m}(m≥j≥2)的全部或一部分,即{Class主1,Class主2,…,Class主i,…,Class主n} ∩ {Class客1,Class客2,…,Class客j,…,Class客m} ≠ Φ。其中Class主1,Class主2,…,Class主i,…,Class主n和Class客1,Class客2,…,Class客j,…,Class客m分别是主、客户数据库的语义分类,Φ表示空集。客户数据库的更新是其自身空间范围涉及其专业领域地理信息的更新,如果主数据库的数据语义分类不能包括客户数据库语义分类的全部或一部分也就是说主数据库的专业或专题信息与客户数据库无关,那么从数据组织或数据分类的角度上讲,主数据库对客户数据库来说就变得文不对题,毫无意义。
<!--[if !supportLists]-->(3) <!--[endif]-->主数据库的现势性(主数据库最终更新时间t主)应比客户数据库的现势性(客户数据库最终更新时间t客)强,即t主 > t客。客户获取地理信息更新增量的目的是进行客户数据库更新,如果主数据库与客户数据库相比没有更高的现势性,那么从时间或时态的角度来说,主数据库就失去了客户的应用价值。
2、矢量地理信息更新增量的传播过程
1948年,拉斯韦尔在其《传播在社会中的结构与功能》一文中指出,传播过程的一般特征是:谁—说了什么—通过什么渠道—对谁—取得了什么效果[16]。由此矢量地理信息更新增
量的传播过程可描述为:主数据库--矢量地理信息更新增量文件--各种网络或移动设备、光
盘、磁盘等数据存储介质--客户数据库--实现矢量地理信息的更新。传播过程的数据流程图见
图1,其中最终客户数据库的更新参见图2。
网络分发
客户端对地理信息增量进行数据变换
对增量信息进行增、删、改解译
并实施对客户数据库操作
图1 矢量地理信息更新增量的传播过程
与其他形式信息的传播相比,矢量地理信息更新增量传播的特殊性是:(1)信息构成复杂:除了传统意义的文字信息外,还包括空间、图形等信息,其中最显著的特征是空间信息可定位。 (2) 信息传播过程复杂:信息的解译需要专门的地理信息系统软件。(3) 传播介质特殊,必须是网络或其他存储数字信息的媒介。(3) 信息的表现形式直观活泼:表现为各种地物实体的空间图形信息。(4) 信息的使用需借助客户数据库:由于是更新增量,是一个差值,所以只有在用其更新客户数据库后才更有使用价值。表1描述了矢量地理信息更新增量与传统信息、软件更新增量传播的对比。另外与软件的更新相比,一般软件的更新增量是与客户原有软件同构的,而矢量地理信息更新增量与客户原有数据有可能是异构的。
表1:矢量地理信息更新增量与传统的信息、软件更新增量传播的对比
|
信息构成 |
信息表现形式 |
发射工具 |
传播介质 |
接收工具 |
解译工具 |
使用方式 |
传统信息 |
文字、语言、声音、图像、视频 |
文字,语言、声音、图形、图像、视频 |
发射站、邮局、物流 |
纸质、数字存储介质,电波,网络 |
电话、电报、收音机、电视机等 |
电话、电报、收音机、电视机等 |
直接使用 |
矢量地理信息更新增量 |
图形、属性 |
图形、文字 |
计算机服务器 |
数字存储介质、网络 |
计算机客户端 |
专用地理信息系统软件 |
对客户数据库更新后使用 |
软件更新增量 |
程序代码 |
程序代码、版本号 |
计算机服务器 |
数字存储介质、网络 |
计算机客户端 |
自解译 |
对原有软件更新后使用 |
传播的关键技术包括增量信息的提取和最终客户数据库的更新,后者在第4节专门讨论,本节讨论增量信息的提取。
根据文献[15],矢量地理信息更新增量包括线目标差、面目标差,另外还应包括点目标差。点目标差应包括目标正差和目标负差;线目标差[15]包括目标正差、目标负差、偏离正负差、延长正差、缩短负差、延长缩短差;面目标差[15]包括目标正差、目标负差、偏离正负差、扩张正差、收缩负差、扩张收缩差。矢量地理信息更新增量信息的提取,实质上就是给定时间区间,从主数据库中得到时间区间两个端点的时间快照,建立快照差分类描述的目标差、被差和交的三元组,从主数据库的各层空间数据层中提取时间快照的点目标差、线目标差和面目标差。这三类目标差集合即用户所需的增量信息。
3 传播内容
矢量地理信息更新增量传播的内容是其增量本身。地理信息增量又称地理信息变化量,描述在某个时间段内指定空间区域的地理信息的变化情况,也就是地理目标增、删、改的情况。如果把修改看成是对同一地理目标先删除后增加的话,那么地理信息的变化可只归类为地理目标的增加和删除。为便于增量信息与客户数据库数据的集成或融合,地理信息的增量文件还应包括地理信息增量的元数据信息。地理信息增量的内容可归纳如下:
(1) 地理信息元数据信息:如地理信息的坐标单位、坐标系、投影类型、比例尺、地理信息的空间覆盖范围、有效数据时间(增量时间区间)等参数。
(2) 删除的地理目标文件:与原数据库结构一致的,且在增量时间区间内被删除的地理目标。
(3) 增加的地理目标文件:与原数据库结构一致的,且在增量时间区间内增加的地理目标。
4 最终客户数据库的更新
最终客户数据库的更新首先对增量文件进行几何纠正,使增量数据的数学基础与客户数据库数学基础相一致,然后依据增量数据与客户数据库数据图层之间的对应关系在客户数据库中提取并删除增量文件中删除的地理目标,增加增量文件中新增的地理目标,并使其属性信息完善,实现客户数据库的更新。
4.1 增量文件几何纠正
(1)人工选取增量文件中删除目标的特征点以及客户数据库中对应目标特征点;
(2)依据精度需要,确定增量文件到客户数据库空间坐标变换多项式,用最小二乘法解算多项式系数;
(3)对原增量文件进行整体仿射变换,得到客户数据库数学基础下的增量文件。
4.2 增量文件的图层与结构重组
通过几何更新,增量文件与客户数据库的数学基础达到了一致。为保证主客户数据库的数据一致性,首先按客户数据库的数据分层方法,将增量文件的删除部分和增加部分重新进行数据分层组织,使增量文件的数据分层、数据结构与客户数据库的数据分层及数据结构相一致。
4.3 对客户数据库中应删除地理目标的提取与删除
逐层提取增量文件中需删除目标,以客户数据库的精度为缓冲区半径,建立这些需删除目标的缓冲区,客户数据库对应图层与上述缓冲区做叠加分析,完全落在缓冲区内的目标为客户数据库该层应删除目标,删除这些目标;与缓冲区有交叉的目标需通过人机交互和借助其他资料判断其是否需要删除,完成对增量文件中删除部分的操作。
4.4 对客户数据库中应增加地理目标的插入
逐层提取增量文件中待插入目标,在客户数据库相应图层中插入这些目标,根据相关补充资料,完善插入目标的属性。
4.5 对客户数据库中发生变化图层拓扑关系的维护
逐层处理客户数据库中有过增删操作的地理信息图层,重建拓扑关系如由于地理目标的增删而引起的合并、分割等。
5 试验与结论
基于上述思想开发了矢量地理信息更新增量传播程序,图2是以房屋图层为例的一个程序运行试验,主、客户数据库间具有相同的数学基础和语义分类,(a)为主数据库现状数据及“增量文件的提取与发布”界面, (b) 更新前客户数据库数据及“增量更新”界面,(c)是更新后的客户数据库数据及增量文件可视化。其中增量文件的提取算法见第2节最后一段,增量更新菜单中各菜单项的实现算法则在第4节做了详细论述。试验表明,程序可在一定程度上实现矢量地理信息更新增量传播和客户数据库更新。
(a) 主数据库现状数据及“增量文件的提取与发布”界面
(b) 更新前客户数据库数据及“增量更新”界面
(c) 更新后的客户数据库数据及增量文件可视化
图2 矢量地理信息更新增量传播
对矢量地理信息更新增量传播的研究,目的在于为使用主数据库发布的更新增量信息更新客户数据库扫清障碍。客户数据库的更新可分为下述四种情况:(1)当主、客户数据库的数学基础、语义分类、数据结构等完全一致时,直接使用更新增量对客户数据库进行相应的目标删除、增加和拓扑关系维护等操作;(2)当主、客户数据库之间除数据结构外,其他属性相同时,首先修改增量文件结构,使增量文件的数据结构与客户数据库完全一致,然后再执行(1)的操作;(3)当当主、客户数据库之间只有数学基础相同时,按客户数据库的数据分层方法,将增量文件的删除部分和增加部分重新进行数据分层组织,使增量文件与客户数据库的数据分层相一致后再执行(2)的操作;(4) 当主、客户数据库之间数学基础不同时,应对增量文件首先进行几何纠正,使增量文件与客户数据库的数学基础一致后再执行(3)的操作。实际工作中使用(1)~(3)进行客户数据库增量更新的情况较多,第(4)种情况操作复杂,不建议使用;但当更新资料匮乏时,(4)也可选择使用。
参考文献
[1] 蒋捷,陈军.基础地理信息数据库更新的若干思考[J].测绘通报,2000,(5):1-3.
[2] FR ITSCH D. GIS Data Revision2visions and Reality [R ].Keynote Speech in Joint ISPRS Commission Work shop on Dynamic and Multi2dimensional GIS. Beijing: NGCC, 1999.
[3] 张丰,刘南,刘仁义,等.面向对象的地籍时空过程表达与数据更新模型研究[J].测绘学报,2010,39(3):303-309.
[4] 陈军,王东华,商瑶玲,等. 国家1:50 000基础地理信息数据库更新工程及实施[J], 地理信息世界,2012,(1):8-12.)
[5] 张保钢,石强. 地形图数据库的增量更新[J],北京测绘,2007(1):1-4).
[6] 李冠成 , 刘志辉. 城市基础比例尺地形图更新与建库[J], 测绘信息与工程,2008,33(4):38-40
[7] 高光星,郑凤娇.城市基本比例尺地形图更新模式的探讨[J],中国测绘, 2006,(1):52-55.)
[8]胡钱钱,李莉.导航电子地图的更新机制与技术方法[J], 地理信息世界, 2008,6(1):77-82.
[9]刘勖,蔡先华. 数据增量探测技术在电子地图更新中的应用[J].测绘通报, 2007,(11):50-53.
[10]张斌,崔铁军.导航电子地图数据增量更新研究[J]. 地理信息世界,2011,(5):33-36.
[11]周晓光. 基于拓扑关系的地籍数据库增量更新方法研究[D]. 长沙:中南大学,2005.
[12] 林艳,刘万增,王育红. 一种基于更新过程的空间变化信息描述方法[J]. 地理与地理信息科学,2011,27(4):24-27.
[13] 朱华吉,吴华瑞.基于地理事件和更新操作的地理要素增量变化分类[J].辽宁工程技术大学学报(自然科学版),2010,29(3):444-458.
[14] 朱华吉.地形数据库增量信息数据建模及其RDF描述[J].吉林大学学报(地球科学版),2007,37(1):195-199,203.
[15] 陈军,林艳,刘万增,周晓光.面向更新的空间目标快照差分类与形式化描述[J],测绘学报,2012 (2):108-114.
[16] 尹章才,李霖. 基于快照-增量的时空索引机制研究[J].测绘学报. 2005 ,34 (3):257-261,282.
[17] 陈军,周晓光,2008.基于拓扑联动的增量更新方法研究——以地籍数据库为例[J], 测绘学报,37(3):322-329.
[18] 王育红, 牛亚辉,林艳.顾及语义差异的基础地理信息客户数据库更新实施模型[J].地理信息与科学,2011,27(1):1-6.
[19] 王育红.面向更新信息提取与集成的空间实体匹配方法 [J].测绘科学,2011,36(1):128-130.
[20] 胡振龙, 李霖,朱海红. 地理数据库驱动的增量更新制图研究[J]. 武汉大学学报(信息科学版),2010,35(12):1478-1481.
[21] 王育红,陈军. 基础地理数据库更新信息传播实施方法研究[J]. 武汉大学学报(信息科学版), 2010,35(9):1116-1120.
[22] 郭庆光.传播学教程[M]. 北京:中国人民大学出版社,1999.