剖析ARCGIS SHAPE文件及写入代码 作者简介:潘永地(1971 - ) ,男,高工,主要从事应用气象方面的研究工作。 文章编号: 1003 - 6598 (2006) 06 - 0036 - 04 剖析ARCGIS SHAPE文件及写入代码 潘永地 (浙江省温州市气象局,浙江温州 325027) 摘 要: 通过对ESR I公司公布的Shape文件格式资料解读,剖析了Shape 文件的结构,并给出写Shape文件的VB代 码,使得普通的数据文件可以直接写成Shape文件格式,为ArcGIS所调用,从而方便广大读者更加简单地使用ArcGIS来处理 气象业务中涉及地理空间的较为复杂的问题。 关键词: Shape文件;ArcGIS;应用 中图分类号: TP311. 11 文献标识码: C 1 引言 ArcGIS是ESR I公司开发的最早的地理信息系统,也是最为成熟的地理信息系统,在国内外有着广 泛的使用,在遥感、气候资源区划和开发、要素立体显示等气象业务中也常常被用来作为处理工具或工 作平台。但是ArcGIS的数据组织比较特殊,与一般的数据处理软件存在着较大的差异,格式转换不方 便,使得业务使用受到一定限制,并且给一些数据的自动化处理带来困难。Shape文件是ArcGIS的基础 文件类型,存储了非拓扑几何和属性信息。Shape文件支持点、线、区域的几何特征,由于不需要处理 拓扑数据结构文件头,在编辑等方面具有更快的处理速度。本文的目的就是通过对ESR I公司发布的 原版资料ESR I Shapefile Technical Descrip tion的翻译解读,剖析Shape文件的结构,利用VB写出直接 生成Shape文件的代码,为广大读者更加方便地使用ArcGIS处理气象数据提供参考。 2 Shape文件结构 2. 1 Shape文件的文件构成Shape文件由3 个文件构成: 主文件、索引文 件、数据文件。 其中主文件的后缀必须是. shp;索引文件的后缀必须是. shx;数据文件的后缀必须是. dbf,这3个 文件共同组成Shape文件。各文件中存储的数据相互联系又各有区别。主文件中是Shape的位置信 息;索引文件是对主文件的索引,指出主文件中记录在文件中的位置信息;数据文件中包括Shape的具 体位置和属性信息。 2. 2 . shp文件的结构 . shp文件由文件头和文件记录构成(图1) ,其中文件大部分结构见表1。 文件头 记录头记录内容 记录头记录内容 记录头记录内容 记录头记录内容 ··· ··· 记录头记录内容 图1 . shp文件的结构 其中Shape类型是ArcGIS定义的图形类型,具体可以参考Shapefile Technical Descrip tion。 每个记录由记录头、记录内容两部分组成。记录头部分由两部分组成: 0~3字节是长整型的记录 数, 4~7字节是记录内容的长度。文件头中的文件长度与记录头中的记录长度均以字( 2 字节)为单 位。记录内容对不同的Shape类型定义不一样,但原理是相同的。因篇幅所限,这里以记录点(point) 类型为例进行说明。点( point)类型的每个记录的记录内容为: 0~3字节长整型的Shape类型、4~11 字节双精度的X坐标、12~19字节双精度的Y坐标。所以记录头中的记录长度就是2 + 4 + 4 = 10个 字长,文件头中文件长度就是50 (文件头长) +总记录数3 14。
表1 . shp文件的文件头结构 位置字段名称数据数据类型字节顺序 0 文件代码9994 32位整型big - endian 4 保留0 32位整型big - endian 8 保留0 32位整型big - endian 12 保留0 32位整型big - endian 16 保留0 32位整型big - endian 20 保留0 32位整型big - endian 24 文件长度文件长度32位整型big - endian 28 版本1000 32位整型little - endian 32 Shape类型Shape类型32位整型little - endian 36 范围框最小X值双精度little - endian 44 范围框最小Y值双精度little - endian 52 范围框最大X值双精度little - endian 60 范围框最大Y值双精度little - endian 68 范围框最小Z值双精度little - endian 76 范围框最大Z值双精度little - endian 84 范围框最小M值双精度little - endian 92 范围框最大M值双精度little - endian 2. 3 . shx文件结构 . shx文件的结构与图1所示的. shp 文件在总体结构上相同,但内容有所区别。文件头的定义与 1shp一致,但文件长度指的是. shx的文件长度,所以这一项的数值是不同的。每1 个记录没有记录 头,内容有2部分组成: 0~3字节表示记录存储位置,以离文件开始处的字数来表示,即50 +记录数 3 14;记录长度,在点(point)类型中为10。2. 4 . dbf文件结构有关描述. dbf文件是Shape文件中的数据存储文件,其 格式是dbase iv的数据文件,具体的格式说明在许多网站都有说明,但在Shape文件中的. dbf有一些特殊的规定。 ①前缀必须与. shp和. shx文件一样。 ②每1个图形特征必须在1个记录内。 ③记录的顺序必须与. shp中的记录顺序一样。 ④在. dbf文件头中的年份值是以1900年为基 础的,即其数值表示年份与1900的差。 3 用VB编写直接写Shape文件的方法及代码 在编写程序时要特别注意的是在一般的机器中写文件的字节顺序是little - endian方式,即小的在 低地址,大的在高地址;而big - endian正好相反,所以对big - endian方式的要人为加以转换,本文编写 了little2big( )函来实现。下面是以点类型为例用VB写Shape文件的代 码: txt2 shape ( ) 。 Function little2big ( x1 As Long, myt1 As Byte, myt2 As Byte, myt3 As Byte, myt4 As Byte) myt1 = Int( x1 / (2 ^ 24) ) myt2 = Int ( ( x1 - ( Int ( x1 / (2 ^24) ) ) 3 2 ^ 24) / (2 ^ 16) ) myt3 = Int ( ( x1 - myt1 3 2 ^24 - myt2 3 2 ^ 16) / (2 ^ 8) ) myt4 = x1 - myt1 3 2 ^ 24 - myt2 3 2 ^ 16 - myt3 3 2 ^ 8 End Function Private Sub txt2 shape ( )
Dim jdattribute (0 To 100) AsDouble‘定义点位 置的x Dim wdattribute (0 To 100) As Double‘定义点 位置的y Dim zmattribute (0 To 100) As String‘定义点位 置名称,如站名 Dim ylattribute (0 To 100) AsDouble‘存点的属 性值,如站点雨量 Dim filelen As Long‘文件长度 Dim records As Long‘记录数 Dim xmin AsDouble‘最小x值 Dim xmax AsDouble‘最大x值 Dim ymin AsDouble‘最小y值 Dim ymax AsDouble‘最大y值 Dim zm AsVariant‘以下为临时变量 Dim temp As String Dim lin0 As Long Dim dblin0 AsDouble Dim myt1 AsByte‘用于传递转换到big形式的 字节临时变量 Dim myt2 As Byte Dim myt3 As Byte Dim myt4 As Byte 为了减小篇幅,本文省略信息的读入过程,即认 为这些信息已经读到zmattribute ( ) 、jdattribute ( ) 、 wdattribute ( ) 、ylattribute ( ) 、records等数组、变量,直 接从写文件开始。 Open (workfile + " shp " ) For Binary As #5打 开文件,workfile为文件名前缀,下同 ′开始写文件头 filelen = records 3 14 + 50‘算出文件长度 Call little2big ( 9994, myt1, myt2, myt3, myt4) ‘将9994转换成big形式。 Put #5, , myt1′写9994的4 个字节 Put #5, , myt2 Put #5, , myt3 Put #5, , myt4 lin0 = 0 For i = 1 To 5 Put #5, , lin0′写入保留项 Next Call little2big ( filelen, myt1, myt2, myt3, myt4) ′文件长转到big形式 Put #5, , myt1′写入文件长度转成big后 的4 个字节 Put #5, , myt2 Put #5, , myt3 Put #5, , myt4 lin0 = 1000 Put #5, , lin0′version = 1000 lin0 = 1 Put #5, , lin0′图形类型shape type 开’ 始求xmin, xmax, ymin, ymax。因比较大小比较容易实现,这里略去该部分代码,而认为xmin、 xmax、ymin、ymax已经得到,下面依次写入xmin、ym2in、xmax、ymax。 Put #5, , xmin : Put #5, , ymin : Put #5, ,xmax : Put #5, , ymax dblin0 = 0‘本例zmin、zmax、mmin、mmax为0,下面依次写入 Put #5, , dblin0 : Put #5, , dblin0: Put #5, , dblin0 : Put #5, , dblin0 ′Mmax = 0 For i = 0 To records $ 1‘记录数转换成big形式 lin0 = i + 1 Call little2big ( lin0, myt1, myt2, myt3, myt4 )‘记录数转换成big后的4个字节,下面写入 Put #5, , myt1: Put #5, , myt2 : Put #5, ,myt3 : Put #5, , myt4 lin0 = 10‘记录内容长度为10 Call little2big ( lin0, myt1, myt2, myt3, myt4) ’ 记录内容长度转换成big后的4个字节 Put #5, , myt1 : Put #5, , myt2: Put #5, ,myt3: Put #5, , myt4 lin0 = 1 ’shapetype = 1 : Put #5, , lin0‘写入图形类型shapetype Put #5, , jdattribute ( i) : Put #5, , wdat2tribute ( i) ‘写入位置信息经度和纬度 Next Close (5) 写’ . shx = = = = = =文件头 Open (workfile + " shx" ) ForB inaryAs #5 写’ 文件头,与. shp 一样,这里略去。要区别的是文件长头长+记录数3 4 For i = 0 To records - 1 lin0 = 50 + 14 3 i ′求记录位置offset Call little2big( lin0, myt1, myt2, myt3, myt4) Put #5, , myt1 : Put #5, , myt2: Put #5, ,myt3 : Put #5, , myt4 lin0 = 10 ′记录内容长度
Call little2big ( lin0, myt1, myt2, myt3,myt4) Put #5, , myt1 : Put #5, , myt2 : Put #5, ,myt3 : Put #5, , myt4 Next Close (5) 下面开始写. dbf文件. dbf文件的写入有许多的文章均有说明,也可以参考文献[ 2、3 ]等,但要注意 上面2. 4中的几点。另外,. dbf也可以由安装了VF等软件后在VB 中可调用的引用对象来实现,从而减少编程量。 4 应用简介 通过上述方法编写完成Shape文件的转换程序后,可以将其作为气象上利用ArcGIS平台开发的基础性工具来使用。例如: 将中尺度站的要素数据从数据库中读出,通过本程序转换成Shape文件,再由ArcGIS读入,可以显示到数字地图上,并通过ArcGIS的内置功能实现 数据由点到面的拓展或将数据进行三维显示等,从而为研究、实际业务提供方便。将气象预报结果通过本程序的转换可以实现预 报产品图像化,改善服务效果。将实况雨量转换成Shape文件后,可以由Arc2GIS的扩展模块实现不同的插值,得到适合本地的 面雨量估算结果。如果用各站点预报雨量代替实况雨量,则可以得到面雨量预报。总之,有了Shape文件转换工具后,在气象数据 与ArcGIS之间建立了1座桥梁,解决了ArcGIS在气象上开发的数据共享问题,从而促进ArcGIS在气象应用中的发展。
|