[摘要]地理信息系統(tǒng)的迅速發(fā)展和廣泛應(yīng)用導(dǎo)致了空間數(shù)據(jù)多源性的產(chǎn)生,為數(shù)據(jù)綜合利用和數(shù)據(jù)共享帶來(lái)不便。本文探討空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn),指出多數(shù)據(jù)格式是多源空間數(shù)據(jù)集成的瓶頸;分析和評(píng)價(jià)了多源空間數(shù)據(jù)集成的三種模式,并展望了多源數(shù)據(jù)集成的發(fā)展方向。
[關(guān)鍵詞]地理信息系統(tǒng)多格式數(shù)據(jù)源多源數(shù)據(jù)集成
一、多數(shù)據(jù)格式是多源空間數(shù)據(jù)集成的瓶頸
1、空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn)
空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn)主要可以概括為以下幾個(gè)層次:
。1)多語(yǔ)義性
地理信息指的是地理系統(tǒng)中各種信息,由于地理系統(tǒng)的研究對(duì)象的多種類(lèi)特點(diǎn)決定了地理信息的多語(yǔ)義性。對(duì)于同一個(gè)地理信息單元(feature),在現(xiàn)實(shí)世界中其幾何特征是一致的,但是卻對(duì)應(yīng)著多種語(yǔ)義,如地理位置、海拔高度、氣候、地貌、土壤等自然地理特征;同時(shí)也包括經(jīng)濟(jì)社會(huì)信息,如行政區(qū)界限、人口、產(chǎn)量等。一個(gè)gis研究的決不會(huì)是一個(gè)孤立的地理語(yǔ)義,但不同系統(tǒng)解決問(wèn)題的側(cè)重點(diǎn)也有所不同,因而會(huì)存在語(yǔ)義分異問(wèn)題。
(2)多時(shí)空性和多尺度
gis數(shù)據(jù)具有很強(qiáng)的時(shí)空特性。一個(gè)gis系統(tǒng)中的數(shù)據(jù)源既有同一時(shí)間不同空間的數(shù)據(jù)系列;也有同一空間不同時(shí)間序列的數(shù)據(jù)。不僅如此,gis會(huì)根據(jù)系統(tǒng)需要而采用不同尺度對(duì)地理空間進(jìn)行表達(dá),不同的觀察尺
……(新文秘網(wǎng)http://jey722.cn省略887字,正式會(huì)員可完整閱讀)……
了瓶頸;sql(標(biāo)準(zhǔn)結(jié)構(gòu)化查詢(xún)語(yǔ)言)以及odbc的出現(xiàn)為這一難題提供了比較滿(mǎn)意的解決方案。但是空間數(shù)據(jù)如何引進(jìn)這種思想,或者說(shuō)將空間數(shù)據(jù)也納進(jìn)標(biāo)準(zhǔn)組織和標(biāo)準(zhǔn)協(xié)議進(jìn)行規(guī)范和管理,從而使空間數(shù)據(jù)共享成為現(xiàn)實(shí)。
二、gis多源數(shù)據(jù)集成模式比較
由于地理信息系統(tǒng)的圖形數(shù)據(jù)格式各異,給信息共享帶來(lái)了極大的不便,解決多格式數(shù)據(jù)源集成一直是近年來(lái)gis應(yīng)用系統(tǒng)開(kāi)發(fā)中需要解決的重要問(wèn)題。目前,實(shí)現(xiàn)多源數(shù)據(jù)集成的方式大致有三種,即:數(shù)據(jù)格式轉(zhuǎn)換模式、數(shù)據(jù)互操作模式、直接數(shù)據(jù)訪問(wèn)模式。
1、數(shù)據(jù)格式轉(zhuǎn)換模式
格式轉(zhuǎn)換模式是傳統(tǒng)gis數(shù)據(jù)集成方法(圖1)。在這種模式下,其他數(shù)據(jù)格式經(jīng)專(zhuān)門(mén)的數(shù)據(jù)轉(zhuǎn)換程序進(jìn)行格式轉(zhuǎn)換后,復(fù)制到當(dāng)前系統(tǒng)中的數(shù)據(jù)庫(kù)或文件中。這是目前gis系統(tǒng)數(shù)據(jù)集成的主要辦法。目前得到公認(rèn)的幾種重要的空間數(shù)據(jù)格式有:esri公司的arc/infocoverage、arcshapefiles、e00格式;autodesk的d*f格式和dwg格式;mapinfo的mif格式;intergraph的dgn格式等等。數(shù)據(jù)轉(zhuǎn)換模式主要存在的問(wèn)題是:
。1)由于缺乏對(duì)空間對(duì)象統(tǒng)一的描述方法,從而使得不同數(shù)據(jù)格式描述空間對(duì)象時(shí)采用的數(shù)據(jù)模型不同,因而轉(zhuǎn)換后不能完全準(zhǔn)確表達(dá)源數(shù)據(jù)的信息。
。2)這種模式需要將數(shù)據(jù)統(tǒng)一起來(lái),違背了數(shù)據(jù)分布和獨(dú)立性的原則;如果數(shù)據(jù)來(lái)源是多個(gè)代理或企業(yè)單位,這種方法需要所有權(quán)的轉(zhuǎn)讓等問(wèn)題[1]。美國(guó)國(guó)家空間數(shù)據(jù)協(xié)會(huì)(nsdi)制定了統(tǒng)一的空間數(shù)據(jù)格式規(guī)范sdts(spatialdatatransformationstandard),包括幾何坐標(biāo)、投影、拓?fù)潢P(guān)系、屬性數(shù)據(jù)、數(shù)據(jù)字典,也包括柵格格式和矢量格式等不同的空間數(shù)據(jù)格式的轉(zhuǎn)換標(biāo)準(zhǔn)。許多軟件利用sdts提供了標(biāo)準(zhǔn)的空間數(shù)據(jù)交換格式。目前,esri在arc/info中提供了sdtsimport以及sdtse*port模塊,intergraph公司在mge產(chǎn)品系列中也支持sdts矢量格式。sdts在一定程度上解決了不同數(shù)據(jù)格式之間缺乏統(tǒng)一的空間對(duì)象描述基礎(chǔ)的問(wèn)題。但sdts目前還很不完善,還不能完全概括空間對(duì)象的不同描述方法,并且還不能統(tǒng)一為各個(gè)層次以及從不同應(yīng)用領(lǐng)域?yàn)榭臻g數(shù)據(jù)轉(zhuǎn)換提供統(tǒng)一的標(biāo)準(zhǔn);并且sdts沒(méi)有為數(shù)據(jù)的集中和分布式處理提供解決方案,所有的數(shù)據(jù)仍需要經(jīng)過(guò)格式轉(zhuǎn)換復(fù)制到系統(tǒng)中,不能自動(dòng)同步更新。
2、數(shù)據(jù)互操作模式
數(shù)據(jù)互操作模式是opengisconsortium(ogc)制定的規(guī)范。ogc是為了發(fā)展開(kāi)放式地理數(shù)據(jù)系統(tǒng)、研究地學(xué)空間信息標(biāo)準(zhǔn)化以及處理方法的一個(gè)非盈利組織。gis互操作是指在異構(gòu)數(shù)據(jù)庫(kù)和分布計(jì)算的情況下,gis用戶(hù)在相互理解的基礎(chǔ)上,能透明地獲取所需的信息。ogc為數(shù)據(jù)互操作制定了統(tǒng)一的規(guī)范,從而使得一個(gè)系統(tǒng)同時(shí)支持不同的空間數(shù)據(jù)格式成為可能。根據(jù)ogc頒布的規(guī)范,可以把提供數(shù)據(jù)源的軟件稱(chēng)為數(shù)據(jù)服務(wù)器(dataservers),把使用數(shù)據(jù)的軟件稱(chēng)為數(shù)據(jù)客戶(hù)(dataclients),數(shù)據(jù)客戶(hù)使用某種數(shù)據(jù)的過(guò)程就是發(fā)出數(shù)據(jù)請(qǐng)求,由數(shù)據(jù)服務(wù)器提供服務(wù)的過(guò)程,其最終目的是使數(shù)據(jù)客戶(hù)能讀取任意數(shù)據(jù)服務(wù)器提供的空間數(shù)據(jù)。ogc規(guī)范基于omg的corba、microsoft的ole/com以及sql等,為實(shí)現(xiàn)不同平臺(tái)間服務(wù)器和客戶(hù)端之間數(shù)據(jù)請(qǐng)求和服務(wù)提供了統(tǒng)一的協(xié)議。ogc規(guī)范正得到omg和iso的承認(rèn),從而逐漸成為一種國(guó)際標(biāo)準(zhǔn),將被越來(lái)越多的gis軟件以及研究者所接受和采納。目前,還沒(méi)有商業(yè)化gis軟件完全支持這一規(guī)范。
數(shù)據(jù)互操作為多源數(shù)據(jù)集成提供了嶄新的思路和規(guī)范。它將gis帶入了開(kāi)放式的時(shí)代,從而為空間數(shù)據(jù)集中式管理和分布存儲(chǔ)與共享提供了操作的依據(jù)。ogc標(biāo)準(zhǔn)將計(jì)算機(jī)軟件領(lǐng)域的非空間數(shù)據(jù)處理標(biāo)準(zhǔn)成功地應(yīng)用到空間數(shù)據(jù)上。但是ogc標(biāo)準(zhǔn)更多考慮到采用了opengis協(xié)議的空間數(shù)據(jù)服務(wù)軟件和空間數(shù)據(jù)客戶(hù)軟件,對(duì)于那些歷史存在的大量非opengis標(biāo)準(zhǔn)的空間數(shù)據(jù)格式的處理辦法還缺乏標(biāo)準(zhǔn)的規(guī)范。而從目前來(lái)看,非opengis標(biāo)準(zhǔn)的空間數(shù)據(jù)格式仍然占據(jù)已有數(shù)據(jù)的主體。
數(shù)據(jù)互操作規(guī)范為多源數(shù)據(jù)集成帶來(lái)了新的模式,但這一模式在應(yīng)用中存在一定局限性:首先,為真正實(shí)現(xiàn)各種格式數(shù)據(jù)之間的互操作,需要每個(gè)每種格式的宿主軟件都按照著統(tǒng)一的規(guī)范實(shí)現(xiàn)數(shù)據(jù)訪問(wèn)接口,在一定時(shí)期內(nèi)還不現(xiàn)實(shí);其次,一個(gè)軟件訪問(wèn)其他軟件的數(shù)據(jù)格式時(shí)是通過(guò)數(shù)據(jù)服務(wù)器實(shí)現(xiàn)的,這個(gè)數(shù)據(jù)服務(wù)器實(shí)際上就是被訪問(wèn)數(shù)據(jù)格式的宿主軟件,也就是說(shuō),用戶(hù)必須同時(shí)擁有這兩個(gè)gis軟件,并且同時(shí)運(yùn)行,才能完成數(shù)據(jù)互操作過(guò)程。
……(未完,全文共4931字,當(dāng)前僅顯示2490字,請(qǐng)閱讀下面提示信息。
收藏《gis多源數(shù)據(jù)集成評(píng)論》)