【转】GIS:为什么我和别的软件不一样
轉(zhuǎn)注:本人號(hào)稱是學(xué)GIS的,但博客上寫來(lái)寫去都是軟件編程的文章,GIS方面則比較OUT了。但水平有限實(shí)在也不知寫什么,所以就決定,搞轉(zhuǎn)貼學(xué)習(xí)。
以下內(nèi)容轉(zhuǎn)自add:凡人做夢(mèng):http://blog.3snews.net/html/73/39273-28240.html
?
?
有兩三周沒(méi)來(lái)這里湊熱鬧了,今天上來(lái)看到果然大家在熱熱鬧鬧的討論天地圖和公共服務(wù)平臺(tái),甚至我在6月份的第一篇有關(guān)“天地圖”的博文都得到了熱情的惠顧。這說(shuō)明天地圖對(duì)很多人,特別是空間信息領(lǐng)域的從業(yè)者來(lái)說(shuō)的確是一件大事。大家關(guān)心天地圖,從不同角度來(lái)看有不同的觀點(diǎn),關(guān)心媒體和運(yùn)營(yíng)的人士想到的是如何推廣宣傳,所以更關(guān)心“天地圖公司”;地圖專家關(guān)心的制圖和投影,所以大家也看到了洪山波兄的有關(guān)投影的精彩博文;我等做GIS應(yīng)用的人更關(guān)心如何基于天地圖服務(wù)進(jìn)行應(yīng)用開(kāi)發(fā),所以可能會(huì)更關(guān)心瓦片地圖的訪問(wèn)接口。
但是非本領(lǐng)域的大眾對(duì)天地圖的關(guān)心都不在此列,你找一個(gè)鄰家女孩訪問(wèn)一下天地圖,讓她談?wù)劯惺?#xff0c;百分之九十的概率她會(huì)關(guān)心她所熟識(shí)的一個(gè)地物在天地圖上有還是沒(méi)有?!把?#xff0c;某某路審美美發(fā)都開(kāi)了一年了,地圖上都沒(méi)有?”,“嘿,不錯(cuò)不錯(cuò),我家小區(qū)里面的路都顯示出來(lái)了”,這是大眾常見(jiàn)的觀察視角。你跟她說(shuō)這個(gè)地圖是經(jīng)緯度坐標(biāo)系統(tǒng),沒(méi)有投影所以不能準(zhǔn)確在地圖上測(cè)量,你得到的反饋只能是一個(gè)清澈而空洞的眼神----牛的眼神。
地圖上的數(shù)據(jù)有還是沒(méi)有,自然和天地圖技術(shù)人員不相關(guān),那是四維的事情,人家有人家的地圖更新計(jì)劃。但大眾的視角代表了對(duì)空間信息服務(wù)的初始需求:基礎(chǔ)要素展現(xiàn)和定位。也別用“要素”這等“準(zhǔn)專業(yè)”詞匯了,就是地名、地址、地物、地形和地理的展現(xiàn)吧。所以,面向大眾的公眾版必然會(huì)應(yīng)對(duì)“新不新、有沒(méi)有”的問(wèn)題。數(shù)據(jù)的質(zhì)量是首要的,技術(shù)倒在其次。其實(shí),也別說(shuō)大眾,就是大部分的政府地圖應(yīng)用需求也是這樣的。目前幾乎公認(rèn)做的最成功的城市級(jí)空間信息服務(wù):北京市信息資源管理中心的共享服務(wù)平臺(tái),在其上跑的各個(gè)政府部門的地圖應(yīng)用絕大部分都是做業(yè)務(wù)數(shù)據(jù)上圖的,也就是業(yè)務(wù)信息尤其是點(diǎn)狀信息在共享服務(wù)上疊加定位。
我時(shí)常在想,可能在美國(guó)也是一樣,大家的需求也都是標(biāo)個(gè)點(diǎn)、定個(gè)位吧,那Esri那樣的產(chǎn)品都賣給了誰(shuí)呢?Esri的銷售肯定比小月月的作者還能忽悠,可看老Jack,也不像郭德綱、周立波啊。再細(xì)想,業(yè)務(wù)信息的上圖是第一步,上圖以后業(yè)務(wù)人員自然就會(huì)想再挖掘這些信息背后的秘密,比如什么時(shí)間什么案件在什么地點(diǎn)發(fā)生的數(shù)量大?哪類地區(qū)哪個(gè)加油站業(yè)績(jī)最好?還需要在哪兒建一個(gè)加油站?香港中路兩邊5米范圍內(nèi)有多少棵綠化樹(shù)木多少根路燈?這時(shí)候他需要的就不僅僅是基礎(chǔ)地圖了,他還需要一件武器:GIS。
若說(shuō)GIS區(qū)別于別的軟件的地方,可能每個(gè)學(xué)習(xí)GIS的人都有一個(gè)共同答案。我想,至少制圖和存儲(chǔ)空間數(shù)據(jù)結(jié)構(gòu)不應(yīng)該算是GIS的獨(dú)特之處吧。Adobe肯定不會(huì)說(shuō)Illustrator是GIS,Oracle也不認(rèn)為有了Spatial模塊它就是GIS軟件平臺(tái)中的一員了。那么GIS有特色的地方就是所謂的空間分析了。
說(shuō)到空間分析,我不想把上學(xué)時(shí)的課本找出來(lái)再溫習(xí)一次,我在空間分析的理論和算法上也沒(méi)有甚至是膚淺的認(rèn)識(shí),在我的眼中,空間分析就是用來(lái)回答類似我剛才的那幾個(gè)問(wèn)題的,去講述上了圖的數(shù)據(jù)背后的故事。最最基礎(chǔ)的空間分析也就是那么三類:
1.????????What’s on the top of what?就是誰(shuí)在誰(shuí)之上。我們俗稱疊加(overlay)分析的。
2.????????What’s close to what?就是誰(shuí)鄰近誰(shuí)。我們俗稱鄰近(proximity)分析的。
3.????????What’s connected to what?就是誰(shuí)連接誰(shuí)。我們俗稱連通或者網(wǎng)絡(luò)(network)分析的。
先說(shuō)說(shuō)第一類。疊加是非常有意思的一類分析,可以解決很多我們遇到的現(xiàn)實(shí)問(wèn)題,所以應(yīng)用場(chǎng)景非常之多。不同的場(chǎng)景也需要不同的疊加方法。ArcGIS最新的在線幫助在總體介紹疊加分析的頁(yè)面有個(gè)表格列出了常用的5種方法。
疊加分析示意圖
?
而除了標(biāo)識(shí)、相交、交集取反、聯(lián)合和更新這五種外,列在在ArcToolbox疊加分析工具箱中還有擦除和空間連接(基于空間關(guān)系傳遞屬性)兩個(gè)方法:
ArcGIS的疊加分析
疊加分析中的“擦除”示意
從這些小示意圖中我們可以初步理解這些疊加操作的概念,在實(shí)際操作中肯定還需要加入其它工具才能實(shí)現(xiàn)具體場(chǎng)景的需求,比如需要基于屬性的融合:
前面列出的矢量數(shù)據(jù)的疊加,對(duì)于柵格數(shù)據(jù)的疊加,最為基礎(chǔ)的就是柵格像元特征值的加減。
?
柵格疊加原理
基于這個(gè)原理,ArcGIS提供的分析工具包括:加權(quán)疊加、加權(quán)總和以及模糊疊加。
?
ArcGIS的柵格疊加分析(模糊是10版本的新功能,先做模糊分類,然后再疊加)
矢量數(shù)據(jù)的疊加分析,在超圖的軟件中也都有很好的體現(xiàn)。
?
超圖桌面幫助中的疊加分析模式
遺憾的是,這些功能目前還只能在Deskpro 6版本中即時(shí)使用,在最新beta的基于UGC底層的SuperMap Deskpro .NET 6R中還沒(méi)有任何分析功能。從這一點(diǎn)上也可以印證,UGC也好,OGC也罷,對(duì)于用戶來(lái)說(shuō),你不給提供我需要的功能,什么底層也白搭。不過(guò)疊加分析的功能在新版本中遲早是會(huì)有的,畢竟這是基礎(chǔ)中的基礎(chǔ)了,如果你還是一個(gè)GIS軟件的話。
雖然幫助上注明從“分析”菜單中調(diào)用疊加分析,但尚且沒(méi)有“分析”選項(xiàng)卡
超圖的柵格分析中沒(méi)有明確提出柵格疊加的概念,我前面也說(shuō)過(guò),柵格疊加的本質(zhì)是柵格運(yùn)算,所以只要有柵格運(yùn)算的功能即可實(shí)現(xiàn)疊加的效果。你可以自己制作疊加的處理方法,比如加權(quán)。
超圖Deskpro 6版本中的柵格分析
?
本想將三類分析一次闡述的,但一看篇幅過(guò)長(zhǎng),還是分成三個(gè)部分完成吧。下一篇說(shuō)說(shuō)鄰近分析。
?
說(shuō)完了GIS分析第一大特質(zhì):疊加分析,這篇小文再談?wù)劦诙惙治?#xff1a;鄰近分析,我上文所說(shuō)的what’s near what。說(shuō)起來(lái)鄰近分析,有一些我們?cè)诂F(xiàn)實(shí)中常常自動(dòng)下意識(shí)使用的場(chǎng)景,比如團(tuán)購(gòu)時(shí)要看看“團(tuán)”是不是在自己住所附近,購(gòu)房時(shí)要考慮周邊環(huán)境,小區(qū)中近鄰的品味和背景,你總是不希望樓下就是一個(gè)K歌房,小區(qū)中都是些三教九流的租客,而是期盼自己住在風(fēng)景優(yōu)美的湖畔,要是附近再有優(yōu)質(zhì)的學(xué)校和醫(yī)院那就更棒了,如果出門步行5分鐘就到工作單位做夢(mèng)也會(huì)笑起來(lái)——那是省委大院!
我們生活中自然而然的事情,先賢們?cè)缫芽偨Y(jié)出道理來(lái)讓我們學(xué)習(xí)。有個(gè)叫做Tobler的大牛提出了地理學(xué)第一定律:Everything is related to everything else, but near things are more related than distant things。翻譯一下就是:任何東西與別的東西之間都是相關(guān)的,但近處的東西比遠(yuǎn)處的東西相關(guān)性更強(qiáng)。所以你和你老婆的相關(guān)性要高過(guò)和老媽的相關(guān)性。這雖然不如我們初中就學(xué)過(guò)的熱力學(xué)第一定律(能量守恒:熱和功可以互相轉(zhuǎn)化)有名氣,但我們學(xué)地理的人Tobler的定律總還是要老老實(shí)實(shí)掌握的。這條定律使得很多后人在用GIS做研究的時(shí)候都會(huì)考慮的一種方法就是:空間自相關(guān)(spatial autocorrelation),是指一些變量在同一個(gè)分布區(qū)內(nèi)的觀測(cè)數(shù)據(jù)之間潛在的相互依賴性,而分析各種依賴關(guān)系誕生了一批又一批的論文。其實(shí)GIS本身的論文也沒(méi)有什么可做的。
緩沖區(qū)是我們最常見(jiàn)的鄰近分析,而鄰近分析的結(jié)果多是面狀的,Buffer的結(jié)果都是多邊形,此外還有泰森多邊形,交通網(wǎng)絡(luò)的服務(wù)區(qū)域也都屬于面狀分析結(jié)果。鄰近分析生成的多邊形也往往參與到疊加分析中,比如沃爾瑪周邊3公里的人口數(shù)量,小區(qū)名稱等;另外鄰近分析的結(jié)果不見(jiàn)得都是面狀的,也可以是線性度量,最短距離我們其實(shí)也是一種鄰近分析。對(duì)分析結(jié)果的表達(dá),用矢量圖形是一種,這最通用,用數(shù)值來(lái)表達(dá)是另一種形式,可以輸出為具體的值或者表。
因?yàn)榫彌_區(qū)分析最常用,所以對(duì)于Buffer,我們有必要多說(shuō)兩句,從高端到山寨,無(wú)論什么GIS軟件,這個(gè)貌似人人皆具有的功能倒有一個(gè)基礎(chǔ)值得一提,就是緩沖區(qū)的距離是基于什么空間度量的。因?yàn)槎S地圖是將地球投影而得,我們常??吹皆诙S地圖上做的buffer都是基于歐式距離(笛卡爾坐標(biāo)),投影有變形,因而這個(gè)buffer的結(jié)果和實(shí)際值都會(huì)有誤差。真正準(zhǔn)確的應(yīng)該是基于球面坐標(biāo),也就是Geodesic Distance(測(cè)地線距離)。這個(gè)數(shù)學(xué)基礎(chǔ)放到大比例尺的范圍內(nèi)顯得意義不大,如果放到全球尺度那就很要命了,特別是用到WGS-84地理坐標(biāo)系中,測(cè)地線緩沖就更加重要,這是因?yàn)?#xff0c;盡管在整個(gè)坐標(biāo)系中對(duì)緯度的轉(zhuǎn)換固定不變,但是由經(jīng)度到線性距離的轉(zhuǎn)換卻會(huì)隨著遠(yuǎn)離赤道而發(fā)生很大變化。用朝鮮半島局勢(shì)來(lái)舉例,韓國(guó)首爾因?yàn)殡x朝鮮太近,基本上在朝鮮大炮的覆蓋范圍,所以首爾永遠(yuǎn)都是韓美的痛,那么朝鮮大炮的緩沖分析有些誤差無(wú)所謂;但要是分析一下朝鮮的洲際導(dǎo)彈大浦洞2(三級(jí)液體燃料,有效射程12000公里),能打到美國(guó)哪兒,這就不能含糊了。我們可以用ArcGIS做一個(gè)例子看看。
?
用mercator投影,用平面測(cè)距從平壤到紐約將近18000公里
?
而用測(cè)地線測(cè)距,實(shí)際距離不過(guò)11900多公里,大浦洞2如果沒(méi)有愛(ài)國(guó)者的保護(hù)落在紐約不成問(wèn)題
另外一個(gè)需要考慮的因素是緩沖區(qū)結(jié)果的互相壓蓋,尤其是多點(diǎn)所作的緩沖區(qū),分析結(jié)果融合與否很重要。
但是這個(gè)融合(dissolve)卻是一個(gè)費(fèi)時(shí)的工作,看似簡(jiǎn)單,其實(shí)要做一個(gè)很復(fù)雜的空間運(yùn)算。
?
想到一個(gè)解決辦法,就是用ArcGIS的制圖綜合工具集中的聚合點(diǎn)工具(aggregate points)先在點(diǎn)周圍生成聚類多邊形而后在給這個(gè)多邊形做buffer即可。
?
?
此外,ArcGIS中生成緩沖區(qū)的設(shè)置比較豐富,比如可以選擇線要素緩沖區(qū)在哪一側(cè)生成,融合的方法,融合的字段等。還有其它工具值得去嘗試,比如近鄰分析和近鄰表,會(huì)實(shí)現(xiàn)一些意想不到的功能。
?
?
?
網(wǎng)絡(luò)分析其實(shí)也是一種典型的鄰近分析,這是大眾最常使用的GIS功能了,所以尋找路徑是在線地圖的必備功能,而行業(yè)GIS應(yīng)用中,反倒不如Buffer普遍,應(yīng)用的層次也比較淺,就是算算最短路徑或者最優(yōu)路徑。有些GIS軟件將交通網(wǎng)絡(luò)和管線網(wǎng)絡(luò)混作一團(tuán),而這兩種網(wǎng)絡(luò)都有各自獨(dú)特的地方,混在一起往往兩個(gè)方面考慮的都不周到。管線上(包括水文)的路徑更多考慮的是連通性和上下游關(guān)系,我要在下一篇中繼續(xù)羅嗦。
在ArcGIS中網(wǎng)絡(luò)分析模塊除了解決從A到B的基本問(wèn)題外,還有三四個(gè)比較有趣的分析方法,一個(gè)是服務(wù)區(qū)域,一個(gè)是最近設(shè)施點(diǎn),還有一個(gè)是在10中新增加的位置(資源)分配。
?
最優(yōu)路徑、服務(wù)區(qū)、最近設(shè)施點(diǎn)
???????在ArcGIS的這些分析設(shè)置中,參數(shù)相當(dāng)多,很多我也并不清楚,而在分析之前如何創(chuàng)建網(wǎng)絡(luò)數(shù)據(jù)集,設(shè)置好網(wǎng)絡(luò)的基本屬性就有不少的學(xué)問(wèn),看來(lái)要想專精,還真需要下一番功夫不可。上面我就是從在線幫助中截取幾張圖片而已,好在在線幫助也都是中文化的了,在一個(gè)爽心的下午,品著拿鐵,信手翻來(lái)也不失樂(lè)趣。
?
按照一開(kāi)始的規(guī)劃,第三篇要寫的是GIS的連通性分析,也就是回答What’s connected to what?的問(wèn)題,但是后來(lái)想了想,這似乎已經(jīng)成了GIS最為簡(jiǎn)單的功能,別說(shuō)所有的GIS軟件,即便是一些非GIS軟件,這個(gè)功能也可以實(shí)現(xiàn),所以我甚至感覺(jué)這項(xiàng)分析都不應(yīng)該算作GIS的特質(zhì)之一。但連通性分析怎么也算是傳統(tǒng)GIS的核心,無(wú)論如何也要簡(jiǎn)單總結(jié)一二。
說(shuō)連通性分析簡(jiǎn)單,主要在于實(shí)現(xiàn)這項(xiàng)功能不需要特別復(fù)雜的基礎(chǔ),無(wú)非是創(chuàng)建一個(gè)包含了三類數(shù)據(jù)庫(kù)表的網(wǎng)絡(luò)而已,這三個(gè)表是邊(edge)表,交匯點(diǎn)(junction)表和連通性規(guī)則(connectivity)表。
借用ArcGIS幫助中的示意圖,邏輯網(wǎng)絡(luò)中的主供水管、支管和交匯點(diǎn)及其連通關(guān)系用三張表可以描述了,至于其中的門道,大家仔細(xì)觀察一下即可明白,注意其中不同的顏色所代表的含義。
除了邊、交匯點(diǎn),還有一些常用的“網(wǎng)絡(luò)詞匯”,簡(jiǎn)單邊是資源只能在端點(diǎn)流出的管道,比如支管,復(fù)雜邊是允許在中間某處抽出資源而無(wú)需在實(shí)體上分隔的管道,比如主干管,源頭(source)是資源流出的點(diǎn),匯點(diǎn)(sink)是資源流入的點(diǎn),孤立交匯點(diǎn)(orphan junction)是系統(tǒng)為了維護(hù)網(wǎng)絡(luò)完整性而把沒(méi)有出現(xiàn)幾何重合的端點(diǎn)硬插入的交匯點(diǎn)等等。另外,在解決網(wǎng)絡(luò)的問(wèn)題中,復(fù)雜的情況也會(huì)很多,在這個(gè)時(shí)候就考驗(yàn)誰(shuí)的軟件想的細(xì)、做的細(xì)了,大家感興趣可以上網(wǎng)去看ArcGIS的在線文檔,里面說(shuō)的比我更細(xì)。
雖然這些都是ArcGIS中幾何網(wǎng)絡(luò)(geometry network)的概念,但其他GIS組織網(wǎng)絡(luò)數(shù)據(jù)的結(jié)構(gòu)及原理大同小異,包括Oracle Spatial中的幾何網(wǎng)絡(luò)(Oracle spatial中是node表、link表和path表)。ArcGIS是希望借助一個(gè)抽象的模型將現(xiàn)實(shí)世界的某種網(wǎng)絡(luò)(定向網(wǎng)絡(luò))表達(dá)出來(lái),而抽象的方式就是濃縮這類網(wǎng)絡(luò)的核心特征,無(wú)論是電力網(wǎng)絡(luò)、給排水網(wǎng)絡(luò)還是電信網(wǎng)絡(luò)。
使用這種解決網(wǎng)絡(luò)問(wèn)題的思考方法有好有壞,好的方面是一套模型、自在擴(kuò)展,所以在ArcGIS產(chǎn)品上誕生了一批行業(yè)上的解決方案,比如telvent的子公司miner&miner做了一套電力上的GIS產(chǎn)品,telcodia做了電信上的GIS產(chǎn)品,AMEC做了水資源的GIS產(chǎn)品,雖然完全是不同領(lǐng)域的解決方案,但它們的基礎(chǔ)卻是同一個(gè)模型;不好的方面是抽象的模型比較“地理化”,缺乏給予最終用戶的直接感受,所以從這個(gè)角度出發(fā),intergraph和smallworld不這樣解決問(wèn)題,它們給出來(lái)的都是面向具體行業(yè)的“工具性”產(chǎn)品,用戶不需要關(guān)心“邊”“交匯點(diǎn)”等抽象概念,他們要做的只是按照系統(tǒng)給出的步驟維護(hù)業(yè)務(wù)中的“人井”“閥門”“電表”“變電站”就好,用戶感受很親切,也容易學(xué)會(huì)軟件的方法。所以曾經(jīng)intergraph的G產(chǎn)品及smallworld的“小世界”顯得很專業(yè),但其實(shí)組織數(shù)據(jù)的方式和上面介紹的基本模型是別無(wú)二樣的,而且它們用的都是Oracle Spatial,只是用戶接口部分更好的考慮了業(yè)務(wù)對(duì)象和行業(yè)特征,這非常值得稱道。只是這兩家公司已經(jīng)在慢慢的淡出GIS領(lǐng)域的群眾視野,尤其在中國(guó),在國(guó)家電網(wǎng)的186項(xiàng)目中敗給ArcGIS,通通出局,也許賣了20億給hexagon的intergraph能再度爆發(fā)出活力。
有了這個(gè)模型,可以做一些分析了,常用的包括:最短路徑,查找連接或者斷開(kāi)的網(wǎng)絡(luò)要素,環(huán)路分析等。在實(shí)際業(yè)務(wù)中用的最廣的是爆管或者斷路分析,抽象一點(diǎn)的表達(dá)就是從某一個(gè)點(diǎn)向上游或者下游追蹤網(wǎng)絡(luò)元素。有一些有學(xué)問(wèn)的電力行業(yè)用戶持有一種觀點(diǎn)就是電氣的拓?fù)鋺?yīng)該單獨(dú)維護(hù),不要和地理網(wǎng)絡(luò)混在一起(電力行業(yè)的拓?fù)渚褪?span lang="EN-US">ArcGIS
的邏輯網(wǎng)絡(luò),和ArcGIS的拓?fù)湟?guī)則無(wú)關(guān))。我不大懂電力,不敢妄自評(píng)判,揣測(cè)其中的緣由:一是GIS的幾何網(wǎng)絡(luò)過(guò)于簡(jiǎn)單,實(shí)際操作中的一些問(wèn)題不容易解決,比如刀閘,相等;二是拋開(kāi)一個(gè)為地理設(shè)計(jì)的模型而使用自己隨意控制的一套表更容易擴(kuò)展;三是沒(méi)有地理空間的負(fù)擔(dān),性能也會(huì)好很多;四是大部分的電氣分析沒(méi)有必要在地理的層面做,只是結(jié)果要展現(xiàn)在地圖上即可,恐怕這是最主要的原因了。不知道我的猜測(cè)對(duì)否,請(qǐng)行業(yè)專家指點(diǎn)一二。但是單獨(dú)做電氣拓?fù)湟灿忻黠@的壞處,就是需要為物理上同一個(gè)要素維護(hù)兩套數(shù)據(jù),這增加了冗余,也增加了維護(hù)的成本,如果不嚴(yán)格把關(guān)的話就會(huì)看到將地圖放大到一定比例,線纜和變壓器根本沒(méi)有連接在一起的“囧圖”,因?yàn)殡姎馔負(fù)涫菦](méi)有問(wèn)題的,維護(hù)人員就不在乎地理拓?fù)淞恕?/p>超圖的網(wǎng)絡(luò)分析功能也很多,特別是在菜單上呈現(xiàn)出的數(shù)量好像是Supermap分析功能中做的最豐富的一類。但超圖的網(wǎng)絡(luò)是將定向網(wǎng)絡(luò)和非定向網(wǎng)絡(luò)混在一起的模型(定向網(wǎng)絡(luò)是有比較明顯的上下游關(guān)系,比如水電氣,而交通網(wǎng)絡(luò)是典型的非定向網(wǎng)絡(luò)),這樣造成的問(wèn)題是功能都有,但都做的不細(xì)。例如橋的限高和限重對(duì)于交通網(wǎng)絡(luò)來(lái)說(shuō)這是一定要表達(dá)的因素,對(duì)于幾何網(wǎng)絡(luò)來(lái)說(shuō)設(shè)置這個(gè)屬性毫無(wú)必要,那在超圖的網(wǎng)絡(luò)模型中是支持還是不支持都顯得比較尷尬了。Supermap的網(wǎng)路分析絕大部分功能針對(duì)的是交通網(wǎng)絡(luò),在ArcGIS中,這不是geometry network做的事,是上一篇提到的network analyst模塊的任務(wù)。不想細(xì)說(shuō)了,基本概念大家都差不多。
從1點(diǎn)到2點(diǎn),有單行、限行、天橋、隧道
?
另外一個(gè)和連通性有關(guān)的話題是連通性的表達(dá)。地圖直觀的顯示路徑這是最常見(jiàn)的,還可以將連通性的結(jié)果存儲(chǔ)在一個(gè)表中,用于后續(xù)的分析,還有一種是用邏輯示意圖(schematics)來(lái)闡述。在美劇24小時(shí)中,主角Jack小強(qiáng)幾乎在每一季中都會(huì)用手中的PDA查看他的堅(jiān)實(shí)搭檔兼粉絲Chole O'brian傳過(guò)來(lái)敵人據(jù)點(diǎn)建筑物的schematics,看得出邏輯示意圖在關(guān)鍵時(shí)刻異常管用。ArcGIS也有Jack,所以必定也有schematics模塊。該模塊可以自動(dòng)根據(jù)幾何網(wǎng)絡(luò)生成邏輯圖,在邏輯圖上進(jìn)行連通性和追蹤分析,能夠控制邏輯圖的樣式還可以通過(guò)ArcGIS Server對(duì)外發(fā)布……我對(duì)這部分不熟悉,還是藏拙吧。
還計(jì)劃再寫兩篇,一篇是說(shuō)說(shuō)高級(jí)模型,最后做個(gè)總結(jié)。
?
?
前面三篇談了談GIS的基礎(chǔ)分析方法,我看了一下大家的反饋。有人覺(jué)得太簡(jiǎn)單,有人覺(jué)得有啟發(fā),但卻有人覺(jué)得太新鮮甚至不明白,所以這也印證了一個(gè)道理:每個(gè)人的需求總是不一樣。眾口雖然難調(diào),我的本意也只是想寫點(diǎn)自己感興趣的東西,但既然花費(fèi)了心血,還是希望對(duì)有心人多點(diǎn)幫助。
第四篇想說(shuō)說(shuō)空間分析中的一些復(fù)雜話題。
現(xiàn)代科學(xué)技術(shù)眾星璀璨,借助互聯(lián)網(wǎng)則可以自由的抓取你感興趣的那一顆。在互聯(lián)網(wǎng)上熱熱鬧鬧被關(guān)注的技術(shù)中,有一個(gè)叫做數(shù)據(jù)挖掘。而數(shù)據(jù)挖掘技術(shù)中,有一類和數(shù)據(jù)展現(xiàn)有關(guān)系。老美命名了兩個(gè)詞:data visualization和infographic,直譯過(guò)來(lái)就是數(shù)據(jù)可視化和信息圖形,基本的意思都是指將數(shù)據(jù)、信息或知識(shí)的用可視化的形式表現(xiàn),但data visualization更強(qiáng)調(diào)數(shù)據(jù)表現(xiàn)后面的故事,也就是能通過(guò)視覺(jué)效果將事物的規(guī)律、趨勢(shì)、發(fā)展讓人的大腦判讀和理解。而地圖是這類技術(shù)中最重要形式的之一。
地圖可以表達(dá)空間模式,并通過(guò)空間模式回答一些問(wèn)題。比如,山西省的肺癌患者是怎樣分布的?如果他們是聚類分布,那這個(gè)聚類的中心在哪兒?是臨汾還是太原?再比如,中國(guó)西部的地震中心最近50年朝什么方向移動(dòng)?再比如氣候變化對(duì)川北和隴南的大熊貓的棲息范圍造成什么樣的影響?再比如,索馬里海盜在哪個(gè)橢圓范圍活動(dòng)的概率最大?原因何在?這些問(wèn)題都和地理因素有關(guān),而且都需要用地圖說(shuō)明答案和結(jié)果,GIS就能解決這類問(wèn)題,這也是GIS與眾不同的特征之一。
在ArcGIS中,這類分析叫做空間統(tǒng)計(jì)分析,從字面上也不難理解,是通過(guò)統(tǒng)計(jì)方法實(shí)現(xiàn)的,將采集到的樣本數(shù)據(jù)按照某種統(tǒng)計(jì)模型進(jìn)行計(jì)算,而發(fā)掘數(shù)據(jù)背后的規(guī)律。地統(tǒng)計(jì)和其他統(tǒng)計(jì)的基礎(chǔ)都一樣,通過(guò)分析事情發(fā)生的可能性研究事情結(jié)果的真實(shí)狀況。如下圖中的假設(shè),如果臨界值Z為5.73,說(shuō)明該聚類分布為偶然現(xiàn)象的可能性小于1%。統(tǒng)計(jì)學(xué)就是這么繞嘴,說(shuō)白一點(diǎn),就是該空間現(xiàn)象是聚類分布的可能性超過(guò)99%。
?
?
在這里不多說(shuō)地統(tǒng)計(jì)的知識(shí)了,像我這半吊子功夫的人往深里寫,讓科學(xué)家們嘲笑的連鮑魚(yú)都噴出來(lái)了,豈不是可惜?將上圖中的幾個(gè)詞匯翻譯一下,也可以讓你回憶起點(diǎn)點(diǎn)高等數(shù)據(jù)的基礎(chǔ)知識(shí)。Critical value是“臨界值”,用Z表示,significant不是“重要的”是“顯著的”,significance是“顯著性”,用P表示,Moran’S是空間自相關(guān)分析的基本測(cè)度,用I表示,Dispersed是離散分布,Random是隨機(jī)分布(偶然的),Clustered是聚類分布(非偶然的)。其中significance可能是統(tǒng)計(jì)學(xué)中是最為重要的一個(gè)概念,因?yàn)榻y(tǒng)計(jì)分析能告訴你的,只是這個(gè)觀察/測(cè)量結(jié)果有多可能是偶然的。如果一個(gè)結(jié)果只有0.1%的可能性是偶然的,那么我們比較有把握相信這個(gè)結(jié)果反映了真實(shí)。一般統(tǒng)計(jì)分析的結(jié)果是觀察到的現(xiàn)象只有小于5%的可能是偶然的,我們就把這個(gè)結(jié)論叫做“significant”。
ArcGIS的空間統(tǒng)計(jì)分析是很有意思的一個(gè)工具集,其中很大部分是用python腳本寫成,你都可以打開(kāi)看到分析的源代碼并根據(jù)自己的分析公式進(jìn)行修改。雖然這個(gè)工具集從ArcView到ArcInfo都有,但很少有人用到,畢竟使用這類工具需要有一定的背景知識(shí)、科學(xué)的態(tài)度和相對(duì)詳實(shí)的觀察數(shù)據(jù),而做這種工作的人往往是科學(xué)家。我們整天討論的都是做項(xiàng)目,掙政府的錢,完全不需要花時(shí)間做這么費(fèi)功夫的事情。實(shí)際上是如果你花時(shí)間做了,可能更容易掙到政府的錢吧,難道你沒(méi)有注意到有些科學(xué)家拿到了大把的經(jīng)費(fèi),花都花不完,而成果其實(shí)只是用GIS基本工具實(shí)現(xiàn)的而已。
?
ArcGIS空間統(tǒng)計(jì)工具集
?
簡(jiǎn)單歸納一下,ArcGIS的空間統(tǒng)計(jì)分析可以做四種工作:
l??度量地理現(xiàn)象的分布,就是研究事件(尤其是點(diǎn)事件)的分布規(guī)律,比如沿著某個(gè)方向分布,這些現(xiàn)象的中心點(diǎn)等。
?
?
l??分析空間分布的模式。主要研究空間自相關(guān)程度,聚類的程度。
l??聚類分布制圖??梢詫⒕垲惖慕Y(jié)果用各種好看的地圖表現(xiàn)出來(lái),這就是用地圖進(jìn)行數(shù)據(jù)挖掘的方式之一,通過(guò)地圖展示空間分析的結(jié)論。如下圖,可以用聚類的程度用不同的顏色表達(dá),犯罪報(bào)警(實(shí)際上下圖顯示的點(diǎn)是赤貧尋求救助電話,綠色的十字是救助站的位置,這都是共產(chǎn)主義國(guó)家干的事,在我們天朝沒(méi)有這項(xiàng)服務(wù),所以不做類比)電話多的地方用紅色表示,藍(lán)色表示電話少,可以給我們一個(gè)科學(xué)的決策依據(jù)(這個(gè)分析結(jié)果還可以用密度圖來(lái)做,但密度不能反映聚類的情況)。
?
l??為空間要素的關(guān)系建模,這個(gè)工具可構(gòu)建空間權(quán)重矩陣或利用回歸分析建立空間關(guān)系模型,從而考察或量化要素間關(guān)系。這類工具實(shí)在數(shù)學(xué)化,搞懂太費(fèi)勁,核心意思就是構(gòu)建一個(gè)統(tǒng)計(jì)數(shù)據(jù)空間結(jié)構(gòu)。因?yàn)榭臻g統(tǒng)計(jì)并不意味著將傳統(tǒng)(非空間)統(tǒng)計(jì)方法應(yīng)用于恰巧是空間數(shù)據(jù)(有?x?和?y?坐標(biāo))的數(shù)據(jù),而是將空間和非空間關(guān)系直接整合到數(shù)學(xué)計(jì)算中。
?
ArcGIS的空間統(tǒng)計(jì)工具依據(jù)的都是地統(tǒng)計(jì)的標(biāo)準(zhǔn)方法,這些方法在一本書(shū)中被通俗易懂、特別清晰的介紹,推薦給想做地統(tǒng)計(jì)和回歸分析的朋友們。這本書(shū)是由Andy Mitchell所著的《GIS分析》第二冊(cè):空間度量和統(tǒng)計(jì)(第一冊(cè)寫的柵格分析:空間模式和關(guān)系)。
?
剛才提到ArcGIS的空間統(tǒng)計(jì)分析工具大部分用python寫成,打開(kāi)它們,你可以學(xué)會(huì)ArcGIS的工程師們是怎么實(shí)現(xiàn)這些聽(tīng)起來(lái)都頭疼的方法的。修改它,然后去發(fā)論文。
?
ArcGIS的modelbuilder早就隨著ArcGIS 9的發(fā)布而得到使用,現(xiàn)在都到ArcGIS 10了,大家自然更能體會(huì)出可視化建模工具對(duì)于復(fù)雜模型和地理分析的意義。但說(shuō)到python,可能沒(méi)有體會(huì)那么深,只是覺(jué)得多了一個(gè)定制ArcGIS的接口而已,其實(shí)python的作用不止這么簡(jiǎn)單,還可以用于將ArcGIS與其他軟件系統(tǒng)結(jié)合起來(lái)。上面除了簡(jiǎn)述地理統(tǒng)計(jì)分析還提到過(guò)回歸分析,如果細(xì)說(shuō)回歸分析那還可以再長(zhǎng)篇累牘的論道,但我們也知道ArcGIS做回歸分析顯然不夠擅長(zhǎng),有的是專業(yè)回歸分析軟件,比如R。R也提供了空間回歸分析方法和工具,更為重要的是R也具有python的module,將R和ArcGIS通過(guò)python“粘合”在一起,將會(huì)為空間回歸及結(jié)果的展現(xiàn)帶來(lái)更強(qiáng)勁的動(dòng)力。兩者的結(jié)合可以有兩種方式,貼圖如下,不贅述,大家實(shí)踐中感受其中的不同。
?
ArcGIS和R通過(guò)python交互(連續(xù)多次)
?
?
R先處理(在R中debug)結(jié)果轉(zhuǎn)換為python,再將其導(dǎo)入ArcGIS,一次交互
?
上文中提到的分析功能沒(méi)有在Supermap中直接找到,所以不知從何入手研究超圖軟件這項(xiàng)能力,不做比較。
?
前面四篇將常見(jiàn)到的GIS分析功能簡(jiǎn)述了一下,但不是說(shuō)GIS就這點(diǎn)玩意兒,還有一些傳統(tǒng)上區(qū)別于其他軟件的地方?jīng)]有提及,比如制圖,比如空間數(shù)據(jù)存儲(chǔ)和管理,這些是GIS軟件的基礎(chǔ),而且地學(xué)專業(yè)畢業(yè)的學(xué)生可能都是從這開(kāi)始學(xué)習(xí)GIS的。另外,GIS軟件本身也林林總總,一些小規(guī)模的產(chǎn)品往往在某一個(gè)技術(shù)點(diǎn)上很有特色,這就要有針對(duì)性的研究了;我們國(guó)產(chǎn)GIS往往也有自己的特色,比如MapGIS和Easymap在制圖上的特色,Supermap在國(guó)產(chǎn)數(shù)據(jù)庫(kù)支持上的特色等,但如果從全面性上來(lái)看,無(wú)出ArcGIS右者。
全面并不意味著樣樣做得都好,也有一些人抱怨ArcGIS的過(guò)度設(shè)計(jì),尤其是在空間分析上,提供的功能頗有一些鮮有人用到。但是我猜測(cè)這是一個(gè)軟件長(zhǎng)期積累的結(jié)果。在一個(gè)軟件長(zhǎng)期、甚至超長(zhǎng)期發(fā)展的過(guò)程中,總會(huì)不斷的遇到更多、更細(xì)的需求,從軟件設(shè)計(jì)者的角度上看,如果認(rèn)為這些需求應(yīng)該滿足、這些功能值得一做,那就會(huì)不斷的增加軟件的內(nèi)容。Esri去年開(kāi)始增加的一個(gè)網(wǎng)站:idea.arcgis.com,用于搜集用戶的需求并組織投票,選擇軟件功能的開(kāi)發(fā)方向。截圖顯示的是已經(jīng)被采納并在開(kāi)發(fā)中的功能需求。
我相信這些從我們眼中“被過(guò)度設(shè)計(jì)”了的功能在美國(guó)用戶群體中,一定有需求。在全面性上下苦工,其實(shí)是一個(gè)很有風(fēng)險(xiǎn)的選項(xiàng),因?yàn)槿绻霾缓镁蜁?huì)被更多的人詬病。本來(lái)只是一個(gè)小眾軟件,因?yàn)槟阕龅暮苋?#xff0c;就會(huì)吸引大眾使用,滿意率十分容易下降。Google現(xiàn)在做的東西越來(lái)越全面,甚至多到讓人瞠目結(jié)舌的程度。有一些做失敗了,比如社交網(wǎng)絡(luò),這個(gè)讓外人看來(lái)Google最容易做成功的一個(gè)方向,畢竟Google有這么多的粉絲和用戶群體,但卻沒(méi)有成功。雖然Google仍在努力翻身,但已經(jīng)不被看好了。所幸的是,Google在LBS、地圖這方面做的很成功,這是我們搞GIS的一大幸事,我們既能有可利用的資源,也開(kāi)了眼界,學(xué)到東西。
GIS有自己的功能,別的軟件也各自有特色,我們做GIS的人既不能妄自菲薄,更不應(yīng)該盲目尊大。我碰到過(guò)兩種不當(dāng)?shù)膽B(tài)度,一種是認(rèn)為GIS一無(wú)是處,所有的傳統(tǒng)GIS軟件都是狗屎、垃圾,不配在互聯(lián)網(wǎng)的時(shí)代存活。持這種態(tài)度的人,言必出LBS、Google,認(rèn)為這些輕功能、重性能的網(wǎng)絡(luò)地圖服務(wù)足夠用了。究其原因,大眾的地圖需求功能不復(fù)雜,但大眾的數(shù)量卻是專業(yè)人士的成千上萬(wàn)倍。從面上講,能滿足大眾的需求,就占據(jù)了主流,并創(chuàng)建了有效的商業(yè)模式。特別是近年來(lái)大眾需求對(duì)地圖、地理、導(dǎo)航有了井噴式的增長(zhǎng),自然會(huì)吸引投資,在技術(shù)上也有了突飛猛進(jìn)的發(fā)展,但專業(yè)用戶、專業(yè)研究的需求并不會(huì)因此而降低。你想,或者不想我,專業(yè)用戶就在那兒,不贊不罵;你管,或者不管我,專業(yè)需求就在那兒,不多不少。而專業(yè)GIS軟件仍然是專業(yè)用戶居家旅行的必備。另外一種態(tài)度是GIS是神圣的,是高尚的,是別的軟件所不能比擬的。持這種態(tài)度的人言必出spatial analysis、高斯克呂格、平差,恨不得把你唬死你,給自己固封在一個(gè)圈子里面,美其名曰GIS圈,外人稍有膽怯,即趾高氣揚(yáng)的貶低別人為:不懂GIS。究其原因,IT的發(fā)展太快,各種新技術(shù)層出不窮,而這種人跟不上發(fā)展,實(shí)際上很自卑,但卻厚顏無(wú)恥。你看,或者不看我,技能就在那兒,不增不減;你罵,或者不罵我,臉皮就在那兒,不厚不薄。但這種人,必定會(huì)被時(shí)代淘汰。
互聯(lián)網(wǎng)促使的是技術(shù)的融合,人的融合,mashup是互聯(lián)網(wǎng)的主題。比如數(shù)據(jù)庫(kù),這么多年都是RDBMS的天下,Oracle、Sql Server、DB2這些大佬們做的是無(wú)所不能的事情,無(wú)論結(jié)構(gòu)的、非結(jié)構(gòu)的,空間的、非空間的皆通吃。但從去年開(kāi)始NoSQL卻無(wú)比的火熱,為什么?因?yàn)樾枨蟮膫€(gè)性化。比如twitter、新浪微博,管理的主要是message,但對(duì)性能要求極高,一個(gè)身形如此龐大的Oracle提供的功能絕大部分人家都用不上,人家真正需要的卻滿足不了,這就是問(wèn)題所在。所以NoSQL產(chǎn)品眾多,基本上都是解決性能伸縮、schema擴(kuò)展等傳統(tǒng)RDBMS弊病的。在文檔管理的NoSQL陣營(yíng)中,有CouchDB、MongoDB、Amazon SimpleDB等悍將,都能支持python、ruby、php等腳本接口,其中MongoDB還支持空間數(shù)據(jù)存儲(chǔ),一個(gè)shape2mongodb的python方法即可將shapefile導(dǎo)入到數(shù)據(jù)庫(kù)中,何樂(lè)而不為?關(guān)鍵這些NoSQL的性能都極高,這在互聯(lián)網(wǎng)的應(yīng)用中都是極受看重的。
毫無(wú)疑問(wèn),技術(shù)是死的,人是活的,技術(shù)本身并沒(méi)有界限,界限都是人心定的。妄自菲薄的也好,盲目尊大的也罷,其內(nèi)心的癥結(jié)都是給自己設(shè)定了一個(gè)界限。技術(shù)飛速進(jìn)步抑或退步都不可怕,對(duì)于GIS來(lái)說(shuō),可怕的是Esri、超圖、中地們自己踏不出GIS的圈子,我們GISer踏不出GIS的圈子,而技術(shù)卻并沒(méi)有拒絕你,這就是GIS的悲哀了。所以技術(shù)人不應(yīng)該被技術(shù)分類,唯一將你分類的是:用戶的需求。GIS,你和別的軟件有什么不一樣的嗎?答案:技術(shù)上沒(méi)有,有的只是解決的需求不同。(完)
?
大家都?xì)w心似箭了吧。忘掉技術(shù),多陪父母,春節(jié)快樂(lè)!
?
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的【转】GIS:为什么我和别的软件不一样的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【求助】AIX5.3主机下 memcac
- 下一篇: Large sum