1背景介紹行政區(qū)劃數(shù)據(jù)是重要的基礎(chǔ)地理信息數(shù)據(jù),但目前市面上能使用的行政區(qū)域數(shù)據(jù)問題頗多。我這里列出幾種大家常用的行政區(qū)劃數(shù)據(jù)供大家參考:
基于上述問題,我想基于權(quán)威的行政區(qū)劃數(shù)據(jù),制作一套長時間序列的、具有符合民政部屬性的、開放獲取的行政區(qū)劃數(shù)據(jù)。目前最權(quán)威的區(qū)劃數(shù)據(jù)是國家基礎(chǔ)地理信息中心于2022年1月發(fā)布的國家基礎(chǔ)地理信息,該數(shù)據(jù)的現(xiàn)勢性為2019年,但該數(shù)據(jù)也存在諸多問題。 因此,基于1比100萬的行政區(qū)劃數(shù)據(jù)、民政部地名數(shù)據(jù)以及其他矢量數(shù)據(jù),我制作了年2020初的行政區(qū)劃數(shù)據(jù)。接下來一段時間,我將基于這套年2020區(qū)劃數(shù)據(jù)與民政部歷年來行政區(qū)劃資料,陸續(xù)更新2015年-2022年的行政區(qū)劃數(shù)據(jù)。 2數(shù)據(jù)處理原則(1)盡可能少地改動矢量數(shù)據(jù); (2)國界、南海諸島的矢量絕不修改,一律以國家基礎(chǔ)地理信息2022年發(fā)布的數(shù)據(jù)為準(zhǔn); (3)各地屬性、統(tǒng)轄信息一律以民政部2019年的數(shù)據(jù)為準(zhǔn); 3制作流程4基礎(chǔ)地理信息數(shù)據(jù)的處理我之前寫過一篇博客用來處理該數(shù)據(jù)庫,具體參考:1:100w基礎(chǔ)地理信息數(shù)據(jù)的鑲嵌(zhuanlan.zhihu.com/p/458211981) 上述步驟處理完之后,數(shù)據(jù)是分塊的。 進(jìn)行縣名稱的數(shù)據(jù)融合,以消除下面的方塊狀組合,再最后選擇中國區(qū)域,獲得的行政區(qū)劃數(shù)據(jù)如下所示。 5屬性匹配寫到這里,首先感謝公眾號數(shù)讀城事繼續(xù)幾年的區(qū)劃數(shù)據(jù)更新,這套數(shù)據(jù)的屬性信息是最全的,而且是和民政部代碼相契合的。這里我直接使用了這套數(shù)據(jù)進(jìn)行了基于縣名稱的空間連接。由此我們的區(qū)劃數(shù)據(jù)初步具有了各縣的屬性信息。 6區(qū)劃矢量修改數(shù)據(jù)修復(fù)由于這套數(shù)據(jù)存在多處數(shù)據(jù)的矢量拓?fù)溴e誤,我們首先使用arcgis自帶的修復(fù)幾何功能進(jìn)行修復(fù)。然后不能修復(fù)的位置,我們進(jìn)行空間定位,通過編輯矢量功能進(jìn)行修復(fù)。 無矢量區(qū)域在制作過程中,也遇到了民政部有行政代碼,國家基礎(chǔ)地理信息數(shù)據(jù)無矢量的情況,比如深圳的坪山區(qū)。如果遇到這樣的問題,我會首先參考天地圖行政區(qū)劃、民政部的矢量區(qū)劃,如果沒有則參考高德地圖的適量區(qū)劃。比如深圳的坪山區(qū)并無矢量: 又如沒有勾畫的區(qū)域,比如胡楊河市、昆玉市等。這些地方就直接勾繪相關(guān)矢量并添加屬性。 矢量多余區(qū)域另外,也遇到了民政部無代碼,但有矢量的情況,比如說甘肅太子山天然林有區(qū)劃矢量,但行政級別上又屬于幾地管轄: 又如蓮花山風(fēng)景保護(hù)區(qū)無行政區(qū)劃代碼,參考高德地圖區(qū)劃數(shù)據(jù),并入康樂縣: 另外比較特殊的地區(qū)是臺灣省,有縣級矢量,但在民政部的行政區(qū)劃中只有省級代碼。為保證本數(shù)據(jù)的所有屬性數(shù)據(jù)以民政部為準(zhǔn),這里對臺灣省的所有縣級數(shù)據(jù)進(jìn)行了合并,只保存省級矢量。 7屬性數(shù)據(jù)修改這部分也是耗時最長的步驟,即使在大部分?jǐn)?shù)據(jù)有屬性數(shù)據(jù)的情況下,依然問題較多。 代碼、名稱等錯誤與民政部的區(qū)劃代碼進(jìn)行300余個市級別的對比,若有不同行政區(qū)域,則找相關(guān)原因。有可能市字段匹配錯誤,比如石家莊的新華區(qū)、滄州市的新華區(qū)字段匹配錯誤(這種最多)。也有可能是被遺漏掉了,比如溫州市的龍港市。 地級為空區(qū)域另外就是我國還有一些特殊的行政單位,比如省直轄市、省直轄縣行政級別上屬于縣級單位,但又無地級單位。 比如湖北省的潛江市、天門市、仙桃市,河南的濟(jì)源市, 海南的臨高縣、東方市等,具體分布圖如下所示,這部分區(qū)域統(tǒng)一將地級屬性命名為空 縣級為空區(qū)域還有一些比較特殊的地區(qū),是地級市,但截止2019年末,該地區(qū)又無縣級行政單位,比如海南儋州市、廣東東莞市等。這部分區(qū)域統(tǒng)一將縣級屬性命名為空。
省級為空區(qū)域這個地區(qū)叫中朝共有領(lǐng)土,在國家基礎(chǔ)地理信息數(shù)據(jù)上有該矢量,但民政部沒有相關(guān)區(qū)劃代碼,且不能修改,因此該地區(qū)的所有相關(guān)屬性皆為空,僅保留矢量信息。 8數(shù)量檢查檢查前提在進(jìn)行檢查前,首先普及一下我國大體的行政區(qū)劃級別。 林區(qū),是中國行政區(qū)劃之一,行政地位與市轄區(qū)、縣級市、縣、自治縣、旗、自治旗、特區(qū)相同,屬縣級行政區(qū),現(xiàn)僅有一個,為湖北省直轄的神農(nóng)架林區(qū) 特區(qū),這里指六枝特區(qū)屬六盤水市轄區(qū)域,位于貴州省西部,現(xiàn)僅有一個。 因此: 省級行政單位有:省、直轄市、自治區(qū)、特區(qū) 市級行政單位有:地級市、自治州、地區(qū)、盟 縣級行政單位有:區(qū)、縣級市、縣、自治縣、旗、自治旗、直轄縣、省直轄市、林區(qū)、特區(qū)。 此外,還有省直轄縣、省直轄市。在民政部的行政區(qū)劃等級中不屬于任何地級行政區(qū)劃代管。屬于縣級行政區(qū),不經(jīng)地級行政區(qū)代管或管轄,由省級行政區(qū)直接管轄,獨立于地級行政區(qū)之外單獨建制,由所在的省或自治區(qū)直接領(lǐng)導(dǎo)和管理。因此省直轄縣、省直轄市無地級行政區(qū),也屬于縣級行政區(qū)。 基于此,我們查詢相關(guān)的2019年民政部的行政區(qū)劃統(tǒng)計如下表所示:
縣級數(shù)量檢查逐個省份進(jìn)行縣級數(shù)量檢查,檢查表格如下:
在檢查過程中,將錯誤的縣級類型屬性改為正確的,最后我國縣級類型分布圖如下所示: 地級數(shù)量檢查這一步是在數(shù)據(jù)合并完成后進(jìn)行的,是對逐個省份進(jìn)行市級類型檢查,主要注意幾個無縣級行政區(qū)的地級市,以及直轄市無地級行政單位。最后我國市級類型分布圖如下所示: 9數(shù)據(jù)合并在檢查完矢量與屬性信息之后,使用數(shù)據(jù)融合工具進(jìn)行地級和省級的數(shù)據(jù)合并。 我國的市級數(shù)據(jù)如圖所示: 我國的省級數(shù)據(jù)如圖所示: 10英文屬性添加參考GADM屬性信息,給矢量數(shù)據(jù)添加數(shù)據(jù)的英文屬性,各個屬性名稱對應(yīng)的名稱如下:
省市縣的類型英文名對應(yīng)為:
另外,考慮到漢語拼音是表述普通話語音的拼音系統(tǒng),后被用作對外宣傳的拼寫法則,這也就是我們看到大部分省市英文為拼音的原因。也有部分地區(qū)是非拼音,使用的是郵政式拼音。例如廣東、廣西、福建有一部分地區(qū)的地名已經(jīng)有了拉丁字母的習(xí)慣拼法,例如Amoy(廈門)、Canton(廣州)、Foochow(福州)等。 但考慮到我國一直使用的拼音代表地名,聯(lián)合國也于1977年起正式改用漢語拼音拼寫中國大陸地名,因此本數(shù)據(jù)全部采用拼音系統(tǒng)代表地名。但單個字的地區(qū),比如廣西橫縣、山西臨縣等,保留縣名稱,再命名。帶民族的,保留民族的英文名字。 自此,我們獲得了完整的具有英文屬性的省市縣行政區(qū)劃矢量數(shù)據(jù)。 11數(shù)據(jù)獲取(1)我也使用vuepress進(jìn)行網(wǎng)站的搭建,后續(xù)的數(shù)據(jù)將放到該網(wǎng)站上。讀者可以登錄www.shengshixian.com(諧音:省市縣),省市縣區(qū)劃數(shù)據(jù)網(wǎng),進(jìn)行數(shù)據(jù)下載。 或者網(wǎng)站shengshixianruiduobao.com(上面的網(wǎng)站需要代理上網(wǎng)) (2)或者讀者也可以直接公眾號回復(fù) 銳多寶矢量 獲取。 12寫在最后我為什么會選做這樣的事?是因為我在搭建自己的網(wǎng)站(landcover100.com)中,經(jīng)常遇到行政區(qū)劃數(shù)據(jù)的問題。到底該用哪一套行政區(qū)劃數(shù)據(jù)深深困擾著我。天地圖數(shù)據(jù)?不完整。中科資環(huán)數(shù)據(jù)?太舊。高德地圖數(shù)據(jù)?屬性不夠。 因此,我準(zhǔn)備自己做一套能夠使用的數(shù)據(jù)。最開始有兩個思路,一個是使用民政部的區(qū)劃數(shù)據(jù),該數(shù)據(jù)的邊界精度非常高,且沒有數(shù)據(jù)加偏。但該數(shù)據(jù)有個問題,民政部并未發(fā)布該數(shù)據(jù),數(shù)據(jù)來源的聲明不太好寫,難道說是通過爬蟲獲取,哈哈哈。另外一個數(shù)據(jù)就是該文的思路,基于國家基礎(chǔ)地理信息中心發(fā)布的縣矢量數(shù)據(jù),這個數(shù)據(jù)雖然精度不高,但勝在權(quán)威,且可以聲明數(shù)據(jù)來源。 因此我打算基于該數(shù)據(jù),參考民政部歷年行政區(qū)劃變化情況,做一套長時間序列的行政區(qū)劃數(shù)據(jù)。年2020初(截至2019年12月31日)的行政區(qū)劃數(shù)據(jù)為基礎(chǔ),將以此為擴(kuò)展,在半年內(nèi)構(gòu)建2015年-2022年的行政區(qū)劃數(shù)據(jù)(后續(xù)會有增刪改查),歡迎持續(xù)關(guān)注。 13參考國家基礎(chǔ)地理信息中心.https://www./ngcc/html/1/index.html 中國科學(xué)院資源環(huán)境科學(xué)與數(shù)據(jù)中心.https://www./ 確定 |
|