Stories

Detail Return Return

基於R語言的GD庫實現地理探測器並自動將連續變量轉為類別變量 - Stories Detail

  本文介紹基於R語言中的GD包,依據柵格影像數據,實現自變量最優離散化方法選取與執行,並進行地理探測器Geodetector)操作的方法。

  首先,在R語言中進行地理探測器操作,可通過geodetector包、GD包等2個包實現。其中,geodetector包是地理探測器模型的原作者團隊開發的,其需要保證輸入的自變量數據已經全部為類別數據;其具體操作方法大家可以參考地理探測器R語言實現:geodetector。而GD包則是另一位學者開發的,其可自動實現自變量數據最優離散化方法選取與執行;本文介紹的就是基於GD包實現地理探測器的具體操作。此外,如果希望基於Excel實現地理探測器,大家可以參考地理探測器Geodetector下載、使用、結果分析方法。

1 包的安裝與導入

  首先,我們可以先到GD包在R語言中的官方網站,大致瞭解一下該包的簡要介紹、開發團隊等基本信息。

  隨後,我們開始GD包的下載與安裝。輸入如下所示的代碼,即可開始包的下載與安裝過程。

install.packages("GD")

  輸入代碼後,按下回車鍵,運行代碼;如下圖所示。在安裝GD包時,會自動將其所需依賴的其他包(如果在此之前沒有配置過)都一併配置好,非常方便。

image

  接下來,輸入如下的代碼,將GD包導入。

library("GD")

  輸入代碼後,按下回車鍵,運行代碼;如下圖所示。

2 數據讀取與預處理

  接下來,我們需要讀取柵格圖像數據,並將其轉為GD包可以識別的數據框Data Frames)格式。

  其中,讀取柵格數據的方法,大家參考基於R語言的raster包讀取遙感影像即可;關於數據格式的轉換,大家參考地理探測器R語言實現:geodetector即可。這一部分的內容本文就不再贅述。

3 地理探測器執行

  接下來,我們就可以開始地理探測器的具體分析;強烈建議大家基於GD包中的gdm()函數,實現一步到位的地理探測器分析操作。

  首先,如果大家輸入數據中的自變量數據具有連續變量,需要將其轉換為類別變量gdm()函數可以實現連續變量離散化方式尋優自動執行。其中,我們可以選擇的離散化方式包括相等間隔法自然間斷點法分位數分類法幾何間隔法標準差法5種不同的方法,分別對應以下第一句代碼中的"equal""natural""quantile""geometric""sd"5個選項。此外,我們還可以依據數據的特徵,對自變量離散化的類別數量加以限定,具體代碼如下所示。

discmethod <- c("equal", "natural", "quantile", "geometric", "sd")
discitv <- c(4:10)

  其中,上述第一句代碼表示,我們後續將從相等間隔法自然間斷點法分位數分類法幾何間隔法標準差法5種不同的方法中,找到每一個連續變量對應的最優離散化方法;第二句代碼則表示,在後續尋找最優離散化方法的同時,還需要對每一個變量的分類數量加以尋優——c(4:10)就表示我們分別將每一個連續變量分為4類、5類、6類,以此類推,一直到10類,從其中找到最優結果對應的類別數量

  接下來,我們即可調用gdm()函數,執行地理探測器分析的具體操作;其中,my_gd為保存地理探測器結果的變量;函數的第一個參數,表示因變量與自變量的關係,~前的變量即為因變量~後的變量即為自變量,多個自變量之間通過+相連接;第二個參數表示自變量中的連續變量,程序將自動對這些連續變量加以離散化方法尋優與執行;第三個參數表示存儲自變量與因變量數據的數據框Data Frames)格式的變量;最後兩個變量,即為前面我們選擇的離散化方法類別數量

my_gd <- gdm(A_LCCS0 ~ C_SlopeS0 + D_AspectS0 + DEM_Reclass + F_LCS0,
                        continuous_variable = c("C_SlopeS0", "D_AspectS0"),
                        data = tif_frame,
                        discmethod = discmethod,
                        discitv = discitv)

  這裏需要注意,如果大家不是通過腳本運行的R語言,而是每次寫一句代碼然後按下回車鍵運行一下,那麼上述代碼中的換行就需要通過同時按下Shift鍵與回車鍵實現。輸入上述代碼後,如下圖所示。

  隨後,即可運行代碼。稍等片刻(具體時長與數據量有關),即可得到地理探測器的結果my_gd。這一變量的具體結構、內容如下圖所示。

  我們可以輸入如下的代碼,將變量my_gd打印出來。

my_gd

  所得結果如下圖所示。

  可以看到,my_gd變量包含了每一個連續變量在離散化後,對應的最優離散化方法類別數量,以及地理探測器的各個分析結果。具體結果的含義與研讀方法,大家參考地理探測器Geodetector下載、使用、結果分析方法,以及地理探測器R語言實現:geodetector這兩篇文章即可,這裏就不再贅述。

  此外,我們可以通過如下的代碼,將上述結果加以可視化。

plot(my_gd)

  運行上述代碼,結果如下圖所示。

  此時,在RStudio軟件的右下方“Plots”中,即可看到可視化結果,如下圖所示。其中,我們可以通過下圖中紅色方框內的箭頭,實現不同圖片的切換顯示。

  上述結果包含7張圖像,其分別與上上圖中的7項輸出內容對應——第一張圖是最優離散化方法的選取過程,第二張圖則是所選出的最優離散化方法對應的分類情況;後5張圖就是地理探測器的分析結果圖,即上上圖中最後5plot分別對應的結果。

  至此,我們就完成了基於R語言中的GD包,依據多張柵格圖像數據,實現類別變量的自動離散化,並進行地理探測器Geodetector)操作的完整流程。

user avatar vjmap Avatar
Favorites 1 users favorite the story!
Favorites

Add a new Comments

Some HTML is okay.