本文介紹基於R語言中的GD包,依據柵格影像數據,實現自變量最優離散化方法選取與執行,並進行地理探測器(Geodetector)操作的方法。
首先,在R語言中進行地理探測器操作,可通過geodetector包、GD包等2個包實現。其中,geodetector包是地理探測器模型的原作者團隊開發的,其需要保證輸入的自變量數據已經全部為類別數據;其具體操作方法大家可以參考地理探測器R語言實現:geodetector。而GD包則是另一位學者開發的,其可自動實現自變量數據的最優離散化方法選取與執行;本文介紹的就是基於GD包實現地理探測器的具體操作。此外,如果希望基於Excel實現地理探測器,大家可以參考地理探測器Geodetector下載、使用、結果分析方法。
1 包的安裝與導入
首先,我們可以先到GD包在R語言中的官方網站,大致瞭解一下該包的簡要介紹、開發團隊等基本信息。
隨後,我們開始GD包的下載與安裝。輸入如下所示的代碼,即可開始包的下載與安裝過程。
install.packages("GD")
輸入代碼後,按下回車鍵,運行代碼;如下圖所示。在安裝GD包時,會自動將其所需依賴的其他包(如果在此之前沒有配置過)都一併配置好,非常方便。

接下來,輸入如下的代碼,將GD包導入。
library("GD")
輸入代碼後,按下回車鍵,運行代碼;如下圖所示。

2 數據讀取與預處理
接下來,我們需要讀取柵格圖像數據,並將其轉為GD包可以識別的數據框(Data Frames)格式。
其中,讀取柵格數據的方法,大家參考基於R語言的raster包讀取遙感影像即可;關於數據格式的轉換,大家參考地理探測器R語言實現:geodetector即可。這一部分的內容本文就不再贅述。
3 地理探測器執行
接下來,我們就可以開始地理探測器的具體分析;強烈建議大家基於GD包中的gdm()函數,實現一步到位的地理探測器分析操作。
首先,如果大家輸入數據中的自變量數據具有連續變量,需要將其轉換為類別變量;gdm()函數可以實現連續變量的離散化方式尋優與自動執行。其中,我們可以選擇的離散化方式包括相等間隔法、自然間斷點法、分位數分類法、幾何間隔法與標準差法等5種不同的方法,分別對應以下第一句代碼中的"equal"、"natural"、"quantile"、"geometric"與"sd"等5個選項。此外,我們還可以依據數據的特徵,對自變量離散化的類別數量加以限定,具體代碼如下所示。
discmethod <- c("equal", "natural", "quantile", "geometric", "sd")
discitv <- c(4:10)
其中,上述第一句代碼表示,我們後續將從相等間隔法、自然間斷點法、分位數分類法、幾何間隔法與標準差法等5種不同的方法中,找到每一個連續變量對應的最優離散化方法;第二句代碼則表示,在後續尋找最優離散化方法的同時,還需要對每一個變量的分類數量加以尋優——c(4:10)就表示我們分別將每一個連續變量分為4類、5類、6類,以此類推,一直到10類,從其中找到最優結果對應的類別數量。
接下來,我們即可調用gdm()函數,執行地理探測器分析的具體操作;其中,my_gd為保存地理探測器結果的變量;函數的第一個參數,表示因變量與自變量的關係,~前的變量即為因變量,~後的變量即為自變量,多個自變量之間通過+相連接;第二個參數表示自變量中的連續變量,程序將自動對這些連續變量加以離散化方法尋優與執行;第三個參數表示存儲自變量與因變量數據的數據框(Data Frames)格式的變量;最後兩個變量,即為前面我們選擇的離散化方法與類別數量。
my_gd <- gdm(A_LCCS0 ~ C_SlopeS0 + D_AspectS0 + DEM_Reclass + F_LCS0,
continuous_variable = c("C_SlopeS0", "D_AspectS0"),
data = tif_frame,
discmethod = discmethod,
discitv = discitv)
這裏需要注意,如果大家不是通過腳本運行的R語言,而是每次寫一句代碼然後按下回車鍵運行一下,那麼上述代碼中的換行就需要通過同時按下Shift鍵與回車鍵實現。輸入上述代碼後,如下圖所示。

隨後,即可運行代碼。稍等片刻(具體時長與數據量有關),即可得到地理探測器的結果my_gd。這一變量的具體結構、內容如下圖所示。

我們可以輸入如下的代碼,將變量my_gd打印出來。
my_gd
所得結果如下圖所示。

可以看到,my_gd變量包含了每一個連續變量在離散化後,對應的最優離散化方法與類別數量,以及地理探測器的各個分析結果。具體結果的含義與研讀方法,大家參考地理探測器Geodetector下載、使用、結果分析方法,以及地理探測器R語言實現:geodetector這兩篇文章即可,這裏就不再贅述。
此外,我們可以通過如下的代碼,將上述結果加以可視化。
plot(my_gd)
運行上述代碼,結果如下圖所示。

此時,在RStudio軟件的右下方“Plots”中,即可看到可視化結果,如下圖所示。其中,我們可以通過下圖中紅色方框內的箭頭,實現不同圖片的切換顯示。

上述結果包含7張圖像,其分別與上上圖中的7項輸出內容對應——第一張圖是最優離散化方法的選取過程,第二張圖則是所選出的最優離散化方法對應的分類情況;後5張圖就是地理探測器的分析結果圖,即上上圖中最後5個plot分別對應的結果。
至此,我們就完成了基於R語言中的GD包,依據多張柵格圖像數據,實現類別變量的自動離散化,並進行地理探測器(Geodetector)操作的完整流程。