動態

詳情

基於R語言的GD庫實現地理探測器並自動將連續變量轉為類別變量 - 動態詳情

12:22 下午 · 11月 06 ,2025

本文介紹基於R語言中的GD包，依據柵格影像數據，實現自變量最優離散化方法選取與執行，並進行地理探測器（Geodetector）操作的方法。

首先，在R語言中進行地理探測器操作，可通過geodetector包、GD包等2個包實現。其中，geodetector包是地理探測器模型的原作者團隊開發的，其需要保證輸入的自變量數據已經全部為類別數據；其具體操作方法大家可以參考地理探測器R語言實現：geodetector。而GD包則是另一位學者開發的，其可自動實現自變量數據的最優離散化方法選取與執行；本文介紹的就是基於GD包實現地理探測器的具體操作。此外，如果希望基於Excel實現地理探測器，大家可以參考地理探測器Geodetector下載、使用、結果分析方法。

1 包的安裝與導入

首先，我們可以先到GD包在R語言中的官方網站，大致瞭解一下該包的簡要介紹、開發團隊等基本信息。

隨後，我們開始GD包的下載與安裝。輸入如下所示的代碼，即可開始包的下載與安裝過程。

install.packages("GD")

輸入代碼後，按下回車鍵，運行代碼；如下圖所示。在安裝GD包時，會自動將其所需依賴的其他包（如果在此之前沒有配置過）都一併配置好，非常方便。

接下來，輸入如下的代碼，將GD包導入。

library("GD")

輸入代碼後，按下回車鍵，運行代碼；如下圖所示。

2 數據讀取與預處理

接下來，我們需要讀取柵格圖像數據，並將其轉為GD包可以識別的數據框（Data Frames）格式。

其中，讀取柵格數據的方法，大家參考基於R語言的raster包讀取遙感影像即可；關於數據格式的轉換，大家參考地理探測器R語言實現：geodetector即可。這一部分的內容本文就不再贅述。

3 地理探測器執行

接下來，我們就可以開始地理探測器的具體分析；強烈建議大家基於GD包中的gdm()函數，實現一步到位的地理探測器分析操作。

首先，如果大家輸入數據中的自變量數據具有連續變量，需要將其轉換為類別變量；gdm()函數可以實現連續變量的離散化方式尋優與自動執行。其中，我們可以選擇的離散化方式包括相等間隔法、自然間斷點法、分位數分類法、幾何間隔法與標準差法等5種不同的方法，分別對應以下第一句代碼中的"equal"、"natural"、"quantile"、"geometric"與"sd"等5個選項。此外，我們還可以依據數據的特徵，對自變量離散化的類別數量加以限定，具體代碼如下所示。

discmethod <- c("equal", "natural", "quantile", "geometric", "sd")
discitv <- c(4:10)

其中，上述第一句代碼表示，我們後續將從相等間隔法、自然間斷點法、分位數分類法、幾何間隔法與標準差法等5種不同的方法中，找到每一個連續變量對應的最優離散化方法；第二句代碼則表示，在後續尋找最優離散化方法的同時，還需要對每一個變量的分類數量加以尋優——c(4:10)就表示我們分別將每一個連續變量分為4類、5類、6類，以此類推，一直到10類，從其中找到最優結果對應的類別數量。

接下來，我們即可調用gdm()函數，執行地理探測器分析的具體操作；其中，my_gd為保存地理探測器結果的變量；函數的第一個參數，表示因變量與自變量的關係，~前的變量即為因變量，~後的變量即為自變量，多個自變量之間通過+相連接；第二個參數表示自變量中的連續變量，程序將自動對這些連續變量加以離散化方法尋優與執行；第三個參數表示存儲自變量與因變量數據的數據框（Data Frames）格式的變量；最後兩個變量，即為前面我們選擇的離散化方法與類別數量。

my_gd <- gdm(A_LCCS0 ~ C_SlopeS0 + D_AspectS0 + DEM_Reclass + F_LCS0,
                        continuous_variable = c("C_SlopeS0", "D_AspectS0"),
                        data = tif_frame,
                        discmethod = discmethod,
                        discitv = discitv)

這裏需要注意，如果大家不是通過腳本運行的R語言，而是每次寫一句代碼然後按下回車鍵運行一下，那麼上述代碼中的換行就需要通過同時按下Shift鍵與回車鍵實現。輸入上述代碼後，如下圖所示。

隨後，即可運行代碼。稍等片刻（具體時長與數據量有關），即可得到地理探測器的結果my_gd。這一變量的具體結構、內容如下圖所示。

我們可以輸入如下的代碼，將變量my_gd打印出來。

my_gd

所得結果如下圖所示。

可以看到，my_gd變量包含了每一個連續變量在離散化後，對應的最優離散化方法與類別數量，以及地理探測器的各個分析結果。具體結果的含義與研讀方法，大家參考地理探測器Geodetector下載、使用、結果分析方法，以及地理探測器R語言實現：geodetector這兩篇文章即可，這裏就不再贅述。

此外，我們可以通過如下的代碼，將上述結果加以可視化。