ELK 處理 Spring Boot 日誌，不錯！詳情 - java,springboot,elk,elasticsearch,微服務碼猿技術專欄博客

大家好，我是不才陳某~

在排查線上異常的過程中，查詢日誌總是必不可缺的一部分。現今大多采用的微服務架構，日誌被分散在不同的機器上，使得日誌的查詢變得異常困難。

工欲善其事，必先利其器。如果此時有一個統一的實時日誌分析平台，那可謂是雪中送碳，必定能夠提高我們排查線上問題的效率。本文帶您瞭解一下開源的實時日誌分析平台 ELK 的搭建及使用。

文章首發公眾號：碼猿技術專欄

ELK 簡介

ELK 是一個開源的實時日誌分析平台，它主要由 Elasticsearch、Logstash 和 Kiabana 三部分組成。

Logstash

Logstash 主要用於收集服務器日誌，它是一個開源數據收集引擎，具有實時管道功能。Logstash 可以動態地將來自不同數據源的數據統一起來，並將數據標準化到您所選擇的目的地。

Logstash 收集數據的過程主要分為以下三個部分：

輸入：數據（包含但不限於日誌）往往都是以不同的形式、格式存儲在不同的系統中，而 Logstash 支持從多種數據源中收集數據（File、Syslog、MySQL、消息中間件等等）。
過濾器：實時解析和轉換數據，識別已命名的字段以構建結構，並將它們轉換成通用格式。
輸出：Elasticsearch 並非存儲的唯一選擇，Logstash 提供很多輸出選擇。

Elasticsearch

Elasticsearch （ES）是一個分佈式的 Restful 風格的搜索和數據分析引擎，它具有以下特點：

查詢：允許執行和合並多種類型的搜索 — 結構化、非結構化、地理位置、度量指標 — 搜索方式隨心而變。
分析：Elasticsearch 聚合讓您能夠從大處着眼，探索數據的趨勢和模式。
速度：很快，可以做到億萬級的數據，毫秒級返回。
可擴展性：可以在筆記本電腦上運行，也可以在承載了 PB 級數據的成百上千台服務器上運行。
彈性：運行在一個分佈式的環境中，從設計之初就考慮到了這一點。
靈活性：具備多個案例場景。支持數字、文本、地理位置、結構化、非結構化，所有的數據類型都歡迎。

Kibana

Kibana 可以使海量數據通俗易懂。它很簡單，基於瀏覽器的界面便於您快速創建和分享動態數據儀表板來追蹤 Elasticsearch 的實時數據變化。其搭建過程也十分簡單，您可以分分鐘完成 Kibana 的安裝並開始探索 Elasticsearch 的索引數據 — 沒有代碼、不需要額外的基礎設施。另外，歡迎關注公眾號碼猿技術專欄，後台回覆“9527”，送你一份Spring Cloud Aliababa實戰視頻！

對於以上三個組件在《ELK 協議棧介紹及體系結構》一文中有具體介紹，這裏不再贅述。

在 ELK 中，三大組件的大概工作流程如下圖所示，由 Logstash 從各個服務中採集日誌並存放至 Elasticsearch 中，然後再由 Kiabana 從 Elasticsearch 中查詢日誌並展示給終端用户。

圖 1. ELK 的大致工作流程

ELK 實現方案

通常情況下我們的服務都部署在不同的服務器上，那麼如何從多台服務器上收集日誌信息就是一個關鍵點了。本篇文章中提供的解決方案如下圖所示：

圖 2. 本文提供的 ELK 實現方案

如上圖所示，整個 ELK 的運行流程如下：

在微服務（產生日誌的服務）上部署一個 Logstash，作為 Shipper 角色，主要負責對所在機器上的服務產生的日誌文件進行數據採集，並將消息推送到 Redis 消息隊列。
另用一台服務器部署一個 Indexer 角色的 Logstash，主要負責從 Redis 消息隊列中讀取數據，並在 Logstash 管道中經過 Filter 的解析和處理後輸出到 Elasticsearch 集羣中存儲。
Elasticsearch 主副節點之間數據同步。
單獨一台服務器部署 Kibana 讀取 Elasticsearch 中的日誌數據並展示在 Web 頁面。

通過這張圖，相信您已經大致清楚了我們將要搭建的 ELK 平台的工作流程，以及所需組件。下面就讓我們一起開始搭建起來吧。

ELK 平台搭建

本節主要介紹搭建 ELK 日誌平台，包括安裝 Indexer 角色的 Logstash，Elasticsearch 以及 Kibana 三個組件。完成本小節，您需要做如下準備：

一台 Ubuntu 機器或虛擬機，作為入門教程，此處省略了 Elasticsearch 集羣的搭建，且將 Logstash(Indexer)、Elasticsearch 以及 Kibana 安裝在同一機器上。
在 Ubuntu 上安裝 JDK，注意 Logstash 要求 JDK 在 1.7 版本以上。
Logstash、Elasticsearch、Kibana 安裝包，您可以在此頁面下載。

安裝 Logstash

解壓壓縮包：

tar -xzvf logstash-7.3.0.tar.gz

顯示更多簡單用例測試，進入到解壓目錄，並啓動一個將控制枱輸入輸出到控制枱的管道。

cd logstash-7.3.0  
elk@elk:~/elk/logstash-7.3.0$ bin/logstash -e 'input { stdin {} } output { { stdout {} } }'

顯示更多看到如下日誌就意味着 Logstash 啓動成功。

圖 3. Logstash 啓動成功日誌

在控制枱輸入 Hello Logstash ，看到如下效果代表 Logstash 安裝成功。

清單 1. 驗證 Logstash 是否啓動成功Hello Logstash

{  
    "@timestamp" =&gt; 2019-08-10T16:11:10.040Z,  
          "host" =&gt; "elk",  
      "@version" =&gt; "1",  
       "message" =&gt; "Hello Logstash"  
}

安裝 Elasticsearch

解壓安裝包：

tar -xzvf elasticsearch-7.3.0-linux-x86_64.tar.gz

啓動 Elasticsearch：

cd elasticsearch-7.3.0/  
bin/elasticsearch

在啓動 Elasticsearch 的過程中我遇到了兩個問題在這裏列舉一下，方便大家排查。

問題一：內存過小，如果您的機器內存小於 Elasticsearch 設置的值，就會報下圖所示的錯誤。解決方案是，修改 elasticsearch-7.3.0/config/jvm.options 文件中的如下配置為適合自己機器的內存大小，若修改後還是報這個錯誤，可重新連接服務器再試一次。

圖 4. 內存過小導致 Elasticsearch 啓動報錯

問題二，如果您是以 root 用户啓動的話，就會報下圖所示的錯誤。解決方案自然就是添加一個新用户啓動 Elasticsearch，至於添加新用户的方法網上有很多，這裏就不再贅述。

圖 5. Root 用户啓動 Elasticsearch 報錯

啓動成功後，另起一個會話窗口執行 curl http://localhost:9200 命令，如果出現如下結果，則代表 Elasticsearch 安裝成功。

清單 2. 檢查 Elasticsearch 是否啓動成功

elk@elk:~$ curl http://localhost:9200  
{  
  "name" : "elk",  
  "cluster_name" : "elasticsearch",  
  "cluster_uuid" : "hqp4Aad0T2Gcd4QyiHASmA",  
  "version" : {  
    "number" : "7.3.0",  
    "build_flavor" : "default",  
    "build_type" : "tar",  
    "build_hash" : "de777fa",  
    "build_date" : "2019-07-24T18:30:11.767338Z",  
    "build_snapshot" : false,  
    "lucene_version" : "8.1.0",  
    "minimum_wire_compatibility_version" : "6.8.0",  
    "minimum_index_compatibility_version" : "6.0.0-beta1"  
  },  
  "tagline" : "You Know, for Search"  
}

安裝 Kibana

解壓安裝包：

tar -xzvf kibana-7.3.0-linux-x86_64.tar.gz

修改配置文件 config/kibana.yml ，主要指定 Elasticsearch 的信息。

清單 3. Kibana 配置信息#Elasticsearch主機地址

elasticsearch.hosts: "http://ip:9200"  
# 允許遠程訪問  
server.host: "0.0.0.0"  
# Elasticsearch用户名 這裏其實就是我在服務器啓動Elasticsearch的用户名  
elasticsearch.username: "es"  
# Elasticsearch鑑權密碼 這裏其實就是我在服務器啓動Elasticsearch的密碼  
elasticsearch.password: "es"

啓動 Kibana：

cd kibana-7.3.0-linux-x86_64/bin  
./kibana

在瀏覽器中訪問 http://ip:5601 ，若出現以下界面，則表示 Kibana 安裝成功。

圖 6. Kibana 啓動成功界面

ELK 日誌平台安裝完成後，下面我們就將通過具體的例子來看下如何使用 ELK，下文將分別介紹如何將 Spring Boot 日誌和 Nginx 日誌交由 ELK 分析。

在 Spring Boot 中使用 ELK

首先我們需要創建一個 Spring Boot 的項目，之前我寫過一篇文章介紹如何使用 AOP 來統一處理 Spring Boot 的 Web 日誌，本文的 Spring Boot 項目就建立在這篇文章的基礎之上。

修改並部署 Spring Boot 項目

在項目 resources 目錄下創建 spring-logback.xml 配置文件。

清單 4. Spring Boot 項目 Logback 的配置

<?xml version="1.0" encoding="UTF-8"?>  
<configuration debug="false">  
    <contextName>Logback For demo Mobile</contextName>  
    <property name="LOG_HOME" value="/log" />  
    <springProperty scope="context" name="appName" source="spring.application.name"  
                    defaultValue="localhost" />  
    ...  
  
    <appender name="ROLLING_FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">  
        ...  
        <encoder class="ch.qos.logback.classic.encoder.PatternLayoutEncoder">  
            <pattern>%d{yyyy-MM-dd HH:mm:ss.SSS} [%thread] %-5level %logger{25} ${appName} -%msg%n</pattern>  
        </encoder>  
        ...  
    </appender>  
    ...  
</configuration>

以上內容省略了很多內容，您可以在源碼中獲取。在上面的配置中我們定義了一個名為 ROLLING_FILE 的 Appender 往日誌文件中輸出指定格式的日誌。而上面的 pattern 標籤正是具體日誌格式的配置，通過上面的配置，我們指定輸出了時間、線程、日誌級別、logger（通常為日誌打印所在類的全路徑）以及服務名稱等信息。

將項目打包，並部署到一台 Ubuntu 服務器上。

清單 5. 打包並部署 Spring Boot 項目

# 打包命令  
mvn package -Dmaven.test.skip=true  
# 部署命令  
java -jar sb-elk-start-0.0.1-SNAPSHOT.jar

查看日誌文件， logback 配置文件中我將日誌存放在 /log/sb-log.log 文件中，執行 more /log/sb-log.log 命令，出現以下結果表示部署成功。

圖 7. Spring Boot 日誌文件

配置 Shipper 角色 Logstash

Spring Boot 項目部署成功之後，我們還需要在當前部署的機器上安裝並配置 Shipper 角色的 Logstash。Logstash 的安裝過程在 ELK 平台搭建小節中已有提到，這裏不再贅述。

安裝完成後，我們需要編寫 Logstash 的配置文件，以支持從日誌文件中收集日誌並輸出到 Redis 消息管道中，Shipper 的配置如下所示。

清單 6. Shipper 角色的 Logstash 的配置

input {  
    file {  
        path => [  
            # 這裏填寫需要監控的文件  
            "/log/sb-log.log"  
        ]  
    }  
}  
  
output {  
    # 輸出到redis  
    redis {  
        host => "10.140.45.190"   # redis主機地址  
        port => 6379              # redis端口號  
        db => 8                   # redis數據庫編號  
        data_type => "channel"    # 使用發佈/訂閲模式  
        key => "logstash_list_0"  # 發佈通道名稱  
    }  
}

其實 Logstash 的配置是與前面提到的 Logstash 管道中的三個部分（輸入、過濾器、輸出）一一對應的，只不過這裏我們不需要過濾器所以就沒有寫出來。上面配置中 Input 使用的數據源是文件類型的，只需要配置上需要收集的本機日誌文件路徑即可。Output 描述數據如何輸出，這裏配置的是輸出到 Redis。

Redis 的配置 data_type 可選值有 channel 和 list 兩個。channel 是 Redis 的發佈/訂閲通信模式，而 list 是 Redis 的隊列數據結構，兩者都可以用來實現系統間有序的消息異步通信。

channel 相比 list 的好處是，解除了發佈者和訂閲者之間的耦合。舉個例子，一個 Indexer 在持續讀取 Redis 中的記錄，現在想加入第二個 Indexer，如果使用 list ，就會出現上一條記錄被第一個 Indexer 取走，而下一條記錄被第二個 Indexer 取走的情況，兩個 Indexer 之間產生了競爭，導致任何一方都沒有讀到完整的日誌。

channel 就可以避免這種情況。這裏 Shipper 角色的配置文件和下面將要提到的 Indexer 角色的配置文件中都使用了 channel 。

配置 Indexer 角色 Logstash

配置好 Shipper 角色的 Logstash 後，我們還需要配置 Indexer 角色 Logstash 以支持從 Redis 接收日誌數據，並通過過濾器解析後存儲到 Elasticsearch 中，其配置內容如下所示。

清單 7. Indexer 角色的 Logstash 的配置

input {  
    redis {  
        host      => "192.168.142.131"    # redis主機地址  
        port      => 6379               # redis端口號  
        db        => 8                  # redis數據庫編號  
        data_type => "channel"          # 使用發佈/訂閲模式  
        key       => "sb-logback"  # 發佈通道名稱  
    }  
}  
  
filter {  
     #定義數據的格式  
     grok {  
       match => { "message" => "%{TIMESTAMP_ISO8601:time} \[%{NOTSPACE:threadName}\] %{LOGLEVEL:level}  %{DATA:logger} %{NOTSPACE:applicationName} -(?:.*=%{NUMBER:timetaken}ms|)"}  
     }  
}  
  
output {  
    stdout {}  
    elasticsearch {  
        hosts => "localhost:9200"  
        index => "logback"  
   }  
}

與 Shipper 不同的是，Indexer 的管道中我們定義了過濾器，也正是在這裏將日誌解析成結構化的數據。下面是我截取的一條 logback 的日誌內容：

清單 8. Spring Boot 項目輸出的一條日誌

2019-08-11 18:01:31.602 [http-nio-8080-exec-2] INFO  c.i.s.aop.WebLogAspect sb-elk -接口日誌  
POST請求測試接口結束調用:耗時=11ms,result=BaseResponse{code=10000, message='操作成功'}

在 Filter 中我們使用 Grok 插件從上面這條日誌中解析出了時間、線程名稱、Logger、服務名稱以及接口耗時幾個字段。Grok 又是如何工作的呢？

message 字段是 Logstash 存放收集到的數據的字段， match = {"message" => ...} 代表是對日誌內容做處理。
Grok 實際上也是通過正則表達式來解析數據的，上面出現的 TIMESTAMP_ISO8601 、 NOTSPACE 等都是 Grok 內置的 patterns。
我們編寫的解析字符串可以使用 Grok Debugger 來測試是否正確，這樣避免了重複在真實環境中校驗解析規則的正確性。

查看效果

經過上面的步驟，我們已經完成了整個 ELK 平台的搭建以及 Spring Boot 項目的接入。下面我們按照以下步驟執行一些操作來看下效果。

啓動 Elasticsearch，啓動命令在 ELK 平台搭建小節中有提到，這裏不贅述（Kibana 啓動同）。啓動 Indexer 角色的 Logstash。

# 進入到 Logstash 的解壓目錄，然後執行下面的命令  
bin/logstash -f indexer-logstash.conf

啓動 Kibana。

啓動 Shipper 角色的 Logstash。

# 進入到 Logstash 的解壓目錄，然後執行下面的命令  
            bin/logstash -f shipper-logstash.conf

調用 Spring Boot 接口，此時應該已經有數據寫入到 ES 中了。

在瀏覽器中訪問 http://ip:5601 ，打開 Kibana 的 Web 界面，並且如下圖所示添加 logback 索引。

圖 8. 在 Kibana 中添加 Elasticsearch 索引

進入 Discover 界面，選擇 logback 索引，就可以看到日誌數據了，如下圖所示。

圖 9. ELK 日誌查看

在 Nginx 中使用 ELK

相信通過上面的步驟您已經成功的搭建起了自己的 ELK 實時日誌平台，並且接入了 Logback 類型的日誌。但是實際場景下，幾乎不可能只有一種類型的日誌，下面我們就再在上面步驟的基礎之上接入 Nginx 的日誌。

當然這一步的前提是我們需要在服務器上安裝 Nginx，具體的安裝過程網上有很多介紹，這裏不再贅述。查看 Nginx 的日誌如下（Nginx 的訪問日誌默認在 /var/log/nginx/access.log 文件中）。

清單 9. Nginx 的訪問日誌

192.168.142.1 - - [17/Aug/2019:21:31:43 +0800] "GET /weblog/get-test?name=elk HTTP/1.1"  
200 3 "http://192.168.142.131/swagger-ui.html" "Mozilla/5.0 (Windows NT 10.0; Win64; x64)  
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36"

同樣，我們需要為此日誌編寫一個 Grok 解析規則，如下所示：

清單 10. 針對 Nginx 訪問日誌的 Grok 解析規則

%{IPV4:ip} \- \- \[%{HTTPDATE:time}\] "%{NOTSPACE:method} %{DATA:requestUrl}  
HTTP/%{NUMBER:httpVersion}" %{NUMBER:httpStatus} %{NUMBER:bytes}  
"%{DATA:referer}" "%{DATA:agent}"

完成上面這些之後的關鍵點是 Indexer 類型的 Logstash 需要支持兩種類型的輸入、過濾器以及輸出，如何支持呢？首先需要給輸入指定類型，然後再根據不同的輸入類型走不同的過濾器和輸出，如下所示。

清單 11. 支持兩種日誌輸入的 Indexer 角色的 Logstash 配置

input {  
    redis {  
        type      => "logback"  
        ...  
    }  
    redis {  
       type       => "nginx"  
       ...  
    }  
}  
  
filter {  
     if [type] == "logback" {  
         ...  
     }  
     if [type] == "nginx" {  
         ...  
     }  
}  
  
output {  
    if [type] == "logback" {  
        ...  
    }  
    if [type] == "nginx" {  
       ...  
    }  
}

我的 Nginx 與 Spring Boot 項目部署在同一台機器上，所以還需修改 Shipper 類型的 Logstash 的配置以支持兩種類型的日誌輸入和輸出，其配置文件的內容可點擊這裏獲取。

以上配置完成後，我們按照查看效果章節中的步驟，啓動 ELK 平台、Shipper 角色的 Logstash、Nginx 以及 Spring Boot 項目,然後在 Kibana 上添加 Nignx 索引後就可同時查看 Spring Boot 和 Nginx 的日誌了，如下圖所示。

圖 10. ELK 查看 Nginx 日誌

ELK 啓動

在上面的步驟中，ELK 的啓動過程是我們一個一個的去執行三大組件的啓動命令的。而且還是在前台啓動的，意味着如果我們關閉會話窗口，該組件就會停止導致整個 ELK 平台無法使用，這在實際工作過程中是不現實的，我們剩下的問題就在於如何使 ELK 在後台運行。

根據《Logstash 最佳實踐》一書的推薦，我們將使用 Supervisor 來管理 ELK 的啓停。首先我們需要安裝 Supervisor，在 Ubuntu 上執行 apt-get install supervisor 即可。安裝成功後，我們還需要在 Supervisor 的配置文件中配置 ELK 三大組件（其配置文件默認為 /etc/supervisor/supervisord.conf 文件）。

清單 12. ELK 後台啓動

[program:elasticsearch]  
environment=JAVA_HOME="/usr/java/jdk1.8.0_221/"  
directory=/home/elk/elk/elasticsearch  
user=elk  
command=/home/elk/elk/elasticsearch/bin/elasticsearch  
  
[program:logstash]  
environment=JAVA_HOME="/usr/java/jdk1.8.0_221/"  
directory=/home/elk/elk/logstash  
user=elk  
command=/home/elk/elk/logstash/bin/logstash -f /home/elk/elk/logstash/indexer-logstash.conf  
  
[program:kibana]  
environment=LS_HEAP_SIZE=5000m  
directory=/home/elk/elk/kibana  
user=elk  
command=/home/elk/elk/kibana/bin/kibana

按照以上內容配置完成後，執行 sudo supervisorctl reload 即可完成整個 ELK 的啓動，而且其默認是開機自啓。當然，我們也可以使用 sudo supervisorctl start/stop [program_name] 來管理單獨的應用。另外，歡迎關注公眾號碼猿技術專欄，後台回覆“9527”，送你一份Spring Cloud Aliababa實戰視頻！