大家好,我是不才陳某~
在排查線上異常的過程中,查詢日誌總是必不可缺的一部分。現今大多采用的微服務架構,日誌被分散在不同的機器上,使得日誌的查詢變得異常困難。
工欲善其事,必先利其器。如果此時有一個統一的實時日誌分析平台,那可謂是雪中送碳,必定能夠提高我們排查線上問題的效率。本文帶您瞭解一下開源的實時日誌分析平台 ELK 的搭建及使用。
文章首發公眾號:碼猿技術專欄
ELK 簡介
ELK 是一個開源的實時日誌分析平台,它主要由 Elasticsearch、Logstash 和 Kiabana 三部分組成。
Logstash
Logstash 主要用於收集服務器日誌,它是一個開源數據收集引擎,具有實時管道功能。Logstash 可以動態地將來自不同數據源的數據統一起來,並將數據標準化到您所選擇的目的地。
Logstash 收集數據的過程主要分為以下三個部分:
- 輸入:數據(包含但不限於日誌)往往都是以不同的形式、格式存儲在不同的系統中,而 Logstash 支持從多種數據源中收集數據(File、Syslog、MySQL、消息中間件等等)。
- 過濾器:實時解析和轉換數據,識別已命名的字段以構建結構,並將它們轉換成通用格式。
- 輸出:Elasticsearch 並非存儲的唯一選擇,Logstash 提供很多輸出選擇。
Elasticsearch
Elasticsearch (ES)是一個分佈式的 Restful 風格的搜索和數據分析引擎,它具有以下特點:
- 查詢:允許執行和合並多種類型的搜索 — 結構化、非結構化、地理位置、度量指標 — 搜索方式隨心而變。
- 分析:Elasticsearch 聚合讓您能夠從大處着眼,探索數據的趨勢和模式。
- 速度:很快,可以做到億萬級的數據,毫秒級返回。
- 可擴展性:可以在筆記本電腦上運行,也可以在承載了 PB 級數據的成百上千台服務器上運行。
- 彈性:運行在一個分佈式的環境中,從設計之初就考慮到了這一點。
- 靈活性:具備多個案例場景。支持數字、文本、地理位置、結構化、非結構化,所有的數據類型都歡迎。
Kibana
Kibana 可以使海量數據通俗易懂。它很簡單,基於瀏覽器的界面便於您快速創建和分享動態數據儀表板來追蹤 Elasticsearch 的實時數據變化。其搭建過程也十分簡單,您可以分分鐘完成 Kibana 的安裝並開始探索 Elasticsearch 的索引數據 — 沒有代碼、不需要額外的基礎設施。另外,歡迎關注公眾號碼猿技術專欄,後台回覆“9527”,送你一份Spring Cloud Aliababa實戰視頻!
對於以上三個組件在 《ELK 協議棧介紹及體系結構》 一文中有具體介紹,這裏不再贅述。
在 ELK 中,三大組件的大概工作流程如下圖所示,由 Logstash 從各個服務中採集日誌並存放至 Elasticsearch 中,然後再由 Kiabana 從 Elasticsearch 中查詢日誌並展示給終端用户。
圖 1. ELK 的大致工作流程
ELK 實現方案
通常情況下我們的服務都部署在不同的服務器上,那麼如何從多台服務器上收集日誌信息就是一個關鍵點了。本篇文章中提供的解決方案如下圖所示:
圖 2. 本文提供的 ELK 實現方案
如上圖所示,整個 ELK 的運行流程如下:
- 在微服務(產生日誌的服務)上部署一個 Logstash,作為 Shipper 角色,主要負責對所在機器上的服務產生的日誌文件進行數據採集,並將消息推送到 Redis 消息隊列。
- 另用一台服務器部署一個 Indexer 角色的 Logstash,主要負責從 Redis 消息隊列中讀取數據,並在 Logstash 管道中經過 Filter 的解析和處理後輸出到 Elasticsearch 集羣中存儲。
- Elasticsearch 主副節點之間數據同步。
- 單獨一台服務器部署 Kibana 讀取 Elasticsearch 中的日誌數據並展示在 Web 頁面。
通過這張圖,相信您已經大致清楚了我們將要搭建的 ELK 平台的工作流程,以及所需組件。下面就讓我們一起開始搭建起來吧。
ELK 平台搭建
本節主要介紹搭建 ELK 日誌平台,包括安裝 Indexer 角色的 Logstash,Elasticsearch 以及 Kibana 三個組件。完成本小節,您需要做如下準備:
- 一台 Ubuntu 機器或虛擬機,作為入門教程,此處省略了 Elasticsearch 集羣的搭建,且將 Logstash(Indexer)、Elasticsearch 以及 Kibana 安裝在同一機器上。
- 在 Ubuntu 上安裝 JDK,注意 Logstash 要求 JDK 在 1.7 版本以上。
- Logstash、Elasticsearch、Kibana 安裝包,您可以在 此頁面 下載。
安裝 Logstash
解壓壓縮包:
tar -xzvf logstash-7.3.0.tar.gz
顯示更多簡單用例測試,進入到解壓目錄,並啓動一個將控制枱輸入輸出到控制枱的管道。
cd logstash-7.3.0
elk@elk:~/elk/logstash-7.3.0$ bin/logstash -e 'input { stdin {} } output { { stdout {} } }'
顯示更多看到如下日誌就意味着 Logstash 啓動成功。
圖 3. Logstash 啓動成功日誌
在控制枱輸入 Hello Logstash ,看到如下效果代表 Logstash 安裝成功。
清單 1. 驗證 Logstash 是否啓動成功Hello Logstash
{
"@timestamp" => 2019-08-10T16:11:10.040Z,
"host" => "elk",
"@version" => "1",
"message" => "Hello Logstash"
}
安裝 Elasticsearch
解壓安裝包:
tar -xzvf elasticsearch-7.3.0-linux-x86_64.tar.gz
啓動 Elasticsearch:
cd elasticsearch-7.3.0/
bin/elasticsearch
在啓動 Elasticsearch 的過程中我遇到了兩個問題在這裏列舉一下,方便大家排查。
問題一 :內存過小,如果您的機器內存小於 Elasticsearch 設置的值,就會報下圖所示的錯誤。解決方案是,修改 elasticsearch-7.3.0/config/jvm.options 文件中的如下配置為適合自己機器的內存大小,若修改後還是報這個錯誤,可重新連接服務器再試一次。
圖 4. 內存過小導致 Elasticsearch 啓動報錯
問題二 ,如果您是以 root 用户啓動的話,就會報下圖所示的錯誤。解決方案自然就是添加一個新用户啓動 Elasticsearch,至於添加新用户的方法網上有很多,這裏就不再贅述。
圖 5. Root 用户啓動 Elasticsearch 報錯
啓動成功後,另起一個會話窗口執行 curl http://localhost:9200 命令,如果出現如下結果,則代表 Elasticsearch 安裝成功。
清單 2. 檢查 Elasticsearch 是否啓動成功
elk@elk:~$ curl http://localhost:9200
{
"name" : "elk",
"cluster_name" : "elasticsearch",
"cluster_uuid" : "hqp4Aad0T2Gcd4QyiHASmA",
"version" : {
"number" : "7.3.0",
"build_flavor" : "default",
"build_type" : "tar",
"build_hash" : "de777fa",
"build_date" : "2019-07-24T18:30:11.767338Z",
"build_snapshot" : false,
"lucene_version" : "8.1.0",
"minimum_wire_compatibility_version" : "6.8.0",
"minimum_index_compatibility_version" : "6.0.0-beta1"
},
"tagline" : "You Know, for Search"
}
安裝 Kibana
解壓安裝包:
tar -xzvf kibana-7.3.0-linux-x86_64.tar.gz
修改配置文件 config/kibana.yml ,主要指定 Elasticsearch 的信息。
清單 3. Kibana 配置信息#Elasticsearch主機地址
elasticsearch.hosts: "http://ip:9200"
# 允許遠程訪問
server.host: "0.0.0.0"
# Elasticsearch用户名 這裏其實就是我在服務器啓動Elasticsearch的用户名
elasticsearch.username: "es"
# Elasticsearch鑑權密碼 這裏其實就是我在服務器啓動Elasticsearch的密碼
elasticsearch.password: "es"
啓動 Kibana:
cd kibana-7.3.0-linux-x86_64/bin
./kibana
在瀏覽器中訪問 http://ip:5601 ,若出現以下界面,則表示 Kibana 安裝成功。
圖 6. Kibana 啓動成功界面
ELK 日誌平台安裝完成後,下面我們就將通過具體的例子來看下如何使用 ELK,下文將分別介紹如何將 Spring Boot 日誌和 Nginx 日誌交由 ELK 分析。
在 Spring Boot 中使用 ELK
首先我們需要創建一個 Spring Boot 的項目,之前我寫過一篇文章介紹 如何使用 AOP 來統一處理 Spring Boot 的 Web 日誌 ,本文的 Spring Boot 項目就建立在這篇文章的基礎之上。
修改並部署 Spring Boot 項目
在項目 resources 目錄下創建 spring-logback.xml 配置文件。
清單 4. Spring Boot 項目 Logback 的配置
<?xml version="1.0" encoding="UTF-8"?>
<configuration debug="false">
<contextName>Logback For demo Mobile</contextName>
<property name="LOG_HOME" value="/log" />
<springProperty scope="context" name="appName" source="spring.application.name"
defaultValue="localhost" />
...
<appender name="ROLLING_FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">
...
<encoder class="ch.qos.logback.classic.encoder.PatternLayoutEncoder">
<pattern>%d{yyyy-MM-dd HH:mm:ss.SSS} [%thread] %-5level %logger{25} ${appName} -%msg%n</pattern>
</encoder>
...
</appender>
...
</configuration>
以上內容省略了很多內容,您可以在源碼中獲取。在上面的配置中我們定義了一個名為 ROLLING_FILE 的 Appender 往日誌文件中輸出指定格式的日誌。而上面的 pattern 標籤正是具體日誌格式的配置,通過上面的配置,我們指定輸出了時間、線程、日誌級別、logger(通常為日誌打印所在類的全路徑)以及服務名稱等信息。
將項目打包,並部署到一台 Ubuntu 服務器上。
清單 5. 打包並部署 Spring Boot 項目
# 打包命令
mvn package -Dmaven.test.skip=true
# 部署命令
java -jar sb-elk-start-0.0.1-SNAPSHOT.jar
查看日誌文件, logback 配置文件中我將日誌存放在 /log/sb-log.log 文件中,執行 more /log/sb-log.log 命令,出現以下結果表示部署成功。
圖 7. Spring Boot 日誌文件
配置 Shipper 角色 Logstash
Spring Boot 項目部署成功之後,我們還需要在當前部署的機器上安裝並配置 Shipper 角色的 Logstash。Logstash 的安裝過程在 ELK 平台搭建小節中已有提到,這裏不再贅述。
安裝完成後,我們需要編寫 Logstash 的配置文件,以支持從日誌文件中收集日誌並輸出到 Redis 消息管道中,Shipper 的配置如下所示。
清單 6. Shipper 角色的 Logstash 的配置
input {
file {
path => [
# 這裏填寫需要監控的文件
"/log/sb-log.log"
]
}
}
output {
# 輸出到redis
redis {
host => "10.140.45.190" # redis主機地址
port => 6379 # redis端口號
db => 8 # redis數據庫編號
data_type => "channel" # 使用發佈/訂閲模式
key => "logstash_list_0" # 發佈通道名稱
}
}
其實 Logstash 的配置是與前面提到的 Logstash 管道中的三個部分(輸入、過濾器、輸出)一一對應的,只不過這裏我們不需要過濾器所以就沒有寫出來。上面配置中 Input 使用的數據源是文件類型的,只需要配置上需要收集的本機日誌文件路徑即可。Output 描述數據如何輸出,這裏配置的是輸出到 Redis。
Redis 的配置 data_type 可選值有 channel 和 list 兩個。channel 是 Redis 的發佈/訂閲通信模式,而 list 是 Redis 的隊列數據結構,兩者都可以用來實現系統間有序的消息異步通信。
channel 相比 list 的好處是,解除了發佈者和訂閲者之間的耦合。舉個例子,一個 Indexer 在持續讀取 Redis 中的記錄,現在想加入第二個 Indexer,如果使用 list ,就會出現上一條記錄被第一個 Indexer 取走,而下一條記錄被第二個 Indexer 取走的情況,兩個 Indexer 之間產生了競爭,導致任何一方都沒有讀到完整的日誌。
channel 就可以避免這種情況。這裏 Shipper 角色的配置文件和下面將要提到的 Indexer 角色的配置文件中都使用了 channel 。
配置 Indexer 角色 Logstash
配置好 Shipper 角色的 Logstash 後,我們還需要配置 Indexer 角色 Logstash 以支持從 Redis 接收日誌數據,並通過過濾器解析後存儲到 Elasticsearch 中,其配置內容如下所示。
清單 7. Indexer 角色的 Logstash 的配置
input {
redis {
host => "192.168.142.131" # redis主機地址
port => 6379 # redis端口號
db => 8 # redis數據庫編號
data_type => "channel" # 使用發佈/訂閲模式
key => "sb-logback" # 發佈通道名稱
}
}
filter {
#定義數據的格式
grok {
match => { "message" => "%{TIMESTAMP_ISO8601:time} \[%{NOTSPACE:threadName}\] %{LOGLEVEL:level} %{DATA:logger} %{NOTSPACE:applicationName} -(?:.*=%{NUMBER:timetaken}ms|)"}
}
}
output {
stdout {}
elasticsearch {
hosts => "localhost:9200"
index => "logback"
}
}
與 Shipper 不同的是,Indexer 的管道中我們定義了過濾器,也正是在這裏將日誌解析成結構化的數據。下面是我截取的一條 logback 的日誌內容:
清單 8. Spring Boot 項目輸出的一條日誌
2019-08-11 18:01:31.602 [http-nio-8080-exec-2] INFO c.i.s.aop.WebLogAspect sb-elk -接口日誌
POST請求測試接口結束調用:耗時=11ms,result=BaseResponse{code=10000, message='操作成功'}
在 Filter 中我們使用 Grok 插件從上面這條日誌中解析出了時間、線程名稱、Logger、服務名稱以及接口耗時幾個字段。Grok 又是如何工作的呢?
- message 字段是 Logstash 存放收集到的數據的字段, match = {"message" => ...} 代表是對日誌內容做處理。
- Grok 實際上也是通過正則表達式來解析數據的,上面出現的 TIMESTAMP_ISO8601 、 NOTSPACE 等都是 Grok 內置的 patterns。
- 我們編寫的解析字符串可以使用 Grok Debugger 來測試是否正確,這樣避免了重複在真實環境中校驗解析規則的正確性。
查看效果
經過上面的步驟,我們已經完成了整個 ELK 平台的搭建以及 Spring Boot 項目的接入。下面我們按照以下步驟執行一些操作來看下效果。
啓動 Elasticsearch,啓動命令在 ELK 平台搭建 小節中有提到,這裏不贅述(Kibana 啓動同)。啓動 Indexer 角色的 Logstash。
# 進入到 Logstash 的解壓目錄,然後執行下面的命令
bin/logstash -f indexer-logstash.conf
啓動 Kibana。
啓動 Shipper 角色的 Logstash。
# 進入到 Logstash 的解壓目錄,然後執行下面的命令
bin/logstash -f shipper-logstash.conf
調用 Spring Boot 接口,此時應該已經有數據寫入到 ES 中了。
在瀏覽器中訪問 http://ip:5601 ,打開 Kibana 的 Web 界面,並且如下圖所示添加 logback 索引。
圖 8. 在 Kibana 中添加 Elasticsearch 索引
進入 Discover 界面,選擇 logback 索引,就可以看到日誌數據了,如下圖所示。
圖 9. ELK 日誌查看
在 Nginx 中使用 ELK
相信通過上面的步驟您已經成功的搭建起了自己的 ELK 實時日誌平台,並且接入了 Logback 類型的日誌。但是實際場景下,幾乎不可能只有一種類型的日誌,下面我們就再在上面步驟的基礎之上接入 Nginx 的日誌。
當然這一步的前提是我們需要在服務器上安裝 Nginx,具體的安裝過程網上有很多介紹,這裏不再贅述。查看 Nginx 的日誌如下(Nginx 的訪問日誌默認在 /var/log/nginx/access.log 文件中)。
清單 9. Nginx 的訪問日誌
192.168.142.1 - - [17/Aug/2019:21:31:43 +0800] "GET /weblog/get-test?name=elk HTTP/1.1"
200 3 "http://192.168.142.131/swagger-ui.html" "Mozilla/5.0 (Windows NT 10.0; Win64; x64)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36"
同樣,我們需要為此日誌編寫一個 Grok 解析規則,如下所示:
清單 10. 針對 Nginx 訪問日誌的 Grok 解析規則
%{IPV4:ip} \- \- \[%{HTTPDATE:time}\] "%{NOTSPACE:method} %{DATA:requestUrl}
HTTP/%{NUMBER:httpVersion}" %{NUMBER:httpStatus} %{NUMBER:bytes}
"%{DATA:referer}" "%{DATA:agent}"
完成上面這些之後的關鍵點是 Indexer 類型的 Logstash 需要支持兩種類型的輸入、過濾器以及輸出,如何支持呢?首先需要給輸入指定類型,然後再根據不同的輸入類型走不同的過濾器和輸出,如下所示。
清單 11. 支持兩種日誌輸入的 Indexer 角色的 Logstash 配置
input {
redis {
type => "logback"
...
}
redis {
type => "nginx"
...
}
}
filter {
if [type] == "logback" {
...
}
if [type] == "nginx" {
...
}
}
output {
if [type] == "logback" {
...
}
if [type] == "nginx" {
...
}
}
我的 Nginx 與 Spring Boot 項目部署在同一台機器上,所以還需修改 Shipper 類型的 Logstash 的配置以支持兩種類型的日誌輸入和輸出,其配置文件的內容可 點擊這裏獲取。
以上配置完成後,我們按照 查看效果 章節中的步驟,啓動 ELK 平台、Shipper 角色的 Logstash、Nginx 以及 Spring Boot 項目,然後在 Kibana 上添加 Nignx 索引後就可同時查看 Spring Boot 和 Nginx 的日誌了,如下圖所示。
圖 10. ELK 查看 Nginx 日誌
ELK 啓動
在上面的步驟中,ELK 的啓動過程是我們一個一個的去執行三大組件的啓動命令的。而且還是在前台啓動的,意味着如果我們關閉會話窗口,該組件就會停止導致整個 ELK 平台無法使用,這在實際工作過程中是不現實的,我們剩下的問題就在於如何使 ELK 在後台運行。
根據 《Logstash 最佳實踐》 一書的推薦,我們將使用 Supervisor 來管理 ELK 的啓停。首先我們需要安裝 Supervisor,在 Ubuntu 上執行 apt-get install supervisor 即可。安裝成功後,我們還需要在 Supervisor 的配置文件中配置 ELK 三大組件(其配置文件默認為 /etc/supervisor/supervisord.conf 文件)。
清單 12. ELK 後台啓動
[program:elasticsearch]
environment=JAVA_HOME="/usr/java/jdk1.8.0_221/"
directory=/home/elk/elk/elasticsearch
user=elk
command=/home/elk/elk/elasticsearch/bin/elasticsearch
[program:logstash]
environment=JAVA_HOME="/usr/java/jdk1.8.0_221/"
directory=/home/elk/elk/logstash
user=elk
command=/home/elk/elk/logstash/bin/logstash -f /home/elk/elk/logstash/indexer-logstash.conf
[program:kibana]
environment=LS_HEAP_SIZE=5000m
directory=/home/elk/elk/kibana
user=elk
command=/home/elk/elk/kibana/bin/kibana
按照以上內容配置完成後,執行 sudo supervisorctl reload 即可完成整個 ELK 的啓動,而且其默認是開機自啓。當然,我們也可以使用 sudo supervisorctl start/stop [program_name] 來管理單獨的應用。另外,歡迎關注公眾號碼猿技術專欄,後台回覆“9527”,送你一份Spring Cloud Aliababa實戰視頻!
結束語
在本教程中,我們主要了解了什麼是 ELK,然後通過實際操作和大家一起搭建了一個 ELK 日誌分析平台,並且接入了 Logback 和 Nginx 兩種日誌。
最後説一句(別白嫖,求關注)
陳某每一篇文章都是精心輸出,如果這篇文章對你有所幫助,或者有所啓發的話,幫忙點贊、在看、轉發、收藏,你的支持就是我堅持下去的最大動力!