CDH的HDFS DataNODE修改了參數之後,重啓又會回退之前的配置狀態,日誌裏面的關鍵日誌是:
根據日誌中Permission denied錯誤和健康檢查禁用狀態,結合Cloudera Manager的運行機制,以下是系統性解決方案:
一、核心問題分析
- 權限拒絕根源
Can't open /var/run/cloudera-scm-agent/process/23545-hdfs-DATANODE/supervisor_status: Permission denied表明:
- Cloudera Manager Agent進程(通常以
root運行)在生成配置文件時,目標目錄/var/run/cloudera-scm-agent/process/23545-hdfs-DATANODE的權限不足 - DataNode進程(以
hdfs用户運行)後續無法讀取生成的配置文件
- 健康檢查禁用原因
DataNode進程因權限問題未能正常啓動,觸發Cloudera Manager的保護機制自動禁用健康檢查
解決方案:
cd /var/run/cloudera-scm-agent/process
mv 23545-hdfs-DATANODE 23545-hdfs-DATANODEBAK
重啓datanode節點
重新生成23545-hdfs-DATANODE文件
以下是節點全部正常