Hadoop HDFS操作詳情 - hadoop,hdfs,大數據,hdfs,HDFS,Python,後端開發技術極客俠博客

在大數據領域，Hadoop HDFS（分佈式文件系統）是最核心的存儲組件之一。本文將詳細介紹HDFS的集羣管理命令和文件操作技巧，幫助您快速掌握Hadoop的日常運維。

一、HDFS集羣一鍵啓停

Hadoop HDFS組件內置了便捷的一鍵啓停腳本，極大簡化了集羣管理流程。

啓動集羣

$HADOOP_HOME/sbin/start-dfs.sh

執行原理：

在執行此腳本的機器上啓動SecondaryNameNode
讀取core-site.xml中的fs.defaultFS配置，確認NameNode所在機器並啓動NameNode
讀取workers文件內容，確認所有DataNode節點並啓動全部DataNode

關閉集羣

$HADOOP_HOME/sbin/stop-dfs.sh

執行原理：

在執行此腳本的機器上關閉SecondaryNameNode
讀取core-site.xml配置，確認NameNode所在機器並關閉NameNode
讀取workers文件內容，確認所有DataNode節點並關閉全部DataNode

二、單進程精細控制

除了一鍵啓停外，Hadoop還提供了單進程控制能力，便於故障排查和精細管理。

方法一：使用hadoop-daemon.sh腳本

# 控制所在機器的單個進程
$HADOOP_HOME/sbin/hadoop-daemon.sh (start|status|stop) (namenode|secondarynamenode|datanode)

方法二：使用hdfs程序

# 更現代的控制方式
hdfs --daemon (start|status|stop) (namenode|secondarynamenode|datanode)

使用示例：

# 啓動本機DataNode
hdfs --daemon start datanode

# 檢查NameNode狀態
hdfs --daemon status namenode

# 停止SecondaryNameNode
hdfs --daemon stop secondarynamenode

三、HDFS文件系統操作

命令工具選擇

HDFS提供了兩種等效的命令行工具：

hadoop fs- 通用文件系統命令
hdfs dfs- 專門針對HDFS的命令

文件系統協議理解

file://- 表示Linux本地文件系統
hdfs://namenode_server:port/- 表示HDFS分佈式文件系統

例如：

完整格式：hdfs://node:8020/user/data
簡化格式：/user/data（協議頭可省略）

常用命令大全

目錄操作

# 創建目錄
hdfs dfs -mkdir /user/data

# 遞歸創建多級目錄
hdfs dfs -mkdir -p /user/data/input

文件查看

# 列出目錄內容
hdfs dfs -ls /user/data

# 查看文件內容
hdfs dfs -cat /user/data/file.txt

文件管理

# 複製文件
hdfs dfs -cp /source/file.txt /destination/

# 移動文件
hdfs dfs -mv /old/location /new/location

# 刪除文件
hdfs dfs -rm /user/data/file.txt

# 遞歸刪除目錄
hdfs dfs -rm -r /user/data/old_dir

數據傳輸

# 上傳本地文件到HDFS
hdfs dfs -put localfile.txt /user/data/

# 從HDFS下載文件到本地
hdfs dfs -get /user/data/file.txt ./

文件內容追加

# 向HDFS文件追加內容
hdfs dfs -appendToFile local_add.txt /user/data/target.txt

四、Web UI可視化操作

除了命令行操作外，HDFS還提供了友好的Web管理界面：

訪問NameNode的Web UI（默認端口：9870）
進行文件的瀏覽、上傳、下載、刪除等操作
查看集羣狀態和存儲情況

實用建議

生產環境建議：使用單進程控制進行維護，避免整個集羣停機
權限管理：注意HDFS的權限控制，合理設置目錄權限
路徑規範：建議使用絕對路徑，避免操作錯誤
操作確認：刪除操作前務必確認路徑，可使用-ls先查看內容

掌握這些命令和技巧，您就能高效地管理Hadoop HDFS集羣並進行日常文件操作。無論是集羣運維還是數據分析，這些基礎技能都將為您的工作帶來極大便利。

提示：具體命令路徑可能因Hadoop版本而異，請根據實際安裝環境調整。

本文章為轉載內容，我們尊重原作者對文章享有的著作權。如有內容錯誤或侵權問題，歡迎原作者聯繫我們進行內容更正或刪除文章。

技術極客俠博客

技術極客俠博客

博客 / 詳情

Hadoop HDFS操作

一、HDFS集羣一鍵啓停

啓動集羣

關閉集羣

二、單進程精細控制

方法一：使用hadoop-daemon.sh腳本

方法二：使用hdfs程序

三、HDFS文件系統操作

命令工具選擇

文件系統協議理解

常用命令大全

目錄操作

文件查看

文件管理

數據傳輸

文件內容追加

四、Web UI可視化操作

實用建議

發佈評論

Product

Company

Support

Company

博客 / 詳情

Hadoop HDFS操作

一、HDFS集羣一鍵啓停

啓動集羣

關閉集羣

二、單進程精細控制

方法一：使用hadoop-daemon.sh腳本

方法二：使用hdfs程序

三、HDFS文件系統操作

命令工具選擇

文件系統協議理解

常用命令大全

目錄操作

文件查看

文件管理

數據傳輸

文件內容追加

四、Web UI可視化操作

實用建議

發佈 評論

發佈評論