隨着企業數字化轉型的深入推進,雲原生架構 已成為現代應用構建的主流選擇。 在大數據處理、AI 大模型訓推等業務場景中,如何實現高效彈性數據資源管理與調度,已成為雲原生落地的關鍵挑戰之一。
近日,雲原生數據編排與加速平台 Fluid 正式入駐青雲 KubeSphere Marketplace,為企業用户提供統一、高效的數據訪問與緩存管理能力,共同打造面向未來的數據驅動新範式。
Fluid + KubeSphere:原生集成,釋放數據價值
Fluid 是一個開源的雲原生數據編排與加速平台,基於 Kubernetes 構建。通過數據緩存與智能調度優化,Fluid 能顯著提升 AI 訓練、大數據分析等場景下的數據訪問性能。
此次通過CCF GitLink編程夏令營(GLCC)平台提供的開源開發力量(開發者:林福濤,項目導師:顧榮) 以 擴展組件 的形式入駐 KubeSphere Marketplace,不僅進一步 降低了部署門檻,還增強了與 Kubernetes 場景的深度適配,幫助企業以更低成本構建統一的數據編排與加速體系。
藉助 KubeSphere 圖形化控制枱,用户可一鍵安裝並完成配置,實現 可視化的數據緩存管理 與 運維自動化。
擴展組件介紹
- 組件名稱:Fluid
- 功能定位:雲原生數據編排與加速核心組件
- 組件鏈接:點擊訪問 Fluid 擴展組件頁面
Fluid 通過 Dataset 抽象層 統一管理多類型數據源,並結合緩存運行時(如 Alluxio、JuiceFS、JindoFS 等)實現高性能數據訪問。
它具備以下核心能力:
✅ 自動緩存調度:根據計算任務與數據訪問模式動態調整緩存佈局,減少跨節點 I/O。
✅ 數據親和性調度:讓計算更靠近數據執行,最大化節點本地緩存命中率。
✅ 緩存預熱與複用:提前加載熱點數據,支持不同任務間緩存共享,提升資源利用率。
✅ 多數據源編排:支持同時掛載 HDFS、OSS、S3、Ceph、NFS 等異構存儲,實現統一訪問接口。
這些特性能極大地提升 AI 模型訓練 與 大數據分析 的數據訪問效率,為雲原生數據架構注入強勁動力。
快速部署指南
環境準備
使用 KubeSphere 企業版 或 KubeSphere 社區版,即可通過控制枱完成 Fluid 的快速部署。 詳細安裝文檔請參考:
👉 KubeSphere 安裝指南
值得一提的是,KubeSphere 社區版與企業版之間支持無縫遷移,用户在完成社區版部署後,僅需更換 License 即可升級為企業版,無需重新安裝或中斷現有服務。
安裝步驟
第一步:進入擴展市場
登錄 KubeSphere 控制枱,依次點擊「工作台」→「擴展組件」,搜索關鍵詞 Fluid。
第二步:安裝擴展組件
點擊進入 Fluid 組件詳情頁,點擊“安裝”。
系統將自動部署相關資源,包括 Fluid Controller、核心 CRD 以及 緩存運行時組件。
第三步:訪問 Fluid 控制枱
部署完成後,可通過控制枱左上角的 Fluid 插件入口直接訪問 Fluid 控制界面,進行數據緩存與加速管理。
更多上手指南請參考: 👉 Fluid 官方快速入門
Fluid 應用場景
1. AI 與大模型訓練
在 AI 訓練場景中,數據分佈廣、訪問頻繁。Fluid 能為訓練節點提供近似本地磁盤的訪問性能,有效提升訓練效率並降低 I/O 等待時間。
2. 大數據分析
對於 Spark、Presto、Flink 等計算引擎,Fluid 通過緩存共享機制減少重複拉取數據的成本,顯著縮短作業執行時長。
3. 科學計算與仿真
在 HPC 場景中,Fluid 讓計算節點共享高速緩存層,突破傳統存儲性能瓶頸,實現更快的數據流轉與任務迭代。
4. 多雲與混合雲數據訪問
Fluid 支持跨集羣數據編排,使企業能夠在多雲環境下實現一致的數據訪問體驗與智能調度策略。
結語
Fluid 入駐 KubeSphere Marketplace,標誌着雲原生數據編排與加速能力的生態化發展邁出關鍵一步。 未來,KubeSphere 將攜手社區夥伴,持續推動開源生態的協同創新,助力更多企業構建高效、智能、可持續的雲原生數據基礎設施。
關於 Fluid
Fluid是一個開源的、原生Kubernetes的分佈式數據集編排器和加速器,適用於大數據和人工智能等數據密集型應用。它由南京大學、阿里雲、Alluxio聯合發起,併成功進入雲原生計算基金會(CNCF)作為沙盒項目託管。Fluid能夠通過支持數據集操作,將分佈式緩存系統(如Alluxio和JuiceFS)轉換為具有自我管理、彈性伸縮和自我修復能力的可觀測緩存服務。同時,通過數據緩存位置信息,Fluid可以為使用數據集的應用程序提供數據親和性調度。
網站地址:https://fluid-cloudnative.github.io/
Fluid研究論文: Rong Gu, Kai Zhang, Zhihao Xu, et al. Fluid: Dataset Abstraction and Elastic Acceleration for Cloud-native Deep Learning Training Jobs. IEEE ICDE, pp. 2183-2196, May, 2022.
關於 KubeSphere
KubeSphere 是領先的雲原生核心服務商青雲科技於 2018 年推出的容器管理平台,致力於打造一個以 Kubernetes 為內核的雲原生分佈式操作系統,幫助企業快速構建健壯的容器雲平台。目前,KubeSphere 逐步打造了完善的企業級雲原生產品家族,並已服務來自金融、運營商、製造、能源、物流、教育等領域的上千家企業客户。
網站地址:https://kubesphere.io/zh/