Stories

Detail Return Return

OurBMC大咖説 | 第13期:OurBMC社區聯手移動雲,破解雲環境BMC管理困局 - Stories Detail

欄目介紹:"OurBMC 大咖説" 是一個由 OurBMC 社區精心策劃的線上講座欄目,每期邀請一位 BMC 相關領域大咖共同探討 BMC 全棧技術的發展趨勢、挑戰和機遇。無論你是初學者還是資深從業者,"OurBMC 大咖説" 都將為你提供一個寶貴的學習和交流的平台。

快來關注 "OurBMC 大咖説" 吧!讓我們一起聆聽大咖們的智慧之聲,共同推動 BMC 全棧技術的進步和發展!

本期人物介紹:朱依新,中移(蘇州)軟件技術有限公司BMC項目經理。從事固件開發和管理7年,主要負責移動雲磐石服務器、DPU等項目的BMC固件開發與管理,參與多項BMC固件行業和團體標準制定。

BMC(基板管理控制器)作為硬件級管理的核心組件,其運行效率直接決定了數據中心運維的整體效能與業務的穩定。然而,在追求極致資源調度與自動化運營的雲環境中,我們長期面臨一些結構性挑戰:底層硬件資源的異構性與管理接口的多樣化,嚴重製約了上層的標準化與自動化推進。

差異化引發困局

  • 數據中心中服務器品牌與型號繁雜,各廠商BMC固件實現不一,導致底層代碼碎片化。這使得驗收團隊不得不為每一套BMC固件重複設計測試用例、搭建專用環境並執行全流程驗證。這種高度重複的驗收工作,不僅造成測試資源的浪費,也嚴重拖慢了整體業務的交付,成為項目快速部署業務的瓶頸之一。
  • 各廠商在redfish屬性實現顆粒度、告警精細化標準定義上存在差異。導致智能運維平台不得不投入大量人力資源進行繁瑣的兼容性開發與適配工作。這不僅提高了研發成本,更引入了潛在的運維風險,使智能化運維難以規模化落地。
  • 在功耗管理、安全機制及故障診斷(RAS)等核心功能上,各廠商實現標準與能力存在差異。這種底層能力的不均衡,直接破壞了運維體驗的一致性,使我們難以構建一個統一且可靠的運維基線,制約了大規模集羣的整體穩定性與可靠性

OurBMC的破局之道

面對這些挑戰,OurBMC開源社區為我們提供了一把關鍵鑰匙——它不僅僅是一個開源項目,更是我們構建下一代統一智能管理基座的共同藍圖與實踐平台。

  • OurBMC通過統一的代碼管理和完全開源的模式,構建了高質量、模塊化的核心代碼庫。基於此代碼基座,我們可以為不同硬件平台搭建出功能一致、質量可靠的BMC固件,徹底改變以往“一個項目一套代碼”的落後模式,將開發精力從低水平重複勞動中解放出來,聚焦於更高價值的創新。
  • 項目創新性地搭配E2000芯片及配套安全策略,實現了從硬件根信任到軟件棧的全鏈路安全加固。通過安全啓動、固件防篡改等機制,顯著提升了基礎設施的底層安全性。
  • 依託多廠商共同維護運營的機制,OurBMC實現了核心功能與接口的統一規範。這不僅極大方便了上層接口調用,更為上層軟件應用提供了統一的接口標準,從根本上解決了因廠商差異化帶來的集成複雜性和管理碎片化問題。

移動雲基於OurBMC的實踐

BMC安全啓動方案的落地,我們基於OurBMC架構,實現了從硬件信任根到操作系統的完整安全啓動鏈條,有效杜絕了固件級惡意代碼注入,為服務器提供了硬件級別的安全防護;

我們積極參與和推動了Redfish接口規範的開發工作,將我們的實際需求融入標準制定,從源頭推動管理接口的統一化與標準化。

同時基於OurBMC架構完成了自研磐石DPU的兼容性適配開發,實現了BMC對DPU卡的深度管理,為異構算力平台提供了統一智能管理能力。

展望未來

我們誠摯地邀請更多夥伴加入這一偉大征程,共同聚焦以下方向:

  • 推動標準共識:完善從硬件適配到上層接口的全棧規範體系。
  • 構建功能積木:沉澱更多高複用、高價值的通用功能模塊。
  • 夯實安全基座:共建從啓動鏈到通信鏈路的全方位可信安全體系。
  • 賦能智能運維:探索BMC與AI結合的故障預測與自治修復能力。

獨行快,眾行遠。讓我們在OurBMC社區中攜手,將分散的力量匯聚於一處,共同打造一個標準、統一、智能、可信的服務器管理新生態,為全球算力基礎設施的未來奠定堅實的基石。

user avatar binghe001 Avatar ucrx2py9 Avatar chenbimo Avatar maventalker Avatar cppfudaodeagan Avatar
Favorites 5 users favorite the story!
Favorites

Add a new Comments

Some HTML is okay.