博客 / 詳情

返回

龍蜥白皮書精選:SysAK—大規模複雜場景的系統運維利器

文/系統運維 SIG

01 概述

SysAK(System Analyse Kit)是龍蜥社區系統運維 SIG,通過對過往百萬服務器運維經驗進行抽象總結,而提供的一個全方位的系統運維工具集,可以覆蓋系統的日常監控、線上問題診斷和系統故障修復等常見運維場景。工具的整體設計上,力圖讓運維工作迴歸簡單,讓系統運維人員不需要深入瞭解內核就能找出問題的所在。

02 技術方案

SysAK 在功能集上會進行全方位覆蓋,垂直打通整個應用的生命週期。當前工具支持監控和診斷兩種模式。其中監控模式下 SysAK 常駐後台,為運維人員提供系統的各項指標。而診斷模式隨用隨啓,主要用於分析不同運維場景下的系統現象診斷與程序控制等。其整體功能如下圖所示:

圖片.png

SysAK 不僅限於一個工具集,除了提供系統運維工具本身外,還設計實現了一套工具開發框架。並通過鬆散耦合、依賴管理、多架 構多版本的構建支持等方式,保障了工具開發者,一次開發,無需額外工作,就能在主流的架構和操作系統版本上集成。其整體結構如下圖所示:

圖片.png

03 應用場景

SysAK 提供的診斷工具可滿足不同應用場景的運維需求:

  • 日常監控:針對各種系統資源更精細化的資源監控,幫助業務運維實現細粒度的運維調度和資源控制。除此之外,還實現了許多增 強的系統指標,實時監控系統的干擾和抖動等情況。
  • 問題診斷:針對負載異常、網絡抖動、內存泄漏、IO 夯、性能異常等情況提供線上診斷功能。同時減少工具的專業性,可操作性強。
  • 故障修復:對於非整機異常的問題(例如死鎖、夯機等), 該工具提供介入能力對系統進行恢復或故障隔離。

更多龍蜥白皮書精選內容,點擊這裏查看。

相關鏈接:

系統運維 SIG 主頁:https://openanolis.cn/sig/sysom

更多龍蜥技術特性解析可移步《龍蜥特性百科》:https://anolis.gitee.io/anolis_features/

2022 龍蜥社區全景白皮書(或公眾號【OpenAnolis龍蜥】回覆關鍵字“白皮書”獲取)https://openanolis.cn/openanoliswhitepaper

—— 完 ——

user avatar
0 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.