簡介
可用性監測是觀測雲提供的綜合性在線服務監控方案。它通過創建無需編寫代碼的 API,利用全球分佈的監測點模擬真實用户在不同地區和網絡環境下的訪問體驗。這種監測不僅涵蓋網絡質量、網站性能、關鍵端點等關鍵業務場景,還提供了對用户使用體驗等多維度性能指標的週期性監控。
應用場景
- 多協議支持:基於 HTTP、TCP、ICMP、WEBSOCKET 協議創建撥測任務,多方面主動監控在線業務的可用性和性能;
- 全球網絡監控:利用觀測雲遍佈全球的監測點,即時監測網絡性能,保障全球服務的可用性和性能表現;
- 網絡站點訪問性能分析:從地理緯度和可用性趨勢兩個方面,分析網絡站點的可用性性能;
- 實時告警通知:基於撥測任務產生的數據配置告警規則,當業務出現異常,會基於規則以郵件、釘釘機器人等方式發送告警通知。
實踐步驟
1、創建撥測任務
- 在觀測雲的「可用性監測」功能中,新建撥測任務,這裏以 API 撥測為例。
- 選擇撥測類型,填寫目標 URL 和判斷條件。
- 按需選擇發送撥測的節點,以及撥測頻率,點擊保存即可。
2、查看效果
等撥測頻率觸發後,即可在「可用性監測」的概覽和查看器中,即可查看到詳細的結果。
3、設置告警監控
當我們希望撥測結果有異常時,能主動告警通知到相關的負責人;我們可以設置監控器來解決這個問題。
3.1 新建可用性數據檢測
在觀測雲的「監控」功能中,新建監控器,選擇“可用性數據檢測”。
3.2 填寫檢測配置
按需填寫檢測頻率、檢測區間、以及觸發的規則。這裏表示響應時間大於 100ms 就告警。更多詳情,可參考規則配置。
3.3 自定義通知內容
觀測雲支持自定義告警通知的標題和內容,並且可以使用預置的模板變量。
3.4 選擇告警策略
監控滿足觸發條件後,支持將告警消息發送給指定的通知對象。通知對象包括但不限於:釘釘機器人、企業微信機器人、飛書機器人、Webhook 自定義、短信組、簡單 HTTP 請求、Slack、Teams、電話、IM 消息發送等等
3.5 查看告警結果
告警觸發後,相關通知對象就會收到告警信息,以下是釘釘機器人的告警信息: