動態

詳情 返回 返回

阿里雲 RDS PostgreSQL 可觀測最佳實踐 - 動態 詳情

阿里雲 RDS PostgreSQL

阿里雲RDS PostgreSQL 是阿里雲提供的一種穩定、可靠、可擴展的關係型數據庫服務,基於開源對象-關係型數據庫 PostgreSQL 打造,兼容 SQL 標準,支持複雜查詢、事務處理、JSON 數據類型以及強大的擴展能力(如 PostGIS、hstore 等)。RDS PostgreSQL 提供全自動的主備高可用架構,支持跨可用區部署,確保業務連續性。用户無需關心底層運維,系統自動完成備份恢復、監控告警、性能優化和版本升級等操作。

該服務支持多種實例規格,可根據業務負載靈活調整配置,實現資源彈性伸縮。同時,集成阿里雲安全體系,提供網絡隔離、數據加密、訪問控制等多重安全防護,保障數據安全。RDS PostgreSQL 廣泛應用於金融、電商、地理信息、數據分析等對數據一致性與複雜查詢要求較高的場景。通過與 DTS、DBS 等阿里雲產品無縫集成,還可實現數據遷移、災備與讀寫分離,提升系統整體性能與可靠性。是企業構建現代化應用的理想數據庫平台之一。

觀測雲

觀測雲是一款專為 IT 工程師打造的全鏈路可觀測產品,它集成了基礎設施監控、應用程序性能監控和日誌管理,為整個技術棧提供實時可觀察性。這款產品能夠幫助工程師全面瞭解端到端的用户體驗追蹤,瞭解應用內函數的每一次調用,以及全面監控雲時代的基礎設施。此外,觀測雲還具備快速發現系統安全風險的能力,為數字化時代提供安全保障。

採集器配置

  1. 登錄觀測雲控制枱
  2. 點擊【集成】菜單
  3. 點擊【雲賬號管理】-【添加雲賬號】,選擇【阿里雲】
  4. 填寫界面所需的信息,如之前已配置過雲賬號信息,則忽略此步驟
  5. 點擊【測試】,測試成功後點擊【保存】,如果測試失敗,請檢查相關配置信息是否正確,並重新測試
  6. 點擊【雲賬號管理】列表上可以看到已經添加的雲賬號,點擊進入詳情頁
  7. 點擊【集成】按鈕,在未安裝列表下找到阿里雲 RDS PostgreSQL,點擊【安裝】按鈕,彈出安裝界面安裝即可。

關鍵指標

指標名 描述 單位
PG_DBAge PG_數據庫年齡 count
PG_InactiveSlots PG_非活躍複製槽數量 count
PG_MaxExecutingSQLTime PG_最慢SQL執行耗時 seconds
PG_MaxSlotWalDelay PG_最大複製槽延遲(MB) byte
PG_ReplayLatency PG_最慢Standby回放延遲(MB) byte
PG_SwellTime PG_最長事務執行耗時 seconds
active_connections_per_cpu PG_每CPU平均活躍連接數 count
conn_usgae PG_連接數使用率 %
cpu_usage PG_CPU使用率 %
five_seconds_executing_sqls PG_五秒慢SQL count
iops_usage PG_IOPS使用率 %
local_fs_inode_usage PG_INODE使用率 %
local_fs_size_usage PG_磁盤空間使用率 %
local_pg_wal_dir_size PG_WAL文件大小 MB
mem_usage PG_內存使用率 %
one_second_executing_sqls PG_一秒慢SQL count
three_seconds_executing_sqls PG_三秒慢SQL count

場景視圖

登錄觀測雲控制枱,點擊「場景」 -「新建儀表板」,輸入 阿里雲 RDS PostgreSQL, 選擇 “阿里雲 RDS PostgreSQL 監控視圖”,點擊 “確定” 即可添加視圖。

圖片

圖片

監控器

觀測雲內置了監控器模板,可以選擇從模版創建監控器,並開啓適合業務的監控器以及時通知相關成員關注問題,觸發條件、頻率等信息可以依據實際業務進行調整。

登錄觀測雲控制枱,點擊「監控」 -「官方模板庫」,輸入 “阿里雲 RDS PostgreSQL”, 選擇對應的監控器,點擊 “確定” 即可添加。

阿里雲 RDS PostgreSQL 內存告警

該告警配置針對阿里雲 PostgreSQL 數據庫的內存使用率進行監控,檢測頻率為每分鐘一次,檢測區間為最近 5 分鐘。當內存使用平均值持續高於 90% 時觸發嚴重告警,介於 80% 至 90% 時觸發重現告警,並支持連續觸發判斷機制,確保及時感知數據庫資源異常。

圖片

阿里雲 RDS PostgreSQL CPU告警

該告警配置針對阿里雲 PostgreSQL 數據庫的 CPU 使用率進行監控,檢測頻率為每分鐘 1 次,檢測區間為最近 5 分鐘。當 CPU 使用平均值持續高於 90% 時觸發嚴重告警,介於 80% 至 90% 時觸發重現告警,並支持連續觸發判斷機制,確保及時感知數據庫資源異常。

圖片

阿里雲 RDS PostgreSQL 告警

該告警配置針對阿里雲 PostgreSQL 數據庫的磁盤使用率進行監控,檢測頻率為每分鐘一次,檢測區間為最近 5 分鐘。當內存使用平均值持續高於 90% 時觸發嚴重告警,介於 80% 至 90% 時觸發重現告警,並支持連續觸發判斷機制,確保及時感知數據庫資源異常。

圖片

總結

觀測雲通過一站式採集阿里雲 RDS PostgreSQL 的關鍵指標(如 CPU、內存、連接數等),結合智能告警規則(如多級閾值、連續觸發判斷),實現對數據庫性能的分鐘級監控與異常快速定位。該實踐可幫助企業提升數據庫穩定性,降低運維成本,增強業務連續性,實現雲上資源的精細化管控與主動運維。

Add a new 評論

Some HTML is okay.