阿里雲 RDS PostgreSQL
阿里雲RDS PostgreSQL 是阿里雲提供的一種穩定、可靠、可擴展的關係型數據庫服務,基於開源對象-關係型數據庫 PostgreSQL 打造,兼容 SQL 標準,支持複雜查詢、事務處理、JSON 數據類型以及強大的擴展能力(如 PostGIS、hstore 等)。RDS PostgreSQL 提供全自動的主備高可用架構,支持跨可用區部署,確保業務連續性。用户無需關心底層運維,系統自動完成備份恢復、監控告警、性能優化和版本升級等操作。
該服務支持多種實例規格,可根據業務負載靈活調整配置,實現資源彈性伸縮。同時,集成阿里雲安全體系,提供網絡隔離、數據加密、訪問控制等多重安全防護,保障數據安全。RDS PostgreSQL 廣泛應用於金融、電商、地理信息、數據分析等對數據一致性與複雜查詢要求較高的場景。通過與 DTS、DBS 等阿里雲產品無縫集成,還可實現數據遷移、災備與讀寫分離,提升系統整體性能與可靠性。是企業構建現代化應用的理想數據庫平台之一。
觀測雲
觀測雲是一款專為 IT 工程師打造的全鏈路可觀測產品,它集成了基礎設施監控、應用程序性能監控和日誌管理,為整個技術棧提供實時可觀察性。這款產品能夠幫助工程師全面瞭解端到端的用户體驗追蹤,瞭解應用內函數的每一次調用,以及全面監控雲時代的基礎設施。此外,觀測雲還具備快速發現系統安全風險的能力,為數字化時代提供安全保障。
採集器配置
- 登錄觀測雲控制枱
- 點擊【集成】菜單
- 點擊【雲賬號管理】-【添加雲賬號】,選擇【阿里雲】
- 填寫界面所需的信息,如之前已配置過雲賬號信息,則忽略此步驟
- 點擊【測試】,測試成功後點擊【保存】,如果測試失敗,請檢查相關配置信息是否正確,並重新測試
- 點擊【雲賬號管理】列表上可以看到已經添加的雲賬號,點擊進入詳情頁
- 點擊【集成】按鈕,在未安裝列表下找到阿里雲 RDS PostgreSQL,點擊【安裝】按鈕,彈出安裝界面安裝即可。
關鍵指標
| 指標名 | 描述 | 單位 |
|---|---|---|
| PG_DBAge | PG_數據庫年齡 | count |
| PG_InactiveSlots | PG_非活躍複製槽數量 | count |
| PG_MaxExecutingSQLTime | PG_最慢SQL執行耗時 | seconds |
| PG_MaxSlotWalDelay | PG_最大複製槽延遲(MB) | byte |
| PG_ReplayLatency | PG_最慢Standby回放延遲(MB) | byte |
| PG_SwellTime | PG_最長事務執行耗時 | seconds |
| active_connections_per_cpu | PG_每CPU平均活躍連接數 | count |
| conn_usgae | PG_連接數使用率 | % |
| cpu_usage | PG_CPU使用率 | % |
| five_seconds_executing_sqls | PG_五秒慢SQL | count |
| iops_usage | PG_IOPS使用率 | % |
| local_fs_inode_usage | PG_INODE使用率 | % |
| local_fs_size_usage | PG_磁盤空間使用率 | % |
| local_pg_wal_dir_size | PG_WAL文件大小 | MB |
| mem_usage | PG_內存使用率 | % |
| one_second_executing_sqls | PG_一秒慢SQL | count |
| three_seconds_executing_sqls | PG_三秒慢SQL | count |
場景視圖
登錄觀測雲控制枱,點擊「場景」 -「新建儀表板」,輸入 阿里雲 RDS PostgreSQL, 選擇 “阿里雲 RDS PostgreSQL 監控視圖”,點擊 “確定” 即可添加視圖。
監控器
觀測雲內置了監控器模板,可以選擇從模版創建監控器,並開啓適合業務的監控器以及時通知相關成員關注問題,觸發條件、頻率等信息可以依據實際業務進行調整。
登錄觀測雲控制枱,點擊「監控」 -「官方模板庫」,輸入 “阿里雲 RDS PostgreSQL”, 選擇對應的監控器,點擊 “確定” 即可添加。
阿里雲 RDS PostgreSQL 內存告警
該告警配置針對阿里雲 PostgreSQL 數據庫的內存使用率進行監控,檢測頻率為每分鐘一次,檢測區間為最近 5 分鐘。當內存使用平均值持續高於 90% 時觸發嚴重告警,介於 80% 至 90% 時觸發重現告警,並支持連續觸發判斷機制,確保及時感知數據庫資源異常。
阿里雲 RDS PostgreSQL CPU告警
該告警配置針對阿里雲 PostgreSQL 數據庫的 CPU 使用率進行監控,檢測頻率為每分鐘 1 次,檢測區間為最近 5 分鐘。當 CPU 使用平均值持續高於 90% 時觸發嚴重告警,介於 80% 至 90% 時觸發重現告警,並支持連續觸發判斷機制,確保及時感知數據庫資源異常。
阿里雲 RDS PostgreSQL 告警
該告警配置針對阿里雲 PostgreSQL 數據庫的磁盤使用率進行監控,檢測頻率為每分鐘一次,檢測區間為最近 5 分鐘。當內存使用平均值持續高於 90% 時觸發嚴重告警,介於 80% 至 90% 時觸發重現告警,並支持連續觸發判斷機制,確保及時感知數據庫資源異常。
總結
觀測雲通過一站式採集阿里雲 RDS PostgreSQL 的關鍵指標(如 CPU、內存、連接數等),結合智能告警規則(如多級閾值、連續觸發判斷),實現對數據庫性能的分鐘級監控與異常快速定位。該實踐可幫助企業提升數據庫穩定性,降低運維成本,增強業務連續性,實現雲上資源的精細化管控與主動運維。