
集鏈路追蹤、應用性能和業務數據于一體的全棧監控平臺,實時、全方位掌控業務和資源健康狀況,幫助用戶實現全棧性能監控與端到端追蹤診斷,提高監控效率,降低運維復雜性與工作量。
產品特點
數據全量采集
前端設備到后端設備數據全量采集并打通,輕松梳理服務依賴關系。
故障精準定位
一站式調用鏈追蹤分析,為故障定位提供詳細參考數據,問題定位更高效、更精準。
問題直觀呈現
對采集到的數據進行自動化匯總、聚合和統計,最終以多種視圖展現,更加直觀。
產品功能
數據采集
通過Agent進行數據采集,提供從基礎設施層、中間層、應用層三層級的全棧資源監控,監控性能指標包括CPU使用率、內存占有率、網絡帶寬、磁盤IO、每分鐘請求數、平均響應延時(ms)等。支持微服務架構下對業務進行請求跟蹤的trace監控,可以監控到所有請求的調用鏈,數據采集更全面。
數據分析
關聯分析:分析分布式系統的每一次系統調用、消息發送、緩存訪問、數據庫訪問和關聯的監控數據。
層級分析:體系化的監控三層級(基礎層、中間層、業務層)分析確保了在復雜微服務架構下每個部分的高度可見性。
根因分析:利用算法對監控指標進行快速診斷與識別,輸出推薦結果輔助運維人員排查問題。
趨勢分析:通過基于歷史比較、健康狀況和資源情況的事件關聯,在問題發生前進行預測和預防性提示。
事件中心
告警管理:將事件發送到消息服務隊列、函數計算、日志服務等多種方式實現事件的自動告警,支持短信、微信、釘釘、郵件的方式以致命、預警、提醒分類的告警級別通知到運維人員,并完成工單對接反饋,最終實現面向告警事件的全生命周期閉環管控。
事件管理:按照告警級別對問題事件進行匯總和分級管理,并以統一列表、日志模式展示,便于問題事件收集分析。
拓撲管理
支持定義節點類型,以直觀圖例展現節點類型,管理更加便捷。業務全鏈路監控拓撲圖將業務的所有調用鏈關系信息集中展現,提供關聯的系統及其指標聚合展示,可以知悉應用被哪些服務依賴、依賴了哪些下游服務以及整體健康度等,直觀感受整體和局部性能狀況。
配置及報表管理
支持自定義監控指標,多種規則創建完成后,可隨時啟用、停止、刪除;對告警任務實行統一管理,便于及時跟蹤及問題反饋;支持自定義報表模板,并對報表任務執行統一管理。
可視化展示
自動更新展示資源的運行狀態和健康狀況,通過全鏈路監控大屏和豐富的圖表分析,幫助運維人員隨時掌握業務健康狀況,確保用戶獲得最佳體驗。