書名: 深入理解Prometheus監控系統作者名: 鮑光亞 張帆本章字數: 649字更新時間: 2024-12-16 17:00:34
前言
寫作目的
隨著Kubernetes在信息技術領域的廣泛應用以及運維工作對監控系統的依賴程度的增加,Prometheus監控系統逐漸成為信息技術架構中不可缺少的功能組件。本書全面而深入地剖析Prometheus監控系統的各個組成部分,幫助讀者理解Prometheus監控系統各個模塊的底層工作機制。
內容結構
本書共11章,總體上按照監控數據的采集和加工流程順序講解各個模塊的底層工作機制。
第1章選取Prometheus發展過程中的4個具有里程碑意義的版本,講解各主要模塊的功能發展、演變過程。
第2章講解Prometheus各個模塊中廣泛用到的YAML文本以及Prometheus配置文件的加載與刷新過程。
第3章講解監控數據來源模塊Exporter的典型工作架構以及原始監控數據是如何加工和對外輸出的。
第4章講解監控目標的自動發現機制,即Prometheus如何探測并發現多種多樣的監控目標。
第5章講解監控數據的采集與加工,即Prometheus服務器如何向大量監控目標請求監控數據,以及如何將監控數據轉換為需要的數據結構并寫入數據庫。
第6章講解Prometheus的本地數據庫TSDB,包括監控數據寫入頭部塊以及頭部子塊的具體過程、頭部塊和主體塊的逐級壓縮過程,以及WAL文件和事務隔離機制等。
第7章講解Prometheus本地數據庫的查詢語言PromQL,包括PromQL解析器、語法樹的結構和語法樹的執行等。
第8章講解監控數據的計算與告警觸發,包括轉錄規則和告警規則的執行以及警報消息的通知等。
第9章講解Prometheus提供的Web服務,包括Web API的各項功能和Web用戶界面中PromQL編輯器的功能等。
第10章講解Prometheus的構建與部署,以及與部署相關的問題。
第11章講解分布式系統Alertmanager,包括分布式集群工作原理以及警報管理系統對警報消息的整個處理流程(從警報接收到分組、濾除、派發和登記)等。