书籍详情

Prometheus监控技术与实践

Prometheus监控技术与实践

作者:陈金窗,刘政委,张其栋,郑少斌 著

出版社:机械工业出版社

出版时间:2020-04-01

ISBN:9787111649649

定价:¥99.00

购买这本书可以去
内容简介
  本书系统化介绍云原生监控系统Prometheus的基本概念和使用方法。本书从基础内容讲起,由浅入深,分析了监控系统的主要功能和运维原则。主要内容包括三大部分,第壹部分“入门基础篇”介绍初识Prometheus云监控的基本点和主要方向,Prometheus架构及核心组件,监控指标与Labels,常用Exporter探测器等;第二部分“技术提高篇”介绍服务发现、告警处理、PromQL数据查询、可视化、Pushgateway等;第三部分“应用实践篇”介绍监控方向,如监控Docker与cAdvisor、Kubernetes、业务程序,编写Exporter探测器和日志监控指标,生产部署,云业务监控平台搭建等。
作者简介
  陈金窗 资深运维技术专家,曾就职于太极、普天、姬慕石、金山软件、中国电信等多家国内外著名企业。从事IT基础设施建设、运维与技术管理20多年,建设、维护超过100个大、中型IT项目和产品,既对服务器、存储、网络、系统、中间件等IT技术有丰富的实践经验,又对ITIL、DevOps、PMP等运维管理有落地经验,特别是对云计算环境中维护管理的相关开源技术有深刻理解,牵头著有《Ansible自动化运维技术与最佳实践》。 刘政委 资深运维技术与管理人员,大型在线游戏和手游自动化运维老兵;对自动化运维和监控技术有着丰富的实践经验,善于互联网技术团队的建设和管理; 深耕IT基础运维规划和建设,对私有云项目实施有一定的实践经验,曾合著《Ansible自动化运维技术与最佳实践》一书。 郑少斌 长期从事云计算相关产品、研发、运维等工作,具备丰富的理论及实践经验,主持国家专项1个,获得已授权专利6个,并曾在通信协会担任数据中心联盟可信云工作组核心专家、通信网络安全服务能力评定技术专家。 张其栋 中国电信云公司软件工程师,主要负责私有容器云平台的研发工作。一直从事云计算、SDN领域的研究与实践,对Docker、Kubernetes、Prometheus、Mesos等技术有丰富的实战经验。
目录
前 言
第一部分 概述
第1章 云计算时代的监控系统 2
11 云计算时代的应用系统 2
111企业“IT云化”实现数字化转型 3
112 云计算时代的IT架构特点 3
113 云计算时代的IT管理变革 4
12 云计算监控的目标和挑战 5
121 云计算监控目标 5
122 云计算监控挑战 7
13 云计算监控的范围和架构 8
131 监控管理的范围 8
132 监控系统的基本架构 9
14 百花齐放的开源监控软件工具 10
141 监控系统成熟度 11
142 Zabbix 11
143 OpenTSDB 12
15 Prometheus监控系统 13
151 应运而生,茁壮成长 13
152 功能完善、监控所有层级指标 15
153开放、高效、易用的完整解决方案 16
16 本章小结 18
第2章Prometheus基本概念及部署 19
21 Prometheus架构 19
22 Prometheus快速部署 20
221 使用二进制文件快速部署 21
222 使用Docker快速安装 25
223 Prometheus Web UI 26
23 Prometheus相关概念 29
231 数据模型 29
232 Metric的四种类型 30
233 Jobs 和 Instances 32
24 Prometheus核心组件 34
25 本章小结 35
第二部分 Prometheus技术基础
第3章 Exporter 38
31 概述 38
311 Exporter类型 38
312 文本数据格式 39
313 获取Exporter 40
32 主机监控 42
321 Linux主机监控 42
322 Windows主机监控 52
33 数据库监控 53
331 MySQL Server exporter 54
332 Redis exporter 60
34 Nginx监控 62
35 Prometheus之黑盒监控 64
351 软件安装与部署 65
352 配置文件 67
36 本章小结 71
第4章 服务发现 73
41 基于文件的服务发现 74
42 基于Consul的服务发现 78
421 Consul体验应用信息 80
422 软件下载与部署 80
423 服务注册发现 83
424 与Prometheus集成 85
43 基于DNS的服务发现 87
431自建DNS服务SRV记录设置 87
432阿里云域名解析SRV记录设置 88
44 Relabelling 89
45 本章小结 93
第5章 PromQL 94
51 时序数据库 94
52 PromQL简介 96
521 数据模型与数据类型 96
522 时间序列选择器 97
53 PromQL聚合操作 100
54 PromQL运算符 102
541 算术运算符 102
542 关系运算符 103
543 向量匹配 105
544 逻辑运算符 107
545 运算符优先级 108
55 PromQL函数 108
551 数学函数 108
552 时间函数 109
553 标签操作函数 110
554 Counter指标增长率 111
555 Gauge指标趋势变化预测 111
56 PromQL查询分析 112
561 指标分析 112
562 PromQL操作分析 113
57 本章小结 113
第6章 告警处理 115
61 概述 115
62 Alertmanager部署 116
621 Alertmanager机制 116
622 使用二进制文件方式安装 117
623 使用Docker安装 120
63 Alertmanager配置 120
631 global 120
632 templates 122
633 route 122
634 receivers 124
635 inhibit_rules 125
64 Prometheus告警规则 126
641 与Alertmanager关联 126
642 告警规则 127
643 使用模板 132
65 告警接收器 133
651 Email接收告警 133
652 企业微信接收告警 136
653基于Webhook的钉钉接收告警 142
654 告警通知模板 146
66 告警临时静默 147
67 本章小结 148
第7章 可视化 149
71 概述 149
72 Grafana安装 150
721 在CentOS上安装 151
722 在Windows上安装 154
723 使用Docker安装 155
73 Grafana基本概念 156
74 Prometheus数据源 158
741 数据源添加 158
742 页面UI说明 160
75 仪表盘导入 161
751 Node Exporter仪表盘 161
752 Windows Node仪表盘 164
753 MySQL仪表盘 166
754 Redis仪表盘 168
755 Nginx仪表盘 168
756 Blackbox Exporter仪表盘 169
76 定制监控图表 171
761 定制仪表盘 171
762 定制面板 175
77 本章小结 183
第8章 Pushgateway 184
81 概述 184
82 Pushgateway集成 185
821 软件下载与部署 186
822 Pushgateway UP状态 187
83 Pushgateway数据管理 187
831向Pushgateway发送和查看监控指标 187
832删除Pushgateway中的监控标准 189
833基于推送的Prometheus监控 189
84 本章小结 192
第三部分 监控综合实践
第9章 OpenStack云计算监控 194
91 OpenStack监控架构 194
92 OpenStack Exporter 196
921 OpenStack Exporter部署 197
922 OpenStack监控可视化 199
93 OpenStack Helm监控 200
931基于OpenStack Helm部署Prometheus 200
932基于OpenStack Helm部署Grafana 203
94 本章小结 204
第10章 Docker容器监控 205
101 Docker容器架构与监控 205
1011 Docker容器架构 205
10
猜您喜欢

读书导航