书籍详情
OpenShift高效运维:SRE视角的集群和分布式系统管理
作者:[德]里克·拉考,[德]曼努埃尔·德瓦尔德
出版社:机械工业出版社
出版时间:2023-12-01
ISBN:9787111741480
定价:¥89.00
购买这本书可以去
内容简介
本书介绍了OpenShift核心概念和部署策略,包括多集群OpenShift容器平台部署,以及按照最佳实践管理OpenShift集群。本书还探讨了部署工作负载到OpenShift的最佳实践、通过最先进的概念监控OpenShift集群,并结合示例构建和部署Kubernetes operator来自动管理任务,使用GitOps方法配置OpenShift集群。本书适合SRE、系统管理员、DevOps工程师和云架构师阅读。
作者简介
Rick Rackow 是一位致力于云和容器采用的资深专家。作为红帽 OpenShift 专用团队的站点可靠性工程师,Rick 管理和维护着无数大规模的 OpenShift 集群,并通过开发和遵循读者将在本书中学习的最佳实践来确保这些集群的可靠性。Manuel Dewald 自 2019 年以来一直在红帽公司担任站点可靠性工程师,他为主要公有云上的 OpenShift 集群提供支持。在此之前,他作为一名软件工程师,在不同的开发团队中参与 DevOps 实践。面对这一切的挑战,他决定转变角色,专注于运营软件同时保持对软件工程的关注,以解决运维的挑战。他对开源软件和良好的软件工程实践充满热情。时不时地,即使在最小的项目上,你可能也会发现他在抱怨错过了测试,而这些小项目只是解决了运维团队的一个小问题。Manuel 经常在会议上发表关于利用 OpenShift 构建基础设施、实施 Kubernetes operator的最佳实践以及 SRE 团队的敏捷实践的演讲。他在 https://blog.redhat.com 和 https://opensource.com 上写了关于 Kubernetes operator、敏捷实践和 Raspberry Pi 项目的博文。
目录
目录
前言1
第1章 概述5
1.1 传统运维团队6
1.2 站点可靠性工程如何提供帮助7
1.3 OpenShift作为站点可靠性工程师的工具7
1.4 SRE团队的个人挑战8
第2章 安装OpenShift10
2.1 OKD、OCP和其他方式10
2.2 使用OpenShift Local的本地集群11
2.3 规划集群规模14
2.4 基本OpenShift安装19
2.5 总结26
第3章 在OpenShift上运行工作负载27
3.1 部署代码28
3.2 访问已部署的服务32
3.3 公开服务35
3.4 使用TLS保护服务40
3.5 总结56
第4章 安全57
4.1 集群访问57
4.2 基于角色的访问控制59
4.3 ServiceAccount63
4.4 威胁建模65
4.5 工作负载66
4.6 总结70
第5章 自动化构建71
5.1 OpenShift镜像构建71
5.2 红帽OpenShift Pipelines84
5.3 总结103
第6章 集群内监控栈105
6.1 Cluster Monitoring Operator105
6.2 指标可视化127
6.3 总结131
第7章 高级监控和可观测性策略132
7.1 面向服务的监控132
7.2 日志141
7.3 可视化146
7.4 总结153
第8章 自动化OpenShift集群运维154
8.1 重复性运维任务155
8.2 重复性运维任务自动化157
8.3 集群配置168
8.4 使用 OpenShift GitOps 管理集群配置169
8.5 总结181
第9章 开发自定义operator以实现集群运维自动化182
9.1 Operator SDK184
9.2 operator设计185
9.3 引导operator186
9.4 设置一个用于开发的CA目录190
9.5 设计自定义资源定义191
9.6 安装自定义资源定义194
9.7 本地operator开发195
9.8 调和函数197
9.9 部署operator198
9.10 创建和更新OpenShift资源202
9.11 指定RBAC权限204
9.12将流量路由到operator206
9.13 添加额外的控制器207
9.14 更新资源状态210
9.15 总结211
第10章 规模化运营OpenShift集群的实用模式212
10.1 集群生命周期212
10.2 集群配置213
10.3 日志214
10.4 监控215
10.5 警报215
10.6 自动化216
10.7 值班217
10.8 事故管理218
10.9 访问OpenShift集群220
10.10 舞台是你的221
前言1
第1章 概述5
1.1 传统运维团队6
1.2 站点可靠性工程如何提供帮助7
1.3 OpenShift作为站点可靠性工程师的工具7
1.4 SRE团队的个人挑战8
第2章 安装OpenShift10
2.1 OKD、OCP和其他方式10
2.2 使用OpenShift Local的本地集群11
2.3 规划集群规模14
2.4 基本OpenShift安装19
2.5 总结26
第3章 在OpenShift上运行工作负载27
3.1 部署代码28
3.2 访问已部署的服务32
3.3 公开服务35
3.4 使用TLS保护服务40
3.5 总结56
第4章 安全57
4.1 集群访问57
4.2 基于角色的访问控制59
4.3 ServiceAccount63
4.4 威胁建模65
4.5 工作负载66
4.6 总结70
第5章 自动化构建71
5.1 OpenShift镜像构建71
5.2 红帽OpenShift Pipelines84
5.3 总结103
第6章 集群内监控栈105
6.1 Cluster Monitoring Operator105
6.2 指标可视化127
6.3 总结131
第7章 高级监控和可观测性策略132
7.1 面向服务的监控132
7.2 日志141
7.3 可视化146
7.4 总结153
第8章 自动化OpenShift集群运维154
8.1 重复性运维任务155
8.2 重复性运维任务自动化157
8.3 集群配置168
8.4 使用 OpenShift GitOps 管理集群配置169
8.5 总结181
第9章 开发自定义operator以实现集群运维自动化182
9.1 Operator SDK184
9.2 operator设计185
9.3 引导operator186
9.4 设置一个用于开发的CA目录190
9.5 设计自定义资源定义191
9.6 安装自定义资源定义194
9.7 本地operator开发195
9.8 调和函数197
9.9 部署operator198
9.10 创建和更新OpenShift资源202
9.11 指定RBAC权限204
9.12将流量路由到operator206
9.13 添加额外的控制器207
9.14 更新资源状态210
9.15 总结211
第10章 规模化运营OpenShift集群的实用模式212
10.1 集群生命周期212
10.2 集群配置213
10.3 日志214
10.4 监控215
10.5 警报215
10.6 自动化216
10.7 值班217
10.8 事故管理218
10.9 访问OpenShift集群220
10.10 舞台是你的221
猜您喜欢