书籍详情
进化:运维技术变革与实践探索
作者:赵成 著
出版社:电子工业出版社
出版时间:2018-06-01
ISBN:9787121338854
定价:¥59.00
购买这本书可以去
内容简介
《进化:运维技术变革与实践探索》依托作者在电信和互联网行业多年的从业经历,结合一线工作实践,从应用生命周期的视角,全面详细地介绍了分布式架构体系下,应用运维体系建设的方方面面,涵盖了体系建设方法论指导、持续交付体系建设思路和实践、稳定性体系规划建设,以及故障的科学管理方法等内容,视角新颖且独特,旨在通过换一个角度看运维,带给读者不一样的思考方式。 《进化:运维技术变革与实践探索》是各行业运维工程师和运维架构师了解新时代运维趋势必不可少的学习材料,同时也是业务架构师,开发、测试等技术人员以及技术经理、总监等管理人员用来丰富技术视角不可多得的宝贵参考书。
作者简介
赵成,是公众号“Forrest 随想录”的作者,多届 ArchSummit 运维专题明星讲师和优秀出品人,TGO 杭州分会会员。目前专注于云计算和人工智能时代的运维转型和提升。 加入蘑菇街之前,赵成在华为工作了七年,经历过开发、测试、运维以及一线客户服务等诸多岗位。他在不断的历练中迅速成长,培养了全面思考的意识和能力,积累了丰富的电信级和互联网业务研发及运维经验。 赵成说他踏上运维之路有很大的偶然性,一,不忍心看着自己跟团队开发出来的系统到了线上总是出问题,所以每当有问题时,他总是冲在前面解决问题,久而久之,便积累了丰富的经验,也成为团队中比较重要的角色;第二,也是更重要的一个因素,他说自己非常享受那种攻克难题之后的成就感。
目录
第1章 运维的本质
1.1 顶级公司的运维定义 / 2
1.1.1 没有运维的Netflix / 2
1.1.2 Netflix是如何成为行业典范的 / 3
1.1.3 总结 / 7
1.2 运维体系建设的核心概念:应用 / 7
1.2.1 应用的起源 / 8
1.2.2 应用模型及关系模型的建立 / 9
1.2.3 微服务架构时代下为什么要以应用为核心 / 12
第2章 运维体系建设
2.1 标准化体系建设基础 / 16
2.1.1 标准化的原因和步骤 / 16
2.1.2 基础设施层面的标准化 / 17
2.1.3 应用层面的标准化 / 19
2.1.4 总结 / 21
2.2 标准化体系建设实践:基础架构标准化 / 22
2.2.1 常见的分布式基础架构组件 / 23
2.2.2 基础架构组件的选型问题 / 24
2.2.3 基础架构的服务化 / 26
2.2.4 运维的职责 / 27
第3章 配置管理数据库(CMDB)
3.1 CMDB的前世今生 / 36
3.1.1 CMDB源起 / 36
3.1.2 传统运维思路下的CMDB / 37
3.1.3 互联网运维体系下的CMDB / 39
3.1.4 CMDB进行时 / 40
3.2 有了CMDB,为什么还需要应用配置管理 / 41
3.2.1 CMDB是面向资源的管理,是运维的基石 / 42
3.2.2 应用配置管理是面向应用的管理,是运维的核心 / 43
3.2.3 总结 / 45
3.3 在CMDB中落地应用的概念 / 46
3.3.1 如何有效组织和管理应用 / 46
3.3.2 应用的集群服务分组建设 / 49
3.3.3 CMDB在基础服务体系中的核心位置 / 51
3.3.4 总结 / 54
第4章 运维组织架构及模式
4.1 运维组织架构和转型 / 56
4.1.1 自助化运维能力的建设 / 56
4.1.2 从价值呈现的角度看运维 / 57
4.1.3 运维协作模式的改变 / 59
4.1.4 运维的组织架构 / 61
4.1.5 总结 / 62
4.2 Google SRE的运维模式 / 63
4.2.1 SRE岗位的定位 / 63
4.2.2 SRE岗位的职责 / 64
4.2.3 如何借鉴和落地 / 67
4.3 从Google CRE谈运维的服务意识 / 67
4.3.1 CRE产生的背景 / 68
4.3.2 CRE岗位的职责 / 69
4.3.3 从CRE谈谈做运维为什么要有服务心态 / 70
4.4 云计算和AI时代下的运维转型 / 73
4.4.1 应用运维的转型 / 75
4.4.2 云计算和AI带给我们的挑战 / 78
4.4.3 总结 / 80
第5章 持续交付
5.1 提升效率,为什么要先做持续交付 / 84
5.1.1 什么是持续交付 / 85
5.1.2 持续交付的关键点 / 86
5.2 持续交付的第一关键点:配置管理 / 88
5.2.1 版本控制 / 89
5.2.2 依赖管理 / 90
5.2.3 软件配置 / 91
5.3 多环境配置管理 / 94
5.3.1 多环境问题 / 94
5.3.2 不同环境下的应用配置管理 / 95
5.3.3 环境配置管理解决方案 / 96
5.3.4 总结 / 100
5.4 多环境建设 / 101
5.4.1 环境分类 / 101
5.4.2 线下环境分类建设 / 102
5.4.3 环境建设上的关键技术点 / 106
5.4.4 总结 / 109
5.5 线上环境建设 / 110
5.5.1 生产环境 / 110
5.5.2 Beta环境 / 112
5.5.3 预发环境 / 113
5.5.4 办公网生产环境 / 116
5.5.5 总结 / 117
5.6 流水线模式 / 118
5.6.1 持续交付流水线简要说明 / 119
5.6.2 项目需求分解 / 119
5.6.3 提交阶段之开发模式选择 / 121
5.6.4 开发模式的选型原则 / 123
5.7 流水线软件构建 / 125
5.7.1 构建环节 / 126
5.7.2 几个关键问题 / 127
5.8 流水线构建完成后的质量保障 / 131
5.8.1 依赖规则限制 / 131
5.8.2 功能测试 / 132
5.8.3 非功能测试 / 133
5.8.4 总结 / 135
5.9 持续交付实践:根据业务场景找方案 / 136
5.9.1 软件的持续部署发布 / 137
5.9.2 发布策略 / 139
5.9.3 持续交付体系的收益 / 141
5.9.4 总结 / 141
第6章 稳定性保障
6.1 极端业务场景下的稳定性保障 / 144
6.1.1 我们所面对的极端业务场景 / 144
6.1.2 技术上的挑战 / 146
6.1.3 极端业务场景下的不确定因素 / 148
6.2 稳定性实践 / 150
6.2.1 容量规划 / 150
6.2.2 限流降级 / 160
6.2.3 开关和预案 / 167
6.2.4 全链路跟踪系统 / 172
第7章 故障管理
7.1 我对故障的理解 / 182
7.2 故障定级和定责 / 186
7.2.1 故障的定级标准 / 187
7.2.2 故障的定责标准 / 189
7.3 故障定责的目的 / 192
7.3.1 关于定责和处罚 / 192
7.3.2 目的是鼓励做事,而不是处罚错误 / 194
7.3.3 处罚的“负”作用远超我们的想象 / 196
7.4 故障应急和故障复盘 / 197
7.4.1 故障应急 / 198
7.4.2 故障复盘 / 201
7.4.3 定期总结故障案例 / 203
7.4.4 总结 / 204
第8章 云运维的技术选型
8.1 为什么蘑菇街会选择上云 / 206
8.1.1 我们所面临的问题 / 206
8.1.2 纵观技术发展趋势 / 211
8.1.3 没有银弹 / 212
8.2 为什么混合云是未来云计算的主流形态 / 213
8.2.1 关于混合云 / 213
8.2.2 我们所经历的几个基础设施建设阶段 / 215
8.2.3 总结 / 219
8.3 面向应用层的云架构解决方案:Spring Cloud / 219
8.3.1 Spring Cloud框架中云的影子 / 220
8.3.2 CNCF / 223
8.3.3 可以预见的技术发展趋势 / 224
8.4 云计算时代的弹性伸缩 / 225
8.4.1 弹性伸缩的主体是谁 / 225
8.4.2 总结 / 228
第9章 CDN
9.1 从CDN和云存储来聊聊云生态的崛起 / 230
9.1.1 CDN和云存储 / 230
9.1.2 云生态的优势 / 231
9.1.3 总结 / 234
9.2 页面静态化架构和二级CDN建设 / 235
9.2.1 静态化架构建设的业务场景 / 235
9.2.2 页面静态化架构 / 237
9.2.3 静态化架构在大促场景中的应用 / 239
9.2.4 二级CDN建设 / 240
9.2.5 总结 / 241
第10章 运维人员的成长之路
10.1 我是如何走上运维岗位的 / 244
10.1.1 我是怎么开始做运维工作的 / 244
10.1.2 我为什么会把运维当作职业发展的方向 / 247
10.1.3 给我们的一点启发 / 251
10.2 运维需要懂产品和运营吗 / 252
10.2.1 运维的角色转变和价值体现 / 253
10.2.2 技术产品 / 254
10.2.3 技术运营 / 254
10.2.4 总结 / 256
10.3 从技术到管理,如何转身 / 257
10.3.1 从员工离职说起 / 257
10.3.2 关于员工离职的两个观点 / 258
10.3.3 谈谈如何做好技术管理 / 259
10.3.4 技术管理中引以为戒的一些反模式 / 261
10.3.5 总结 / 262
10.4 树立个人品牌意识 / 263
10.4.1 对求职者的背景调查 / 263
10.4.2 如何树立个人口碑 / 265
10.4.3 要引以为戒的反例 / 266
10.4.4 共勉 / 268
拓展阅读:运维与安全
1.1 顶级公司的运维定义 / 2
1.1.1 没有运维的Netflix / 2
1.1.2 Netflix是如何成为行业典范的 / 3
1.1.3 总结 / 7
1.2 运维体系建设的核心概念:应用 / 7
1.2.1 应用的起源 / 8
1.2.2 应用模型及关系模型的建立 / 9
1.2.3 微服务架构时代下为什么要以应用为核心 / 12
第2章 运维体系建设
2.1 标准化体系建设基础 / 16
2.1.1 标准化的原因和步骤 / 16
2.1.2 基础设施层面的标准化 / 17
2.1.3 应用层面的标准化 / 19
2.1.4 总结 / 21
2.2 标准化体系建设实践:基础架构标准化 / 22
2.2.1 常见的分布式基础架构组件 / 23
2.2.2 基础架构组件的选型问题 / 24
2.2.3 基础架构的服务化 / 26
2.2.4 运维的职责 / 27
第3章 配置管理数据库(CMDB)
3.1 CMDB的前世今生 / 36
3.1.1 CMDB源起 / 36
3.1.2 传统运维思路下的CMDB / 37
3.1.3 互联网运维体系下的CMDB / 39
3.1.4 CMDB进行时 / 40
3.2 有了CMDB,为什么还需要应用配置管理 / 41
3.2.1 CMDB是面向资源的管理,是运维的基石 / 42
3.2.2 应用配置管理是面向应用的管理,是运维的核心 / 43
3.2.3 总结 / 45
3.3 在CMDB中落地应用的概念 / 46
3.3.1 如何有效组织和管理应用 / 46
3.3.2 应用的集群服务分组建设 / 49
3.3.3 CMDB在基础服务体系中的核心位置 / 51
3.3.4 总结 / 54
第4章 运维组织架构及模式
4.1 运维组织架构和转型 / 56
4.1.1 自助化运维能力的建设 / 56
4.1.2 从价值呈现的角度看运维 / 57
4.1.3 运维协作模式的改变 / 59
4.1.4 运维的组织架构 / 61
4.1.5 总结 / 62
4.2 Google SRE的运维模式 / 63
4.2.1 SRE岗位的定位 / 63
4.2.2 SRE岗位的职责 / 64
4.2.3 如何借鉴和落地 / 67
4.3 从Google CRE谈运维的服务意识 / 67
4.3.1 CRE产生的背景 / 68
4.3.2 CRE岗位的职责 / 69
4.3.3 从CRE谈谈做运维为什么要有服务心态 / 70
4.4 云计算和AI时代下的运维转型 / 73
4.4.1 应用运维的转型 / 75
4.4.2 云计算和AI带给我们的挑战 / 78
4.4.3 总结 / 80
第5章 持续交付
5.1 提升效率,为什么要先做持续交付 / 84
5.1.1 什么是持续交付 / 85
5.1.2 持续交付的关键点 / 86
5.2 持续交付的第一关键点:配置管理 / 88
5.2.1 版本控制 / 89
5.2.2 依赖管理 / 90
5.2.3 软件配置 / 91
5.3 多环境配置管理 / 94
5.3.1 多环境问题 / 94
5.3.2 不同环境下的应用配置管理 / 95
5.3.3 环境配置管理解决方案 / 96
5.3.4 总结 / 100
5.4 多环境建设 / 101
5.4.1 环境分类 / 101
5.4.2 线下环境分类建设 / 102
5.4.3 环境建设上的关键技术点 / 106
5.4.4 总结 / 109
5.5 线上环境建设 / 110
5.5.1 生产环境 / 110
5.5.2 Beta环境 / 112
5.5.3 预发环境 / 113
5.5.4 办公网生产环境 / 116
5.5.5 总结 / 117
5.6 流水线模式 / 118
5.6.1 持续交付流水线简要说明 / 119
5.6.2 项目需求分解 / 119
5.6.3 提交阶段之开发模式选择 / 121
5.6.4 开发模式的选型原则 / 123
5.7 流水线软件构建 / 125
5.7.1 构建环节 / 126
5.7.2 几个关键问题 / 127
5.8 流水线构建完成后的质量保障 / 131
5.8.1 依赖规则限制 / 131
5.8.2 功能测试 / 132
5.8.3 非功能测试 / 133
5.8.4 总结 / 135
5.9 持续交付实践:根据业务场景找方案 / 136
5.9.1 软件的持续部署发布 / 137
5.9.2 发布策略 / 139
5.9.3 持续交付体系的收益 / 141
5.9.4 总结 / 141
第6章 稳定性保障
6.1 极端业务场景下的稳定性保障 / 144
6.1.1 我们所面对的极端业务场景 / 144
6.1.2 技术上的挑战 / 146
6.1.3 极端业务场景下的不确定因素 / 148
6.2 稳定性实践 / 150
6.2.1 容量规划 / 150
6.2.2 限流降级 / 160
6.2.3 开关和预案 / 167
6.2.4 全链路跟踪系统 / 172
第7章 故障管理
7.1 我对故障的理解 / 182
7.2 故障定级和定责 / 186
7.2.1 故障的定级标准 / 187
7.2.2 故障的定责标准 / 189
7.3 故障定责的目的 / 192
7.3.1 关于定责和处罚 / 192
7.3.2 目的是鼓励做事,而不是处罚错误 / 194
7.3.3 处罚的“负”作用远超我们的想象 / 196
7.4 故障应急和故障复盘 / 197
7.4.1 故障应急 / 198
7.4.2 故障复盘 / 201
7.4.3 定期总结故障案例 / 203
7.4.4 总结 / 204
第8章 云运维的技术选型
8.1 为什么蘑菇街会选择上云 / 206
8.1.1 我们所面临的问题 / 206
8.1.2 纵观技术发展趋势 / 211
8.1.3 没有银弹 / 212
8.2 为什么混合云是未来云计算的主流形态 / 213
8.2.1 关于混合云 / 213
8.2.2 我们所经历的几个基础设施建设阶段 / 215
8.2.3 总结 / 219
8.3 面向应用层的云架构解决方案:Spring Cloud / 219
8.3.1 Spring Cloud框架中云的影子 / 220
8.3.2 CNCF / 223
8.3.3 可以预见的技术发展趋势 / 224
8.4 云计算时代的弹性伸缩 / 225
8.4.1 弹性伸缩的主体是谁 / 225
8.4.2 总结 / 228
第9章 CDN
9.1 从CDN和云存储来聊聊云生态的崛起 / 230
9.1.1 CDN和云存储 / 230
9.1.2 云生态的优势 / 231
9.1.3 总结 / 234
9.2 页面静态化架构和二级CDN建设 / 235
9.2.1 静态化架构建设的业务场景 / 235
9.2.2 页面静态化架构 / 237
9.2.3 静态化架构在大促场景中的应用 / 239
9.2.4 二级CDN建设 / 240
9.2.5 总结 / 241
第10章 运维人员的成长之路
10.1 我是如何走上运维岗位的 / 244
10.1.1 我是怎么开始做运维工作的 / 244
10.1.2 我为什么会把运维当作职业发展的方向 / 247
10.1.3 给我们的一点启发 / 251
10.2 运维需要懂产品和运营吗 / 252
10.2.1 运维的角色转变和价值体现 / 253
10.2.2 技术产品 / 254
10.2.3 技术运营 / 254
10.2.4 总结 / 256
10.3 从技术到管理,如何转身 / 257
10.3.1 从员工离职说起 / 257
10.3.2 关于员工离职的两个观点 / 258
10.3.3 谈谈如何做好技术管理 / 259
10.3.4 技术管理中引以为戒的一些反模式 / 261
10.3.5 总结 / 262
10.4 树立个人品牌意识 / 263
10.4.1 对求职者的背景调查 / 263
10.4.2 如何树立个人口碑 / 265
10.4.3 要引以为戒的反例 / 266
10.4.4 共勉 / 268
拓展阅读:运维与安全
猜您喜欢