书籍详情
云计算和大数据服务:技术架构、运营管理与智能实践
作者:陈赤榕,叶新江,李彦涛,刘国萍 著
出版社:清华大学出版社
出版时间:2022-01-01
ISBN:9787302586586
定价:¥168.00
购买这本书可以去
内容简介
《云计算和大数据服务——技术架构、运营管理与智能实践》采用理论与实践相结合的形式,系统阐述云计算和大数据服务的具体实现。 云计算和大数据服务战略的落地,包括技术构建和运营管理、新兴的人工智能技术的应用,以及组织能力的建设。针对这一目标,全书分为七部分:云计算技术、大数据及数据智能、服务的技术运营、智能运营、安全技术与管理、服务质量管理和组织能力。《云计算和大数据服务——技术架构、运营管理与智能实践》的目的是帮助读者对这些云计算和大数据的重要专题从基本概念、发展思路到解决方案有一个系统认识。 本书具有非常强的可读性和实践指导意义,可作为云计算和大数据企业的高层管理人员和技术架构师的参考读物,也可以作为高校相关专业师生的教学参考用书。
作者简介
陈赤榕:30年云服务技术运营架构与管理经验,硅谷早期的云计算技术运营人员之一。北京聆通科技有限公司联合创始人,CEO。叶新江:20年大数据技术架构与管理经验,每日互动股份有限公司(个推)创始团队成员,CTO。李彦涛:30年通信和云计算行业经验, 国内著名通信及云计算系统架构师之一。北京聆通科技有限公司联合创始人,CTO。刘国萍:20年云计算、物联网、人工智能行业经验,网络安全技术领域专家。中国电信研究院教授级高级工程师,博士。
目录
第1章综述
1.1本书的框架思路: 云计算和大数据服务实现的四要素
1.2本书的框架结构
1.2.1技术构建(第1、第2部分): 云计算和大数据
1.2.2服务运营(第3、第4、第5部分): 技术、管理、AIOps和安全
1.2.3服务质量管理(第6部分)
1.2.4组织能力(第7部分)
1.3本书的章节结构
1.4云计算技术与服务
1.4.1云计算的发展史
1.4.2云计算的定义
1.4.3云计算的服务模式
1.4.4云计算的部署方式
1.5大数据和数据智能的技术与服务
1.5.1大数据的定义
1.5.2云计算与大数据的关系
1.5.3数据智能
1.6技术运营: 从技术升级到服务的实现关键
1.7智能实践
第1部分云计算技术
第2章云计算技术综述
2.1云计算的技术发展回顾
2.1.1云计算技术概念的发展
2.1.2云计算相关技术的发展
2.2云服务的技术结构
2.2.1云服务的技术层次
2.2.2云服务的技术结构适用场景
2.3云服务对技术团队带来的挑战
2.3.1对研发团队的挑战
2.3.2对技术运营团队的挑战
2.3.3对服务质量控制团队的挑战
第3章云计算的技术框架: 面向服务的架构
3.17×24小时云服务的挑战
3.1.1传统企业服务软件与云服务软件对比
3.1.2特性化与统一服务
3.1.3面向运营及服务系统功能
3.1.4IT管理与服务监控
3.2云服务架构
3.2.1设计的基础模式
3.2.2设计的结构模式
3.3构建高可靠性
3.3.1可靠性理论与云计算平台的需求实现
3.3.2可靠性设计
3.3.3负载均衡与集群
3.3.4双机热备
3.3.5异地灾备
3.4构建高性能
3.4.1系统容量与性能瓶颈
3.4.2接入与Web层容量与性能设计与优化
3.4.3服务层容量与性能设计与优化
3.4.4数据层容量与性能设计与优化
3.4.5应对高并发容量
3.5构建高伸缩性
3.5.1设计规则扩展与性能
3.5.2并发访问量
3.5.3并发数据访问与I/O
3.6构建高可配置性
3.6.1系统配置
3.6.2站点配置
3.6.3用户配置
3.6.4服务配置与技术运营关系
3.7构建高可管理性云计算平台
3.7.1系统维护周期
3.7.2系统维护与服务中断
3.7.3系统可配置性
3.7.4系统监控能力
3.7.5日志记录与错误处理
3.7.6用于服务的配置、监控与日志系统
3.8案例分析
3.8.1背景介绍
3.8.2解决方案
3.8.3讨论
3.9本章小结
第4章云服务的技术基础: 虚拟化
4.1虚拟化技术的发展历史
4.2虚拟化技术分类
4.3系统虚拟化
4.3.1系统虚拟化的优势
4.3.2系统虚拟化存在的问题
4.3.3系统虚拟化的不足
4.4网络虚拟化
4.4.1网络虚拟化的分类
4.4.2网络虚拟化的优势
4.4.3网络虚拟化的不足
4.5容器的虚拟化
4.6其他虚拟化技术
4.7市场主流虚拟化技术对比
4.8虚拟化对云计算的推动
4.9虚拟化与数据中心
4.9.1虚拟化数据中心的优点
4.9.2虚拟化数据中心的风险
4.9.3虚拟化数据中心风险应对
4.10研究分析: 虚拟化技术的发展趋势
4.11本章小结
第5章云服务的平台技术: IaaS、PaaS和SaaS
5.1平台技术的发展
5.1.1平台技术演进阶段
5.1.2云管理平台贯穿云平台技术发展始终
5.1.3云平台技术发展的展望
5.1.4关于FaaS平台的思考
5.2IaaS
5.2.1IaaS平台架构
5.2.2IaaS的适用场景
5.2.3IaaS的优缺点
5.2.4IaaS的市场价值
5.2.5IaaS的局限性
5.3PaaS
5.3.1PaaS平台架构
5.3.2PaaS的适用场景
5.3.3PaaS的优缺点
5.3.4PaaS的市场价值
5.3.5PaaS的局限性
5.4SaaS
5.4.1SaaS平台架构
5.4.2SaaS的适用场景
5.4.3SaaS的优缺点
5.4.4SaaS的市场价值
5.4.5SaaS的局限性
5.5CaaS
5.5.1CaaS平台架构
5.5.2CaaS的适用场景
5.5.3CaaS的优缺点
5.5.4CaaS的市场价值
5.6云管理平台
5.6.1云管理平台的规范架构
5.6.2云管理平台的职能
5.6.3云管理平台的应用场景举例
5.7平台的实施要点和挑战
5.7.1技术选型
5.7.2实施要点
5.7.3风险和挑战
5.8案例研究: SaaS的构建、演进、成果与教训
5.8.1背景介绍
5.8.2自建IDC阶段
5.8.3采用IaaS公有云阶段
5.8.4混合云阶段
5.8.5容器化及微服务阶段
5.8.6数据安全
第6章云服务的应用层技术: 微服务
6.1微服务与云计算
6.2微服务的定义
6.3微服务的发展简史
6.4微服务和SOA的关系
6.5微服务的构成要素
6.6微服务的优缺点
6.6.1微服务的优点
6.6.2微服务的缺点
6.7微服务的实施要点
6.8案例分析: SMS推送平台的微服务化
6.8.1背景简介
6.8.2系统特点
6.8.3早期设计
6.8.4解决方案
6.8.5决策过程
6.8.6实施过程
6.8.7实施效果
6.8.8未来改进
6.8.9项目回顾
第2部分大数据与数据智能
第7章大数据理论及相关模型
7.1大数据概念的提出和演进
7.24V 1O特征模型: 大数据特征
7.3第四范式: 问题解决的新模式
7.4蜜蜂效应: 数据的选择价值
7.5大数据业务成熟度模型
7.5.1业务监测
7.5.2业务洞察
7.5.3业务优化
7.5.4数据变现
7.5.5商业重塑
7.6数据智能
第8章数据智能平台构建策略
8.1数据业务的构建过程
8.1.1数据系统建设
8.1.2数据业务建模
8.1.3数据业务开展
8.2数据智能体系要求
8.2.1建设思路、原则和目标
8.2.2基础平台
8.2.3融合平台
8.2.4治理系统
8.2.5质量保证
8.2.6安全计算
8.2.7分析挖掘
8.2.8数据可视化
8.3数据中台策略
8.3.1数据仓库和数据湖
8.3.2数据中台
8.3.3数据中台和数据仓库、数据湖的差别
第9章大数据技术和平台
9.1大数据基础技术系统组成
9.2大数据开源体系各部分介绍
9.2.1Hadoop介绍
9.2.2开源生态系统
9.3大数据生态的发展态势
9.3.1数据治理与安全
9.3.2基础设施
9.3.3数据协作工作台
9.3.4数据分析流程自动化
9.3.5AI驱动的应用发展趋势
9.4实践讨论: 大数据存储的建模
9.4.1分布式存储的架构
9.4.2数据存储设计
9.4.3NoSQL的问题
9.4.4存储设计实例
第10章大数据分析系统技术
10.1分析系统架构设计
10.1.1CAP理论
10.1.2分析系统考量三要素
10.1.3实时查询过程
10.2架构选择
10.2.1大规模并行处理架构
10.2.2基于搜索引擎的架构
10.2.3预计算系统架构
10.2.4三种架构的对比
第11章企业大数据实施策略
11.1企业实施大数据战略面临的挑战
11.2实施规划
11.2.1切入点规划
11.2.2组织配置和调整
11.2.3数据获取和挖掘
11.2.4效果评估
11.3案例研究: 大数据运营场景及系统实施
11.3.1背景介绍
11.3.2演化路径
11.3.3个推V1.0——基础SaaS产品
11.3.4个推V2.0——大数据基础下的智能推送
11.3.5个推V3.0——数据智能下的个推
11.4实践中的经验教训
11.4.1技术陷阱
11.4.2简洁及成本意识
11.4.3新技术的进一步应用
11.4.4总结
第3部分服务的技术运营
第12章服务的技术运营综述
12.1技术运营的基本概念
12.2云服务的技术运营
12.2.1云服务的技术运营也是关于生产系统的运营
12.2.2技术运营的功能
12.2.3是技术运营,而不仅仅是维护
12.3云服务技术运营的目标
12.3.1从航空服务公司的要求来看
12.3.2云服务的运营管理目标
12.3.3技术运营永恒的四大指标
12.4技术运营的双维模型
12.4.1技术运营的双维概念
12.4.2双维的目的
12.4.3技术运营的双维模型
12.4.4双维平台的实施
12.5DevOps方法论
12.5.1DevOps简史
12.5.2DevOps定义
12.5.3DevOps的关键过程
12.6服务可靠性工程
12.6.1服务可靠性工程的定义与要点
12.6.2SRE与DevOps
12.7双维模型、DevOps与SRE的指导意义和应用
12.7.1双维模型: 给CXO的运营指导
12.7.2DevOps与SRE: 给技术架构师的指导
12.7.3实践讨论(1): Dev与Ops的和与分
12.7.4实践讨论(2): 技术运营不同阶段各种方法论的应用
12.7.5实践讨论(3): 在研发团队中引进DevOps思维
第13章服务的生产设计
13.1生产设计的目的
13.1.1建立生产型的云服务
13.1.2云服务的生产设计
13.2生产设计方法
13.2.1生产设计目标
13.2.2生产设计流程
13.3生产设计(1): 工程开发期间的任务
13.3.1服务平台的重要部分: 基础建设工程
13.3.2服务可用度
13.3.3服务的可管理性
13.3.4安全性
13.3.5可扩展性
13.4生产设计(2): 上线期间的任务
13.4.1生产线验收
13.4.2生产线部署
13.4.3日常维护计划
13.5服务支持结构: 团队和知识
13.5.1团队结构
13.5.2知识传递: 文档的需求
13.6实践和讨论
13.6.1从工程到实施的关键: 系统层的逻辑设计
13.6.2进入生产线: 生产线的部署设计
第14章服务的业务连续性
14.1云服务业务连续性及其挑战
14.1.1业务连续性的定义
14.1.2云服务提供商面临的挑战
14.2云计算的业务连续性方案概述
14.2.1业务连续性的管理
14.2.2业务连续性的技术方案——灾备系统概述
14.3灾备系统架构
14.3.1网络系统
14.3.2云计算应用系统
14.3.3数据同步系统
14.3.4管理工具: 手动服务转移
14.4灾备方案的成本效率
14.4.1灾备资源的合理使用
14.4.2公有云和私有云之间的结合
14.5案例研究: 云服务提供商思科WebEx的灾备系统
14.5.1背景介绍
14.5.2WebEx GSB架构
14.5.3WebEx GSB的设计挑战和要点
14.5.4项目回顾
14.6本章小结
第15章服务运营的监控体系
15.1服务监控概述
15.2监控体系架构
15.2.1监控体系的层级结构
15.2.2监控体系的“4 2”要素
15.2.3Google SRE的监控方法论
15.2.4监控体系常涉及的数据库
15.3基础设施层的监控
15.3.1基础设施层监控对象
15.3.2基础设施的监控方法
15.3.3虚拟化监控
15.3.4容器化监控
15.4应用层监控
15.5服务层监控
15.5.1互联网性能监控
15.5.2用户体验监控
15.6案例研究——基础设施层监控
15.6.1背景介绍
15.6.2监控软件选择
15.6.3OpenFalcon简介
15.6.4分布式监控系统的指标体系
15.6.5监控平台的架构
15.6.6痛点与难点
第16章服务运营的自动化
16.1自动化理论
16.1.1自动化简介
16.1.2IT自动化的一般模型
16.1.3自动化的优点
16.1.4自动化的风险和局限性
16.2自动化运维的一般过程
16.2.1一个新手运维工程师的升级之路
16.2.2运维自动化发展阶段总结
16.3自动化等级
16.3.1驾驶自动化的等级
16.3.2Google SRE对自动化的分级
16.4自动化工具
16.4.1平台自动化工具: Kubernetes
16.4.2实践讨论: 用Kubernetes建立持续交付流程
16.4.3任务自动化工具: SaltStack
16.4.4实践讨论: 用SaltStack管理操作系统内核参数
16.4.5系统自动化工具: PXE
16.4.6实践讨论: 用PXE实施批量装机
16.5自动化的风险及控制
16.5.1自动化带来的技术风险
16.5.2自动化导致的故障
16.5.3自动化风险控制的一些方法
16.6运维自动化的深入: 引入控制理论
16.6.1控制原理介绍
16.6.2数据库自动化中控制理论的应用——自治数据库
16.6.3实践研究: HBase的压缩和分区状态迁移
16.7人工智能在自动化中的应用
16.7.1人工智能和机器学习
16.7.2人工智能与自动化: 实施策略
16.7.3人工智能与自动化: 实施切入点
16.8本章小结
第17章7×24小时服务的运营管理综述
17.17×24小时服务运营的管理目标
17.2经典的运营管理框架
17.2.1ITIL
12.2.2CMM和CMMI
17.2.3敏捷
17.2.4eTom
17.2.56Sigma
17.2.6COBIT
17.2.7经典框架的局限性
17.3以服务为核心的运营管理流程
17.4日常的运营管理
17.4.1沟通效率
17.4.2知识管理
17.4.3运营会议
17.5管理流程面对的挑战
17.5.1建立流程过程中的挑战
17.5.2成熟的运营——持续改进
17.6运营管理的成熟度: 五重境界
17.7案例研究: 运营管理流程的推广与改进
17.7.1背景
17.7.2推广计划
17.7.3结果分析
17.7.4下一步计划
17.8案例的延伸讨论: 主动式和被动式的运营管理
17.9本章小结
第18章事件、事故和问题管理三流程
18.17×24小时生产线运营的挑战
18.2服务运营的整体思路
18.3事件管理和生产线监控
18.3.1目的
18.3.2事件管理的流程
18.3.3生产线的监控系统
18.3.4实践中的要点
18.3.5实践中的要点与难点
18.4事故管理
18.4.1目的
18.4.2流程
18.4.3实践中的要点
18.4.4实践中的难点
18.5问题管理
18.5.1目的
18.5.2流程
18.5.3实践中的要点
18.5.4实践中的难点: 主动型问题管理
18.6实践(1): 事故管理流程的设计
18.6.1背景
18.6.2事故管理流程的总体设计
18.6.3设计中的特别关注点
18.7实践(2): 对管理者的建议
18.7.1生产服务管理体系建立的切入点: 事故管理
18.7.2立足于“技术 管理”的双维模型: 生产线事故一半出自
管理问题
18.7.3整体生产线管理框架: 各流程之间的交互
18.8案例分析: 从技术和管理的双维角度剖析事故
18.8.1背景
18.8.2事故复盘
18.8.3事故分析
18.8.4改进措施及成果
第19章变更管理
19.1变更管理介绍
19.1.1变更管理的目的
19.1.2变更管理的范畴
19.2变更管理的原理
19.2.1变更管理的任务
19.2.2变更的执行策略
19.2.3变更管理的流程
19.2.4变更流程的效果衡量
19.3云服务运营中的挑战
19.3.1云服务生产运营所面临的挑战
19.3.2变更管理对服务运营和商务的益处
19.3.3了解服务生产运营状况: 好还是差
19.4实践中的要点
19.4.1实践的核心: 控制
19.4.2实施的关键步骤
19.4.3变更流程1: 变更申请
19.4.4变更流程2: 变更审批
19.4.5变更流程3: 变更实施
19.4.6变更流程4: 变更反思
19.4.7团队和职责
19.5实践中的难点
19.5.1运营管理文化的建立
19.5.2高层管理者的支持
19.5.3支持变更管理的政策
19.6案例研究(1): 变更管理实施中所发现的运营问题和改进
19.6.1背景介绍
19.6.2研发与运营的冲突
19.6.3解决方案: 变更管理与用户管理、发布管理的结合
19.6.4蓝绿部署、灰度发布
19.6.5环境一致性管理
18.6.6进一步的讨论
19.7案例研究(2): 复杂环境下变更管理流程的设计
19.7.1背景介绍
19.7.2团队结构
19.7.3流程及其说明
19.7.4实施要素
19.7.5进一步的讨论
第20章容量管理
20.1容量管理的目的
20.2ITIL的容量管理方法介绍
20.2.1容量管理的基本流程
20.2.2容量管理的三个层次
20.2.3容量管理相关的基本要素
20.3云服务容量管理的挑战和要点
20.3.1来自云服务的挑战
20.3.2容量管理的要点
20.4容量规划
20.4.1容量需求分析
20.4.2容量建模与容量方案
20.4.3成本审核与调整
20.4.4实施计划
20.5性能管理
20.6容量规划的关键: 建模
20.6.1使用量的模拟: 使用量与时间的关系
20.6.2成本的模拟: 成本与使用量的关系
20.7建模的数学方法
20.7.1回归分析法
20.7.2趋势外推预测方法
20.7.3时间序列平滑预测法
20.7.4机器学习算法
20.8容量管理的衡量指标
20.9成功因素和风险
20.10案例研究: 苏宁金融容量管理的技术解决方案
20.10.1背景介绍
20.10.2技术解决方案
20.10.3成本管理的实施
20.10.4容量模型的建立
20.10.5智能算法的应用
第4部分智能运营(AIOps)
第21章数据能力——智能运营(AIOps)介绍
21.1数据能力的新阶段: AIOps
21.2AIOps发展历史: 从ITOA到AIOps
21.2.1ITOA
21.2.2AIOps
21.3AIOps的技术栈
21.4机器学习介绍
21.4.1机器学习的定义
21.4.2监督学习和无监督学习
21.4.3神经网络及深度学习
21.4.4机器学习中的分类与聚类
21.5AIOps为工厂运营管理赋能
21.6场景讨论: 运维报警风暴的处理
21.6.1报警风暴
21.6.2基于时间序列数据定义异常值
21.6.3使用机器学习的非监督算法报警
21.6.4用机器学习方法进一步提取更丰富的数据
21.7本章小结
第22章AIOps中的算法基础
22.1AIOps适用场景和算法策略
22.1.1AIOps适用场景
22.1.2AIOps策略: 场景分解和算法组合
22.2KPI聚类
22.2.1k中心聚类算法
22.2.2密度聚类算法
22.2.3随机聚类算法
22.3瓶颈分析
22.3.1皮尔逊(Pearson)相关系数
22.3.2逻辑回归
22.3.3决策树
22.4异常检测与容量预测
22.4.1异常检测
22.4.2容量预测
22.4.3ARIMA模型
22.4.4HoltWinters指数平滑算法
22.4.5长短期记忆算法
22.5异常定位
22.5.1异常定位的定义与难点
22.5.2iDice
22.5.3Adtributor算法
22.6故障预测
22.6.1故障预测的定义
22.6.2隐式马尔可夫模型
22.6.3支持向量机与核函数
22.6.4多示例学习
22.7实践讨论: 异常检测场景中的算法选择思路
22.8数据重视和增量学习
第23章AIOps的落地: 企业实施
23.1AIOps企业实施战略
23.1.1实施路线图
23.1.2实施策略
23.2建立基础: 数据先行
23.2.1数据整合
23.2.2数据处理
23.3实践讨论
23.3.1阶段性实施策略
23.3.2落地点之一 : 降低MTTR
23.3.3策略实施中容易犯的错误
23.4案例研究: 苏宁金融的智能运维实践
23.4.1背景介绍
23.4.2苏宁金融智能运维生态体系
23.4.3AIOps切入点选择: 问题根因分析
23.4.4技术挑战
23.4.5智能问题诊断流程
23.4.6智能问题诊断算法模型
23.4.7模型效果表现
23.4.8总结: 挑战、思路与计划
第5部分安全技术与管理
第24章云计算安全概述
24.1概述
24.1.1云计算安全的定义
24.1.2广义的云计算安全
24.2云计算安全的挑战和研究现状
24.2.1云计算安全研究焦点域
24.2.2国内外云计算安全技术研究现状
24.2.3云计算模式下信息安全技术演进趋势
24.3国内外云计算安全相关的标准化组织及其研究成果
24.3.1云安全联盟(CSA)
24.3.2联合技术委员会
24.3.3国际电信联盟电信标准化部门
24.3.4分布式管理任务组
24.3.5全国信息安全标准化技术委员会
24.3.6中国通信标准化协会
24.4本章小结
第25章云计算安全架构
25.1云计算安全体系架构
25.2云计算模型与安全架构模型间的映射关系
25.3云计算安全职责划分
25.4本章小结
第26章云计算基础设施安全
26.1云计算基础设施面临的安全风险
26.2云计算基础设施的安全保护机制
26.2.1物理安全
26.2.2网络安全
26.2.3主机安全
26.2.4虚拟化安全
26.2.5中间件安全
26.3本章小结
第27章云计算数据安全
27.1云计算环境下数据安全综述
27.1.1数据安全保护的意义
27.1.2数据生命周期
27.2服务提供商面临的数据安全风险及挑战
27.2.1数据加密
27.2.2钓鱼行为
27.2.3数据审计与监控
27.3数据安全保护机制
27.3.1数据加密介绍
27.3.2数据脱敏
27.3.3数据残余销毁
27.3.4数据沿袭(Data Lineage)
27.3.5数据备份与恢复
27.3.6访问控制
27.3.7新一代云计算安全技术
27.4案例分析: 政务云的数据安全设施
27.4.1项目背景
27.4.2技术方案
27.4.3实施要点
27.5本章小结
第28章IaaS和PaaS服务安全
28.1IaaS服务用户需重点关注的安全问题
28.1.1系统基础服务安全风险及应对措施
28.1.2远程管理风险及应对措施
28.1.3DNS威胁及应对措施
28.2IaaS服务用户安全检查清单
28.3PaaS服务用户需重点关注的安全问题
28.3.1安全相关的API
28.3.2应用安全部署
28.3.3远程安全访问
28.3.4服务锁定风险
28.4PaaS服务用户安全检查清单
28.5本章小结
第29章SaaS服务安全
29.1SaaS服务安全风险
29.1.1互联网服务安全现状
29.1.2SaaS服务安全需求
29.2SaaS应用安全保护机制
29.2.1安全开发生命周期
29.2.2Web应用防火墙
29.2.3身份识别与访问管理
29.2.4终端用户安全
29.3案例研究: 桌面云服务安全部署方案
29.3.1桌面云服务概述
29.3.2设计挑战
29.3.3设计要点
29.4本章小结
第30章云计算安全治理
30.1组织架构与过程模型
30.1.1组织架构
30.1.2风险管理
30.1.3过程模型
30.2云计算安全治理操作
30.2.1云计算安全指南制定
30.2.2安全监控与事件响应
30.2.3威胁管理和渗透测试
30.2.4变更管理
30.2.5安全审计与日志
30.3隐私保护
30.3.1云计算环境下隐私保护的概念
30.3.2云计算环境下的隐私数据
30.3.3云计算环境下隐私数据保护对策
30.4案例: 金融业的电子支付运营安全
30.4.1需求分析
30.4.2设计考虑
30.4.3安全运营治理实施
30.4.4成效评估
30.5本章小结
第31章云计算的合规性
31.1IT合规概述
31.1.1什么是IT合规
31.1.2IT合规对云计算提供商的必要性
31.1.3云服务提供商在合规中面临的挑战
31.2信息化合规规划
31.2.1信息科技合规整体框架
31.2.2IT合规解决方案
31.3IT合规实践
31.3.1IT合规的工作内容
31.3.2IT合规的实践建议
31.4合规工作中的难点和解决思路
31.4.1公司的战略与支持
31.4.2IT管理
31.4.3技术运营团队的工作
31.5案例研究: 在线金融服务商的合规实践
31.5.1背景介绍
31.5.2安全整改内容
31.5.3实施阶段
31.5.4合规整改结果
31.5.5项目挑战点
31.5.6后期项目的风险和困难点
31.6本章小结
31.6.1合规实施的要点
31.6.2合规实施的难点
31.6.3进一步的建议
第6部分服务质量管理
第32章云服务的质量工程
32.1服务质量保证的基本原理
32.1.1软件服务质量
32.1.2软件过程质量
32.1.3质量管理体系的构成
32.1.4软件质量控制
32.1.5软件质量保证
32.1.6软件质量改进
32.2质量保证过程
32.2.1验证与确认
32.2.2评审
32.2.3正式评审会议
32.2.4单元测试与集成测试
32.2.5功能测试
32.2.6回归测试
32.2.7系统的非功能性测试
32.2.8验收测试
32.2.9技术运营阶段的质量保证活动
32.3云服务平台的特有质量诉求
32.3.1可用性
32.3.2安全性
32.3.3可扩充性
32.4需求评审和设计评审
32.4.1需求评审
32.4.2系统架构设计评审
32.4.3系统部署物理设计评审
32.5云服务的验证
32.5.1可用性验证
32.5.2安全性验证
32.5.3可伸缩性验证
32.5.4通过SLA来保证质量水平
第33章服务运营的质量管理
33.1服务质量管理的目的
33.2经典的服务质量管理方法
33.2.1ITIL/CSI框架
33.2.26Sigma框架
33.2.3戴明循环理论
33.3云服务运营中质量管理所面临的挑战
33.3.1源自运营目标的挑战
33.3.2来自执行中的难度
33.4对服务质量管理的探索: GMAI方法及其要点
33.5GMAI服务质量管理: 服务改进的框架
33.5.1质量管理目标(Goal)
33.5.2衡量(Measure)
33.5.3分析(Analysis)
33.5.4改进(Improve)
33.6GMAI服务质量管理: 服务改进的持续
33.6.1持续性的实现方法: 来自目标和项目的驱动
33.6.2持续性的基础: 证明自己的业务价值
33.7实践讨论(1): 如何保证服务质量改进的持续性
33.8实践讨论(2): 服务质量管理如何获得管理层的支持
33.8.1高质量的报告
33.8.2高级管理人员仪表板
33.9服务质量管理方案的选择
第7部分组织能力
第34章组织能力的构建与发展
34.1组织能力概述
34.1.1企业成功的关键
34.1.2组织能力的定义和建设
34.1.3云服务的组织能力框架
34.2云计算服务公司面临的挑战
34.3员工能力
34.3.1建立学习型组织
34.3.2有效的培训体系
34.4员工的思维模式
34.4.1公司价值观的建立: 如何确定价值观的内容
34.4.2价值观落地: 团队的接受
34.5员工治理
34.5.1组织架构: 合理的团队结构
34.5.2组织架构中的边界管理: 边界弱化、增强及平衡
34.5.3业务流程: 明确的制度
34.5.4有效的信息管理
34.6技术体系的组织架构
34.6.1一元初始: 研发
34.6.2二元架构: 研发、运营
34.6.3三元架构: 研发、运营、数据
34.6.4四元架构: 研发、运营、数据、管理
34.7客服体系的组织架构
34.8实践研究(1): 构建高效的技术运营团队
34.8.1背景
34.8.2思维方式: 技术运营的管理思想
34.8.3团队治理: 团队的结构与责任
34.8.4团队能力: 团队的培养
34.9实践研究(2): 构建大数据的组织能力
34.9.1企业的新型竞争力: 分析能力
34.9.2大数据组织能力模型
34.9.3员工思维
34.9.4员工治理
34.10实践研究(3): 构建服务导向的客户服务部门
34.10.1客服的三种核心服务方式
34.10.2被动式服务: 问题的快速响应
34.10.3主动式服务: 有效的客户管理
34.10.4服务体系的改进
34.10.5本章小结
参考文献
后记——行自云起时,更上一层楼
1.1本书的框架思路: 云计算和大数据服务实现的四要素
1.2本书的框架结构
1.2.1技术构建(第1、第2部分): 云计算和大数据
1.2.2服务运营(第3、第4、第5部分): 技术、管理、AIOps和安全
1.2.3服务质量管理(第6部分)
1.2.4组织能力(第7部分)
1.3本书的章节结构
1.4云计算技术与服务
1.4.1云计算的发展史
1.4.2云计算的定义
1.4.3云计算的服务模式
1.4.4云计算的部署方式
1.5大数据和数据智能的技术与服务
1.5.1大数据的定义
1.5.2云计算与大数据的关系
1.5.3数据智能
1.6技术运营: 从技术升级到服务的实现关键
1.7智能实践
第1部分云计算技术
第2章云计算技术综述
2.1云计算的技术发展回顾
2.1.1云计算技术概念的发展
2.1.2云计算相关技术的发展
2.2云服务的技术结构
2.2.1云服务的技术层次
2.2.2云服务的技术结构适用场景
2.3云服务对技术团队带来的挑战
2.3.1对研发团队的挑战
2.3.2对技术运营团队的挑战
2.3.3对服务质量控制团队的挑战
第3章云计算的技术框架: 面向服务的架构
3.17×24小时云服务的挑战
3.1.1传统企业服务软件与云服务软件对比
3.1.2特性化与统一服务
3.1.3面向运营及服务系统功能
3.1.4IT管理与服务监控
3.2云服务架构
3.2.1设计的基础模式
3.2.2设计的结构模式
3.3构建高可靠性
3.3.1可靠性理论与云计算平台的需求实现
3.3.2可靠性设计
3.3.3负载均衡与集群
3.3.4双机热备
3.3.5异地灾备
3.4构建高性能
3.4.1系统容量与性能瓶颈
3.4.2接入与Web层容量与性能设计与优化
3.4.3服务层容量与性能设计与优化
3.4.4数据层容量与性能设计与优化
3.4.5应对高并发容量
3.5构建高伸缩性
3.5.1设计规则扩展与性能
3.5.2并发访问量
3.5.3并发数据访问与I/O
3.6构建高可配置性
3.6.1系统配置
3.6.2站点配置
3.6.3用户配置
3.6.4服务配置与技术运营关系
3.7构建高可管理性云计算平台
3.7.1系统维护周期
3.7.2系统维护与服务中断
3.7.3系统可配置性
3.7.4系统监控能力
3.7.5日志记录与错误处理
3.7.6用于服务的配置、监控与日志系统
3.8案例分析
3.8.1背景介绍
3.8.2解决方案
3.8.3讨论
3.9本章小结
第4章云服务的技术基础: 虚拟化
4.1虚拟化技术的发展历史
4.2虚拟化技术分类
4.3系统虚拟化
4.3.1系统虚拟化的优势
4.3.2系统虚拟化存在的问题
4.3.3系统虚拟化的不足
4.4网络虚拟化
4.4.1网络虚拟化的分类
4.4.2网络虚拟化的优势
4.4.3网络虚拟化的不足
4.5容器的虚拟化
4.6其他虚拟化技术
4.7市场主流虚拟化技术对比
4.8虚拟化对云计算的推动
4.9虚拟化与数据中心
4.9.1虚拟化数据中心的优点
4.9.2虚拟化数据中心的风险
4.9.3虚拟化数据中心风险应对
4.10研究分析: 虚拟化技术的发展趋势
4.11本章小结
第5章云服务的平台技术: IaaS、PaaS和SaaS
5.1平台技术的发展
5.1.1平台技术演进阶段
5.1.2云管理平台贯穿云平台技术发展始终
5.1.3云平台技术发展的展望
5.1.4关于FaaS平台的思考
5.2IaaS
5.2.1IaaS平台架构
5.2.2IaaS的适用场景
5.2.3IaaS的优缺点
5.2.4IaaS的市场价值
5.2.5IaaS的局限性
5.3PaaS
5.3.1PaaS平台架构
5.3.2PaaS的适用场景
5.3.3PaaS的优缺点
5.3.4PaaS的市场价值
5.3.5PaaS的局限性
5.4SaaS
5.4.1SaaS平台架构
5.4.2SaaS的适用场景
5.4.3SaaS的优缺点
5.4.4SaaS的市场价值
5.4.5SaaS的局限性
5.5CaaS
5.5.1CaaS平台架构
5.5.2CaaS的适用场景
5.5.3CaaS的优缺点
5.5.4CaaS的市场价值
5.6云管理平台
5.6.1云管理平台的规范架构
5.6.2云管理平台的职能
5.6.3云管理平台的应用场景举例
5.7平台的实施要点和挑战
5.7.1技术选型
5.7.2实施要点
5.7.3风险和挑战
5.8案例研究: SaaS的构建、演进、成果与教训
5.8.1背景介绍
5.8.2自建IDC阶段
5.8.3采用IaaS公有云阶段
5.8.4混合云阶段
5.8.5容器化及微服务阶段
5.8.6数据安全
第6章云服务的应用层技术: 微服务
6.1微服务与云计算
6.2微服务的定义
6.3微服务的发展简史
6.4微服务和SOA的关系
6.5微服务的构成要素
6.6微服务的优缺点
6.6.1微服务的优点
6.6.2微服务的缺点
6.7微服务的实施要点
6.8案例分析: SMS推送平台的微服务化
6.8.1背景简介
6.8.2系统特点
6.8.3早期设计
6.8.4解决方案
6.8.5决策过程
6.8.6实施过程
6.8.7实施效果
6.8.8未来改进
6.8.9项目回顾
第2部分大数据与数据智能
第7章大数据理论及相关模型
7.1大数据概念的提出和演进
7.24V 1O特征模型: 大数据特征
7.3第四范式: 问题解决的新模式
7.4蜜蜂效应: 数据的选择价值
7.5大数据业务成熟度模型
7.5.1业务监测
7.5.2业务洞察
7.5.3业务优化
7.5.4数据变现
7.5.5商业重塑
7.6数据智能
第8章数据智能平台构建策略
8.1数据业务的构建过程
8.1.1数据系统建设
8.1.2数据业务建模
8.1.3数据业务开展
8.2数据智能体系要求
8.2.1建设思路、原则和目标
8.2.2基础平台
8.2.3融合平台
8.2.4治理系统
8.2.5质量保证
8.2.6安全计算
8.2.7分析挖掘
8.2.8数据可视化
8.3数据中台策略
8.3.1数据仓库和数据湖
8.3.2数据中台
8.3.3数据中台和数据仓库、数据湖的差别
第9章大数据技术和平台
9.1大数据基础技术系统组成
9.2大数据开源体系各部分介绍
9.2.1Hadoop介绍
9.2.2开源生态系统
9.3大数据生态的发展态势
9.3.1数据治理与安全
9.3.2基础设施
9.3.3数据协作工作台
9.3.4数据分析流程自动化
9.3.5AI驱动的应用发展趋势
9.4实践讨论: 大数据存储的建模
9.4.1分布式存储的架构
9.4.2数据存储设计
9.4.3NoSQL的问题
9.4.4存储设计实例
第10章大数据分析系统技术
10.1分析系统架构设计
10.1.1CAP理论
10.1.2分析系统考量三要素
10.1.3实时查询过程
10.2架构选择
10.2.1大规模并行处理架构
10.2.2基于搜索引擎的架构
10.2.3预计算系统架构
10.2.4三种架构的对比
第11章企业大数据实施策略
11.1企业实施大数据战略面临的挑战
11.2实施规划
11.2.1切入点规划
11.2.2组织配置和调整
11.2.3数据获取和挖掘
11.2.4效果评估
11.3案例研究: 大数据运营场景及系统实施
11.3.1背景介绍
11.3.2演化路径
11.3.3个推V1.0——基础SaaS产品
11.3.4个推V2.0——大数据基础下的智能推送
11.3.5个推V3.0——数据智能下的个推
11.4实践中的经验教训
11.4.1技术陷阱
11.4.2简洁及成本意识
11.4.3新技术的进一步应用
11.4.4总结
第3部分服务的技术运营
第12章服务的技术运营综述
12.1技术运营的基本概念
12.2云服务的技术运营
12.2.1云服务的技术运营也是关于生产系统的运营
12.2.2技术运营的功能
12.2.3是技术运营,而不仅仅是维护
12.3云服务技术运营的目标
12.3.1从航空服务公司的要求来看
12.3.2云服务的运营管理目标
12.3.3技术运营永恒的四大指标
12.4技术运营的双维模型
12.4.1技术运营的双维概念
12.4.2双维的目的
12.4.3技术运营的双维模型
12.4.4双维平台的实施
12.5DevOps方法论
12.5.1DevOps简史
12.5.2DevOps定义
12.5.3DevOps的关键过程
12.6服务可靠性工程
12.6.1服务可靠性工程的定义与要点
12.6.2SRE与DevOps
12.7双维模型、DevOps与SRE的指导意义和应用
12.7.1双维模型: 给CXO的运营指导
12.7.2DevOps与SRE: 给技术架构师的指导
12.7.3实践讨论(1): Dev与Ops的和与分
12.7.4实践讨论(2): 技术运营不同阶段各种方法论的应用
12.7.5实践讨论(3): 在研发团队中引进DevOps思维
第13章服务的生产设计
13.1生产设计的目的
13.1.1建立生产型的云服务
13.1.2云服务的生产设计
13.2生产设计方法
13.2.1生产设计目标
13.2.2生产设计流程
13.3生产设计(1): 工程开发期间的任务
13.3.1服务平台的重要部分: 基础建设工程
13.3.2服务可用度
13.3.3服务的可管理性
13.3.4安全性
13.3.5可扩展性
13.4生产设计(2): 上线期间的任务
13.4.1生产线验收
13.4.2生产线部署
13.4.3日常维护计划
13.5服务支持结构: 团队和知识
13.5.1团队结构
13.5.2知识传递: 文档的需求
13.6实践和讨论
13.6.1从工程到实施的关键: 系统层的逻辑设计
13.6.2进入生产线: 生产线的部署设计
第14章服务的业务连续性
14.1云服务业务连续性及其挑战
14.1.1业务连续性的定义
14.1.2云服务提供商面临的挑战
14.2云计算的业务连续性方案概述
14.2.1业务连续性的管理
14.2.2业务连续性的技术方案——灾备系统概述
14.3灾备系统架构
14.3.1网络系统
14.3.2云计算应用系统
14.3.3数据同步系统
14.3.4管理工具: 手动服务转移
14.4灾备方案的成本效率
14.4.1灾备资源的合理使用
14.4.2公有云和私有云之间的结合
14.5案例研究: 云服务提供商思科WebEx的灾备系统
14.5.1背景介绍
14.5.2WebEx GSB架构
14.5.3WebEx GSB的设计挑战和要点
14.5.4项目回顾
14.6本章小结
第15章服务运营的监控体系
15.1服务监控概述
15.2监控体系架构
15.2.1监控体系的层级结构
15.2.2监控体系的“4 2”要素
15.2.3Google SRE的监控方法论
15.2.4监控体系常涉及的数据库
15.3基础设施层的监控
15.3.1基础设施层监控对象
15.3.2基础设施的监控方法
15.3.3虚拟化监控
15.3.4容器化监控
15.4应用层监控
15.5服务层监控
15.5.1互联网性能监控
15.5.2用户体验监控
15.6案例研究——基础设施层监控
15.6.1背景介绍
15.6.2监控软件选择
15.6.3OpenFalcon简介
15.6.4分布式监控系统的指标体系
15.6.5监控平台的架构
15.6.6痛点与难点
第16章服务运营的自动化
16.1自动化理论
16.1.1自动化简介
16.1.2IT自动化的一般模型
16.1.3自动化的优点
16.1.4自动化的风险和局限性
16.2自动化运维的一般过程
16.2.1一个新手运维工程师的升级之路
16.2.2运维自动化发展阶段总结
16.3自动化等级
16.3.1驾驶自动化的等级
16.3.2Google SRE对自动化的分级
16.4自动化工具
16.4.1平台自动化工具: Kubernetes
16.4.2实践讨论: 用Kubernetes建立持续交付流程
16.4.3任务自动化工具: SaltStack
16.4.4实践讨论: 用SaltStack管理操作系统内核参数
16.4.5系统自动化工具: PXE
16.4.6实践讨论: 用PXE实施批量装机
16.5自动化的风险及控制
16.5.1自动化带来的技术风险
16.5.2自动化导致的故障
16.5.3自动化风险控制的一些方法
16.6运维自动化的深入: 引入控制理论
16.6.1控制原理介绍
16.6.2数据库自动化中控制理论的应用——自治数据库
16.6.3实践研究: HBase的压缩和分区状态迁移
16.7人工智能在自动化中的应用
16.7.1人工智能和机器学习
16.7.2人工智能与自动化: 实施策略
16.7.3人工智能与自动化: 实施切入点
16.8本章小结
第17章7×24小时服务的运营管理综述
17.17×24小时服务运营的管理目标
17.2经典的运营管理框架
17.2.1ITIL
12.2.2CMM和CMMI
17.2.3敏捷
17.2.4eTom
17.2.56Sigma
17.2.6COBIT
17.2.7经典框架的局限性
17.3以服务为核心的运营管理流程
17.4日常的运营管理
17.4.1沟通效率
17.4.2知识管理
17.4.3运营会议
17.5管理流程面对的挑战
17.5.1建立流程过程中的挑战
17.5.2成熟的运营——持续改进
17.6运营管理的成熟度: 五重境界
17.7案例研究: 运营管理流程的推广与改进
17.7.1背景
17.7.2推广计划
17.7.3结果分析
17.7.4下一步计划
17.8案例的延伸讨论: 主动式和被动式的运营管理
17.9本章小结
第18章事件、事故和问题管理三流程
18.17×24小时生产线运营的挑战
18.2服务运营的整体思路
18.3事件管理和生产线监控
18.3.1目的
18.3.2事件管理的流程
18.3.3生产线的监控系统
18.3.4实践中的要点
18.3.5实践中的要点与难点
18.4事故管理
18.4.1目的
18.4.2流程
18.4.3实践中的要点
18.4.4实践中的难点
18.5问题管理
18.5.1目的
18.5.2流程
18.5.3实践中的要点
18.5.4实践中的难点: 主动型问题管理
18.6实践(1): 事故管理流程的设计
18.6.1背景
18.6.2事故管理流程的总体设计
18.6.3设计中的特别关注点
18.7实践(2): 对管理者的建议
18.7.1生产服务管理体系建立的切入点: 事故管理
18.7.2立足于“技术 管理”的双维模型: 生产线事故一半出自
管理问题
18.7.3整体生产线管理框架: 各流程之间的交互
18.8案例分析: 从技术和管理的双维角度剖析事故
18.8.1背景
18.8.2事故复盘
18.8.3事故分析
18.8.4改进措施及成果
第19章变更管理
19.1变更管理介绍
19.1.1变更管理的目的
19.1.2变更管理的范畴
19.2变更管理的原理
19.2.1变更管理的任务
19.2.2变更的执行策略
19.2.3变更管理的流程
19.2.4变更流程的效果衡量
19.3云服务运营中的挑战
19.3.1云服务生产运营所面临的挑战
19.3.2变更管理对服务运营和商务的益处
19.3.3了解服务生产运营状况: 好还是差
19.4实践中的要点
19.4.1实践的核心: 控制
19.4.2实施的关键步骤
19.4.3变更流程1: 变更申请
19.4.4变更流程2: 变更审批
19.4.5变更流程3: 变更实施
19.4.6变更流程4: 变更反思
19.4.7团队和职责
19.5实践中的难点
19.5.1运营管理文化的建立
19.5.2高层管理者的支持
19.5.3支持变更管理的政策
19.6案例研究(1): 变更管理实施中所发现的运营问题和改进
19.6.1背景介绍
19.6.2研发与运营的冲突
19.6.3解决方案: 变更管理与用户管理、发布管理的结合
19.6.4蓝绿部署、灰度发布
19.6.5环境一致性管理
18.6.6进一步的讨论
19.7案例研究(2): 复杂环境下变更管理流程的设计
19.7.1背景介绍
19.7.2团队结构
19.7.3流程及其说明
19.7.4实施要素
19.7.5进一步的讨论
第20章容量管理
20.1容量管理的目的
20.2ITIL的容量管理方法介绍
20.2.1容量管理的基本流程
20.2.2容量管理的三个层次
20.2.3容量管理相关的基本要素
20.3云服务容量管理的挑战和要点
20.3.1来自云服务的挑战
20.3.2容量管理的要点
20.4容量规划
20.4.1容量需求分析
20.4.2容量建模与容量方案
20.4.3成本审核与调整
20.4.4实施计划
20.5性能管理
20.6容量规划的关键: 建模
20.6.1使用量的模拟: 使用量与时间的关系
20.6.2成本的模拟: 成本与使用量的关系
20.7建模的数学方法
20.7.1回归分析法
20.7.2趋势外推预测方法
20.7.3时间序列平滑预测法
20.7.4机器学习算法
20.8容量管理的衡量指标
20.9成功因素和风险
20.10案例研究: 苏宁金融容量管理的技术解决方案
20.10.1背景介绍
20.10.2技术解决方案
20.10.3成本管理的实施
20.10.4容量模型的建立
20.10.5智能算法的应用
第4部分智能运营(AIOps)
第21章数据能力——智能运营(AIOps)介绍
21.1数据能力的新阶段: AIOps
21.2AIOps发展历史: 从ITOA到AIOps
21.2.1ITOA
21.2.2AIOps
21.3AIOps的技术栈
21.4机器学习介绍
21.4.1机器学习的定义
21.4.2监督学习和无监督学习
21.4.3神经网络及深度学习
21.4.4机器学习中的分类与聚类
21.5AIOps为工厂运营管理赋能
21.6场景讨论: 运维报警风暴的处理
21.6.1报警风暴
21.6.2基于时间序列数据定义异常值
21.6.3使用机器学习的非监督算法报警
21.6.4用机器学习方法进一步提取更丰富的数据
21.7本章小结
第22章AIOps中的算法基础
22.1AIOps适用场景和算法策略
22.1.1AIOps适用场景
22.1.2AIOps策略: 场景分解和算法组合
22.2KPI聚类
22.2.1k中心聚类算法
22.2.2密度聚类算法
22.2.3随机聚类算法
22.3瓶颈分析
22.3.1皮尔逊(Pearson)相关系数
22.3.2逻辑回归
22.3.3决策树
22.4异常检测与容量预测
22.4.1异常检测
22.4.2容量预测
22.4.3ARIMA模型
22.4.4HoltWinters指数平滑算法
22.4.5长短期记忆算法
22.5异常定位
22.5.1异常定位的定义与难点
22.5.2iDice
22.5.3Adtributor算法
22.6故障预测
22.6.1故障预测的定义
22.6.2隐式马尔可夫模型
22.6.3支持向量机与核函数
22.6.4多示例学习
22.7实践讨论: 异常检测场景中的算法选择思路
22.8数据重视和增量学习
第23章AIOps的落地: 企业实施
23.1AIOps企业实施战略
23.1.1实施路线图
23.1.2实施策略
23.2建立基础: 数据先行
23.2.1数据整合
23.2.2数据处理
23.3实践讨论
23.3.1阶段性实施策略
23.3.2落地点之一 : 降低MTTR
23.3.3策略实施中容易犯的错误
23.4案例研究: 苏宁金融的智能运维实践
23.4.1背景介绍
23.4.2苏宁金融智能运维生态体系
23.4.3AIOps切入点选择: 问题根因分析
23.4.4技术挑战
23.4.5智能问题诊断流程
23.4.6智能问题诊断算法模型
23.4.7模型效果表现
23.4.8总结: 挑战、思路与计划
第5部分安全技术与管理
第24章云计算安全概述
24.1概述
24.1.1云计算安全的定义
24.1.2广义的云计算安全
24.2云计算安全的挑战和研究现状
24.2.1云计算安全研究焦点域
24.2.2国内外云计算安全技术研究现状
24.2.3云计算模式下信息安全技术演进趋势
24.3国内外云计算安全相关的标准化组织及其研究成果
24.3.1云安全联盟(CSA)
24.3.2联合技术委员会
24.3.3国际电信联盟电信标准化部门
24.3.4分布式管理任务组
24.3.5全国信息安全标准化技术委员会
24.3.6中国通信标准化协会
24.4本章小结
第25章云计算安全架构
25.1云计算安全体系架构
25.2云计算模型与安全架构模型间的映射关系
25.3云计算安全职责划分
25.4本章小结
第26章云计算基础设施安全
26.1云计算基础设施面临的安全风险
26.2云计算基础设施的安全保护机制
26.2.1物理安全
26.2.2网络安全
26.2.3主机安全
26.2.4虚拟化安全
26.2.5中间件安全
26.3本章小结
第27章云计算数据安全
27.1云计算环境下数据安全综述
27.1.1数据安全保护的意义
27.1.2数据生命周期
27.2服务提供商面临的数据安全风险及挑战
27.2.1数据加密
27.2.2钓鱼行为
27.2.3数据审计与监控
27.3数据安全保护机制
27.3.1数据加密介绍
27.3.2数据脱敏
27.3.3数据残余销毁
27.3.4数据沿袭(Data Lineage)
27.3.5数据备份与恢复
27.3.6访问控制
27.3.7新一代云计算安全技术
27.4案例分析: 政务云的数据安全设施
27.4.1项目背景
27.4.2技术方案
27.4.3实施要点
27.5本章小结
第28章IaaS和PaaS服务安全
28.1IaaS服务用户需重点关注的安全问题
28.1.1系统基础服务安全风险及应对措施
28.1.2远程管理风险及应对措施
28.1.3DNS威胁及应对措施
28.2IaaS服务用户安全检查清单
28.3PaaS服务用户需重点关注的安全问题
28.3.1安全相关的API
28.3.2应用安全部署
28.3.3远程安全访问
28.3.4服务锁定风险
28.4PaaS服务用户安全检查清单
28.5本章小结
第29章SaaS服务安全
29.1SaaS服务安全风险
29.1.1互联网服务安全现状
29.1.2SaaS服务安全需求
29.2SaaS应用安全保护机制
29.2.1安全开发生命周期
29.2.2Web应用防火墙
29.2.3身份识别与访问管理
29.2.4终端用户安全
29.3案例研究: 桌面云服务安全部署方案
29.3.1桌面云服务概述
29.3.2设计挑战
29.3.3设计要点
29.4本章小结
第30章云计算安全治理
30.1组织架构与过程模型
30.1.1组织架构
30.1.2风险管理
30.1.3过程模型
30.2云计算安全治理操作
30.2.1云计算安全指南制定
30.2.2安全监控与事件响应
30.2.3威胁管理和渗透测试
30.2.4变更管理
30.2.5安全审计与日志
30.3隐私保护
30.3.1云计算环境下隐私保护的概念
30.3.2云计算环境下的隐私数据
30.3.3云计算环境下隐私数据保护对策
30.4案例: 金融业的电子支付运营安全
30.4.1需求分析
30.4.2设计考虑
30.4.3安全运营治理实施
30.4.4成效评估
30.5本章小结
第31章云计算的合规性
31.1IT合规概述
31.1.1什么是IT合规
31.1.2IT合规对云计算提供商的必要性
31.1.3云服务提供商在合规中面临的挑战
31.2信息化合规规划
31.2.1信息科技合规整体框架
31.2.2IT合规解决方案
31.3IT合规实践
31.3.1IT合规的工作内容
31.3.2IT合规的实践建议
31.4合规工作中的难点和解决思路
31.4.1公司的战略与支持
31.4.2IT管理
31.4.3技术运营团队的工作
31.5案例研究: 在线金融服务商的合规实践
31.5.1背景介绍
31.5.2安全整改内容
31.5.3实施阶段
31.5.4合规整改结果
31.5.5项目挑战点
31.5.6后期项目的风险和困难点
31.6本章小结
31.6.1合规实施的要点
31.6.2合规实施的难点
31.6.3进一步的建议
第6部分服务质量管理
第32章云服务的质量工程
32.1服务质量保证的基本原理
32.1.1软件服务质量
32.1.2软件过程质量
32.1.3质量管理体系的构成
32.1.4软件质量控制
32.1.5软件质量保证
32.1.6软件质量改进
32.2质量保证过程
32.2.1验证与确认
32.2.2评审
32.2.3正式评审会议
32.2.4单元测试与集成测试
32.2.5功能测试
32.2.6回归测试
32.2.7系统的非功能性测试
32.2.8验收测试
32.2.9技术运营阶段的质量保证活动
32.3云服务平台的特有质量诉求
32.3.1可用性
32.3.2安全性
32.3.3可扩充性
32.4需求评审和设计评审
32.4.1需求评审
32.4.2系统架构设计评审
32.4.3系统部署物理设计评审
32.5云服务的验证
32.5.1可用性验证
32.5.2安全性验证
32.5.3可伸缩性验证
32.5.4通过SLA来保证质量水平
第33章服务运营的质量管理
33.1服务质量管理的目的
33.2经典的服务质量管理方法
33.2.1ITIL/CSI框架
33.2.26Sigma框架
33.2.3戴明循环理论
33.3云服务运营中质量管理所面临的挑战
33.3.1源自运营目标的挑战
33.3.2来自执行中的难度
33.4对服务质量管理的探索: GMAI方法及其要点
33.5GMAI服务质量管理: 服务改进的框架
33.5.1质量管理目标(Goal)
33.5.2衡量(Measure)
33.5.3分析(Analysis)
33.5.4改进(Improve)
33.6GMAI服务质量管理: 服务改进的持续
33.6.1持续性的实现方法: 来自目标和项目的驱动
33.6.2持续性的基础: 证明自己的业务价值
33.7实践讨论(1): 如何保证服务质量改进的持续性
33.8实践讨论(2): 服务质量管理如何获得管理层的支持
33.8.1高质量的报告
33.8.2高级管理人员仪表板
33.9服务质量管理方案的选择
第7部分组织能力
第34章组织能力的构建与发展
34.1组织能力概述
34.1.1企业成功的关键
34.1.2组织能力的定义和建设
34.1.3云服务的组织能力框架
34.2云计算服务公司面临的挑战
34.3员工能力
34.3.1建立学习型组织
34.3.2有效的培训体系
34.4员工的思维模式
34.4.1公司价值观的建立: 如何确定价值观的内容
34.4.2价值观落地: 团队的接受
34.5员工治理
34.5.1组织架构: 合理的团队结构
34.5.2组织架构中的边界管理: 边界弱化、增强及平衡
34.5.3业务流程: 明确的制度
34.5.4有效的信息管理
34.6技术体系的组织架构
34.6.1一元初始: 研发
34.6.2二元架构: 研发、运营
34.6.3三元架构: 研发、运营、数据
34.6.4四元架构: 研发、运营、数据、管理
34.7客服体系的组织架构
34.8实践研究(1): 构建高效的技术运营团队
34.8.1背景
34.8.2思维方式: 技术运营的管理思想
34.8.3团队治理: 团队的结构与责任
34.8.4团队能力: 团队的培养
34.9实践研究(2): 构建大数据的组织能力
34.9.1企业的新型竞争力: 分析能力
34.9.2大数据组织能力模型
34.9.3员工思维
34.9.4员工治理
34.10实践研究(3): 构建服务导向的客户服务部门
34.10.1客服的三种核心服务方式
34.10.2被动式服务: 问题的快速响应
34.10.3主动式服务: 有效的客户管理
34.10.4服务体系的改进
34.10.5本章小结
参考文献
后记——行自云起时,更上一层楼
猜您喜欢