书籍详情
DataOps实践手册:敏捷精益的数据运营
作者:[美] 哈文德·阿特瓦尔(Harvinder Atwal) 著,马欢 等 译
出版社:机械工业出版社
出版时间:2022-11-01
ISBN:9787111716068
定价:¥99.00
购买这本书可以去
内容简介
数据运营是指通过数据来分析和解决问题,利用各种数据科学技术挖掘数据价值,帮助企业优化业务管理和提升决策效率。随着我国数字化转型的深入,传统基于项目、人工处理的各类数据运营活动已经无法满足业务发展要求。集合了敏捷开发、精益制造以及DevOps理念的DataOps因此顺势而生,并且受到了业界的广泛关注。 本书总结了作者25年的行业经验和对DataOps的认知,从当前数据科学交付面临哪些挑战、什么是DataOps、通过哪些手段可以建立对数据的信任,以及如何实现DataOps目标和成功实施DataOps几个方面进行了系统的阐述。本书适合参与数字化转型的各类角色人员学习,尤其有助于数据科学高级管理岗位的专业人士开拓视野、提升领导力。
作者简介
马欢,本科毕业于同济大学,后获得上海交通大学工学硕士学位。从开发工程师做起,担任过系统分析师、系统架构师、项目经理等角色。具有20多年的信息系统开发设计经验,曾经两次获得部级科技发展奖项。主持翻译了《DAMA-DMBOK数据管理知识体系指南》系列等专业书籍,作为骨干编委参与编写《国际数据之都——上海城市数字化转型市民手册》,此外还翻译了《首席数据官管理手册:建立并运行组织的数据供应链》《区块链重构规则》《数据与现实》《星型模型》等多本译著。2011年首次把数据管理专业认证CDMP引入中国,并获得CDMP大师级认证,主理的“DAMA数据管理”是国内最活跃的专业社区之一。本书翻译组: 组 长马欢 《DAMA数据管理知识体系指南》系列、 《首席数据官管理手册: 建立并运行组织的数据供应链》 主译者 组 员(按姓氏笔画排序)马虎山 上海市海促会浦江学术委员会 高级研究员 数据管理专家王彪 北京天融信科技有限公司 数据安全治理专家王晓萍 上海市海促会浦江学术委员会 高级研究员 数据管理专家石秀峰 用友网络科技股份有限公司 数据管理专家史凯 精益数据方法论创始人 《精益数据方法论》作者李燕 东北证券股份有限公司 数据治理负责人赵后钰 国际商业机器全球服务 (大连) 有限公司 咨询经理胡刚 上海逸迅信息科技有限公司CTO数据管理专家郭媛 上海市海外经济技术促进会 秘书长唐超 华为技术有限公司全球技术服务部 数据管理专家常国珍 CDA数据科学研究院 院长彭云 南方电网数字电网集团有限公司 高级工程师 数据管理专家
目录
译者序
前言
第1部分 入门
第1章 数据科学中的问题
有问题吗?
现实
数据价值
技术、软件和算法
数据科学家
数据科学过程
组织文化
知识鸿沟
数据科学家的知识鸿沟
IT知识鸿沟
技术知识鸿沟
领导力知识鸿沟
数据素养鸿沟
缺乏支持
教育和文化
不明确的目标
留给数据科学家来弄清楚
总结
尾注
第2章 数据战略
我们为什么需要新的数据战略
数据已不再属于IT
数据战略的范围
战略时间跨度
战略发起人
从识别现状开始
组织方面
人员方面
技术方面
流程方面
数据资产方面
识别分析用例
使命、愿景和KPI
构思——我们能做些什么?
数据生命周期的基准能力
差距分析——需要改变什么?
定义数据战略目标——我们需要
从哪里开始?
交付数据战略
定义数据战略举措——我们如何
实现目标?
制定执行和度量计划——如何
知道进度?
总结
尾注
第2部分 迈向数据运营
第3章 精益思维
精益思维简介
丰田的起源
精益软件开发
精益产品开发
精益思维和数据分析
识别浪费
价值流图
快速交付
拉动式系统
看到整体
根因分析
总结
尾注
第4章 敏捷协作
为什么选择敏捷?
瀑布式项目管理
敏捷价值观
敏捷框架
Scrum
XP及 Scrum/XP 混合
看板方法
Scrumban
大规模敏捷
SoS
规范敏捷交付
规模化敏捷框架
DataOps的敏捷
DataOps宣言
DataOps原则
数据科学生命周期
敏捷DataOps 实践
构思
准备
研发
过渡/生产
总结
尾注
第5章 构建反馈和度量
系统思维
持续改进
反馈循环
团队健康
回顾
健康检查
海星回顾
帆船回顾
事前检验
服务交付
服务交付审查会议
改进服务交付
产品健康
数据产品监控的KPI
监控
概念漂移
产品效益
效益度量
效益度量的挑战
A/B测试和度量的替代方案
指标的挑战
总结
尾注
第3部分 进一步措施
第6章 建立信任
信任拥有数据和系统的人
访问和供应数据
数据安全和隐私
资源利用率监控
人们可以信任数据
元数据
加标签
采集过程中的信任
数据质量评估
数据清理
数据血缘
数据发现
数据治理
总结
尾注
第7章 面向 DataOps 的 DevOps
开发和运营
冲突
打破螺旋
持续交付的快速流程
可重现的环境
部署管道
持续集成
自动化测试
部署和发布流程
自动部署
发布流程
DevOps 度量
审核流程
数据分析的DevOps
数据冲突
数据管道环境
数据管道编排
数据管道持续集成
简化和重用
MLOps 和 AIOps
机器学习模型开发
机器学习模型投产
总结
尾注
第8章 DataOps 组织
团队结构
面向职能的团队
面向领域的团队
新技能矩阵
核心角色
支持角色
团队不需要“I型人”
优化团队
沟通渠道和团队规模
产品型而非项目型
办公位置
汇报关系
数据平台管理
跨职能角色
总结
尾注
第4部分 自服务组织
第9章 DataOps 技术
基于DataOps的价值和原则选择
工具
调整脊椎模型
对实践和工具的影响
DataOps技术生态系统
流水线
数据集成
数据准备
流处理
数据管理
可重复性、部署、编排和监控
计算基础设施和查询执行引擎
数据存储
DataOps平台
数据分析工具
挑战
建造vs购买
扩展
内部构建
购买或租赁现成产品
借用开源软件
扩建、构建、购买、出租或借用
云原生架构
不断发展的技术栈
Wardley地图
使用Wardley地图
技术雷达
总结
尾注
第10章 DataOps工厂
第一步
从数据战略开始
领导力
最小可行的DataOps
第一个方案
度量
第一个DataOps团队
跨团队扩展
达到临界点
团队协调
文化
数据治理
扩展
成功的组织
集中化平台
全局自动化
提供自助服务
总结
尾注
前言
第1部分 入门
第1章 数据科学中的问题
有问题吗?
现实
数据价值
技术、软件和算法
数据科学家
数据科学过程
组织文化
知识鸿沟
数据科学家的知识鸿沟
IT知识鸿沟
技术知识鸿沟
领导力知识鸿沟
数据素养鸿沟
缺乏支持
教育和文化
不明确的目标
留给数据科学家来弄清楚
总结
尾注
第2章 数据战略
我们为什么需要新的数据战略
数据已不再属于IT
数据战略的范围
战略时间跨度
战略发起人
从识别现状开始
组织方面
人员方面
技术方面
流程方面
数据资产方面
识别分析用例
使命、愿景和KPI
构思——我们能做些什么?
数据生命周期的基准能力
差距分析——需要改变什么?
定义数据战略目标——我们需要
从哪里开始?
交付数据战略
定义数据战略举措——我们如何
实现目标?
制定执行和度量计划——如何
知道进度?
总结
尾注
第2部分 迈向数据运营
第3章 精益思维
精益思维简介
丰田的起源
精益软件开发
精益产品开发
精益思维和数据分析
识别浪费
价值流图
快速交付
拉动式系统
看到整体
根因分析
总结
尾注
第4章 敏捷协作
为什么选择敏捷?
瀑布式项目管理
敏捷价值观
敏捷框架
Scrum
XP及 Scrum/XP 混合
看板方法
Scrumban
大规模敏捷
SoS
规范敏捷交付
规模化敏捷框架
DataOps的敏捷
DataOps宣言
DataOps原则
数据科学生命周期
敏捷DataOps 实践
构思
准备
研发
过渡/生产
总结
尾注
第5章 构建反馈和度量
系统思维
持续改进
反馈循环
团队健康
回顾
健康检查
海星回顾
帆船回顾
事前检验
服务交付
服务交付审查会议
改进服务交付
产品健康
数据产品监控的KPI
监控
概念漂移
产品效益
效益度量
效益度量的挑战
A/B测试和度量的替代方案
指标的挑战
总结
尾注
第3部分 进一步措施
第6章 建立信任
信任拥有数据和系统的人
访问和供应数据
数据安全和隐私
资源利用率监控
人们可以信任数据
元数据
加标签
采集过程中的信任
数据质量评估
数据清理
数据血缘
数据发现
数据治理
总结
尾注
第7章 面向 DataOps 的 DevOps
开发和运营
冲突
打破螺旋
持续交付的快速流程
可重现的环境
部署管道
持续集成
自动化测试
部署和发布流程
自动部署
发布流程
DevOps 度量
审核流程
数据分析的DevOps
数据冲突
数据管道环境
数据管道编排
数据管道持续集成
简化和重用
MLOps 和 AIOps
机器学习模型开发
机器学习模型投产
总结
尾注
第8章 DataOps 组织
团队结构
面向职能的团队
面向领域的团队
新技能矩阵
核心角色
支持角色
团队不需要“I型人”
优化团队
沟通渠道和团队规模
产品型而非项目型
办公位置
汇报关系
数据平台管理
跨职能角色
总结
尾注
第4部分 自服务组织
第9章 DataOps 技术
基于DataOps的价值和原则选择
工具
调整脊椎模型
对实践和工具的影响
DataOps技术生态系统
流水线
数据集成
数据准备
流处理
数据管理
可重复性、部署、编排和监控
计算基础设施和查询执行引擎
数据存储
DataOps平台
数据分析工具
挑战
建造vs购买
扩展
内部构建
购买或租赁现成产品
借用开源软件
扩建、构建、购买、出租或借用
云原生架构
不断发展的技术栈
Wardley地图
使用Wardley地图
技术雷达
总结
尾注
第10章 DataOps工厂
第一步
从数据战略开始
领导力
最小可行的DataOps
第一个方案
度量
第一个DataOps团队
跨团队扩展
达到临界点
团队协调
文化
数据治理
扩展
成功的组织
集中化平台
全局自动化
提供自助服务
总结
尾注
猜您喜欢