书籍详情
大数据实践之路:数据中台+数据分析+产品应用
作者:林泽丰,许秋贵,陈斌,陈丽媛 著
出版社:电子工业出版社
出版时间:2021-09-01
ISBN:9787121416651
定价:¥69.00
购买这本书可以去
内容简介
本书共13 章,汇集了7 位作者(来自多个大型互联网企业)的知识总结和经验分享。本书借助老汤姆、小风、阿北、小诺在某电商企业数据部门工作的故事,通过大量案例深入浅出地介绍了数据中台建设与应用之路。本书以Why-What-How 的思路展开,从0 到1 介绍知识点,并重点讲述How 的过程,同时结合某个场景下的具体案例,以使读者更好地理解实操过程。 每个企业都会面临各种各样的数据问题,有数据质量的问题、数据获取效率的问题、数据应用价值的问题等。本书首先介绍数据中台的建设,确保数据的质量,为企业的数据质量体系建设提供坚实的基础;然后,进行深入业务的分析探索,介绍如何从数据分析角度更好地赋能业务发展;最后,介绍数据应用,解决数据获取效率的问题,并把一些分析思路和业务策略沉淀为数据产品,从而更好地将数据应用于业务。本书结合多个大型互联网企业的实际项目案例,让读者真正掌握数据产品经理这个新兴职业的必备技能和核心能力。 本书主要面向数据产品经理,数据分析师、数据运营人员等数据行业从业者也可以在本书中找到一些思路和方法,如了解数据的应用、掌握分析方法等。本书也可以为想转行做数据产品经理的读者提供帮助。
作者简介
林泽丰,笔名小风,某国有企业的数据中台产品负责人。UBDC全域大数据峰会“灯塔人物”,“友盟杯”数据大赛三等奖获得者,公众号“一个数据人的自留地”的课程讲师。在电商、社交、交通、直播等领域担任过产品、运营、数据等部门的负责人,有7年多的互联网从业经验。跨领域、跨部门实战经验丰富,曾从0到1搭建过企业数据中台、大数据平台、智能营销平台,擅长埋点模型设计、指标质量治理、数仓架构、数据运营等。 许秋贵,笔名阿北,贝壳找房的高级数据分析师,毕业于东北农业大学。在校期间主导开发了校园拼车等应用,帮助大学生拼车省钱出行。曾就职于百度、滴滴等互联网“大厂”,有多年数据分析经验。 陈斌,笔名小诺,某互联网“大厂”的策略产品经理,毕业于大连东软信息学院。人人都是产品经理网站的“20年度热文作者”,公众号“一个数据人的自留地”的联合创办人。先后就职于百度、小米,在搜索引擎、资讯、电商等领域从事过搜索、推荐、BI、画像、反作弊、消息触达等产品工作,涉猎范围较广,经验丰富。 陈丽媛,笔名草帽小子,自如画像数据产品经理,拥有两项发明专利。人人都是产品经理网站的专栏作家,公众号“一个数据人的自留地”联合创办人。在用户画像、数据埋点、指标体系、BI等方面具有丰富的实战经验,所著系列文章深受广大读者喜爱。 梁旭鹏,笔名大鹏,某互联网“大厂”的数据产品负责人,毕业于北京邮电大学的硕士研究生。人人都是产品经理网站的专栏作家,《数据产品经理修炼手册:从零基础到大数据产品实践》的作者,公众号“一个数据人的自留地”的创办人。在电商、内容、出行、金融等领域有近10年的大数据从业经验。 黄为伟,笔名伟仔,资深数据产品经理,金融学硕士,理学学士,公众号“一个数据人的自留地”的联合创办人。先后就职于清科集团、交通银行、小米、字节跳动,在私募、银行、信贷、财务领域从事过数据分析和数据产品的相关工作,经验丰富。 陈勃,笔名薄荷点点,某互联网“大厂”的高级数据产品经理,公众号“一个数据人的自留地”的作者。先后就职于dangdang网、北京中交兴路信息科技有限公司、JD物流集团,曾负责货运大数据平台、无人仓仓储大脑等数据产品,北京市科协金桥工程种子资金项目负责人。
目录
第1 章 那些困扰我们的数据问题
数据中台篇
第2 章 元数据中心
2.1 元数据中心概述
2.2 元数据中心的核心功能
2.2.1 数据整合
2.2.2 数据管理
2.2.3 数据地图
第3 章 数据指标中心
3.1 数据指标中心概述
3.2 数据指标中心的设计思路
3.2.1 定义指标并将其归集到对应的主题域
3.2.2 拆分原子指标与派生指标
3.2.3 定义原子指标与派生指标的生产逻辑
3.2.4 通过指标管理平台对指标进行规范生产
第4 章 数仓模型中心
4.1 数仓模型中心概述
4.2 数仓模型中心的设计思路
4.2.1 控制数据源
4.2.2 划分主题域
4.2.3 构建一致性维度
4.2.4 构建总线矩阵
4.2.5 数仓分层建设
4.2.6 数仓效果评估
第5 章 数据资产中心
5.1 数据资产中心概述
5.2 数据资产中心的治理流程
5.2.1 数据资产定级
5.2.2 数据资产质量治理
5.2.3 数据资产成本治理
第6 章 数据服务中心
6.1 数据服务中心概述
6.2 数据服务中心的设计思路
6.2.1 将数据写入查询库
6.2.2 搭建元数据模型
6.2.3 按主题归类
6.2.4 缓存优化
6.2.5 数据接口化
6.2.6 构建API 集市
6.2.7 统一数据服务
数据分析篇
第7 章 数据分析理论
7.1 业务和数据
7.2 数据分析师的全貌
7.3 数据分析团队的组织架构及其对应的工作模式
7.4 数据分析师的工作方式
7.4.1 工作象限图
7.4.2 1+N 的工作内容
7.4.3 与业务方的合作模式
7.4.4 有关工作方式常见问题的解法思考
第8 章 数据分析实操
8.1 预测性分析
8.1.1 预测性分析的目的
8.1.2 分析思路与方法
8.1.3 预测性分析案例
8.2 描述性分析
8.3 诊断性分析
8.4 数据分析报告
数据应用篇
第9 章 BI 系统
9.1 让人头疼的看板需求
9.2 BI 系统介绍
9.3 BI 系统的关键技术
9.4 BI 系统实践
9.4.1 数据接入
9.4.2 数据集加工
9.4.3 数据集权限控制
9.4.4 可视化报表配置
9.4.5 可视化结果展示
9.4.6 数据分析OLAP
9.4.7 如何衡量BI 系统是否成功
第10 章 用户画像
10.1 用户画像的全貌
10.2 用户画像的需求
10.3 用户画像的规划
10.3.1 用户画像的业务架构
10.3.2 用户画像的产品架构
10.3.3 用户画像的版本计划
10.3.4 用户画像的项目执行计划
10.4 用户ID 体系
10.5 标签体系
10.6 用户画像系统
10.7 用户画像的应用
第11 章 电商反作弊体系
11.1 电商黑产的现状
11.2 电商黑产的防控方案
11.2.1 活动的损失评估
11.2.2 反电商黑产作弊案例
第12 章 资讯个性化推荐
12.1 资讯的内容处理
12.1.1 资讯的内容来源
12.1.2 资讯的分类体系
12.1.3 常见的分类问题及内容分类原则
12.1.4 分类体系的构建
12.1.5 内容的标注与机器学习
12.2 资讯用户的画像和特征
12.2.1 资讯用户的画像
12.2.2 资讯用户的特征
12.3 资讯的推荐算法
12.3.1 资讯的信息抽取
12.3.2 资讯的分词方法
12.3.3 资讯的过滤排重
12.3.4 资讯的召回模型
12.3.5 资讯的算法排序
12.4 资讯的重排策略及案例
12.4.1 常见的重排策略及策略的目标
12.4.2 资讯的重排策略案例
第13 章 电商个性化推送
13.1 push 的衡量
13.1.1 push 的目标与本质
13.1.2 push 的衡量指标
13.2 push 的优化方向
13.3 push 的推荐案例
13.3.1 新用户推荐方案
13.3.2 推荐的效果评测
数据中台篇
第2 章 元数据中心
2.1 元数据中心概述
2.2 元数据中心的核心功能
2.2.1 数据整合
2.2.2 数据管理
2.2.3 数据地图
第3 章 数据指标中心
3.1 数据指标中心概述
3.2 数据指标中心的设计思路
3.2.1 定义指标并将其归集到对应的主题域
3.2.2 拆分原子指标与派生指标
3.2.3 定义原子指标与派生指标的生产逻辑
3.2.4 通过指标管理平台对指标进行规范生产
第4 章 数仓模型中心
4.1 数仓模型中心概述
4.2 数仓模型中心的设计思路
4.2.1 控制数据源
4.2.2 划分主题域
4.2.3 构建一致性维度
4.2.4 构建总线矩阵
4.2.5 数仓分层建设
4.2.6 数仓效果评估
第5 章 数据资产中心
5.1 数据资产中心概述
5.2 数据资产中心的治理流程
5.2.1 数据资产定级
5.2.2 数据资产质量治理
5.2.3 数据资产成本治理
第6 章 数据服务中心
6.1 数据服务中心概述
6.2 数据服务中心的设计思路
6.2.1 将数据写入查询库
6.2.2 搭建元数据模型
6.2.3 按主题归类
6.2.4 缓存优化
6.2.5 数据接口化
6.2.6 构建API 集市
6.2.7 统一数据服务
数据分析篇
第7 章 数据分析理论
7.1 业务和数据
7.2 数据分析师的全貌
7.3 数据分析团队的组织架构及其对应的工作模式
7.4 数据分析师的工作方式
7.4.1 工作象限图
7.4.2 1+N 的工作内容
7.4.3 与业务方的合作模式
7.4.4 有关工作方式常见问题的解法思考
第8 章 数据分析实操
8.1 预测性分析
8.1.1 预测性分析的目的
8.1.2 分析思路与方法
8.1.3 预测性分析案例
8.2 描述性分析
8.3 诊断性分析
8.4 数据分析报告
数据应用篇
第9 章 BI 系统
9.1 让人头疼的看板需求
9.2 BI 系统介绍
9.3 BI 系统的关键技术
9.4 BI 系统实践
9.4.1 数据接入
9.4.2 数据集加工
9.4.3 数据集权限控制
9.4.4 可视化报表配置
9.4.5 可视化结果展示
9.4.6 数据分析OLAP
9.4.7 如何衡量BI 系统是否成功
第10 章 用户画像
10.1 用户画像的全貌
10.2 用户画像的需求
10.3 用户画像的规划
10.3.1 用户画像的业务架构
10.3.2 用户画像的产品架构
10.3.3 用户画像的版本计划
10.3.4 用户画像的项目执行计划
10.4 用户ID 体系
10.5 标签体系
10.6 用户画像系统
10.7 用户画像的应用
第11 章 电商反作弊体系
11.1 电商黑产的现状
11.2 电商黑产的防控方案
11.2.1 活动的损失评估
11.2.2 反电商黑产作弊案例
第12 章 资讯个性化推荐
12.1 资讯的内容处理
12.1.1 资讯的内容来源
12.1.2 资讯的分类体系
12.1.3 常见的分类问题及内容分类原则
12.1.4 分类体系的构建
12.1.5 内容的标注与机器学习
12.2 资讯用户的画像和特征
12.2.1 资讯用户的画像
12.2.2 资讯用户的特征
12.3 资讯的推荐算法
12.3.1 资讯的信息抽取
12.3.2 资讯的分词方法
12.3.3 资讯的过滤排重
12.3.4 资讯的召回模型
12.3.5 资讯的算法排序
12.4 资讯的重排策略及案例
12.4.1 常见的重排策略及策略的目标
12.4.2 资讯的重排策略案例
第13 章 电商个性化推送
13.1 push 的衡量
13.1.1 push 的目标与本质
13.1.2 push 的衡量指标
13.2 push 的优化方向
13.3 push 的推荐案例
13.3.1 新用户推荐方案
13.3.2 推荐的效果评测
猜您喜欢