增强型分析:AI驱动的数据分析、业务决策与案例实践
作者:彭鸿涛,张宗耀,聂磊
出版社:机械工业出版社
出版时间:2019-09-01
ISBN:9787111634164
定价:¥89.00
推荐序一
\n推荐序二
\n前言
\n第1章 数据科学家的成长之路 1
\n1.1 算法与数据科学家 1
\n1.1.1 数据科学、人工智能、机器学习等 2
\n1.1.2 室内活动还是室外活动 3
\n1.2 数据科学家不断成长的几个阶段 3
\n1.2.1 算法——如何构建数据分析模型 5
\n1.2.2 用法——如何回头看模型 6
\n1.2.3 业务——如何产生更大价值 7
\n1.2.4 战略——如何更广 8
\n1.3 数据科学家的工作模式与组织结构 9
\n1.3.1 数据驱动还是业务驱动 9
\n1.3.2 数据科学家团队的组织结构 9
\n1.4 数据科学家的工作方法要点 10
\n第2章 大数据探索及预处理 13
\n2.1 大数据探索 13
\n2.1.1 数值类型 13
\n2.1.2 连续型数据的探索 14
\n2.1.3 分类型数据的探索 19
\n2.1.4 示例:数据探索 20
\n2.2 数据预处理 26
\n2.2.1 数据清洗 26
\n2.2.2 数据变换 29
\n2.2.3 数据归约 41
\n2.3 衍生指标的加工 44
\n2.3.1 衍生指标概述 45
\n2.3.2 将数值转化为百分位数 45
\n2.3.3 把类别变量替换为数值 46
\n2.3.4 多变量组合 47
\n2.3.5 从时间序列中提取特征 47
\n第3章 预测模型的新技术 49
\n3.1 集成学习 49
\n3.1.1 Averaging方法 49
\n3.1.2 Boosting方法 51
\n3.2 Gradient Tree Boosting介绍 53
\n3.2.1 梯度与梯度下降 53
\n3.2.2 Gradient Tree Boosting算法的原理 55
\n3.3 Gradient Tree Boosting的改进方向 57
\n3.3.1 Gradient Tree Boosting的使用要点 57
\n3.3.2 Regularization 59
\n3.3.3 XGBoost介绍 60
\n3.4 模型的最佳参数设置 60
\n3.5 投票决定最终预测结果 65
\n3.6 让模型在训练结束后还能被更新 66
\n3.6.1 热启动 67
\n3.6.2 增量学习 67
\n3.7 多输出预测 68
\n3.7.1 Binary Relevance 69
\n3.7.2 Classifier Chain 70
\n3.7.3 Ensemble Classifier Chain 70
\n3.8 案例:如何给客户从数百个产品中寻找合适的产品 71
\n3.8.1 问题提出 72
\n3.8.2 建模思路 72
\n3.8.3 模型训练及应用 73
\n第4章 序列分析 76
\n4.1 通过客户行为研究做出服务策略 76
\n4.2 频繁项集、关联规则的挖掘 77
\n4.2.1 基本概念 77
\n4.2.2 频繁或稀疏项集的挖掘 78
\n4.2.3 关联规则的挖掘 86
\n4.3 序列模式的挖掘以及应用 88
\n4.3.1 换种视角观察项间的顺序 88
\n4.3.2 “事无巨细”还是“事有巨细” 89
\n4.3.3 序列挖掘的相关算法介绍 92
\n4.3.4 示例:挖掘购买物品的序列模式 96
\n4.4 序列规则的挖掘以及应用 101
\n4.4.1 将频繁序列通过业务解读转换为行动指南 101
\n4.4.2 序列规则的挖掘实现行动指南 102
\n4.4.3 序列规则的挖掘算法 102
\n4.4.4 示例:通过客户购买产品的序列推荐合适的产品 104
\n4.5 序列预测的挖掘以及应用 107
\n4.5.1 序列规则与序列预测的关系 107
\n4.5.2 序列预测算法的介绍 108
\n4.5.3 示例:客户下一步会做什么 110
\n第5章 应用数据分析做出最优决策 114
\n5.1 Prescriptive分析概述 114
\n5.1.1 业务分析的3个层次 115
\n5.1.2 为什么需要Prescriptive分析 116
\n5.1.3 什么时候需要Prescriptive分析 117
\n5.2 确定因素和非确定因素下的决策分析 118
\n5.3 What-If分析和Goal Seeking分析 121
\n5.4 优化技术介绍 122
\n5.4.1 数据挖掘算法中常用的优化技术 122
\n5.4.2 优化问题求解工具介绍 127
\n5.4.3 CVXPY优化工具在机器学习算法中的应用 130
\n5.4.4 应用优化技术寻找最优产品推荐 134
\n5.5 仿真分析 135
\n5.5.1 蒙特卡洛的介绍 135
\n5.5.2 采用蒙特卡洛方法进行重采样 137
\n5.6 马尔可夫链及马尔可夫决策过程 143
\n5.6.1 马尔可夫过程及马尔可夫链 145
\n5.6.2 马尔可夫决策过程及应用工具 148
\n5.6.3 应用马尔可夫决策过程研究营销策略及客户生命周期价值 151
\n第6章 深入探讨CNN 155
\n6.1 换个角度讨论CNN 155
\n6.1.1 卷积是在做什么 156
\n6.1.2 人脸检测与人脸识别 159
\n6.1.3 深度学习意味着什么 165
\n......
\n