书籍详情

统计挖掘与机器学习：大数据预测建模和分析技术（原书第3版）

作者：[美] 布鲁斯·拉特纳（Bruce Ratner）著，郑磊，刘子未，石仁达，郑扬洋译

出版社：机械工业出版社

出版时间：2021-09-01

ISBN：9787111689942

定价：¥149.00

购买这本书可以去

内容简介

　　本书是一本区分统计数据挖掘和机器学习数据挖掘的图书。它创造性地汇编了数据挖掘技术，解决了对经典和现代统计方法框架的扩展，用于预测建模和大数据分析。SM-DM为数据挖掘领域新晋的数据科学家所面临的共同问题提供了适当的解决方案。它的展示侧重于数据科学家（通常被称为统计学家、数据采矿者和数据分析师）的需求，提供实用但又强大的、简单而又有洞察力的量化技术，其中大部分使用了新机器学习影响改进的“旧”统计方法。

作者简介

暂缺《统计挖掘与机器学习：大数据预测建模和分析技术（原书第3版）》作者简介

第3版前言
第2版前言
致谢
关于作者
第1章　引论 1
11　个人计算机与统计学 1
12　统计学和数据分析 2
13　EDA简介 3
14　EDA范式 4
15　EDA的弱点 5
16　小数据和大数据 5
161　数据规模特征 6
162　数据规模：个人观点 7
17　数据挖掘范式 7
18　统计学和机器学习 8
19　统计数据挖掘 9
参考资料 9
第2章　数据处理相关学科：统计学和数据科学 11
21　引言 11
22　背景 11
23　统计学与数据科学的比较 12
24　讨论：统计学与数据科学的不同之处 18
25　本章小结 19
26　结语 19
参考资料 19
第3章　变量评估的两种基本数据挖掘方法 21
31　引言 21
32　相关系数 21
33　散点图 22
34　数据挖掘 24
341　示例31 24
342　示例32 24
35　平滑散点图 25
36　一般关联性检验 27
37　本章小结 28
参考资料 29
第4章　用于评估成对变量的基于CHAID的数据挖掘方法 30
41　引言 30
42　散点图 30
43　平滑散点图 31
44　CHAID入门 32
45　用更平滑的散点图进行基于CHAID的数据挖掘 33
46　本章小结 36
参考资料 37
第5章　校直数据的简单性和可取性对建模十分重要 38
51　引言 38
52　数据的直度和对称度 38
53　数据挖掘是高级概念 39
54　相关系数 39
55　（xx3，yy3）散点图 40
56　挖掘（xx3，yy3）关系 41
57　基于遗传算法的数据挖掘如何处理数据 43
58　校直多个变量 43
59　本章小结 44
参考资料 44
第6章　排序数据对称化：提高数据预测能力的统计数据挖掘方法 45
61　引言 45
62　量度范围 45
63　茎叶图 47
64　箱线图 47
65　排序数据对称处理方法的图示 47
651　示例1 48
652　示例2 50
66　本章小结 56
参考资料 56
第7章　主成分分析：多变量评估的统计数据挖掘方法 57
71　引言 57
72　EDA重新表述范式 57
73　关键点 58
74　PCA基础 58
75　示例详解 58
76　PCA的代数特征 59
77　一个不常见示例 60
771　R_CD元素（X1，X2，X3，X4，X5，X6）主成分分析 61
772　R_CD元素（X1，X2，X3，X4，X5，X6）主成分分析结果 61
78　用PCA构造准交互变量 62
79　本章小结 66
第8章　市场份额估算：一个特殊的数据挖掘案例 67
81　引言 67
82　背景 67
83　一个特殊的数据挖掘案例 68
84　构建RAL的YUM市场份额模型 69
841　市场份额模型的十分位分析 76
842　YUM_3mos市场份额模型的结论 76
85　本章小结 77
附录8A 　生成 PROMO_Code哑变量 77
附录8B　PROMO_Code哑变量的PCA 77
附录8C　PROMO_Code哑变量上的逻辑斯谛回归YUM_3mos 78
附录8D　生成YUM_3mos_wo_PROMO_CodeEff 78
附录 8E　将变量标准化为位于[0， 1]内 78
参考资料 79
第9章　相关系数在[-1,+1]内取值，是这样吗 80
91　引言 80
92　相关系数的基础知识 80
93　计算相关系数 81
94　重新配对 82
95　计算经调整的相关系数 84
96　重新配对的意义 84
97　本章小结 84
第10章　逻辑斯谛回归：回应建模方法 85
101　引言 85
102　逻辑斯谛回归模型 86
1021　示例 86
1022　为LRM打分 87
103　案例分析 88
104　logit值和logit散点图 89
105　校直数据的重要性 90
106　校直数据的重述 91
1061　幂阶梯法 91
1062　突起规则 91
1063　测量校直数据 92
107　校直示例数据 92
1071　FD2_OPEN的重述 93
1072　INVESTMENT的重述 94
108　在突起规则不适用的情况下选用的技术 95
1081　拟合logit值散点图 95
1082　平滑预测值与实际值散点图 96
109　MOS_OPEN的重述 96
1010　评估变量的重要性 99
10101　计算G统计量 99
10102　单变量的重要性 100
10103　变量子集合的重要性 100
10104　不同变量子集合的重要性比较 100
1011　案例的重要变量 101
1012　变量的相对重要性 102
1013　案例变量的最佳子集合 103
1014　模型预测准确性的可视化指标 104
10141　得分组的平滑残差散点图 104
10142　基于十分位组的平滑预测与实际值散点图 106
10

猜您喜欢

人工智能未来趋势、安全、教育与人类关系

数据智能研究前沿

Python机器学习案例教程