机器学习中的统计思维(Python实现)
作者:董平
出版社:清华大学出版社
出版时间:2023-09-01
ISBN:9787302634010
定价:¥99.00
目录
绪论..................................................................................................................1
0.1本书讲什么,初衷是什么...................................................................... 1
0.2贯穿本书的两大思维模式...................................................................... 3
0.2.1提问的思维方式 ........................................................................ 3
0.2.2发散的思维方式 ........................................................................ 4
0.3这本书决定它还想要这样...................................................................... 5
0.3.1第一性原理 ............................................................................... 5
0.3.2奥卡姆剃刀原理 ........................................................................ 7
0.4如何使用本书 ...................................................................................... 8
第 1章步入监督学习之旅 .............................................................................11
1.1机器学习从数据开始 .......................................................................... 11
1.2监督学习是什么 ................................................................................. 14
1.2.1基本术语 ................................................................................ 16
1.2.2学习过程如同一场科学推理...................................................... 17
1.3如何评价模型的好坏 .......................................................................... 21
1.3.1评价模型的量化指标................................................................ 21
1.3.2拟合能力 ................................................................................ 24
1.3.3泛化能力 ................................................................................ 24
1.4损失最小化思想 ................................................................................. 25
1.5怎样理解模型的性能:方差-偏差折中思想 ........................................... 27
1.6如何选择最优模型.............................................................................. 28
1.6.1正则化:对模型复杂程度加以惩罚............................................ 28
1.6.2交叉验证:样本的多次重复利用 ............................................... 30
1.7本章小结 ........................................................................................... 31
1.8习题.................................................................................................. 31
第 2章线性回归模型 ....................................................................................33
2.1探寻线性回归模型.............................................................................. 33
2.1.1诺贝尔奖中的线性回归模型...................................................... 33
2.1.2回归模型的诞生 ...................................................................... 34
2.1.3线性回归模型结构 ................................................................... 38
2.2最小二乘法........................................................................................ 39
2.2.1回归模型用哪种损失:平方损失 ............................................... 40
机器学习中的统计思维 (Python实现)
2.2.2如何估计模型参数:最小二乘法 ............................................... 41
2.3线性回归模型的预测 .......................................................................... 44
2.3.1一元线性回归模型的预测 ......................................................... 44
2.3.2多元线性回归模型的预测 ......................................................... 48
2.4拓展部分:岭回归与套索回归 ............................................................. 49
2.4.1岭回归.................................................................................... 50
2.4.2套索回归 ................................................................................ 51
2.5案例分析——共享单车数据集 ............................................................. 53
2.6本章小结 ........................................................................................... 56
2.7习题.................................................................................................. 57
第 3章 K近邻模型 ......................................................................................59
3.1邻友思想 ........................................................................................... 59
3.2 K近邻算法....................................................................................... 60
3.2.1聚合思想 ................................................................................ 60
3.2.2 K近邻模型的具体算法............................................................ 61
3.2.3 K近邻算法的三要素 ............................................................... 63
3.2.4 K近邻算法的可视化 ............................................................... 67
3.3最近邻分类器的误差率 ....................................................................... 67
3.4 k维树............................................................................................... 70
3.4.1 k维树的构建 .......................................................................... 70
3.4.2 k维树的搜索 .......................................................................... 73
3.5拓展部分:距离度量学习的 K近邻分类器 .......................................... 76
3.6案例分析——莺尾花数据集 ................................................................ 79
3.7本章小结 ........................................................................................... 83
3.8习题.................................................................................................. 83
第 4章贝叶斯推断 .......................................................................................85
4.1贝叶斯思想........................................................................................ 85
4.1.1什么是概率 ............................................................................. 86
4.1.2从概率到条件概率 ................................................................... 91
4.1.3贝叶斯定理 ............................................................................. 93
4.2贝叶斯分类器 .................................................................................... 97
4.2.1贝叶斯分类 ............................................................................. 97
4.2.2朴素贝叶斯分类 ...................................................................... 98
4.3如何训练贝叶斯分类器 ......................................................................103
4.3.1极大似然估计:概率最大化思想 ..............................................104
4.3.2贝叶斯估计:贝叶斯思想 ........................................................111
4.4常用的朴素贝叶斯分类器...................................................................115
4.4.1离散属性变量下的朴素贝叶斯分类器 .......................................115
4.4.2连续特征变量下的朴素贝叶斯分类器 .......................................115
4.5拓展部分 ..........................................................................................116
4.5.1半朴素贝叶斯.........................................................................116
目录
4.5.2贝叶斯网络 ............................................................................119
4.6案例分析——蘑菇数据集 ...................................................................122
4.7本章小结 ..........................................................................................124
4.8习题.................................................................................................124
4.9阅读时间:贝叶斯思想的起源 ............................................................125
第 5章逻辑回归模型 .................................................................................. 131
5.1一切始于逻辑函数.............................................................................131
5.1.1逻辑函数 ...............................................................................131
5.1.2逻辑斯谛分布.........................................................................133
5.1.3逻辑回归 ...............................................................................134
5.2逻辑回归模型的学习 .........................................................................136
5.2.1加权最小二乘法 .....................................................................136
5.2.2极大似然法 ............................................................................139
5.3逻辑回归模型的学习算法...................................................................141
5.3.1梯度下降法 ............................................................................141
5.3.2牛顿法...................................................................................143
5.4拓展部分 ..........................................................................................144
5.4.1拓展 1:多分类逻辑回归模型 ..................................................144
5.4.2拓展 2:非线性逻辑回归模型 ..................................................147
5.5案例分析——离职数据集 ...................................................................147
5.6本章小结 ..........................................................................................149
5.7习题.................................................................................................150
5.8阅读时间:牛顿法是牛顿提出的吗 .....................................................150
第 6章最大熵模型 ..................................................................................... 153
6.1问世间熵为何物 ................................................................................153
6.1.1热力学熵 ...............................................................................153
6.1.2信息熵...................................................................................155
6.2最大熵思想.......................................................................................156
6.2.1离散随机变量的分布...............................................................156
6.2.2连续随机变量的分布...............................................................160
6.3最大熵模型的学习问题 ......................................................................163
6.3.1最大熵模型的定义 ..................................................................163
6.3.2最大熵模型的原始问题与对偶问题...........................................167
6.3.3最大熵模型的学习 ..................................................................169
6.4模型学习的最优化算法 ......................................................................173
6.4.1最速梯度下降法 .....................................................................177
6.4.2拟牛顿法:DFP算法和 BFGS算法 ........................................178
6.4.3改进的迭代尺度法 ..................................................................179
6.5案例分析——汤圆小例子 ...................................................................183
6.6本章小结 ..........................................................................................185
6.7习题.................................................................................................186
机器学习中的统计思维 (Python实现)
6.8阅读时间:奇妙的对数 ......................................................................187
第 7章决策树模型 ..................................................................................... 191
7.1决策树中蕴含的基本思想...................................................................191
7.1.1什么是决策树.........................................................................191
7.1.2决策树的基本思想 ..................................................................195
7.2决策树的特征选择.............................................................................195
7.2.1错分类误差 ............................................................................195
7.2.2基于熵的信息增益和信息增益比 ..............................................196
7.2.3基尼不纯度 ............................................................................199
7.2.4比较错分类误差、信息熵和基尼不纯度 ....................................201
7.3决策树的生成算法.............................................................................201
7.3.1 ID3算法................................................................................202
7.3.2 C4.5算法 ..............................................................................205
7.3.3 CART算法............................................................................205
7.4决策树的剪枝过程.............................................................................211
7.4.1预剪枝...................................................................................211
7.4.2后剪枝...................................................................................213
7.5拓展部分:随机森林 .........................................................................223
7.6案例分析——帕尔默企鹅数据集 .........................................................223
7.7本章小结 ..........................................................................................226
7.8习题.................................................................................................226
7.9阅读时间:经济学中的基尼指数.........................................................227
第 8章感知机模型 ..................................................................................... 231
8.1感知机制——从逻辑回归到感知机 .....................................................231
8.2感知机的学习 ...................................................................................233
8.3感知机的优化算法.............................................................................234
8.3.1原始形式算法.........................................................................235
8.3.2对偶形式算法.........................................................................239
8.4案例分析——莺尾花数据集 ...............................................................241
8.5本章小结 ..........................................................................................243
8.6习题.................................................................................................243
第 9章支持向量机 ..................................................................................... 245
9.1从感知机到支持向量机 ......................................................................245
9.2线性可分支持向量机 .........................................................................248
9.2.1线性可分支持向量机与最大间隔算法 .......................................248
9.2.2对偶问题与硬间隔算法 ...........................................................254
9.3线性支持向量机 ................................................................................258
9.3.1线性支持向量机的学习问题.....................................................259
9.3.2对偶问题与软间隔算法 ...........................................................260
9.3.3线性支持向量机之合页损失.....................................................263
9.4非线性支持向量机.............................................................................265
目录
9.4.1核变换的根本——核函数 ........................................................266
9.4.2非线性可分支持向量机 ...........................................................277
9.4.3非线性支持向量机 ..................................................................278
9.5 SMO优化方法 .................................................................................279
9.5.1“失败的”坐标下降法 ...........................................................279
9.5.2“成功的”SMO算法.............................................................280
9.6案例分析——电离层数据集 ...............................................................287
9.7本章小结 ..........................................................................................288
9.8习题.................................................................................................289
第 10章 EM算法 ...................................................................................... 291
10.1极大似然法与 EM算法 ...................................................................291
10.1.1具有缺失数据的豆花小例子..................................................291
10.1.2具有隐变量的硬币盲盒例子..................................................295
10.2 EM算法的迭代过程........................................................................298
10.2.1 EM算法中的两部曲 ............................................................298
10.2.2 EM算法的合理性 ...............................................................302
10.3 EM算法的应用 ..............................................................................305
10.3.1高斯混合模型......................................................................305
10.3.2隐马尔可夫模型 ..................................................................309
10.4本章小结 ........................................................................................316
10.5习题 ...............................................................................................317
第 11章提升方法....................................................................................... 319
11.1提升方法(Boosting)是一种集成学习方法.......................................319
11.1.1什么是集成学习 ..................................................................319
11.1.2强可学习与弱可学习............................................................321
11.2起步于 AdaBoost算法 ....................................................................323
11.2.1两大内核:前向回归和可加模型 ...........................................323
11.2.2 AdaBoost的前向分步算法...................................................324
11.2.3 AdaBoost分类算法 .............................................................326
11.2.4 AdaBoost分类算法的训练误差 ............................................333
11.3提升树和 GBDT算法 .....................................................................339
11.3.1回归提升树 .........................................................................339
11.3.2 GDBT算法 ........................................................................342
11.4拓展部分:XGBoost算法................................................................344
11.5案例分析——波士顿房价数据集 .......................................................346
11.6本章小结 ........................................................................................347
11.7习题 ...............................................................................................348
参考文献 ....................................................................................................... 349