书籍详情

Python机器学习开发实战

Python机器学习开发实战

作者:王新宇 著

出版社:人民邮电出版社

出版时间:2020-07-01

ISBN:9787115525277

定价:¥59.80

购买这本书可以去
内容简介
  本书一共分为19章,1~7章是编程基础,为了让那些没有编程经验的但是又想从事数据分析工作的学员有个入门的基础。8~19章则介绍了机器学习领域中常用的算法,他们分别是线性回归,逻辑回归,神经网络,线性判别,最近邻算法,决策树与随机森林,朴素贝叶斯,支持向量机,主成分分析,奇异值分解,k-means聚类。在第19章中则着重介绍了现在比较流行的深度学习框架。
作者简介
  王新宇,上海大学副教授,主讲机器学习课程,研究方向包括金融行业大数据挖掘、医学行业大数据挖掘、图像识别以及高性能计算。
目录
第1章 环境配置与准备知识 1
1.1 环境配置 1
1.2 机器学习相关概念 2
1.2.1 机器学习中的数据 2
1.2.2 训练集和测试集 4
1.2.3 欠拟合与过度拟合 5
1.2.4 人工智能、机器学习、深度
学习 5
第2章 Python基础知识 6
2.1 hello world! 6
2.2 变量 6
2.3 操作符 7
2.3.1 基本运算符 7
2.3.2 比较运算符 8
2.3.3 逻辑运算符 10
2.4 字符串 11
2.4.1 基础 11
2.4.2 转义字符 12
2.4.3 索引和切片 13
2.4.4 字符串方法 14
2.5 列表 18
2.6 集合 21
2.7 字典 22
2.8 循环语句 24
2.9 判断语句 26
2.10 函数 26
2.11 面向对象编程 29
第3章 数值计算扩展工具——
Numpy 31
3.1 创建数组 31
3.1.1 创建元素为0或1的数组 31
3.1.2 将列表转换为数组 33
3.1.3 生成一串数字 33
3.1.4 生成特殊数组 34
3.2 数组索引 35
3.3 排序与查询 36
3.4 随机数生成器 39
3.5 数学函数 41
3.5.1 三角函数 41
3.5.2 指数与对数 43
3.5.3 约数 43
3.5.4 数组自身加乘 44
3.5.5 算术运算 45
3.6 统计函数 47
3.7 线性代数 50
第4章 数据分析工具——
Pandas 52
4.1 序列对象Series 52
4.1.1 创建Series对象 52
4.1.2 Series索引 53
4.1.3 查看Series相关属性 56
4.1.4 二元运算 57
4.1.5 统计方法 62
4.1.6 缺失值处理 65
4.1.7 排序 66
4.1.8 计数与重复 67
4.1.9 其他 69
4.2 数据框对象DataFrame 70
4.2.1 创建数据框 70
4.2.2 行操作 71
4.2.3 列操作 73
4.3 分组对象GroupBy 75
4.3.1 基本函数 75
4.3.2 统计函数 77
第5章 可视化展示库——
Matplotlib 80
5.1 作图类命令 80
5.1.1 折线图 80
5.1.2 柱状图和条形图 82
5.1.3 散点图 84
5.1.4 饼图 85
5.1.5 面积图 86
5.2 坐标轴控制 88
5.2.1 axis 88
5.2.2 xlim与ylim 89
5.2.3 xticks与yticks 90
5.2.4 xlabel与ylabel 90
5.3 其他设置 91
第6章 通用型开源机器学习库——
Scikit 93
6.1 预处理 94
6.1.1 标准化 95
6.1.2 非线性转换 96
6.1.3 归一化 97
6.1.4 二值化 97
6.1.5 分类特征编码 98
6.1.6 缺失值插补 99
6.1.7 生成多项式特征 100
6.2 降维 101
6.3 有监督学习与无监督学习 101
6.4 模型评估 102
6.4.1 测试集评分 102
6.4.2 交叉验证迭代器 105
6.4.3 分层交叉验证迭代器 108
6.4.4 分组迭代器 109
6.4.5 时间序列交叉验证 111
第7章 机器学习常用数据集 112
7.1 boston房价数据集 112
7.1.1 数据集基本信息描述 112
7.1.2 数据探索 113
7.2 diabetes糖尿病数据集 115
7.2.1 数据基本信息描述 116
7.2.2 数据探索 116
7.3 digits手写字体识别数据集 117
7.3.1 数据集基本信息描述 124
7.3.2 数据集探索 124
7.4 iris鸢尾花数据集 127
7.4.1 数据集基本信息描述 127
7.4.2 数据探索 128
7.5 wine红酒数据集 131
7.5.1 数据集基本信息描述 131
7.5.2 数据探索 132
第8章 线性回归算法 134
8.1 从二次函数到机器学习 134
8.1.1 二次函数最优求解方法 134
8.1.2 梯度下降 135
8.1.3 梯度下降的Python实现 138
8.1.4 初始值与学习速率? 的选择 139
8.2 深入理解线性回归算法 142
8.2.1 回归曲线的数学解释 143
8.2.2 梯度下降方法求解最优直线 144
8.2.3 理解“机器学习”中的
“学习” 145
8.2.4 导数求解与梯度下降 145
8.2.5 学习速率? 与迭代次数的设置 146
8.3 线性回归算法实战——糖尿病患者
病情预测 146
第9章 逻辑回归算法 149
9.1 逻辑回归算法的基础知识 149
9.1.1 直线分割平面 149
9.1.2 逻辑函数 153
9.2 深入理解逻辑回归算法 155
9.2.1 直线分类器与逻辑回归的结合 155
9.2.2 Sigmoid函数的作用 158
9.2.3 逻辑回归模型 159
9.3 逻辑回归算法实战—— 二维鸢尾花
分类 160
第10章 神经网络算法 164
10.1 神经网络算法的基础知识 164
10.1.1 逻辑回归与神经网络的关系 165
10.1.2 激活函数 165
10.2 深入理解神经网络算法 167
10.2.1 神经网络的表示 167
10.2.2 做回归的神经网络 168
10.2.3 做二分类的神经网络 168
10.2.4 做多分类的神经网络 169
10.3 神经网络的应用 169
10.3.1 MLPClassifier分类 169
10.3.2 MLPRegressor回归 171
第11章 线性判别算法 173
11.1 线性判别算法的核心知识 173
11.1.1 方差 173
11.1.2 投影 175
11.1.3 投影方式与方差的关系 177
11.2 线性判别算法详解 178
11.2.1 投影的实际应用 179
11.2.2 另一种思路解决重叠问题 180
11.2.3 线性判别算法的实质 182
11.3 线性判别算法实战—— 花卉分类 183
第12章 K最近邻算法 187
12.1 K最近邻算法的核心知识 187
12.1.1 两点的距离公式 187
12.1.2 权重 188
12.2 K最近邻算法详解 188
12.2.1 K最近邻算法原理 188
12.2.2 K最近邻算法的关键—— k的
选择 191
12.2.3 距离加权最近邻算法 191
12.3 K最近邻算法实战—— 手写字体
识别 192
第13章 决策树方法与随机
森林 194
13.1 决策树方法的基本知识 194
13.2 决策树方法的原理 197
13.2.1 信息熵 198
13.2.2 分割数据 199
13.2.3 计算信息增益 201
13.3 决策树方法实战—— 红酒分类 204
13.4 随机森林 205
第14章 贝叶斯算法 206
14.1 贝叶斯算法的基础知识 206
14.1.1 概率 206
14.1.2 条件概率 207
14.1.3 联合概率 209
14.1.4 贝叶斯定理 210
14.2 深入理解贝叶斯算法 210
14.2.1 先验概率和后验概率 211
14.2.2 词向量 211
14.2.3 贝叶斯模型 214
14.3 贝叶斯算法实战—— 文本分类 222
第15章 支持向量机 225
15.1 支持向量机的基础知识 225
15.1.1 向量 225
15.1.2 点积 228
15.1.3 投影 229
15.1.4 向量与代数直线的关系 230
15.2 深入理解支持向量机 233
15.2.1 超平面 233
15.2.2 支持向量机在二维空间的
超平面 234
15.2.3 计算最优超平面 235
15.3 支持向量机实战—— 鸢尾花分类 237
第16章 PCA降维算法 240
16.1 PCA降维算法的核心知识 240
16.1.1 矩阵的直观理解 240
16.1.2 特征向量的本质 243
16.1.3 协方差 244
16.1.4 协方差矩阵 244
16.2 PCA降维算法详解 244
16.2.1 协方差矩阵的特征向量 245
16.2.2 PCA降维算法的Python
实现 246
16.3 PCA降维算法实战—— iris数据集
可视化 247
第17章 SVD奇异值分解 249
17.1 SVD奇异值分解的相关知识 249
17.2 深入理解矩阵作用 250
17.2.1 矩阵作用 250
17.2.2 将矩阵作用分解为特征向量
作用 251
17.2.3 将矩阵作用分解为奇异矩阵
作用 253
17.3 SVD奇异值分解的应用 255
17.3.1 U矩阵的理解 257
17.3.2 V矩阵的理解 258
17.3.3 S矩阵的理解 259
第18章 聚类算法 260
18.1 深入理解K均值聚类算法 260
18.2 Scikit库中的K均值聚类算法 264
18.3 其他聚类算法 266
第19章 深度学习框架及其
应用 269
19.1 TensorFlow 269
19.1.1 TensorFlow的基本概念 269
19.1.2 TensorFlow的应用 271
19.2 Keras 277
19.3 PyTorch 282
19.4 Caffe 288
猜您喜欢

读书导航