书籍详情

Python机器学习经典实例(第2版)

Python机器学习经典实例(第2版)

作者:[意] 朱塞佩·查博罗(Giuseppe Ciaburro) 著,王海玲,李昉 译

出版社:人民邮电出版社

出版时间:2021-12-01

ISBN:9787115556929

定价:¥139.80

购买这本书可以去
内容简介
  本书介绍了如何使用scikit-learn、TensorFlow等关键库来有效解决现实世界的机器学习问题。本书着重于实用的解决方案,提供多个案例,详细地讲解了如何使用Python生态系统中的现代库来构建功能强大的机器学习应用程序;还介绍了分类、聚类和推荐引擎等多种机器学习算法,以及如何将监督学习和无监督学习技术应用于实际问题;最后,介绍了强化学习、深度神经网络和自动机器学习等应用示例。本书适合数据科学家、机器学习开发人员、深度学习爱好者以及希望使用机器学习技术和算法解决实际问题的Python程序员阅读。
作者简介
  朱塞佩.查博罗(Giuseppe Ciaburro)拥有环境技术物理学博士学位和两个学科的硕士学位,他的重点研究方向是机器学习在城市声环境研究中的应用。他有超过15年的编程专业经验(Python、R、MATLAB),开始从事燃烧学领域的研究,后又致力于声学和噪音控制方向,并出版过几本著作,销量均不错。普拉蒂克.乔希(Prateek Joshi)毕业于南加州大学,拥有人工智能硕士学位。他是一位人工智能专家,也是一位 TEDx演讲者,曾位列福布斯30岁以下的30位精英榜单,并在美国消费者新闻与商业频道(CNBC)、TechCrunch、硅谷商业期刊(Silicon Valley Business Journal)及更多的刊物上发表过文章。
目录
第 1章 监督学习 1
1.1 技术要求 1
1.2 简介 2
1.3 用Python创建数组 3
1.3.1 准备工作 3
1.3.2 详细步骤 3
1.3.3 工作原理 4
1.3.4 更多内容 4
1.4 用均值移除法进行数据预处理 5
1.4.1 准备工作 5
1.4.2 详细步骤 6
1.4.3 工作原理 7
1.4.4 更多内容 7
1.5 数据缩放 7
1.5.1 准备工作 7
1.5.2 详细步骤 8
1.5.3 工作原理 9
1.5.4 更多内容 9
1.6 归一化 9
1.6.1 准备工作 9
1.6.2 详细步骤 10
1.6.3 工作原理 10
1.6.4 更多内容 10
1.7 二值化 10
1.7.1 准备工作 11
1.7.2 详细步骤 11
1.7.3 工作原理 11
1.7.4 更多内容 12
1.8 one-hot编码 12
1.8.1 准备工作 12
1.8.2 详细步骤 12
1.8.3 工作原理 13
1.8.4 更多内容 14
1.9 标签编码 14
1.9.1 准备工作 14
1.9.2 详细步骤 14
1.9.3 工作原理 15
1.9.4 更多内容 16
1.10 构建线性回归器 16
1.10.1 准备工作 17
1.10.2 详细步骤 18
1.10.3 工作原理 20
1.10.4 更多内容 20
1.11 计算回归准确度 21
1.11.1 准备工作 21
1.11.2 详细步骤 21
1.11.3 工作原理 22
1.11.4 更多内容 22
1.12 模型持久化 22
1.12.1 准备工作 22
1.12.2 详细步骤 23
1.12.3 工作原理 23
1.12.4 更多内容 23
1.13 构建岭回归器 24
1.13.1 准备工作 25
1.13.2 详细步骤 25
1.13.3 工作原理 26
1.14 构建多项式回归器 26
1.14.1 准备工作 27
1.14.2 详细步骤 27
1.14.3 工作原理 29
1.14.4 更多内容 29
1.15 估算房屋价格 29
1.15.1 准备工作 30
1.15.2 详细步骤 30
1.15.3 工作原理 33
1.15.4 更多内容 33
1.16 计算特征的相对重要性 33
1.16.1 准备工作 34
1.16.2 详细步骤 34
1.16.3 工作原理 36
1.16.4 更多内容 36
1.17 评估共享单车的需求分布 36
1.17.1 准备工作 36
1.17.2 详细步骤 36
1.17.3 工作原理 39
1.17.4 更多内容 39
第 2章 构建分类器 41
2.1 技术要求 41
2.2 简介 42
2.3 构建简单分类器 42
2.3.1 准备工作 43
2.3.2 详细步骤 43
2.3.3 工作原理 45
2.3.4 更多内容 45
2.4 构建逻辑回归分类器 45
2.4.1 准备工作 45
2.4.2 详细步骤 46
2.4.3 工作原理 49
2.4.4 更多内容 49
2.5 构建朴素贝叶斯分类器 49
2.5.1 准备工作 50
2.5.2 详细步骤 50
2.5.3 工作原理 52
2.5.4 更多内容 53
2.6 将数据集划分成训练集和测试集 53
2.6.1 准备工作 54
2.6.2 详细步骤 54
2.6.3 工作原理 56
2.6.4 更多内容 57
2.7 用交叉验证评估模型准确度 57
2.7.1 准备工作 57
2.7.2 详细步骤 57
2.7.3 工作原理 58
2.7.4 更多内容 59
2.8 混淆矩阵可视化 59
2.8.1 准备工作 60
2.8.2 详细步骤 60
2.8.3 工作原理 61
2.8.4 更多内容 62
2.9 提取性能报告 62
2.9.1 准备工作 62
2.9.2 详细步骤 62
2.9.3 工作原理 63
2.9.4 更多内容 63
2.10 根据特征评估汽车质量 63
2.10.1 准备工作 63
2.10.2 详细步骤 64
2.10.3 工作原理 66
2.10.4 更多内容 66
2.11 生成验证曲线 66
2.11.1 准备工作 67
2.11.2 详细步骤 67
2.11.3 工作原理 69
2.11.4 更多内容 69
2.12 生成学习曲线 69
2.12.1 准备工作 70
2.12.2 详细步骤 70
2.12.3 工作原理 71
2.12.4 更多内容 71
2.13 估算收入阶层 71
2.13.1 准备工作 72
2.13.2 详细步骤 72
2.13.3 工作原理 75
2.13.4 更多内容 75
2.14 葡萄酒质量预测 75
2.14.1 准备工作 76
2.14.2 详细步骤 76
2.14.3 工作原理 78
2.14.4 更多内容 78
2.15 新闻组热门话题分类 78
2.15.1 准备工作 78
2.15.2 详细步骤 79
2.15.3 工作原理 80
2.15.4 更多内容 80
第3章 预测建模 81
3.1 技术要求 81
3.2 简介 82
3.3 用SVM构建线性分类器 82
3.3.1 准备工作 83
3.3.2 详细步骤 84
3.3.3 工作原理 86
3.3.4 更多内容 87
3.4 用SVM构建非线性分类器 87
3.4.1 准备工作 87
3.4.2 详细步骤 87
3.4.3 工作原理 89
3.4.4 更多内容 89
3.5 解决类型不平衡问题 89
3.5.1 准备工作 90
3.5.2 详细步骤 90
3.5.3 工作原理 93
3.5.4 更多内容 93
3.6 提取置信度 93
3.6.1 准备工作 93
3.6.2 详细步骤 93
3.6.3 工作原理 95
3.6.4 更多内容 96
3.7 寻找最优超参数 96
3.7.1 准备工作 96
3.7.2 详细步骤 96
3.7.3 工作原理 100
3.7.4 更多内容 101
3.8 构建事件预测器 101
3.8.1 准备工作 101
3.8.2 详细步骤 102
3.8.3 工作原理 104
3.8.4 更多内容 104
3.9 估算交通流量 104
3.9.1 准备工作 104
3.9.2 详细步骤 105
3.9.3 工作原理 107
3.9.4 更多内容 107
3.10 用TensorFlow简化机器学习流程 107
3.10.1 准备工作 107
3.10.2 详细步骤 108
3.10.3 工作原理 109
3.10.4 更多内容 109
3.11 堆叠法实现 109
3.11.1 准备工作 109
3.11.2 详细步骤 109
3.11.3 工作原理 110
3.11.4 更多内容 111
第4章 无监督学习——聚类 112
4.1 技术要求 112
4.2 简介 113
4.3 用k-means算法聚类数据 113
4.3.1 准备工作 114
4.3.2 详细步骤 114
4.3.3 工作原理 116
4.3.4 更多内容 117
4.4 用向量量化压缩图片 117
4.4.1 准备工作 118
4.4.2 详细步骤 118
4.4.3 工作原理 121
4.4.4 更多内容 121
4.5 用凝聚层次聚类进行数据分组 122
4.5.1 准备工作 122
4.5.2 详细步骤 122
4.5.3 工作原理 125
4.5.4 更多内容 125
4.6 评估聚类算法性能 126
4.6.1 准备工作 126
4.6.2 详细步骤 126
4.6.3 工作原理 129
4.6.4 更多内容 129
4.7 用DBSCAN算法估算簇的个数 129
4.7.1 准备工作 130
4.7.2 详细步骤 130
4.7.3 工作原理 133
4.7.4 更多内容 133
4.8 探索股票数据模式 134
4.8.1 准备工作 134
4.8.2 详细步骤 134
4.8.3 工作原理 136
4.8.4 更多内容 136
4.9 构建市场细分模型 136
4.9.1 准备工作 136
4.9.2 详细步骤 137
4.9.3 工作原理 139
4.9.4 更多内容 139
4.10 用自动编码器重构手写数字图像 139
4.10.1 准备工作 140
4.10.2 详细步骤 140
4.10.3 工作原理 143
4.10.4 更多内容 144
第5章 可视化数据 145
5.1 技术需求 145
5.2 简介 146
5.3 画3D散点图 146
5.3.1 准备工作 146
5.3.2 详细步骤 146
5.3.3 工作原理 148
5.3.4 更多内容 148
5.4 画气泡图 148
5.4.1 准备工作 148
5.4.2 详细步骤 148
5.4.3 工作原理 149
5.4.4 更多内容 150
5.5 画动态气泡图 150
5.5.1 准备工作 150
5.5.2 详细步骤 150
5.5.3 工作原理 152
5.5.4 更多内容 152
5.6 画饼图 152
5.6.1 准备工作 152
5.6.2 详细步骤 153
5.6.3 工作原理 154
5.6.4 更多内容 154
5.7 绘制日期格式的时间序列数据 154
5.7.1 准备工作 154
5.7.2 详细步骤 154
5.7.3 工作原理 156
5.7.4 更多内容 156
5.8 画直方图 156
5.8.1 准备工作 157
5.8.2 详细步骤 157
5.8.3 工作原理 158
5.8.4 更多内容 159
5.9 可视化热力图 159
5.9.1 准备工作 159
5.9.2 详细步骤 159
5.9.3 工作原理 161
5.9.4 更多内容 161
5.10 动态信号的可视化模拟 161
5.10.1 准备工作 161
5.10.2 详细步骤 161
5.10.3 工作原理 163
5.10.4 更多内容 164
5.11 用seaborn库画图 164
5.11.1 准备工作 164
5.11.2 详细步骤 164
5.11.3 工作原理 166
5.11.4 更多内容 166
第6章 构建推荐引擎 167
6.1 技术要求 167
6.2 简介 168
6.3 为数据处理构建函数组合 168
6.4 构建机器学习管道 171
6.5 构建最近邻分类器 173
6.6 构建KNN分类器 176
6.7 构建KNN回归器 181
6.8 计算欧式距离分数 184
6.9 计算皮尔逊相关系数 186
6.10 查找数据集中的相似用户 189
6.11 生成电影推荐 191
6.12 实现排序算法 193
6.13 用TensorFlow构建过滤器模型 195
第7章 文本数据分析 201
7.1 技术要求 201
7.2 简介 202
7.3 用标记解析的方法预处理数据 203
7.4 提取文本数据的词干 205
7.5 用词形还原的方法还原文本的基本形式 207
7.6 用分块的方法划分文本 209
7.7 构建词袋模型 211
7.8 构建文本分类器 214
7.9 识别名字性别 217
7.10 语句情感分析 219
7.11 用主题建模识别文本模式 223
7.12 用spaCy进行词性标注 226
7.13 用gensim构建Word2Vec模型 228
7.14 用浅层学习检测垃圾信息 229
第8章 语音识别 232
8.1 技术要求 232
8.2 简介 233
8.3 读取和绘制音频数据 233
8.4 将音频信号转换为频域 236
8.5 用自定义参数生成音频信号 238
8.6 合成音乐 241
8.7 提取频域特征 243
8.8 构建隐马尔可夫模型 246
8.9 构建语音识别器 248
8.10 构建TTS系统 253
第9章 时序列化和时序数据分析 256
9.1 技术要求 256
9.2 简介 257
9.3 将数据转换为时间序列格式 257
9.4 切分时间序列数据 260
9.5 操作时间序列数据 262
9.6 从时序数据中提取统计信息 265
9.7 为序列数据构建隐马尔可夫模型 268
9.8 为序列化文本数据构建条件随机场 271
9.9 股市数据分析 274
9.10 用RNN预测时间序列数据 279
第 10章 图像内容分析 284
10.1 技术要求 284
10.2 简介 285
10.3 用OpenCV_Python操作图像 286
10.4 边缘检测 288
10.5 直方图均衡 290
10.6 角点检测 293
10.7 SIFT特征点检测 294
10.8 构建Star特征检测器 296
10.9 用视觉码本和向量量化创建特征 299
10.10 用极端随机森林训练图像分类器 302
10.11 构建对象识别器 304
10.12 用LightGBM进行图像分类 306

第 11章 生物特征人脸识别 310
11.1 技术要求 310
11.2 简介 311
11.3 从网络摄像头采集和处理视频信息 311
11.4 用Haar级联构建人脸识别器 313
11.5 构建眼鼻检测器 316
11.6 主成分分析 319
11.7 核主成分分析 321
11.8 盲源分离 324
11.9 用局部二值模式直方图构建人脸识别器 328
11.10 基于HOG模型进行人脸识别 332
11.11 人脸特征点识别 334
11.12 用人脸识别进行用户身份验证 336
第 12章 强化学习 339
12.1 技术要求 339
12.2 简介 340
12.3 用MDP预报天气 341
12.4 用DP优化金融投资组合 344
12.5 找出最短路径 346
12.6 使用Q学习决定折扣因子 348
12.7 实现深度Q学习算法 351
12.8 开发基于AI的动态模型系统 353
12.9 通过双Q学习进行深度强化学习 355
12.10 通过dueling Q学习进行深度强化学习 357
第 13章 深度神经网络 361
13.1 技术要求 361
13.2 简介 362
13.3 构建感知机模型 362
13.4 构建单层神经网络 365
13.5 构建深度神经网络 368
13.6 创建向量量化器 371
13.7 为序列数据分析构建循环神经网络 373
13.8 可视化OCR数据库字符 377
13.9 使用神经网络构建光学字符识别器 379
13.10 用ANN实现优化算法 381

第 14章 无监督表示学习 385
14.1 需要的文件 385
14.2 简介 386
14.3 用降噪自动编码器检测欺诈交易 386
14.4 用CBOW和skipgram表示生成词嵌入 391
14.5 用PCA和t-SNE可视化MNIST数据 393
14.6 使用词嵌入进行推特情感分析 397
14.7 用scikit-learn实现LDA 400
14.8 用LDA对文本文档分类 402
14.9 为LDA准备数据 405
第 15章 自动机器学习与迁移学习 408
15.1 技术要求 408
15.2 简介 409
15.3 Auto-WEKA 409
15.4 用AutoML工具TPOT生成机器学习管道 410
15.5 Auto-Keras 412
15.6 auto-sklearn 413
15.7 用MLBox进行功能选择和泄漏检测 415
15.8 用卷积神经网络进行迁移学习 417
15.9 用ResNet-50作预训练图像分类器进行迁移学习 421
15.10 用VGG16模型作特征提取器进行迁移学习 423
15.11 用预训练GloVe嵌入模型进行迁移学习 425
第 16章 生产中的应用 430
16.1 技术要求 430
16.2 简介 430
16.3 处理非结构化数据 431
16.4 部署机器学习模型 433
16.5 跟踪生产中的变化 435
16.6 跟踪准确率并优化模型 437
猜您喜欢

读书导航