书籍详情
增强深度神经网络
作者:凯蒂沃尔,杜春晓 译
出版社:中国电力出版社
出版时间:2020-12-01
ISBN:9787519849641
定价:¥78.00
购买这本书可以去
内容简介
深入深度神经网络,揭开对抗性输入如何欺骗深度神经网络。 探讨如何生成对抗性输入去攻击深度神经网络。 探索真实对抗性攻击场景和为对抗性威胁建模。 评估神经网络的健壮性;学会增强人工智能系统应对对抗性数据的能力。 考察未来几年可用哪些方式让人工智能更擅长模拟人的感知。
作者简介
Katy Warr专攻人工智能和数据分析。她此前有多年企业软件架构设计和开发经验。她拥有爱丁堡大学人工智能和计算机科学学位
目录
目录
前言 1
第1 章 机器学习入门 7
本书使用的库 7
用pip 安装库 10
用conda 安装库12
第2 章 机器学习流程概览 15
第3 章 数据分类工作流:泰坦尼克号数据集 17
项目布局建议 17
导入 18
提出问题 19
数据术语 19
获取数据 21
清洗数据 22
创建特征 29
数据采样 31
数据插值 31
规范数据 32
重构 33
基准模型 35
不同算法族 35
模型堆叠 37
建模 38
评估模型 38
优化模型 40
混淆矩阵 41
ROC 曲线 42
学习曲线 44
部署模型 45
第4 章 数据缺失 47
检查数据缺失情况 48
删除缺数据的行或列 52
插值 53
添加标识列 54
第5 章 清洗数据 55
处理列名 55
替换缺失值 56
第6 章 探索数据 59
数据大小 59
汇总统计 60
直方图 61
散点图 62
Joint Plot 图 63
Pair Grid 图 66
箱形图和小提琴图 68
比较两个序数型特征 69
相关性 71
RadViz 图 76
平行坐标图 78
第7 章 预处理数据 81
标准化 81
调整取值范围 83
虚拟变量 84
标签编码 85
频数编码 86
从字符串抽取类别型数据 87
类别型数据的其他编码方法 89
日期特征的处理方法 91
添加col_na 特征 92
特征工程 93
第8 章 特征选择 95
共线列 95
套索回归 99
递归特征消除 100
互信息 102
主成分分析 103
特征重要性 103
第9 章 类别不平衡 105
采用不同度量标准 105
树模型和集成方法 105
惩罚模型 106
对小众类别上采样 106
生成小众数据 107
对大众类别下采样 107
先上采样,再下采样 109
第10 章 分类 111
对数概率回归 112
朴素贝叶斯 117
支持向量机 120
k 近邻 123
决策树 126
随机森林 133
XGBoost 138
LightGBM150
TPOT 155
第11 章 模型选择 161
验证曲线 161
学习曲线 163
第12 章 度量标准和分类评估 165
混淆矩阵 165
度量标准 168
准确率 170
召回率 171
精准率 171
f1 值 172
分类报告 172
ROC 曲线 173
精准率- 召回率曲线 175
累积增益图 176
lift 曲线 178
类别平衡 180
类别预测错误 181
判别阈值 182
第13 章 解释模型 185
回归系数 185
特征重要性 186
LIME 包186
解释树模型 188
部分依赖图 189
替代模型 193
Shapley 值 194
第14 章 回归 199
基准模型 201
线性回归 202
支持向量机 206
k 近邻 208
决策树 210
随机森林 217
XGBoost 回归 220
LightGBM 回归 228
第15 章 度量标准和回归模型的评估 233
度量标准 233
残差图 236
异方差性 237
残差正态性 237
预测误差图 239
第16 章 解释回归模型 241
Shapley 值 241
第17 章 降维技术 247
PCA 方法 247
UMAP 方法 267
t-SNE 方法 273
PHATE 方法 277
第18 章 聚类 283
k-means 算法 283
层次聚类 290
理解簇 293
第19 章 流水线 299
分类流水线 299
回归流水线 302
PCA 流水线 303
作者介绍 305
前言 1
第1 章 机器学习入门 7
本书使用的库 7
用pip 安装库 10
用conda 安装库12
第2 章 机器学习流程概览 15
第3 章 数据分类工作流:泰坦尼克号数据集 17
项目布局建议 17
导入 18
提出问题 19
数据术语 19
获取数据 21
清洗数据 22
创建特征 29
数据采样 31
数据插值 31
规范数据 32
重构 33
基准模型 35
不同算法族 35
模型堆叠 37
建模 38
评估模型 38
优化模型 40
混淆矩阵 41
ROC 曲线 42
学习曲线 44
部署模型 45
第4 章 数据缺失 47
检查数据缺失情况 48
删除缺数据的行或列 52
插值 53
添加标识列 54
第5 章 清洗数据 55
处理列名 55
替换缺失值 56
第6 章 探索数据 59
数据大小 59
汇总统计 60
直方图 61
散点图 62
Joint Plot 图 63
Pair Grid 图 66
箱形图和小提琴图 68
比较两个序数型特征 69
相关性 71
RadViz 图 76
平行坐标图 78
第7 章 预处理数据 81
标准化 81
调整取值范围 83
虚拟变量 84
标签编码 85
频数编码 86
从字符串抽取类别型数据 87
类别型数据的其他编码方法 89
日期特征的处理方法 91
添加col_na 特征 92
特征工程 93
第8 章 特征选择 95
共线列 95
套索回归 99
递归特征消除 100
互信息 102
主成分分析 103
特征重要性 103
第9 章 类别不平衡 105
采用不同度量标准 105
树模型和集成方法 105
惩罚模型 106
对小众类别上采样 106
生成小众数据 107
对大众类别下采样 107
先上采样,再下采样 109
第10 章 分类 111
对数概率回归 112
朴素贝叶斯 117
支持向量机 120
k 近邻 123
决策树 126
随机森林 133
XGBoost 138
LightGBM150
TPOT 155
第11 章 模型选择 161
验证曲线 161
学习曲线 163
第12 章 度量标准和分类评估 165
混淆矩阵 165
度量标准 168
准确率 170
召回率 171
精准率 171
f1 值 172
分类报告 172
ROC 曲线 173
精准率- 召回率曲线 175
累积增益图 176
lift 曲线 178
类别平衡 180
类别预测错误 181
判别阈值 182
第13 章 解释模型 185
回归系数 185
特征重要性 186
LIME 包186
解释树模型 188
部分依赖图 189
替代模型 193
Shapley 值 194
第14 章 回归 199
基准模型 201
线性回归 202
支持向量机 206
k 近邻 208
决策树 210
随机森林 217
XGBoost 回归 220
LightGBM 回归 228
第15 章 度量标准和回归模型的评估 233
度量标准 233
残差图 236
异方差性 237
残差正态性 237
预测误差图 239
第16 章 解释回归模型 241
Shapley 值 241
第17 章 降维技术 247
PCA 方法 247
UMAP 方法 267
t-SNE 方法 273
PHATE 方法 277
第18 章 聚类 283
k-means 算法 283
层次聚类 290
理解簇 293
第19 章 流水线 299
分类流水线 299
回归流水线 302
PCA 流水线 303
作者介绍 305
猜您喜欢