书籍详情
机器学习入门与实战(微课版)
作者:王志
出版社:电子工业出版社
出版时间:2023-02-01
ISBN:9787121448607
定价:¥38.00
购买这本书可以去
内容简介
本书以掌握Python语言基础为前提,由浅入深、全面系统地讲解了机器学习的相关知识及技能,内容注重实用性和可操作性,在介绍机器学习理论知识的基础上,结合具体的实战实例,给出了详细的代码及实现步骤。全书共9个项目,分别介绍了数据分析基础、机器学习项目实战流程、探索性数据分析与特征工程、常见机器学习算法及框架、交叉验证与超参数调优,并结合主流机器学习技术框架Scikit-learn,展开了信用违约分类预测、社交媒体评论分类预测、共享单车用量需求回归预测、信用卡客户忠诚度回归预测的项目实战。
作者简介
暂缺《机器学习入门与实战(微课版)》作者简介
目录
项目1 数据分析基础 1
任务1 开发环境的搭建 1
1.1.1 数据分析相关库 1
1.1.2 Anaconda的安装和使用 2
1.1.3 Jupyter Notebook的使用 3
任务2 NumPy的应用 4
1.2.1 数组对象的创建 4
1.2.2 数组的索引和切片 10
任务3 Pandas的应用 14
1.3.1 Series对象的创建 14
1.3.2 Series对象的索引和切片 15
1.3.3 Series对象的常用属性 17
任务4 数据可视化 17
1.4.1 安装和导入 18
1.4.2 绘图的流程 18
任务5 Pandas、NumPy库的数据操作 18
1.5.1 数据读入 18
1.5.2 数据选择 19
1.5.3 缺失值填充 20
1.5.4 数据透视表绘制 21
1.5.5 数据集合并 21
1.5.6 独热编码 23
项目2 机器学习项目实战流程 25
任务1 知识准备 26
2.1.1 问题定义 26
2.1.2 数据准备 27
2.1.3 模型训练 30
2.1.4 模型评估 34
2.1.5 模型部署 38
2.1.6 模型监控与更新 39
2.1.7 小结 40
任务2 使用Scikit-learn框架完成基本的机器学习项目 40
2.2.1 Estimator 40
2.2.2 Metrics 41
2.2.3 小结 41
任务3 实战:泰坦尼克号事件生存预测 42
2.3.1 问题定义 42
2.3.2 数据准备 42
2.3.3 模型训练 45
2.3.4 模型评估 46
2.3.5 小结 47
项目3 探索性数据分析与特征工程 48
任务1 知识准备 49
3.1.1 探索性数据分析 49
3.1.2 特征工程 56
3.1.3 特征抽取 58
3.1.4 特征转换 61
3.1.5 特征选择 67
3.1.6 小结 67
任务2 实战:基于决策树的泰坦尼克号事件生存预测 68
3.2.1 问题定义 68
3.2.2 数据准备 68
3.2.3 模型训练 77
3.2.4 模型评估 77
3.2.5 数据保存 78
3.2.6 小结 78
项目4 常见机器学习算法及框架 79
任务1 知识准备 79
4.1.1 损失函数、代价函数与目标函数 79
4.1.2 逻辑回归与神经网络 81
4.1.3 决策树与随机森林 84
任务2 基于集成学习思想的算法 85
任务3 Python环境下XGBoost的安装及使用 88
任务4 Python环境下LightGBM的安装及使用 89
项目5 交叉验证与超参数调优 91
任务1 知识准备 92
5.1.1 机器学习算法中的参数与超参数 92
5.1.2 超参数调优方法 92
5.1.3 GBM算法的超参数调优 97
任务2 随机森林超参数调优 99
5.2.1 RF框架的参数意义 99
5.2.2 RF决策树的参数含义 100
任务3 实战:GBM算法超参数调优 101
5.3.1 问题定义 101
5.3.2 数据准备 101
5.3.3 小结 107
项目6 信用违约分类预测 109
任务1 信用违约分类建模 109
6.1.1 问题定义 109
6.1.2 数据准备 110
6.1.3 模型训练 114
6.1.4 模型评估 115
6.1.5 小结 116
任务2 实战:处理不平衡样本来优化模型 116
6.2.1 数据准备 116
6.2.2 小结 119
项目7 社交媒体评论分类预测 120
任务1 社交媒体评论分类建模 120
7.1.1 问题定义 120
7.1.2 数据准备 121
7.1.3 模型训练 125
7.1.4 模型评估 126
7.1.5 小结 126
任务2 实战:使用不同文本特征提取方法来优化模型 127
7.2.1 问题定义 127
7.2.2 数据准备 127
7.2.3 基于TF-IDF特征的模型训练与评估 130
7.2.4 TSNE、LDA降维操作及TSNE可视化 131
7.2.5 基于LDA方法对TF-IDF特征降维处理后的模型训练与评估 132
7.2.6 基于词向量方法的模型训练与评估 133
7.2.7 小结 135
项目8 共享单车用量需求回归预测 136
任务1 共享单车用量需求回归建模 136
8.1.1 问题定义 136
8.1.2 数据准备 137
8.1.3 模型训练 143
8.1.4 模型评估 143
8.1.5 小结 144
任务2 实战:使用特征选择及离散化方法来优化模型 144
8.2.1 问题定义 144
8.2.2 数据准备 145
8.2.3 模型训练 148
8.2.4 模型评估 149
8.2.5 小结 149
项目9 信用卡客户忠诚度回归预测 150
任务1 信用卡客户忠诚度回归建模 150
9.1.1 问题定义 150
9.1.2 数据准备 151
9.1.3 模型训练 160
9.1.4 模型评估 160
9.1.5 小结 162
任务2 实战:增加数据源抽取特征来优化模型 162
9.2.1 问题定义 162
9.2.2 数据准备 162
9.2.3 模型训练 167
9.2.4 模型评估 167
9.2.5 小结 168
附录A 课后习题及参考答案 169
项目1 习题及参考答案 169
项目2 习题及参考答案 170
项目3 习题及参考答案 171
项目4 习题及参考答案 172
项目5 习题及参考答案 173
项目6 习题及参考答案 174
项目7 习题及参考答案 174
项目8 习题及参考答案 175
项目9 习题及参考答案 176
任务1 开发环境的搭建 1
1.1.1 数据分析相关库 1
1.1.2 Anaconda的安装和使用 2
1.1.3 Jupyter Notebook的使用 3
任务2 NumPy的应用 4
1.2.1 数组对象的创建 4
1.2.2 数组的索引和切片 10
任务3 Pandas的应用 14
1.3.1 Series对象的创建 14
1.3.2 Series对象的索引和切片 15
1.3.3 Series对象的常用属性 17
任务4 数据可视化 17
1.4.1 安装和导入 18
1.4.2 绘图的流程 18
任务5 Pandas、NumPy库的数据操作 18
1.5.1 数据读入 18
1.5.2 数据选择 19
1.5.3 缺失值填充 20
1.5.4 数据透视表绘制 21
1.5.5 数据集合并 21
1.5.6 独热编码 23
项目2 机器学习项目实战流程 25
任务1 知识准备 26
2.1.1 问题定义 26
2.1.2 数据准备 27
2.1.3 模型训练 30
2.1.4 模型评估 34
2.1.5 模型部署 38
2.1.6 模型监控与更新 39
2.1.7 小结 40
任务2 使用Scikit-learn框架完成基本的机器学习项目 40
2.2.1 Estimator 40
2.2.2 Metrics 41
2.2.3 小结 41
任务3 实战:泰坦尼克号事件生存预测 42
2.3.1 问题定义 42
2.3.2 数据准备 42
2.3.3 模型训练 45
2.3.4 模型评估 46
2.3.5 小结 47
项目3 探索性数据分析与特征工程 48
任务1 知识准备 49
3.1.1 探索性数据分析 49
3.1.2 特征工程 56
3.1.3 特征抽取 58
3.1.4 特征转换 61
3.1.5 特征选择 67
3.1.6 小结 67
任务2 实战:基于决策树的泰坦尼克号事件生存预测 68
3.2.1 问题定义 68
3.2.2 数据准备 68
3.2.3 模型训练 77
3.2.4 模型评估 77
3.2.5 数据保存 78
3.2.6 小结 78
项目4 常见机器学习算法及框架 79
任务1 知识准备 79
4.1.1 损失函数、代价函数与目标函数 79
4.1.2 逻辑回归与神经网络 81
4.1.3 决策树与随机森林 84
任务2 基于集成学习思想的算法 85
任务3 Python环境下XGBoost的安装及使用 88
任务4 Python环境下LightGBM的安装及使用 89
项目5 交叉验证与超参数调优 91
任务1 知识准备 92
5.1.1 机器学习算法中的参数与超参数 92
5.1.2 超参数调优方法 92
5.1.3 GBM算法的超参数调优 97
任务2 随机森林超参数调优 99
5.2.1 RF框架的参数意义 99
5.2.2 RF决策树的参数含义 100
任务3 实战:GBM算法超参数调优 101
5.3.1 问题定义 101
5.3.2 数据准备 101
5.3.3 小结 107
项目6 信用违约分类预测 109
任务1 信用违约分类建模 109
6.1.1 问题定义 109
6.1.2 数据准备 110
6.1.3 模型训练 114
6.1.4 模型评估 115
6.1.5 小结 116
任务2 实战:处理不平衡样本来优化模型 116
6.2.1 数据准备 116
6.2.2 小结 119
项目7 社交媒体评论分类预测 120
任务1 社交媒体评论分类建模 120
7.1.1 问题定义 120
7.1.2 数据准备 121
7.1.3 模型训练 125
7.1.4 模型评估 126
7.1.5 小结 126
任务2 实战:使用不同文本特征提取方法来优化模型 127
7.2.1 问题定义 127
7.2.2 数据准备 127
7.2.3 基于TF-IDF特征的模型训练与评估 130
7.2.4 TSNE、LDA降维操作及TSNE可视化 131
7.2.5 基于LDA方法对TF-IDF特征降维处理后的模型训练与评估 132
7.2.6 基于词向量方法的模型训练与评估 133
7.2.7 小结 135
项目8 共享单车用量需求回归预测 136
任务1 共享单车用量需求回归建模 136
8.1.1 问题定义 136
8.1.2 数据准备 137
8.1.3 模型训练 143
8.1.4 模型评估 143
8.1.5 小结 144
任务2 实战:使用特征选择及离散化方法来优化模型 144
8.2.1 问题定义 144
8.2.2 数据准备 145
8.2.3 模型训练 148
8.2.4 模型评估 149
8.2.5 小结 149
项目9 信用卡客户忠诚度回归预测 150
任务1 信用卡客户忠诚度回归建模 150
9.1.1 问题定义 150
9.1.2 数据准备 151
9.1.3 模型训练 160
9.1.4 模型评估 160
9.1.5 小结 162
任务2 实战:增加数据源抽取特征来优化模型 162
9.2.1 问题定义 162
9.2.2 数据准备 162
9.2.3 模型训练 167
9.2.4 模型评估 167
9.2.5 小结 168
附录A 课后习题及参考答案 169
项目1 习题及参考答案 169
项目2 习题及参考答案 170
项目3 习题及参考答案 171
项目4 习题及参考答案 172
项目5 习题及参考答案 173
项目6 习题及参考答案 174
项目7 习题及参考答案 174
项目8 习题及参考答案 175
项目9 习题及参考答案 176
猜您喜欢