书籍详情

Python机器学习实战案例(第2版)

Python机器学习实战案例(第2版)

作者:赵卫东 董亮

出版社:清华大学出版社

出版时间:2022-03-01

ISBN:9787302601241

定价:¥59.00

购买这本书可以去
内容简介
  机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书基于Python语言,实现了12个典型的实战案例,其内容涵盖了机器学习的基础算法,主要包括统计学习基础、可视化、常用的分类算法、文本分析、卷积神经网络、循环神经网络、注意力机制、生成对抗网络、电子推荐系统等理论。 本书深入浅出,以实际应用的项目作为案例,实践性强,注重提升读者的动手操作能力,适合作为高等院校本科生及研究生机器学习、深度学习、数据挖掘等课程的实验教材,也可作为对机器学习和深度学习感兴趣的研究人员和工程技术人员的参考资料。
作者简介
  赵卫东,复旦大学计算机科学技术学院副教授。主要负责本科生和各类研究生机器学习、大数据核心技术和商务智能(商务数据分析)等课程的教学。2011年纽约大学访问学者、2015年上海市科技进步二等奖获得者、CDA三级认证数据科学家、腾讯云和百度云机器学习认证讲师。主讲的商务智能课程被评为上海市精品课程以及CMOOC联盟线上线下混合式教学改革项目,并获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括机器学习应用和大数据分析等。主持国家自然科学基金2项,国家重点研发计划子课题、上海市浦江人才以及企业合作课题等30多项。已在Knowledge and Information Systems, Information Processing & Management,Information Systems Frontiers等国内外刊物和学术会议发表论文100多篇。出版专著、教材《机器学习》《机器学习案例实战》《Python机器学习实战案例》等10多部。
目录
第1章集装箱危险品瞒报预测
1.1业务背景分析
1.2数据提取
1.3数据预处理
1.3.1数据集成
1.3.2数据清洗
1.3.3数据变换
1.3.4数据离散化
1.3.5特征重要性筛选
1.3.6数据平衡
1.4危险品瞒报预测建模
1.5模型评估
思考题
第2章保险产品推荐
2.1业务背景分析
2.2数据探索
2.3数据预处理
2.4分类模型构建
2.5平衡数据集
2.6算法调参
2.7模型比较
思考题
第3章图书类目自动标引系统
3.1业务背景分析
3.2数据提取
3.3数据预处理
3.4基于贝叶斯分类的文献标引
3.4.1增量训练
3.4.2特征降维与消歧
3.4.3权重调节
3.5贝叶斯分类性能评估
3.6基于BERT算法的文献标引
3.6.1数据预处理
3.6.2构建训练集
3.6.3模型实现
思考题
 
 
第4章基于分类算法的学习失败预警
4.1业务背景分析
4.2学习失败风险预测流程
4.3数据收集
4.4数据预处理
4.4.1数据探查及特征选择
4.4.2数据集划分及不平衡样本处理
4.4.3样本生成及标准化处理
4.5随机森林算法
4.5.1网格搜索及模型训练
4.5.2结果分析与可视化
4.5.3特征重要性分析
4.5.4与其他算法比较
思考题
第5章自然语言处理技术实例
5.1业务背景分析
5.2分析框架
5.3数据收集
5.4建立模型
5.4.1文本分词
5.4.2主题词提取
5.4.3情感分析
5.4.4语义角色标记
5.4.5语言模型
5.4.6词向量模型Word2Vec
思考题
第6章基于标签的信息推荐系统
6.1业务背景分析
6.2数据预处理
6.2.1现有系统现状
6.2.2数据预处理
6.3内容分析
6.4基于协同过滤推荐
6.4.1用户偏好矩阵构建
6.4.2用户相似度度量
6.5基于用户兴趣推荐
6.6“冷启动”问题与混合策略
6.6.1冷启动问题分析
6.6.2混合策略
思考题
第7章快销行业客户行为分析与流失预警
7.1业务背景分析
7.2数据预处理
7.2.1数据整理
7.2.2数据统计与探查
7.3用户行为分析
7.3.1用户流失风险评估
7.3.2流失风险预警模型集成
思考题
第8章基于深度学习的图片识别系统
8.1业务背景分析
8.2图片识别技术方案
8.3图片预处理——表格旋转
8.4图片预处理——表格提取
8.5基于密集卷积网络的文本识别模型
8.5.1训练数据生成
8.5.2DenseNet模型训练
8.5.3文本识别模型调用
8.6基于LSTM算法实现文本识别
8.6.1环境安装
8.6.2模型设计
8.6.3模型训练
8.6.4模型使用
思考题
第9章超分辨率图像重建
9.1数据探索
9.2数据预处理
9.2.1图像尺寸调整
9.2.2载入数据
9.2.3图像预处理
9.2.4持久化测试数据
9.3模型设计
9.3.1残差块
9.3.2上采样 PixelShuffle方法
9.3.3生成器
9.3.4判别器
9.3.5损失函数与优化器定义
9.3.6训练过程
9.4实验评估
思考题
第10章基于YOLO v5的电动车骑手头盔检测
10.1数据集的准备
10.2数据划分与预处理
10.3YOLO v5模型训练和优化
10.4YOLO v5模型应用
10.5YOLO v5模型移植
10.5.1模型转换
10.5.2Android头盔检测应用实现
10.6总结
思考题
第11章基于UNET算法的农业遥感图像分割
11.1数据准备
11.2数据预处理
11.3UNet语义分割模型搭建
11.3.1定义训练参数
11.3.2定义UNET主干特征提取网络模块
11.3.3定义UNET网络
11.3.4数据增强
11.3.5获取数据集以及模型
11.3.6设置回调函数
11.3.7设置损失函数
11.4图像语义分割模型训练
11.5语义分割模型使用
11.6总结
思考题
第12章基于自注意力、BiLSTM和TextCNN算法的新闻分类
12.1数据概况
12.2数据预处理
12.2.1分词
12.2.2关键词提取
12.2.3搭建和训练Word2Vec模型
12.3新闻分类模型训练和优化
12.3.1SelfAttention模型
12.3.2BiLSTM模型
12.3.3TextCNN模型
12.4结果分析
思考题
附录A机器学习复习题
附录B深度学习复习题
附录CAnaconda的安装与使用
参考文献
猜您喜欢

读书导航