书籍详情
Python数据挖掘:入门、进阶与实用案例分析
作者:卢滔 张良均 戴浩 李曼 陈四德 著
出版社:机械工业出版社
出版时间:2023-08-01
ISBN:9787111730101
定价:¥99.00
购买这本书可以去
内容简介
内容简介这是一本以项目实战案例为驱动的数据挖掘著作,它能帮助完全没有Python编程基础和数据挖掘基础的读者快速掌握Python数据挖掘的技术、流程与方法。在写作方式上,本书与传统的“理论与实践结合”的入门书不同,它以数据挖掘领域的知名赛事“泰迪杯”数据挖掘挑战赛(已举办10届)和“泰迪杯”数据分析技能赛(已举办5届)(累计1500余所高校的10余万师生参赛)为依托,精选了11个经典赛题,将Python编程知识、数据挖掘知识和行业知识三者融合,让读者在实践中快速掌握电商、教育、交通、传媒、电力、旅游、制造等7大行业的数据挖掘方法。本书不仅适用于零基础的读者自学,还适用于教师教学,为了帮助读者更加高效地掌握本书的内容,本书提供了以下10项附加价值:(1)建模平台:提供一站式大数据挖掘建模平台,免配置,包含大量案例工程,边练边学,告别纸上谈兵(2)视频讲解:提供不少于600分钟Python编程和数据挖掘相关教学视频,边看边学,快速收获经验值(3)精选习题:精心挑选不少于60道数据挖掘练习题,并提供详细解答,边学边练,检查知识盲区(4)作者答疑:学习过程中有任何问题,通过“树洞”小程序,纸书拍照,一键发给作者,边问边学,事半功倍(5)数据文件:提供各个案例配套的数据文件,与工程实践结合,开箱即用,增强实操性(6)程序代码:提供书中代码的电子文件及相关工具的安装包,代码导入平台即可运行,学习效果立竿见影(7)教学课件:提供配套的PPT课件,使用本书作为教材的老师可以申请,节省备课时间(8)模型服务:提供不少于10个数据挖掘模型,模型提供完整的案例实现过程,助力提升数据挖掘实践能力(9)教学平台:泰迪科技为本书提供的附加资源提供一站式数据化教学平台,附有详细操作指南,边看边学边练,节省时间(10)就业推荐:提供大量就业推荐机会,与1500+企业合作,包含华为、京东、美的等知名企业通过学习本书,读者可以理解数据挖掘的原理,迅速掌握大数据技术的相关操作,为后续数据分析、数据挖掘、深度学习的实践及竞赛打下良好的技术基础。
作者简介
暂缺《Python数据挖掘:入门、进阶与实用案例分析》作者简介
目录
Contents?目 录
前 言
第一篇 基础篇
第1章 数据挖掘概述 2
1.1 数据挖掘简介 2
1.2 数据挖掘的通用流程 4
1.2.1 目标分析 4
1.2.2 数据抽取 4
1.2.3 数据探索 5
1.2.4 数据预处理 5
1.2.5 分析与建模 5
1.2.6 模型评价 6
1.3 常用数据挖掘工具 6
1.4 Python数据挖掘环境配置 7
1.5 小结 9
第2章 Python数据挖掘编程基础 10
2.1 Python使用入门 10
2.1.1 基本命令 10
2.1.2 判断与循环 14
2.1.3 函数 15
2.1.4 库的导入与添加 17
2.2 Python数据分析及预处理
常用库 19
2.2.1 NumPy 19
2.2.2 pandas 20
2.2.3 Matplotlib 20
2.3 Python数据挖掘建模常用框架
和库 20
2.3.1 scikit-learn 21
2.3.2 深度学习 21
2.3.3 其他 23
2.4 小结 25
第二篇 入门篇
第3章 电商平台手机销售数据采集与
分析 28
3.1 背景与目标 28
3.1.1 背景 29
3.1.2 数据说明 29
3.1.3 目标分析 30
3.2 数据采集 31
3.2.1 手机销售数据采集 31
3.2.2 手机售后数据采集 32
3.3 数据探索与预处理 34
3.3.1 数据信息探索 34
3.3.2 缺失值处理 36
3.3.3 文本处理 37
3.4 数据可视化分析 38
3.4.1 手机的销售因素分析 38
3.4.2 用户的消费习惯分析 45
3.4.3 用户的售后评论分析 49
3.5 制定营销策略 50
3.6 小结 51
第4章 自动售货机销售数据分析与
应用 52
4.1 背景与目标 52
4.1.1 背景 52
4.1.2 数据说明 53
4.1.3 目标分析 53
4.2 数据读取与预处理 54
4.2.1 数据读取 54
4.2.2 数据清洗 55
4.2.3 数据规约 57
4.3 销售数据可视化分析 59
4.3.1 销售额和自动售货机数量的
关系 59
4.3.2 订单数量和自动售货机数量的
关系 60
4.3.3 畅销和滞销商品 63
4.3.4 自动售货机的销售情况 64
4.3.5 订单支付方式占比 67
4.3.6 各消费时段的订单用户
占比 68
4.4 销售额预测 69
4.4.1 统计周销售额 69
4.4.2 平稳性检验 70
4.4.3 差分处理 72
4.4.4 模型定阶 74
4.4.5 模型预测 74
4.5 小结 75
第5章 教育平台的线上课程推荐
策略 76
5.1 背景与目标 76
5.1.1 背景 77
5.1.2 数据说明 77
5.1.3 目标分析 78
5.2 数据探索 78
5.2.1 数据质量分析 79
5.2.2 课程单价分布分析 81
5.3 数据预处理 82
5.4 平台的运营状况分析 83
5.4.1 用户留存率 83
5.4.2 用户活跃时间 88
5.4.3 课程受欢迎程度 90
5.5 Apriori模型的构建 92
5.5.1 Apriori算法 93
5.5.2 构建Apriori模型 94
5.5.3 模型应用 97
5.6 制定课程推荐策略 98
5.7 小结 99
第三篇 进阶篇
第6章 电视产品的营销推荐 102
6.1 背景与目标 102
6.1.1 背景 103
6.1.2 数据说明 103
6.1.3 目标分析 104
6.2 数据预处理 105
6.2.1 数据清洗 105
6.2.2 数据探索 109
6.2.3 属性构建 115
6.3 分析与建模 118
6.3.1 基于物品的协同过滤推荐
模型 119
6.3.2 基于流行度的推荐算法
模型 121
6.4 模型评价 122
6.5 小结 124
第7章 运输车辆安全驾驶行为
分析 125
7.1 背景与目标 125
7.1.1 背景 126
7.1.2 数据说明 126
7.1.3 目标分析 126
7.2 构建车辆驾驶行为指标 127
7.3 数据探索分析 129
7.3.1 分布分析 129
7.3.2 相关性分析 131
7.3.3 异常值检测 132
7.4 驾驶行为聚类分析 133
7.4.1 K-Means聚类 133
7.4.2 层次聚类 135
7.4.3 高斯混合模型聚类 136
7.4.4 谱聚类 137
7.5 构建驾驶行为预测模型 139
7.5.1 构建LDA模型 139
7.5.2 构建朴素贝叶斯模型 140
7.5.3 构建神经网络模型 142
7.6 驾驶行为安全分析总结 143
7.7 小结 143
第8章 基于非侵入式负荷监测与
分解的电力数据挖掘 144
8.1 背景与目标 144
8.1.1 背景 144
8.1.2 数据说明 146
8.1.3 目标分析 148
8.2
前 言
第一篇 基础篇
第1章 数据挖掘概述 2
1.1 数据挖掘简介 2
1.2 数据挖掘的通用流程 4
1.2.1 目标分析 4
1.2.2 数据抽取 4
1.2.3 数据探索 5
1.2.4 数据预处理 5
1.2.5 分析与建模 5
1.2.6 模型评价 6
1.3 常用数据挖掘工具 6
1.4 Python数据挖掘环境配置 7
1.5 小结 9
第2章 Python数据挖掘编程基础 10
2.1 Python使用入门 10
2.1.1 基本命令 10
2.1.2 判断与循环 14
2.1.3 函数 15
2.1.4 库的导入与添加 17
2.2 Python数据分析及预处理
常用库 19
2.2.1 NumPy 19
2.2.2 pandas 20
2.2.3 Matplotlib 20
2.3 Python数据挖掘建模常用框架
和库 20
2.3.1 scikit-learn 21
2.3.2 深度学习 21
2.3.3 其他 23
2.4 小结 25
第二篇 入门篇
第3章 电商平台手机销售数据采集与
分析 28
3.1 背景与目标 28
3.1.1 背景 29
3.1.2 数据说明 29
3.1.3 目标分析 30
3.2 数据采集 31
3.2.1 手机销售数据采集 31
3.2.2 手机售后数据采集 32
3.3 数据探索与预处理 34
3.3.1 数据信息探索 34
3.3.2 缺失值处理 36
3.3.3 文本处理 37
3.4 数据可视化分析 38
3.4.1 手机的销售因素分析 38
3.4.2 用户的消费习惯分析 45
3.4.3 用户的售后评论分析 49
3.5 制定营销策略 50
3.6 小结 51
第4章 自动售货机销售数据分析与
应用 52
4.1 背景与目标 52
4.1.1 背景 52
4.1.2 数据说明 53
4.1.3 目标分析 53
4.2 数据读取与预处理 54
4.2.1 数据读取 54
4.2.2 数据清洗 55
4.2.3 数据规约 57
4.3 销售数据可视化分析 59
4.3.1 销售额和自动售货机数量的
关系 59
4.3.2 订单数量和自动售货机数量的
关系 60
4.3.3 畅销和滞销商品 63
4.3.4 自动售货机的销售情况 64
4.3.5 订单支付方式占比 67
4.3.6 各消费时段的订单用户
占比 68
4.4 销售额预测 69
4.4.1 统计周销售额 69
4.4.2 平稳性检验 70
4.4.3 差分处理 72
4.4.4 模型定阶 74
4.4.5 模型预测 74
4.5 小结 75
第5章 教育平台的线上课程推荐
策略 76
5.1 背景与目标 76
5.1.1 背景 77
5.1.2 数据说明 77
5.1.3 目标分析 78
5.2 数据探索 78
5.2.1 数据质量分析 79
5.2.2 课程单价分布分析 81
5.3 数据预处理 82
5.4 平台的运营状况分析 83
5.4.1 用户留存率 83
5.4.2 用户活跃时间 88
5.4.3 课程受欢迎程度 90
5.5 Apriori模型的构建 92
5.5.1 Apriori算法 93
5.5.2 构建Apriori模型 94
5.5.3 模型应用 97
5.6 制定课程推荐策略 98
5.7 小结 99
第三篇 进阶篇
第6章 电视产品的营销推荐 102
6.1 背景与目标 102
6.1.1 背景 103
6.1.2 数据说明 103
6.1.3 目标分析 104
6.2 数据预处理 105
6.2.1 数据清洗 105
6.2.2 数据探索 109
6.2.3 属性构建 115
6.3 分析与建模 118
6.3.1 基于物品的协同过滤推荐
模型 119
6.3.2 基于流行度的推荐算法
模型 121
6.4 模型评价 122
6.5 小结 124
第7章 运输车辆安全驾驶行为
分析 125
7.1 背景与目标 125
7.1.1 背景 126
7.1.2 数据说明 126
7.1.3 目标分析 126
7.2 构建车辆驾驶行为指标 127
7.3 数据探索分析 129
7.3.1 分布分析 129
7.3.2 相关性分析 131
7.3.3 异常值检测 132
7.4 驾驶行为聚类分析 133
7.4.1 K-Means聚类 133
7.4.2 层次聚类 135
7.4.3 高斯混合模型聚类 136
7.4.4 谱聚类 137
7.5 构建驾驶行为预测模型 139
7.5.1 构建LDA模型 139
7.5.2 构建朴素贝叶斯模型 140
7.5.3 构建神经网络模型 142
7.6 驾驶行为安全分析总结 143
7.7 小结 143
第8章 基于非侵入式负荷监测与
分解的电力数据挖掘 144
8.1 背景与目标 144
8.1.1 背景 144
8.1.2 数据说明 146
8.1.3 目标分析 148
8.2
猜您喜欢