Python数据分析与挖掘实战(第2版)
作者:张良均,谭立云,刘名军,江建明
出版社:机械工业出版社
出版时间:2019-12-01
ISBN:9787111640028
定价:¥79.00
前言
\n基础篇
\n第1章 数据挖掘基础 2
\n1.1 某知名连锁餐饮企业的困惑 2
\n1.2 从餐饮服务到数据挖掘 4
\n1.3 数据挖掘的基本任务 5
\n1.4 数据挖掘建模过程 5
\n1.4.1 定义挖掘目标 6
\n1.4.2 数据取样 6
\n1.4.3 数据探索 7
\n1.4.4 数据预处理 8
\n1.4.5 挖掘建模 8
\n1.4.6 模型评价 8
\n1.5 常用数据挖掘建模工具 9
\n1.6 小结 11
\n第2章 Python数据分析简介 12
\n2.1 搭建Python开发平台 14
\n2.1.1 所要考虑的问题 14
\n2.1.2 基础平台的搭建 14
\n2.2 Python使用入门 16
\n2.2.1 运行方式 16
\n2.2.2 基本命令 17
\n2.2.3 数据结构 19
\n2.2.4 库的导入与添加 24
\n2.3 Python数据分析工具 26
\n2.3.1 NumPy 27
\n2.3.2 SciPy 28
\n2.3.3 Matplotlib 29
\n2.3.4 pandas 31
\n2.3.5 StatsModels 33
\n2.3.6 scikit-learn 33
\n2.3.7 Keras 34
\n2.3.8 Gensim 36
\n2.4 配套附件使用设置 37
\n2.5 小结 38
\n第3章 数据探索 39
\n3.1 数据质量分析 39
\n3.1.1 缺失值分析 40
\n3.1.2 异常值分析 40
\n3.1.3 一致性分析 44
\n3.2 数据特征分析 44
\n3.2.1 分布分析 44
\n3.2.2 对比分析 48
\n3.2.3 统计量分析 51
\n3.2.4 周期性分析 54
\n3.2.5 贡献度分析 55
\n3.2.6 相关性分析 58
\n3.3 Python主要数据探索函数 62
\n3.3.1 基本统计特征函数 62
\n3.3.2 拓展统计特征函数 66
\n3.3.3 统计绘图函数 67
\n3.4 小结 74
\n第4章 数据预处理 75
\n4.1 数据清洗 75
\n4.1.1 缺失值处理 75
\n4.1.2 异常值处理 80
\n4.2 数据集成 80
\n4.2.1 实体识别 81
\n4.2.2 冗余属性识别 81
\n4.2.3 数据变换 81
\n4.2.4 简单函数变换 81
\n4.2.5 规范化 82
\n4.2.6 连续属性离散化 84
\n4.2.7 属性构造 87
\n4.2.8 小波变换 88
\n4.3 数据归约 91
\n4.3.1 属性归约 91
\n4.3.2 数值归约 95
\n4.4 Python主要数据预处理函数 98
\n4.5 小结 101
\n第5章 挖掘建模 102
\n5.1 分类与预测 102
\n5.1.1 实现过程 103
\n5.1.2 常用的分类与预测算法 103
\n5.1.3 回归分析 104
\n5.1.4 决策树 108
\n5.1.5 人工神经网络 115
\n5.1.6 分类与预测算法评价 120
\n5.1.7 Python分类预测模型特点 125
\n5.2 聚类分析 125
\n5.2.1 常用聚类分析算法 126
\n5.2.2 K-Means聚类算法 127
\n5.2.3 聚类分析算法评价 132
\n5.2.4 Python主要聚类分析算法 133
\n5.3 关联规则 135
\n5.3.1 常用关联规则算法 136
\n5.3.2 Apriori算法 136
\n5.4 时序模式 142
\n5.4.1 时间序列算法 142
\n5.4.2 时间序列的预处理 143
\n5.4.3 平稳时间序列分析 145
\n5.4.4 非平稳时间序列分析 148
\n5.4.5 Python主要时序模式算法 156
\n5.5 离群点检测 159
\n5.5.1 离群点的成因及类型 160
\n5.5.2 离群点检测方法 160
\n5.5.3 基于模型的离群点检测方法 161
\n5.5.4 基于聚类的离群点检测方法 164
\n5.6 小结 167
\n实战篇
\n第6章 财政收入影响因素分析及预测 170
\n6.1 背景与挖掘目标 170
\n6.2 分析方法与过程 171
\n6.2.1 分析步骤与流程 172
\n6.2.2 数据探索分析 172
\n6.2.3 数据预处理 176
\n6.2.4 模型构建 178
\n6.3 上机实验 184
\n6.4 拓展思考 185
\n6.5 小结 186
\n第7章 航空公司客户价值分析 187
\n7.1 背景与挖掘目标 187
\n7.2 分析方法与过程 188
\n7.2.1 分析步骤与流程 189
\n7.2.2 数据探索分析 189
\n7.2.3 数据预处理 200
\n7.2.4 模型构建 207
\n7.2.5 模型应用 212
\n7.3 上机实验 214
\n7.4 拓展思考 215
\n7.5 小结 216
\n第8章 商品零售购物篮分析 217
\n8.1 背景与挖掘目标 217
\n8.2 分析方法与过程 218
\n8.2.1 数据探索分析 219
\n8.2.2 数据预处理 224
\n8.2.3 模型构建 226
\n8.3 上机实验 232
\n8.4 拓展思考 233
\n8.5 小结 233
\n第9章 基于水色图像的水质评价 234
\n9.1 背景与挖掘目标 234
\n9.2 分析方法与过程 235
\n9.2.1 分析步骤与流程 236
\n9.2.2 数据预处理 236
\n9.2.3 模型构建 240
\n9.2.4 水质评价 241
\n9.3 上机实验 242
\n9.4 拓展思考 242
\n9.5 小结 243
\n第10章 家用热水器用户行为分析与事件识别 244
\n10.1 背景与挖掘目标 244
\n10.2 分析方法与过程 245
\n10.2.1 数据探索分析 246
\n10.2.2 数据预处理 249
\n10.2.3 模型构建 260
\n10.2.4 模型检验 261
\n10.3 上机实验 262
\n10.4 拓展思考 264
\n10.5 小结 265
\n第11章 电子商务网站用户行为分析及服务推荐 266
\n11.1 背景与挖掘目标 266
\n11.2 分析方法与过程 267
\n11.2.1 分析步骤与流程 267
\n11.2.2 数据抽取 269
\n11.2.3 数据探索分析 270
\n11.2.4 数据预处理 279
\n11.2.5 构建智能推荐模型 283
\n11.3 上机实验 291
\n11.4 拓展思考 293
\n11.5 小结 293
\n第12章 电商产品评论数据情感分析 294
\n12.1 背景与挖掘目标 294
\n12.2 分析方法与过程 295
\n12.2.1 评论预处理 296
\n12.2.2 评论分词 297
\n12.2.3 构建模型 303
\n12.3 上机实验 315
\n12.4 拓展思考 316
\n12.5 小结 318
\n提高篇
\n第13章 基于Python引擎的开源数据挖掘建模平台(TipDM) 320
\n13.1 平台简介 321
\n13.1.1 模板 321
\n13.1.2 数据源 322
\n13.1.3 工程 323
\n13.1.4 系统组件 324
\n13.1.5 TipDM数据挖掘建模平台的本地化部署 326
\n13.2 快速构建数据挖掘工程 327
\n13.2.1 导入数据 329
\n13.2.2 配置输入源组件 331
\n13.2.3 配置缺失值处理组件 332
\n13.2.4 配置记录选择组件 334
\n13.2.5 配置数据标准化组件 334
\n13.2.6 配置K-Means组件 336
\n13.3 小结 339
\n