书籍详情

大数据挖掘实验教程

大数据挖掘实验教程

作者:赵志升 著,赵志升 梁俊花 编

出版社:北京师范大学出版社

出版时间:2020-08-01

ISBN:9787303260997

定价:¥49.80

购买这本书可以去
内容简介
  1、本书通过典型案例的R语言实现,清晰解读教材中晦涩难懂的理论阐述与算法推导,让抽象的大数据落地到具体行业上,理论联系实际,实用性强。 2、实验指导书中所有案例均来自医疗大数据研究室项目和培训积累,并且结合课堂体验和学习效果,从中精挑细选的典型案例。 3、适合不同层次的读者。不仅适合高等院校的各相关专业的本专科生、研究生,也适合零编程基础的科研人员以及对大数据分析技术感兴趣的人士阅读。
作者简介
  赵志升,女,河北北方学院,教授,教龄35年,长期从事大数据分析、计算机应用相关的教学与研究,发表相关论文50余篇,专著1部,主编教材8部,先后主持省厅级项目15项,获国家软件著作权20余项,获河北省医学科技一等奖1项,获河北省科学技术进步三等奖1项,讲授的课程包括:《数据库原理与应用》《数据仓库与数据挖掘》《大数据分析基础》《信息系统分析与设计》等。
目录
第1章实验工具的选择1
11实验工具选择1
12R语言3
13Python语言15
第2章数据的准备34
21数据采集34
22数据抽样51
23数据质量分析55
第3章数据预处理方法77
31数据清洗77
32数据集成85
33数据变换90
34数据规约97
35数据降维106
第4章回归方法110
41多元线性回归110
42逻辑回归120
43线性判别分析126
第5章分类方法131
51K近邻分类131
52贝叶斯分类139
53神经网络146
54决策树153
55随机森林160
56支持向量机164
57分类的评价175
第6章关联规则192
61关联规则概要192
62Apriori算法193
63FPGrowth算法200
第7章聚类分析207
71聚类方法概要207
72Kmeans聚类算法209
73K中心点聚类算法216
74密度聚类算法220
75层次聚类算法225
76期望最大化聚类算法228
77神经网络聚类算法232
78模糊C均值聚类算法235
79高斯混合聚类算法238
第8章预测方法241
81预测方法概要241
82灰色预测241
83马尔科夫预测247
第9章离群点诊断251
91单变量的离群点诊断251
92基于回归的离群点诊断
254
93基于聚类的离群点诊断
259
94局部离群点因子检测263
第10章时间序列分析方法267
101季节指数预测法267
102解读自回归时间序列模型
272
103时间序列分解280
第11章综合案例286
111员工离职预测分析286
112北京二手房房价分析299
猜您喜欢

读书导航