书籍详情
大数据挖掘实验教程
作者:赵志升 著,赵志升 梁俊花 编
出版社:北京师范大学出版社
出版时间:2020-08-01
ISBN:9787303260997
定价:¥49.80
购买这本书可以去
内容简介
1、本书通过典型案例的R语言实现,清晰解读教材中晦涩难懂的理论阐述与算法推导,让抽象的大数据落地到具体行业上,理论联系实际,实用性强。 2、实验指导书中所有案例均来自医疗大数据研究室项目和培训积累,并且结合课堂体验和学习效果,从中精挑细选的典型案例。 3、适合不同层次的读者。不仅适合高等院校的各相关专业的本专科生、研究生,也适合零编程基础的科研人员以及对大数据分析技术感兴趣的人士阅读。
作者简介
赵志升,女,河北北方学院,教授,教龄35年,长期从事大数据分析、计算机应用相关的教学与研究,发表相关论文50余篇,专著1部,主编教材8部,先后主持省厅级项目15项,获国家软件著作权20余项,获河北省医学科技一等奖1项,获河北省科学技术进步三等奖1项,讲授的课程包括:《数据库原理与应用》《数据仓库与数据挖掘》《大数据分析基础》《信息系统分析与设计》等。
目录
第1章实验工具的选择1
11实验工具选择1
12R语言3
13Python语言15
第2章数据的准备34
21数据采集34
22数据抽样51
23数据质量分析55
第3章数据预处理方法77
31数据清洗77
32数据集成85
33数据变换90
34数据规约97
35数据降维106
第4章回归方法110
41多元线性回归110
42逻辑回归120
43线性判别分析126
第5章分类方法131
51K近邻分类131
52贝叶斯分类139
53神经网络146
54决策树153
55随机森林160
56支持向量机164
57分类的评价175
第6章关联规则192
61关联规则概要192
62Apriori算法193
63FPGrowth算法200
第7章聚类分析207
71聚类方法概要207
72Kmeans聚类算法209
73K中心点聚类算法216
74密度聚类算法220
75层次聚类算法225
76期望最大化聚类算法228
77神经网络聚类算法232
78模糊C均值聚类算法235
79高斯混合聚类算法238
第8章预测方法241
81预测方法概要241
82灰色预测241
83马尔科夫预测247
第9章离群点诊断251
91单变量的离群点诊断251
92基于回归的离群点诊断
254
93基于聚类的离群点诊断
259
94局部离群点因子检测263
第10章时间序列分析方法267
101季节指数预测法267
102解读自回归时间序列模型
272
103时间序列分解280
第11章综合案例286
111员工离职预测分析286
112北京二手房房价分析299
11实验工具选择1
12R语言3
13Python语言15
第2章数据的准备34
21数据采集34
22数据抽样51
23数据质量分析55
第3章数据预处理方法77
31数据清洗77
32数据集成85
33数据变换90
34数据规约97
35数据降维106
第4章回归方法110
41多元线性回归110
42逻辑回归120
43线性判别分析126
第5章分类方法131
51K近邻分类131
52贝叶斯分类139
53神经网络146
54决策树153
55随机森林160
56支持向量机164
57分类的评价175
第6章关联规则192
61关联规则概要192
62Apriori算法193
63FPGrowth算法200
第7章聚类分析207
71聚类方法概要207
72Kmeans聚类算法209
73K中心点聚类算法216
74密度聚类算法220
75层次聚类算法225
76期望最大化聚类算法228
77神经网络聚类算法232
78模糊C均值聚类算法235
79高斯混合聚类算法238
第8章预测方法241
81预测方法概要241
82灰色预测241
83马尔科夫预测247
第9章离群点诊断251
91单变量的离群点诊断251
92基于回归的离群点诊断
254
93基于聚类的离群点诊断
259
94局部离群点因子检测263
第10章时间序列分析方法267
101季节指数预测法267
102解读自回归时间序列模型
272
103时间序列分解280
第11章综合案例286
111员工离职预测分析286
112北京二手房房价分析299
猜您喜欢