书籍详情

基于R的统计分析与数据挖掘

基于R的统计分析与数据挖掘

作者:薛薇 著

出版社:中国人民大学出版社

出版时间:2014-05-01

ISBN:9787300190747

定价:¥48.00

购买这本书可以去
内容简介
  本书聚焦当今备受国内外数据分析师和数据应用者关注的R语言,关注如何借助R实现统计分析和数据挖掘。它既不是仅侧重理论讲解的统计分析和数据挖掘教科书,也不是仅侧重R编程操作的使用手册,而是以数据分析贯穿全书的两者的有机结合。本书特色在于:以数据模拟的直观方式论述方法原理的同时,通过案例强化R的操作实践性;在以解决应用问题为目标讨论R操作的同时,通过原理论述强化模型结果的解读理解。本书定位于统计分析和数据挖掘的学习者、实践者和研究者,旨在使读者理解统计分析原理,熟练操控R软件,拓展数据应用,提升研究水平。
作者简介
  薛薇,工学硕士,经济学博士,中国人民大学应用统计科学研究中心副主任,中国人民大学统计学院副教授。关注数据挖掘及统计建模、统计和数据挖掘软件应用、统计数据库系统研发等方面。涉足网络新媒体舆论传播和互动建模、政府和官方微博分析、电商数据分析、学科学术热点跟踪等文本挖掘,以及社会网络分析和以数据挖掘为依托的客户关系管理等领域。主要著作:《SPSS统计分析方法及应用》、《SPSS Modeler数据挖掘方法及应用》、《基于R的统计分析和数据挖掘》、《基于信息技术的统计信息系统》等。
目录
第1章 关于R
1.1 为什么选择R
1.2 如何学习R
1.3 R入门必备
1.4 小 结
第2章 R的数据组织
2.1 R的数据对象
2.2 创建和访问R的数据对象
2.3 从文本文件读数据
2.4 外部数据的导入
2.5 R数据组织的其他问题
2.6 小 结
第3章 R的数据管理
3.1 数据合并
3.2 数据排序
3.3 缺失数据报告
3.4 变量计算
3.5 变量值的重编码
3.6 数据筛选
3.7 数据保存
3.8 数据管理中控制流程
3.9 小 结
第4章 R的基本数据分析:描述和相关
4.1 数值型单变量的描述
4.2 分类型单变量的描述
4.3 两数值型变量相关性的分析
4.4 两分类型变量相关性的分析
4.5 小 结
第5章 R的基本数据分析:可视化
5.1 绘图基础
5.2 数值型单变量分布的可视化
5.3 分类型变量分布和相关性的可视化
5.4 两数值型变量相关性的可视化
5.5 lattice绘图
5.6 小 结
第6章 R的两均值比较检验
6.1 两独立样本的均值检验
6.2 两配对样本的均值检验
6.3 样本均值检验的功效分析
6.4 两总体分布差异的非参数检验
6.5 两样本均值差的置换检验
6.6 两样本均值差的自举法检验
6.7 小 结
第7章 R的方差分析
7.1 单因素方差分析
7.2 单因素协方差分析
7.3 多因素方差分析
7.4 小 结
第8章 R的回归分析:一般线性模型
8.1 回归分析概述
8.2 建立线性回归模型
8.3 线性回归方程的检验
8.4 回归诊断:误差项是否满足高斯马尔科夫假定
8.5 回归诊断:诊断数据中的异常观测点
8.6 回归诊断:多重共线性的诊断
8.7 回归建模策略
8.8 回归模型验证
8.9 带虚拟变量的线性回归分析
8.10 小 结
第9章 R的回归分析:广义线性模型
9.1 广义线性模型概述
9.2 logistic回归分析:连接函数和参数估计
9.3 logistic回归分析:解读模型和模型检验
9.4 logistic回归分析:R函数和示例
9.5 logistic回归分析:回归诊断
9.6 泊松回归分析
9.7 广义线性模型的交叉验证
9.8 小 结
第10章 R的聚类分析
10.1 聚类分析概述
10.2 K-Means聚类
10.3 层次聚类
10.4 两步聚类
10.5 小 结
第11章 R的因子分析:变量降维
11.1 因子分析概述
11.2 构造因子变量:基于主成分分析法
11.3 构造因子变量:基于主轴因子法
11.4 因子变量的命名
11.5 计算因子得分
11.6 小 结
第12章 R的线性判别分析:分类模型
12.1 距离判别
12.2 Fisher判别
12.3 小 结
第13章 R的决策树:预测模型
13.1 决策树算法概述
13.2 分类回归树的生长过程
13.3 分类回归树的剪枝
13.4 建立分类回归树的R函数和示例
13.5 建立分类回归树的组合预测模型
13.6 随机森林
13.7 小 结
第14章 R的人工神经网络:预测和聚类
14.1 人工神经网络概述
14.2 B-P反向传播网络
14.3 B-P反向传播网络的R函数和示例
14.4 SOM自组织映射网络
14.5 小 结
猜您喜欢

读书导航