R语言程序设计
作者:周围,崔濒月
出版社:清华大学出版社
出版时间:2023-03-01
ISBN:9787302626503
定价:¥59.00
基础篇
第1章R语言概述3
1.1认识R语言3
1.1.1R语言是什么3
1.1.2R语言与数据科学3
1.1.3R语言与计算思维4
1.2第一个R语言会话4
1.2.1开发环境配置4
1.2.2程序编写运行6
1.3R语言包9
1.3.1包的含义9
1.3.2包的安装和使用9
1.4R语言数据集9
1.5综合实验10
1.5.1实验1: R语言软件安装10
1.5.2实验2: RStudio安装15
1.5.3实验3: 编写“Hello World!”程序19
1.5.4实验4: 工作空间的管理和使用20
1.5.5实验5: 使用rmarkdown包22
思考与练习25
第2章数据对象27
2.1数据类型27
2.1.1数据类型分类27
2.1.2数据类型的转换27
2.1.3数据类型的查看28
2.2数据结构292.3向量30
2.3.1创建向量30
2.3.2向量的运算31
2.3.3向量的索引32
2.3.4向量的排序34
2.4矩阵34
2.4.1创建矩阵34
2.4.2矩阵的合并35
2.4.3矩阵的运算36
2.4.4矩阵的索引37
2.5数组38
2.6数据框39
2.6.1创建数据框40
2.6.2数据框的索引40
2.7列表41
2.7.1创建列表41
2.7.2列表的索引41
2.8因子42
2.8.1创建因子42
2.8.2创建有规律的因子44
2.9综合实验44
2.9.1实验1: 熟悉向量的计算44
2.9.2实验2: 灵活使用矩阵45
2.9.3实验3: 综合运用数据框50
2.9.4实验4: 熟悉因子52
思考与练习53
〖3〗R语言程序设计目录〖3〗第3章数据管理55
3.1控制结构55
3.1.1分支结构55
3.1.2循环结构56
3.1.3控制语句58
3.2函数59
3.2.1数学运算函数59
3.2.2字符处理函数62
3.2.3日期处理函数64
3.2.4自定义函数66
3.2.5函数的嵌套68
3.3apply函数族68
3.3.1函数族68
3.3.2apply()函数69
3.3.3tapply()函数70
3.3.4lapply()函数71
3.3.5sapply()函数71
3.4数据输入与输出71
3.4.1数据输入71
3.4.2数据输出72
3.5综合实验73
3.5.1实验1: 编写自定义函数73
3.5.2实验2: 百分制成绩换算75
3.5.3实验3: 两种方法实现数据处理76
3.5.4实验4: 实现爬虫功能77
思考与练习78
第4章数据可视化79
4.1绘图基础79
4.1.1高级绘图函数79
4.1.2低级绘图函数83
4.1.3绘制图形89
4.2绘图进阶93
4.2.1ggplot2绘图包93
4.2.2使用qplot()函数绘图94
4.2.3使用ggplot()函数绘图94
4.3绘制更丰富的图形96
4.4综合实验98
4.4.1实验1: 绘制鸢尾花数据图形98
4.4.2实验2: 绘制汽车数据图形100
4.4.3实验3: 绘制交互式图形106
思考与练习110
进阶篇
第5章数据探索113
5.1数据描述113
5.1.1数据的类别113
5.1.2数据的集中趋势114
5.1.3数据的离散程度114
5.1.4数据的分布特征115
5.1.5数据的相似性117
5.2数据清洗118
5.2.1处理缺失数据118
5.2.2处理异常数据119
5.2.3处理重复数据121
5.3数据集成121
5.3.1数据集的合并121
5.3.2数据子集的获取122
5.3.3数据的分组汇总123
5.3.4数据的频数计算124
5.3.5使用SQL语句125
5.4数据规范125
5.5数据重构126
5.6综合实验128
5.6.1实验1: 对mtcars数据集的初步探索128
5.6.2实验2: 处理数据集中的缺失值130
5.6.3实验3: 对mtcars数据集的标准化132
5.6.4实验4: 数据重构133
思考与练习135
第6章数据分析137
6.1随机数模拟137
6.1.1生成随机数137
6.1.2特定分布的随机数137
6.1.3随机抽样138
6.2假设检验139
6.2.1假设检验的方法139
6.2.2均值检验139
6.2.3相关性检验141
6.3方差分析142
6.4线性回归143
6.4.1变量间关系144
6.4.2一元线性回归144
6.4.3多项式回归146
6.4.4多元线性回归147
6.5广义线性模型149
6.5.1广义线性模型概况149
6.5.2Logistic回归150
6.5.3泊松回归153
6.6综合实验154
6.6.1实验1: 假设检验的应用154
6.6.2实验2: 方差分析155
6.6.3实验3: 一元线性回归分析160
6.6.4实验4: 多项式回归分析162
6.6.5实验5: 泊松回归分析164
6.6.6实验6: Logistics回归分析166
思考与练习172
第7章数据挖掘174
7.1相关概念174
7.1.1数据分析与数据挖掘174
7.1.2数据挖掘与机器学习175
7.1.3数据驱动为核心的机器学习175
7.1.4模型评估176
7.2分类与回归178
7.2.1决策树178
7.2.2随机森林178
7.2.3KNN178
7.2.4朴素贝叶斯179
7.2.5支持向量机179
7.2.6人工神经网络180
7.3聚类分析180
7.3.1K均值聚类180
7.3.2主成分分析181
7.4可视化挖掘工具181
7.5综合实验181
7.5.1实验1: 决策树181
7.5.2实验2: 随机森林183
7.5.3实验3: KNN186
7.5.4实验4: 朴素贝叶斯187
7.5.5实验5: 支持向量机189
7.5.6实验6: 人工神经网络192
7.5.7实验7: KMeans聚类194
7.5.8实验8: 主成分分析196
思考与练习199
拓展篇
第8章高级特性203
8.1面向对象的编程203
8.1.1面向对象的含义203
8.1.2R语言与面向对象编程204
8.1.3S3类206
8.1.4S4类207
8.2程序调试209
8.2.1程序调试介绍209
8.2.2R语言如何调试209
8.3性能提升210
8.3.1向量化210
8.3.2语句优化212
8.4并行计算212
8.5综合实验213
思考与练习217
第9章应用拓展219
9.1R语言与数学219
9.1.1微积分219
9.1.2线性代数219
9.1.3概率论与数理统计220
9.1.4多元统计分析220
9.1.5数值计算220
9.2R语言的应用拓展220
9.2.1关联规则220
9.2.2智能推荐221
9.2.3时间序列221
9.2.4深度学习222
思考与练习222
附录A本书使用的函数223
参考文献229