书籍详情
R语言数据分析与可视化从入门到精通
作者:程乾,刘永,高博 著
出版社:北京大学出版社
出版时间:2020-09-01
ISBN:9787301314807
定价:¥119.00
购买这本书可以去
内容简介
R语言是一个自由、免费、源代码开放的编程语言和环境,它提供了强大的数据分析功能和丰富的数据可视化手段。随着数据科学的快速发展,R语言已经成为数据分析领域炙手可热的通用语言。全书分为3篇共12章,具体内容如下。 第1篇:入门篇(第1章~第3章)。本篇将带领读者逐步走进R语言的世界,帮助读者对R语言形成初步的认识,并学会如何获取和安装R语言,以及如何在需要时获取帮助。然后介绍R语言的一些基础知识,这些知识是灵活应用R语言的必要前提。最后重点介绍R语言函数的使用方法,同时也会涉及一些其他相关内容,如流程控制和R语言环境等。 第2篇:进阶篇(第4章~第11章)。本篇介绍R语言数据管理、数据分析和数据可视化的三大威力,包括通过数据获取、导出、整合和清理等操作将零散的数据整合为可以分析处理的数据集的多种方法;并介绍一些常用基础统计和高级统计的实现方法,以及R语言的图形生成、图形修饰、外部绘图插件和图形展示等功能。 第3篇:实战篇(第12章)。本篇通过一个实战案例,综合讲解R语言在数据处理与可视化分析方面的实战技能。
作者简介
程乾,长期从事教育测量和教育大数据分析,擅长教育测量技术、数据可视化、数据挖掘算法和数据库管理,并致力于R的推广和普及。刘永,R语言极客,数据分析专家,曾任职于科大讯飞(深圳),新光在线(深圳),擅长数据管理、数据可视化、潜在分类分析、结构方程建模和统计计算,对R语言有深入研究。高博,高级工程师,主要研究方向为云计算与大数据、数据可视化等,熟悉R语言、.Net、PHP、Python、DevOps、MySQL、SQLServer等技术和工具。参与编写了《代码的力量——Discuz!源码分析与插件开发实例进阶》《PHP+MySQL+AJAX Web开发给力起飞》《Java Web应用开发给力起飞》等图书。主持省部级纵向课题3项,参与纵向、横向课题16项,获得软件著作权12项。
目录
第1篇 入门篇第1章 R语言快速入门 /3
1.1 R语言及其历史 /4
1.1.1 R语言的源起 /4
1.1.2 R语言的版本更新 /4
1.2 R语言的优势和劣势 /5
1.2.1 R语言的优势 /5
1.2.2 R语言的劣势 /6
1.3 R语言的软件获取及安装 /6
1.3.1 获取R语言软件 /6
1.3.2 在Windows平台上安装 /7
1.3.3 在Linux平台上安装 /10
1.3.4 在Mac OS平台上安装 /11
1.4 R语言的辅助工具 /13
1.4.1 R GUI /13
1.4.2 RStudio /16
1.4.3 获取帮助 /19
1.5 新手问答 /21
1.6 小试牛刀:练习设置RStudio全局选项 /21
本章小结 /23
第2章 R语言的编程基础(上) /24
2.1 对象与变量 /25
2.1.1 对象 /25
2.1.2 变量 /26
2.1.3 变量的列举和删除 /28
2.2 数据类型 /30
2.2.1 常用数据类型 /31
2.2.2 特殊值 /31
2.3 数据结构 /32
2.3.1 向量 /32
2.3.2 矩阵和数组 /38
2.3.3 因子 /43
2.3.4 列表 /46
2.3.5 数据框 /50
2.3.6 原子向量和递归向量 /53
2.4 数学运算 /58
2.4.1 基础运算 /58
2.4.2 向量运算 /61
2.4.3 矩阵运算 /64
2.5 新手问答 /65
2.6 小试牛刀:提取数据框子集,并对部分列做统计计算 /66
本章小结 /67
第3章 R语言的编程基础(下) /68
3.1 流程控制 /69
3.1.1 repeat循环 /69
3.1.2 while循环 /70
3.1.3 for循环 /70
3.1.4 if…else语句 /72
3.1.5 switch语句 /73
3.2 编写R函数 /74
3.2.1 函数格式 /74
3.2.2 函数参数 /75
3.2.3 返回值 /77
3.2.4 函数调用 /77
3.3 R语言常用函数 /78
3.3.1 文件操作函数 /78
3.3.2 基础计算函数 /81
3.3.3 概率分布函数 /86
3.3.4 字符处理函数 /90
3.4 R包 /94
3.4.1 R包的管理 /94
3.4.2 R包的加载 /97
3.4.3 自定义R包 /98
3.5 环境空间 /103
3.5.1 环境空间的种类 /103
3.5.2 环境空间的使用方法 /104
3.5.3 环境空间的特征 /106
3.6 新手问答 /108
3.7 小试牛刀:编写函数并实现调用 /109
本章小结 /110
第2篇 进阶篇第
4章 R语言的数据获取与导出 /113
4.1 数据获取 /114
4.1.1 导入R语言系统格式数据 /114
4.1.2 导入带有分隔符的文本数据 /114
4.1.3 导入Excel数据 /115
4.1.4 读取数据库数据 /119
4.1.5 读取其他统计工具的数据 /128
4.1.6 从互联网抓取数据 /136
4.2 数据导出 /151
4.2.1 写入R语言系统格式的数据 /151
4.2.2 写入文本文件 /152
4.2.3 写入Excel文件 /152
4.2.4 写入数据库 /153
4.3 新手问答 /155
4.4 小试牛刀:比较R语言读/写文件的效率 /156
本章小结 /158
第5章 R语言的数据管理威力之数据操作 /159
5.1 R语言内置数据操作函数 /160
5.1.1 查看和编辑数据 /160
5.1.2 筛选 /163
5.1.3 合并 /165
5.1.4 分组和汇总 /168
5.1.5 排序 /170
5.1.6 转换 /173
5.2 数据重塑 /175
5.3 apply函数族 /178
5.3.1 apply()函数 /178
5.3.2 lapply()函数 /181
5.3.3 sapply()函数 /183
5.3.4 vapply()函数 /183
5.3.5 mapply()函数 /184
5.4 plyr扩展包 /184
5.5 用sqldf()函数实现数据框的SQL风格查询 /189
5.6 dplyr扩展包 /191
5.7 新手问答 /199
5.8 牛刀小试:对矩阵各列使用不同的
函数 /200
本章小结 /202
第6章 语言的数据分析威力之基本统计 /203
6.1 描述性统计 /204
6.1.1 描述性统计量 /204
6.1.2 列联表 /206
6.1.3 同时呈现多个统计量 /210
6.2 计数数据的检验 /215
6.2.1 卡方检验的基本原理 /215
6.2.2 在R语言中实现卡方检验 /216
6.3 相关分析 /220
6.3.1 相关的类型 /220
6.3.2 各种相关系数计算在R语言中的实现 /221
6.4 t检验 /224
6.4.1 独立样本t检验 /225
6.4.2 非独立样本t检验 /227
6.4.3 对t检验的前提假设进行检验 /228
6.5 方差分析 /230
6.5.1 方差分析的基本术语 /230
6.5.2 aov()函数 /231
6.5.3 单因素非重复测量方差分析 /232
6.5.4 单因素协方差分析 /235
6.5.5 单因素重复测量方差分析 /238
6.5.6 两因素方差分析 /240
6.5.7 对方差分析前提假设的检验 /242
6.6 非参数检验 /242
6.6.1 两总体比较 /243
6.6.2 多于两总体比较 /244
6.7 回归分析 /244
6.7.1 lm()函数 /245
6.7.2 模型拟合 /245
6.7.3 模型诊断 /249
6.7.4 模型改进 /251
6.8 新手问答 /257
6.9 小试牛刀:独立样本均值差异检验 /257
本章小结 /259
第7章 R语言的数据分析威力之高级方法 /262
7.1 判别分析 /263
7.1.1 判别分析的原理 /263
7.1.2 判别分析在R语言中的实现 /264
7.2 聚类分析 /273
7.2.1 聚类分析的原理 /274
7.2.2 聚类分析在R语言中的实现 /279
7.3 主成分分析 /289
7.3.1 主成分分析的原理 /289
7.3.2 主成分分析在R语言中的实现 /290
7.4 因子分析 /292
7.4.1 因子分析的原理 /293
7.4.2 因子分析在R语言中的实现 /295
7.5 新手问答 /302
7.6 小试牛刀:尝试实现层次聚类 /302
本章小结 /303
第8章 R语言的可视化威力之图形生成 /304
8.1 R语言绘图系统 /305
8.2 单变量绘图和双变量绘图 /305
8.2.1 散点图 /305
8.2.2 折线图 /309
8.2.3 条形图 /312
8.2.4 饼图 /314
8.2.5 箱线图 /315
8.2.6 直方图和核密度图 /317
8.3 多变量绘图 /319
8.3.1 气泡图 /319
8.3.2 热图 /321
8.3.3 马赛克图 /322
8.3.4 相关矩阵图 /325
8.3.5 三维散点图 /327
8.4 新手问答 /328
8.5 小试牛刀:将两个数据源绘制在同一个坐标系中 /329
本章小结 /330
第9章 R语言的可视化威力之图形优化 /331
9.1 添加图形元素 /332
9.1.1 坐标轴 /332
9.1.2 图例 /337
9.1.3 文本注解 /341
9.1.4 标题 /343
9.1.5 参考线 /344
9.1.6 线段和带箭头的线段 /346
9.1.7 矩形阴影 /347
9.2 控制图形外观 /348
9.2.1 整体外观 /348
9.2.2 局部外观 /351
9.2.3 文本 /352
9.2.4 线条 /353
9.2.5 矩形 /354
9.2.6 点的形状 /355
9.3 图形配色与布局 /356
9.3.1 颜色与调色板 /356
9.3.2 面板和分面 /362
9.3.3 图形组合 /365
9.4 新手问答 /368
9.5 小试牛刀:使用网格系统组合图形 /369
本章小结 /370
第10章 R语言的可视化威力之外部插件 /371
10.1 ggvis插件包 /372
10.1.1 ggivs与ggplot2的对比 /372
10.1.2 绘图语法 /374
10.1.3 图层 /377
10.1.4 图形修饰 /384
10.2 plotly插件包 /391
10.2.1 plotly插件包对ggplot2包绘图对象的扩展 /392
10.2.2 绘图语法 /393
10.2.3 绘图示例 /403
10.2.4 图形修饰 /416
10.3 新手问答 /422
10.4 小试牛刀:使用plotly插件包绘制组合图 /423
本章小结 /425
第11章 R语言的可视化威力之图形展示 /426
11.1 传统图形输出 /427
11.1.1 输出为位图文件 /427
11.1.2 输出为PDF文件 /428
11.1.3 输出为矢量图 /429
11.2 网页输出 /429
11.2.1 使用R Markdown输出为网页 /430
11.2.2 使用shiny输出为网页 /437
11.3 新手问答 /443
11.4 小试牛刀:将绘图输出为HTML文档 /444
本章小结 /446
第3篇 实战篇
第12章 R语言对产品性价比的数据分析与可视化 /449
12.1 数据采集 /450
12.1.1 分析页面结构 /450
12.1.2 编写爬虫程序 /454
12.1.3 抓取数据并保存 /463
12.2 数据清理 /463
12.2.1 变量(字符)拆分与抽取 /464
12.2.2 检测数据缺失与重复值 /466
12.2.3 变量类型转化与重命名 /468
12.3 数据分析与数据可视化 /470
12.3.1 探索性数据分析 /470
12.3.2 图书价格和评论指标的聚类分析 /484
12.3.3 图书性价比分析 /487
本章小结 /496
参考文献 /497
1.1 R语言及其历史 /4
1.1.1 R语言的源起 /4
1.1.2 R语言的版本更新 /4
1.2 R语言的优势和劣势 /5
1.2.1 R语言的优势 /5
1.2.2 R语言的劣势 /6
1.3 R语言的软件获取及安装 /6
1.3.1 获取R语言软件 /6
1.3.2 在Windows平台上安装 /7
1.3.3 在Linux平台上安装 /10
1.3.4 在Mac OS平台上安装 /11
1.4 R语言的辅助工具 /13
1.4.1 R GUI /13
1.4.2 RStudio /16
1.4.3 获取帮助 /19
1.5 新手问答 /21
1.6 小试牛刀:练习设置RStudio全局选项 /21
本章小结 /23
第2章 R语言的编程基础(上) /24
2.1 对象与变量 /25
2.1.1 对象 /25
2.1.2 变量 /26
2.1.3 变量的列举和删除 /28
2.2 数据类型 /30
2.2.1 常用数据类型 /31
2.2.2 特殊值 /31
2.3 数据结构 /32
2.3.1 向量 /32
2.3.2 矩阵和数组 /38
2.3.3 因子 /43
2.3.4 列表 /46
2.3.5 数据框 /50
2.3.6 原子向量和递归向量 /53
2.4 数学运算 /58
2.4.1 基础运算 /58
2.4.2 向量运算 /61
2.4.3 矩阵运算 /64
2.5 新手问答 /65
2.6 小试牛刀:提取数据框子集,并对部分列做统计计算 /66
本章小结 /67
第3章 R语言的编程基础(下) /68
3.1 流程控制 /69
3.1.1 repeat循环 /69
3.1.2 while循环 /70
3.1.3 for循环 /70
3.1.4 if…else语句 /72
3.1.5 switch语句 /73
3.2 编写R函数 /74
3.2.1 函数格式 /74
3.2.2 函数参数 /75
3.2.3 返回值 /77
3.2.4 函数调用 /77
3.3 R语言常用函数 /78
3.3.1 文件操作函数 /78
3.3.2 基础计算函数 /81
3.3.3 概率分布函数 /86
3.3.4 字符处理函数 /90
3.4 R包 /94
3.4.1 R包的管理 /94
3.4.2 R包的加载 /97
3.4.3 自定义R包 /98
3.5 环境空间 /103
3.5.1 环境空间的种类 /103
3.5.2 环境空间的使用方法 /104
3.5.3 环境空间的特征 /106
3.6 新手问答 /108
3.7 小试牛刀:编写函数并实现调用 /109
本章小结 /110
第2篇 进阶篇第
4章 R语言的数据获取与导出 /113
4.1 数据获取 /114
4.1.1 导入R语言系统格式数据 /114
4.1.2 导入带有分隔符的文本数据 /114
4.1.3 导入Excel数据 /115
4.1.4 读取数据库数据 /119
4.1.5 读取其他统计工具的数据 /128
4.1.6 从互联网抓取数据 /136
4.2 数据导出 /151
4.2.1 写入R语言系统格式的数据 /151
4.2.2 写入文本文件 /152
4.2.3 写入Excel文件 /152
4.2.4 写入数据库 /153
4.3 新手问答 /155
4.4 小试牛刀:比较R语言读/写文件的效率 /156
本章小结 /158
第5章 R语言的数据管理威力之数据操作 /159
5.1 R语言内置数据操作函数 /160
5.1.1 查看和编辑数据 /160
5.1.2 筛选 /163
5.1.3 合并 /165
5.1.4 分组和汇总 /168
5.1.5 排序 /170
5.1.6 转换 /173
5.2 数据重塑 /175
5.3 apply函数族 /178
5.3.1 apply()函数 /178
5.3.2 lapply()函数 /181
5.3.3 sapply()函数 /183
5.3.4 vapply()函数 /183
5.3.5 mapply()函数 /184
5.4 plyr扩展包 /184
5.5 用sqldf()函数实现数据框的SQL风格查询 /189
5.6 dplyr扩展包 /191
5.7 新手问答 /199
5.8 牛刀小试:对矩阵各列使用不同的
函数 /200
本章小结 /202
第6章 语言的数据分析威力之基本统计 /203
6.1 描述性统计 /204
6.1.1 描述性统计量 /204
6.1.2 列联表 /206
6.1.3 同时呈现多个统计量 /210
6.2 计数数据的检验 /215
6.2.1 卡方检验的基本原理 /215
6.2.2 在R语言中实现卡方检验 /216
6.3 相关分析 /220
6.3.1 相关的类型 /220
6.3.2 各种相关系数计算在R语言中的实现 /221
6.4 t检验 /224
6.4.1 独立样本t检验 /225
6.4.2 非独立样本t检验 /227
6.4.3 对t检验的前提假设进行检验 /228
6.5 方差分析 /230
6.5.1 方差分析的基本术语 /230
6.5.2 aov()函数 /231
6.5.3 单因素非重复测量方差分析 /232
6.5.4 单因素协方差分析 /235
6.5.5 单因素重复测量方差分析 /238
6.5.6 两因素方差分析 /240
6.5.7 对方差分析前提假设的检验 /242
6.6 非参数检验 /242
6.6.1 两总体比较 /243
6.6.2 多于两总体比较 /244
6.7 回归分析 /244
6.7.1 lm()函数 /245
6.7.2 模型拟合 /245
6.7.3 模型诊断 /249
6.7.4 模型改进 /251
6.8 新手问答 /257
6.9 小试牛刀:独立样本均值差异检验 /257
本章小结 /259
第7章 R语言的数据分析威力之高级方法 /262
7.1 判别分析 /263
7.1.1 判别分析的原理 /263
7.1.2 判别分析在R语言中的实现 /264
7.2 聚类分析 /273
7.2.1 聚类分析的原理 /274
7.2.2 聚类分析在R语言中的实现 /279
7.3 主成分分析 /289
7.3.1 主成分分析的原理 /289
7.3.2 主成分分析在R语言中的实现 /290
7.4 因子分析 /292
7.4.1 因子分析的原理 /293
7.4.2 因子分析在R语言中的实现 /295
7.5 新手问答 /302
7.6 小试牛刀:尝试实现层次聚类 /302
本章小结 /303
第8章 R语言的可视化威力之图形生成 /304
8.1 R语言绘图系统 /305
8.2 单变量绘图和双变量绘图 /305
8.2.1 散点图 /305
8.2.2 折线图 /309
8.2.3 条形图 /312
8.2.4 饼图 /314
8.2.5 箱线图 /315
8.2.6 直方图和核密度图 /317
8.3 多变量绘图 /319
8.3.1 气泡图 /319
8.3.2 热图 /321
8.3.3 马赛克图 /322
8.3.4 相关矩阵图 /325
8.3.5 三维散点图 /327
8.4 新手问答 /328
8.5 小试牛刀:将两个数据源绘制在同一个坐标系中 /329
本章小结 /330
第9章 R语言的可视化威力之图形优化 /331
9.1 添加图形元素 /332
9.1.1 坐标轴 /332
9.1.2 图例 /337
9.1.3 文本注解 /341
9.1.4 标题 /343
9.1.5 参考线 /344
9.1.6 线段和带箭头的线段 /346
9.1.7 矩形阴影 /347
9.2 控制图形外观 /348
9.2.1 整体外观 /348
9.2.2 局部外观 /351
9.2.3 文本 /352
9.2.4 线条 /353
9.2.5 矩形 /354
9.2.6 点的形状 /355
9.3 图形配色与布局 /356
9.3.1 颜色与调色板 /356
9.3.2 面板和分面 /362
9.3.3 图形组合 /365
9.4 新手问答 /368
9.5 小试牛刀:使用网格系统组合图形 /369
本章小结 /370
第10章 R语言的可视化威力之外部插件 /371
10.1 ggvis插件包 /372
10.1.1 ggivs与ggplot2的对比 /372
10.1.2 绘图语法 /374
10.1.3 图层 /377
10.1.4 图形修饰 /384
10.2 plotly插件包 /391
10.2.1 plotly插件包对ggplot2包绘图对象的扩展 /392
10.2.2 绘图语法 /393
10.2.3 绘图示例 /403
10.2.4 图形修饰 /416
10.3 新手问答 /422
10.4 小试牛刀:使用plotly插件包绘制组合图 /423
本章小结 /425
第11章 R语言的可视化威力之图形展示 /426
11.1 传统图形输出 /427
11.1.1 输出为位图文件 /427
11.1.2 输出为PDF文件 /428
11.1.3 输出为矢量图 /429
11.2 网页输出 /429
11.2.1 使用R Markdown输出为网页 /430
11.2.2 使用shiny输出为网页 /437
11.3 新手问答 /443
11.4 小试牛刀:将绘图输出为HTML文档 /444
本章小结 /446
第3篇 实战篇
第12章 R语言对产品性价比的数据分析与可视化 /449
12.1 数据采集 /450
12.1.1 分析页面结构 /450
12.1.2 编写爬虫程序 /454
12.1.3 抓取数据并保存 /463
12.2 数据清理 /463
12.2.1 变量(字符)拆分与抽取 /464
12.2.2 检测数据缺失与重复值 /466
12.2.3 变量类型转化与重命名 /468
12.3 数据分析与数据可视化 /470
12.3.1 探索性数据分析 /470
12.3.2 图书价格和评论指标的聚类分析 /484
12.3.3 图书性价比分析 /487
本章小结 /496
参考文献 /497
猜您喜欢