书籍详情
R 4编程入门与数据科学实战:数据科学与大数据技术
作者:[美]马塔·威利(Matt Wiley),[澳]乔舒亚·威利(Joshua F. Wiley)著,孙云华 郭涛 译
出版社:清华大学出版社
出版时间:2023-06-01
ISBN:9787302629382
定价:¥99.80
购买这本书可以去
内容简介
学习如何使用R 4,编写和保存R脚本,读入和写出数据文件,使用内置函数,并了解常用的统计方法。这本深入浅出的教程介绍了R 4的主要功能,包括图表的新调色板、可用于大数据的增强的参考计数系统,以及文本的新数据导入设置和对基于文本的分类数据进行建模的统计方法。书中每一章都以知识点清单开始,后是对该章介绍的R函数的总结,以及用于测试新知识的练习。本书开篇介绍了R和CRAN软件包在Windows和macOS上的实践安装,大部分内容是对统计方法的介绍(非验证性的、应用性的统计),主要依靠R和R可视化来理解、激励和进行统计测试和建模。本书展示了R在具体案例中的使用,如方差分析、多元回归和调节回归、数据可视化、假设检验等,并采取了一种基于实例的实践方法,将实践与对所做统计的清晰解释结合起来。主要内容 ◆ 获取并安装R和RStudio ◆ 从多种文件格式导入和导出数据 ◆ 分析数据并生成图形(包括置信区间) ◆ 互动式地进行假设检验◆ 对多元回归和调节回归解决方案进行编码
作者简介
Matt Wiley领导维多利亚大学的机构有效性、研究和评估部门,同时负责促进战略和单位规划、数据知情决策、州/地区/联邦问责制度的发展。作为一名终身数学副教授,他曾在数学教育(加利福尼亚州)和学生参与(得克萨斯州)活动中获奖。此外,Matt拥有加利福尼亚大学和得克萨斯A&M系统的计算机科学、商业和纯数学学位。除了学术成就,他还参与合著了三本关于流行的R编程语言的图书,并担任一家统计咨询公司的管理合伙人近10年。他还拥有使用R、SQL、C、Ruby、FORTRAN、JavaScript语言的编程经验。作为一名程序员、出版作家、数学家和变革型领导者,Matt总是将写作的热情同解决逻辑和数据科学问题的乐趣融为一体。无论是在会议室,还是在教室,他都喜欢采用动态的方式与跨学科和多元化的团队进行合作,使复杂的想法和项目变得易于解决。 F. Wiley是莫纳什大学脑与健康特纳研究所以及心理科学学院的讲师。他在加利福尼亚州大学洛杉矶分校获得博士学位,并完成了初级保健和预防方面的博士后培训。他的研究采用先进的定量方法来解释心理社会因素、睡眠和其他与心理和身体健康有关的健康行为之间的动态关系。他独立开发或与他人共同开发了许多R 语言程序包,包括用于运行贝叶斯尺度-位置结构方程模型的varian程序包;将R语言链接到商业Mplus软件的MplusAutomation程序包;用于更快逻辑运算的额外运算符;用于诊断、效应大小和轻松显示多级/混合效应模型结果的多级工具;辅助JWileymisc进行数据探索或者加速分析的函数。
目录
第1章 R语言的安装 1
1.1 技术栈 2
1.2 操作系统升级 2
1.2.1 Windows 2
1.2.2 macOS 2
1.3 从CRAN下载并安装R语言 3
1.3.1 Windows 3
1.3.2 macOS 3
1.4 下载并安装RStudio软件 4
1.4.1 Windows 4
1.4.2 macOS 5
1.5 RStudio的使用方法 5
1.6 R语言脚本的编写 9
1.7 总结 13
1.8 练习与融会贯通 13
1.8.1 理论核查 13
1.8.2 练习题 14
第2章 程序包的安装与使用 15
2.1 程序包的安装 16
2.2.1 haven程序包 17
2.2.2 readxl程序包 17
2.2.3 writexl程序包 18
2.2.4 data.table程序包 18
2.2.5 extraoperators程序包 19
2.2.6 JWileymisc程序包 19
2.2.7 ggplot2程序包 19
2.2.8 visreg程序包 20
2.2.9 emmeans程序包 20
2.2.10 ez程序包 21
2.2.11 palmerpenguins程序包 21
2.2 程序包的使用说明 21
2.3 总结 22
2.4 练习与融会贯通 22
2.4.1 理论核查 23
2.4.2 练习题 23
第3章 数据的输入与输出 25
3.1 设置R语言 25
3.2 输入 26
3.2.1 手动输入 26
3.2.2 CSV格式文件:.csv 27
3.2.3 Excel格式文件:.xlsx或.xls 29
3.2.4 RDS格式文件:.rds 30
3.2.5 其他专有格式 31
3.3 输出 33
3.3.1 CSV格式文件 33
3.3.2 Excel 格式文件 33
3.3.3 RDS格式文件 34
3.4 总结 34
3.5 练习与融会贯通 34
3.5.1 理论核查 35
3.5.2 练习题 35
第4章 数据的处理 37
4.1 设置R语言 37
4.2 数据样式 39
4.3 data.table的工作方式 41
4.3.1 行操作的工作方式 41
4.3.2 列操作的工作方式 51
4.3.3 组操作的工作方式 57
4.4 示例 58
4.4.1 示例一:市区计数 58
4.4.2 示例二:都市统计区 59
4.4.3 示例三 60
4.5 总结 60
4.6 练习与融会贯通 62
4.6.1 理论核查 62
4.6.2 练习题 62
第5章 数据与样本 63
5.1 设置R语言 63
5.2 总体与样本 64
5.3 变量与数据 65
5.3.1 示例一 66
5.3.2 示例二 68
5.3.3 示例三 69
5.3.4 关于变量与数据的思考 69
5.4 统计思维 70
5.5 研究评估 70
5.6 样本评估 71
5.6.1 便利抽样 72
5.6.2 K抽样 74
5.6.3 分群抽样 77
5.6.4 分层抽样 80
5.6.5 随机抽样 84
5.6.6 样本知识回顾 86
5.7 频数表 87
5.7.1 示例一 87
5.7.2 示例二 89
5.7.3 示例三 90
5.8 总结 93
5.9 练习与融会贯通 95
5.9.1 理论核查 95
5.9.2 练习题 95
第6章 描述性统计 97
6.1 设置R语言 97
6.2 可视化 98
6.2.1 柱状图 98
6.2.2 点图/图表 103
6.2.3 ggplot2绘图包 105
6.3 集中趋势 112
6.3.1 算术平均值 112
6.3.2 中位数 116
6.4 数据的分布 119
6.4.1 示例一 120
6.4.2 示例二 123
6.4.3 示例三 125
6.5 数据湍流(方差) 126
6.5.1 示例一 129
6.5.2 示例二 131
6.6 总结 132
6.7 练习与融会贯通 133
6.7.1 理论核查 134
6.7.2 练习题 134
第7章 概率与分布 137
7.1 设置R语言 137
7.2 概率 138
7.2.1 示例一:独立性 140
7.2.2 示例二:补集 141
7.2.3 概率思维总结 142
7.3 正态分布 143
7.3.1 示例一 145
7.3.2 示例二 147
7.3.3 示例三 148
7.3.4 示例四 150
7.4 概率分布 154
7.4.1 示例一 156
7.4.2 示例二 158
7.5 中心极限定理 159
7.5.1 示例一 161
7.5.2 示例二 165
7.5.3 示例三 169
7.6 总结 172
7.7 练习与融会贯通 173
7.7.1 理论核查 173
7.7.2 练习题 174
第8章 相关与回归 175
8.1 设置R语言 175
8.2 相关性 177
8.2.1 参数化 179
8.2.2 非参数化:斯皮尔曼 181
8.2.3 非参数化:肯德尔 183
8.2.4 相关性选择 185
8.3 简单的线性回归关系 185
8.3.1 介绍 185
8.3.2 假设 189
8.3.3 方差R2的定义 193
8.3.4 R语言中的线性回归 193
8.4 总结 202
8.5 练习与融会贯通 203
8.5.1 理论核查 203
8.5.2 练习题 204
第9章 置信区间 205
9.1 设置R语言 206
9.2 可视化置信区间 207
9.2.1 示例一:Sigma已知 210
9.2.2 示例二:Sigma未知 216
9.2.3 示例三 218
9.2.4 示例四 219
9.3 相似与不同数据的比较与理解 221
9.3.1 示例一 221
9.3.2 示例二 223
9.4 总结 224
9.5 练习与融会贯通 224
9.5.1 理论核查 225
9.5.2 练习题 225
第10章 假设检验 227
10.1 设置R语言 227
10.2 H0与H1的对比 228
10.2.1 示例一 229
10.2.2 示例二 229
10.3 类错误与第二类错误 230
10.3.1 示例一 231
10.3.2 示例二 232
10.3.3 示例三 232
10.4 Alpha与Beta的概念 232
10.5 假设 235
10.6 零假设显著性检验 236
10.6.1 示例一 237
10.6.2 示例二 239
10.6.3 示例三 241
10.7 总结 243
10.8 练习与融会贯通 244
10.8.1 理论核查 244
10.8.2 练习题 244
第11章 多元回归 245
11.1 设置R语言 245
11.2 线性回归的Redux架构 247
11.3 多元回归 254
11.3.1 多元预测模型的意义 254
11.3.2 R语言中的多元回归 256
11.3.3 效应的范围与格式 263
11.3.4 假设与清除 274
11.4 分类预测 279
11.4.1 示例一 282
11.4.2 示例二 285
11.5 总结 288
11.6 练习与融会贯通 289
11.6.1 理论核查 289
11.6.2 练习题 289
第12章 调节回归 291
12.1 设置R语言 291
12.2 调节回归理论 292
12.3 R语言中分类变量与连续变量的调节回归 296
12.4 R语言中存在两个连续变量的调节回归 305
12.5 总结 313
12.6 练习与融会贯通 313
12.6.1 理论核查 313
12.6.2 练习题 313
第13章 方差分析 317
13.1 设置R语言 317
13.2 方差分析的背景 318
13.3 单因素方差分析 324
13.3.1 示例一 324
13.3.2 示例二 329
13.4 多因素方差分析 332
13.4.1 示例一 332
13.4.2 示例二 343
13.5 总结 347
13.6 练习与融会贯通 348
13.6.1 理论核查 348
13.6.2 练习题 348
参考文献 351
1.1 技术栈 2
1.2 操作系统升级 2
1.2.1 Windows 2
1.2.2 macOS 2
1.3 从CRAN下载并安装R语言 3
1.3.1 Windows 3
1.3.2 macOS 3
1.4 下载并安装RStudio软件 4
1.4.1 Windows 4
1.4.2 macOS 5
1.5 RStudio的使用方法 5
1.6 R语言脚本的编写 9
1.7 总结 13
1.8 练习与融会贯通 13
1.8.1 理论核查 13
1.8.2 练习题 14
第2章 程序包的安装与使用 15
2.1 程序包的安装 16
2.2.1 haven程序包 17
2.2.2 readxl程序包 17
2.2.3 writexl程序包 18
2.2.4 data.table程序包 18
2.2.5 extraoperators程序包 19
2.2.6 JWileymisc程序包 19
2.2.7 ggplot2程序包 19
2.2.8 visreg程序包 20
2.2.9 emmeans程序包 20
2.2.10 ez程序包 21
2.2.11 palmerpenguins程序包 21
2.2 程序包的使用说明 21
2.3 总结 22
2.4 练习与融会贯通 22
2.4.1 理论核查 23
2.4.2 练习题 23
第3章 数据的输入与输出 25
3.1 设置R语言 25
3.2 输入 26
3.2.1 手动输入 26
3.2.2 CSV格式文件:.csv 27
3.2.3 Excel格式文件:.xlsx或.xls 29
3.2.4 RDS格式文件:.rds 30
3.2.5 其他专有格式 31
3.3 输出 33
3.3.1 CSV格式文件 33
3.3.2 Excel 格式文件 33
3.3.3 RDS格式文件 34
3.4 总结 34
3.5 练习与融会贯通 34
3.5.1 理论核查 35
3.5.2 练习题 35
第4章 数据的处理 37
4.1 设置R语言 37
4.2 数据样式 39
4.3 data.table的工作方式 41
4.3.1 行操作的工作方式 41
4.3.2 列操作的工作方式 51
4.3.3 组操作的工作方式 57
4.4 示例 58
4.4.1 示例一:市区计数 58
4.4.2 示例二:都市统计区 59
4.4.3 示例三 60
4.5 总结 60
4.6 练习与融会贯通 62
4.6.1 理论核查 62
4.6.2 练习题 62
第5章 数据与样本 63
5.1 设置R语言 63
5.2 总体与样本 64
5.3 变量与数据 65
5.3.1 示例一 66
5.3.2 示例二 68
5.3.3 示例三 69
5.3.4 关于变量与数据的思考 69
5.4 统计思维 70
5.5 研究评估 70
5.6 样本评估 71
5.6.1 便利抽样 72
5.6.2 K抽样 74
5.6.3 分群抽样 77
5.6.4 分层抽样 80
5.6.5 随机抽样 84
5.6.6 样本知识回顾 86
5.7 频数表 87
5.7.1 示例一 87
5.7.2 示例二 89
5.7.3 示例三 90
5.8 总结 93
5.9 练习与融会贯通 95
5.9.1 理论核查 95
5.9.2 练习题 95
第6章 描述性统计 97
6.1 设置R语言 97
6.2 可视化 98
6.2.1 柱状图 98
6.2.2 点图/图表 103
6.2.3 ggplot2绘图包 105
6.3 集中趋势 112
6.3.1 算术平均值 112
6.3.2 中位数 116
6.4 数据的分布 119
6.4.1 示例一 120
6.4.2 示例二 123
6.4.3 示例三 125
6.5 数据湍流(方差) 126
6.5.1 示例一 129
6.5.2 示例二 131
6.6 总结 132
6.7 练习与融会贯通 133
6.7.1 理论核查 134
6.7.2 练习题 134
第7章 概率与分布 137
7.1 设置R语言 137
7.2 概率 138
7.2.1 示例一:独立性 140
7.2.2 示例二:补集 141
7.2.3 概率思维总结 142
7.3 正态分布 143
7.3.1 示例一 145
7.3.2 示例二 147
7.3.3 示例三 148
7.3.4 示例四 150
7.4 概率分布 154
7.4.1 示例一 156
7.4.2 示例二 158
7.5 中心极限定理 159
7.5.1 示例一 161
7.5.2 示例二 165
7.5.3 示例三 169
7.6 总结 172
7.7 练习与融会贯通 173
7.7.1 理论核查 173
7.7.2 练习题 174
第8章 相关与回归 175
8.1 设置R语言 175
8.2 相关性 177
8.2.1 参数化 179
8.2.2 非参数化:斯皮尔曼 181
8.2.3 非参数化:肯德尔 183
8.2.4 相关性选择 185
8.3 简单的线性回归关系 185
8.3.1 介绍 185
8.3.2 假设 189
8.3.3 方差R2的定义 193
8.3.4 R语言中的线性回归 193
8.4 总结 202
8.5 练习与融会贯通 203
8.5.1 理论核查 203
8.5.2 练习题 204
第9章 置信区间 205
9.1 设置R语言 206
9.2 可视化置信区间 207
9.2.1 示例一:Sigma已知 210
9.2.2 示例二:Sigma未知 216
9.2.3 示例三 218
9.2.4 示例四 219
9.3 相似与不同数据的比较与理解 221
9.3.1 示例一 221
9.3.2 示例二 223
9.4 总结 224
9.5 练习与融会贯通 224
9.5.1 理论核查 225
9.5.2 练习题 225
第10章 假设检验 227
10.1 设置R语言 227
10.2 H0与H1的对比 228
10.2.1 示例一 229
10.2.2 示例二 229
10.3 类错误与第二类错误 230
10.3.1 示例一 231
10.3.2 示例二 232
10.3.3 示例三 232
10.4 Alpha与Beta的概念 232
10.5 假设 235
10.6 零假设显著性检验 236
10.6.1 示例一 237
10.6.2 示例二 239
10.6.3 示例三 241
10.7 总结 243
10.8 练习与融会贯通 244
10.8.1 理论核查 244
10.8.2 练习题 244
第11章 多元回归 245
11.1 设置R语言 245
11.2 线性回归的Redux架构 247
11.3 多元回归 254
11.3.1 多元预测模型的意义 254
11.3.2 R语言中的多元回归 256
11.3.3 效应的范围与格式 263
11.3.4 假设与清除 274
11.4 分类预测 279
11.4.1 示例一 282
11.4.2 示例二 285
11.5 总结 288
11.6 练习与融会贯通 289
11.6.1 理论核查 289
11.6.2 练习题 289
第12章 调节回归 291
12.1 设置R语言 291
12.2 调节回归理论 292
12.3 R语言中分类变量与连续变量的调节回归 296
12.4 R语言中存在两个连续变量的调节回归 305
12.5 总结 313
12.6 练习与融会贯通 313
12.6.1 理论核查 313
12.6.2 练习题 313
第13章 方差分析 317
13.1 设置R语言 317
13.2 方差分析的背景 318
13.3 单因素方差分析 324
13.3.1 示例一 324
13.3.2 示例二 329
13.4 多因素方差分析 332
13.4.1 示例一 332
13.4.2 示例二 343
13.5 总结 347
13.6 练习与融会贯通 348
13.6.1 理论核查 348
13.6.2 练习题 348
参考文献 351
猜您喜欢