书籍详情
R语言医学数据分析实战
作者:赵军 著
出版社:人民邮电出版社
出版时间:2020-08-01
ISBN:9787115539151
定价:¥79.00
购买这本书可以去
内容简介
本书以医学数据为例,讲解如何使用R进行数据分析,结合大量精选的实例对常用分析方法进行了深入浅出的介绍,以帮助读者解决医学数据分析中的实际问题。本书共分为14章,第1章~第3章介绍了R语言的基本用法;第4章介绍了数据可视化;第5章介绍了基本的统计分析方法;第6章~第8章介绍了医学研究中最常用的三种回归模型;第9章介绍了生存分析的基本方法;第10章~第12章介绍了几种常用的多元统计分析方法;第13章介绍了临床诊断试验的统计评价指标和计算方法;第14章介绍了在医学科研实践中常用的Meta分析方法。本书适用于临床医学、公共卫生及其他医学相关专业的本科生和研究生使用,亦可作为其他专业的学生和科研工作者学习数据分析的参考书。阅读本书,读者不仅能掌握使用R及相关包快速解决实际问题的方法,还能更深入地理解数据分析。
作者简介
赵军,泰国宋卡王子大学流行病学博士,湖北医药学院公共卫生与管理学院副教授、硕士研究生导师。讲授医药数理统计方法、医学统计学、高级统计学等课程。近三年以第一作者身份发表SCI论文5篇,研究方向为临床流行病学、医学统计学。
目录
第 1章 R语言介绍\t1
1.1 什么是R语言 1
1.2 为什么使用R分析数据 1
1.3 R的下载与安装 2
1.4 启动和退出R 2
1.5 RStudio 3
1.6 R包 4
1.6.1 什么是包 4
1.6.2 包的安装 5
1.6.3 包的使用和更新 5
1.7 开始使用R 5
1.7.1 获取帮助 5
1.7.2 把R当作一个计算器 6
1.7.3 R对象 8
1.8 工作空间管理 11
1.9 小结 12
1.10 习题 12
第 2章 创建数据集 14
2.1 R的数据结构 14
2.1.1 向量 14
2.1.2 因子 16
2.1.3 矩阵 17
2.1.4 数组 19
2.1.5 列表 20
2.1.6 数据框 21
2.1.7 数据类型的转换 22
2.2 用R获取数据 23
2.2.1 获取内置数据集 23
2.2.2 模拟特定分布的数据 24
2.2.3 获取其他格式的数据 25
2.2.4 导出数据 26
2.2.5 用rio包导入和导出数据 26
2.3 数据录入 27
2.4 小结 28
2.5 习题 30
第3章 数据框的操作 31
3.1 用基本包处理数据框 31
3.1.1 查看数据框里的内容 31
3.1.2 选取数据框的子集 34
3.1.3 将数据框按照某个变量的值排序 35
3.1.4 查找和删除重复数据 36
3.1.5 在数据框中添加和删除变量 37
3.1.6 把数据框添加到搜索路径 38
3.2 用dplyr包处理数据框 39
3.2.1 使用filter()和slice()筛选行 40
3.2.2 使用arrange()排列行 41
3.2.3 使用select()选择列 42
3.2.4 使用mutate()添加新变量 43
3.2.5 使用summarise()计算统计量 43
3.2.6 使用group_by()拆分数据框 44
3.2.7 使用传递符“%>%”组合多个操作 45
3.3 数据框的合并 46
3.3.1 纵向合并 46
3.3.2 横向合并 47
3.3.3 按照某个共有变量合并 47
3.4 数据框的长宽格式的转换 48
3.5 缺失值的处理 50
3.5.1 识别缺失值 50
3.5.2 探索数据框里的缺失值 51
3.5.3 填充缺失值 52
3.6 处理大型数据集的策略 55
3.6.1 清理工作空间 55
3.6.2 快速读取.csv文件 55
3.6.3 模拟一个大型数据集 56
3.6.4 剔除不需要的变量 57
3.6.5 选取数据集的一个随机样本 58
3.7 小结 58
3.8 习题 60
第4章 数据可视化 62
4.1 用R的基础绘图系统作图 62
4.1.1 函数plot() 62
4.1.2 直方图和密度曲线图 63
4.1.3 条形图 65
4.1.4 饼图 67
4.1.5 箱线图和小提琴图 67
4.1.6 克利夫兰点图 68
4.1.7 导出图形 69
4.2 用ggplot2包作图 70
4.2.1 初识ggplot2包 70
4.2.2 分布的特征 74
4.2.3 比例的构成 76
4.2.4 用函数ggsave()保存图形 78
4.3 其他图形 78
4.3.1 金字塔图 78
4.3.2 横向堆栈条形图 79
4.3.3 热图 79
4.3.4 三维散点图 80
4.3.5 词云图 81
4.3.6 动态图形 82
4.4 小结 83
4.5 习题 85
第5章 基本统计分析 86
5.1 数值型变量的描述性统计分析 88
5.2 分类变量的列联表和独立性检验 91
5.2.1 生成频数表和列联表 91
5.2.2 独立性检验 96
5.3 连续型变量组间差异的比较 101
5.3.1 独立样本的t检验 101
5.3.2 非独立样本的t检验 102
5.3.3 单因素方差分析 103
5.3.4 组间差异的非参数检验 105
5.4 用函数tablestack()汇总双变量分析结果 106
5.5 变量间的相关性 111
5.5.1 连续型变量间的相关性 111
5.5.2 分类变量间的相关性 114
5.5.3 相关性的可视化 115
5.6 小结 118
5.7 习题 120
第6章 线性回归分析 122
6.1 简单线性回归 122
6.1.1 拟合简单线性回归模型 123
6.1.2 模型输出结果的解释 124
6.1.3 回归诊断 126
6.2 分层线性回归 129
6.3 多重线性回归 133
6.3.1 拟合多重线性回归模型 133
6.3.2 多重共线性 135
6.3.3 逐步回归 136
6.3.4 回归诊断 139
6.4 小结 140
6.5 习题 141
第7章 Logistic回归分析 142
7.1 二分类Logistic回归 142
7.1.1 Logistic回归模型 142
7.1.2 Logistic回归实例 143
7.1.3 表格数据的Logistic回归 151
7.2 条件Logistic回归 155
7.3 无序多分类Logistic回归 157
7.4 有序Logistic回归 161
7.5 小结 166
7.6 习题 167
第8章 Poisson回归分析 168
8.1 Poisson回归模型 168
8.2 过度离散的判定及处理 171
8.3 对数线性模型 174
8.4 小结 178
8.5 习题 178
第9章 生存分析 180
9.1 生存对象 180
9.2 生存率的估计与生存曲线 182
9.3 生存率的比较 184
9.4 Cox回归 186
9.4.1 建立Cox回归模型 186
9.4.2 比例风险假定的检验 188
9.4.3 生存的预测 188
9.5 小结 190
9.6 习题 190
第 10章 聚类分析 192
10.1 相似性的度量 192
10.1.1 样品间的距离 192
10.1.2 变量间的相似系数 195
10.2 层次聚类法 196
10.2.1 类之间相似系数的定义 196
10.2.2 Q型聚类 196
10.2.3 R型聚类 203
10.3 k均值聚类法 204
10.4 小结 206
10.5 习题 207
第 11章 判别分析 209
11.1 距离判别 209
11.2 K最邻近判别 213
11.3 Fisher判别 215
11.4 Bayes判别 218
11.5 小结 219
11.6 习题 220
第 12章 主成分分析和因子分析 221
12.1 主成分分析 221
12.1.1 主成分的定义 221
12.1.2 主成分的求解 222
12.1.3 主成分分析的注意事项 226
12.2 因子分析 226
12.2.1 因子分析模型的定义 226
12.2.2 因子分析模型的求解 227
12.2.3 因子旋转 229
12.2.4 因子分析的注意事项 231
12.3 小结 232
12.4 习题 233
第 13章 临床诊断试验评价 234
13.1 二分类结果的评价指标 234
13.1.1 灵敏度和特异度 234
13.1.2 预测值 235
13.1.3 图解灵敏度、特异度、阳性预测值和阴性预测值 235
13.1.4 诊断试验的综合评价指标 236
13.2 ROC及曲线下面积 237
13.2.1 单个ROC分析 237
13.2.2 两个ROC的比较 240
13.2.3 Logistic回归的ROC曲线 241
13.3 联合试验 243
13.4 小结 244
13.5 习题 244
第 14章 Meta分析 245
14.1 Meta分析的基本步骤 245
14.2 Meta分析的常用统计方法 246
14.3 二分类变量资料的Meta分析 247
14.3.1 OR、RR或RD的合并 248
14.3.2 发表偏倚的识别 251
14.3.3 敏感性分析 253
14.4 连续型变量资料的Meta分析 254
14.5 Meta分析的注意事项 255
14.6 小结 256
14.7 习题 256
习题参考答案 258
参考文献 273
函数索引 274
1.1 什么是R语言 1
1.2 为什么使用R分析数据 1
1.3 R的下载与安装 2
1.4 启动和退出R 2
1.5 RStudio 3
1.6 R包 4
1.6.1 什么是包 4
1.6.2 包的安装 5
1.6.3 包的使用和更新 5
1.7 开始使用R 5
1.7.1 获取帮助 5
1.7.2 把R当作一个计算器 6
1.7.3 R对象 8
1.8 工作空间管理 11
1.9 小结 12
1.10 习题 12
第 2章 创建数据集 14
2.1 R的数据结构 14
2.1.1 向量 14
2.1.2 因子 16
2.1.3 矩阵 17
2.1.4 数组 19
2.1.5 列表 20
2.1.6 数据框 21
2.1.7 数据类型的转换 22
2.2 用R获取数据 23
2.2.1 获取内置数据集 23
2.2.2 模拟特定分布的数据 24
2.2.3 获取其他格式的数据 25
2.2.4 导出数据 26
2.2.5 用rio包导入和导出数据 26
2.3 数据录入 27
2.4 小结 28
2.5 习题 30
第3章 数据框的操作 31
3.1 用基本包处理数据框 31
3.1.1 查看数据框里的内容 31
3.1.2 选取数据框的子集 34
3.1.3 将数据框按照某个变量的值排序 35
3.1.4 查找和删除重复数据 36
3.1.5 在数据框中添加和删除变量 37
3.1.6 把数据框添加到搜索路径 38
3.2 用dplyr包处理数据框 39
3.2.1 使用filter()和slice()筛选行 40
3.2.2 使用arrange()排列行 41
3.2.3 使用select()选择列 42
3.2.4 使用mutate()添加新变量 43
3.2.5 使用summarise()计算统计量 43
3.2.6 使用group_by()拆分数据框 44
3.2.7 使用传递符“%>%”组合多个操作 45
3.3 数据框的合并 46
3.3.1 纵向合并 46
3.3.2 横向合并 47
3.3.3 按照某个共有变量合并 47
3.4 数据框的长宽格式的转换 48
3.5 缺失值的处理 50
3.5.1 识别缺失值 50
3.5.2 探索数据框里的缺失值 51
3.5.3 填充缺失值 52
3.6 处理大型数据集的策略 55
3.6.1 清理工作空间 55
3.6.2 快速读取.csv文件 55
3.6.3 模拟一个大型数据集 56
3.6.4 剔除不需要的变量 57
3.6.5 选取数据集的一个随机样本 58
3.7 小结 58
3.8 习题 60
第4章 数据可视化 62
4.1 用R的基础绘图系统作图 62
4.1.1 函数plot() 62
4.1.2 直方图和密度曲线图 63
4.1.3 条形图 65
4.1.4 饼图 67
4.1.5 箱线图和小提琴图 67
4.1.6 克利夫兰点图 68
4.1.7 导出图形 69
4.2 用ggplot2包作图 70
4.2.1 初识ggplot2包 70
4.2.2 分布的特征 74
4.2.3 比例的构成 76
4.2.4 用函数ggsave()保存图形 78
4.3 其他图形 78
4.3.1 金字塔图 78
4.3.2 横向堆栈条形图 79
4.3.3 热图 79
4.3.4 三维散点图 80
4.3.5 词云图 81
4.3.6 动态图形 82
4.4 小结 83
4.5 习题 85
第5章 基本统计分析 86
5.1 数值型变量的描述性统计分析 88
5.2 分类变量的列联表和独立性检验 91
5.2.1 生成频数表和列联表 91
5.2.2 独立性检验 96
5.3 连续型变量组间差异的比较 101
5.3.1 独立样本的t检验 101
5.3.2 非独立样本的t检验 102
5.3.3 单因素方差分析 103
5.3.4 组间差异的非参数检验 105
5.4 用函数tablestack()汇总双变量分析结果 106
5.5 变量间的相关性 111
5.5.1 连续型变量间的相关性 111
5.5.2 分类变量间的相关性 114
5.5.3 相关性的可视化 115
5.6 小结 118
5.7 习题 120
第6章 线性回归分析 122
6.1 简单线性回归 122
6.1.1 拟合简单线性回归模型 123
6.1.2 模型输出结果的解释 124
6.1.3 回归诊断 126
6.2 分层线性回归 129
6.3 多重线性回归 133
6.3.1 拟合多重线性回归模型 133
6.3.2 多重共线性 135
6.3.3 逐步回归 136
6.3.4 回归诊断 139
6.4 小结 140
6.5 习题 141
第7章 Logistic回归分析 142
7.1 二分类Logistic回归 142
7.1.1 Logistic回归模型 142
7.1.2 Logistic回归实例 143
7.1.3 表格数据的Logistic回归 151
7.2 条件Logistic回归 155
7.3 无序多分类Logistic回归 157
7.4 有序Logistic回归 161
7.5 小结 166
7.6 习题 167
第8章 Poisson回归分析 168
8.1 Poisson回归模型 168
8.2 过度离散的判定及处理 171
8.3 对数线性模型 174
8.4 小结 178
8.5 习题 178
第9章 生存分析 180
9.1 生存对象 180
9.2 生存率的估计与生存曲线 182
9.3 生存率的比较 184
9.4 Cox回归 186
9.4.1 建立Cox回归模型 186
9.4.2 比例风险假定的检验 188
9.4.3 生存的预测 188
9.5 小结 190
9.6 习题 190
第 10章 聚类分析 192
10.1 相似性的度量 192
10.1.1 样品间的距离 192
10.1.2 变量间的相似系数 195
10.2 层次聚类法 196
10.2.1 类之间相似系数的定义 196
10.2.2 Q型聚类 196
10.2.3 R型聚类 203
10.3 k均值聚类法 204
10.4 小结 206
10.5 习题 207
第 11章 判别分析 209
11.1 距离判别 209
11.2 K最邻近判别 213
11.3 Fisher判别 215
11.4 Bayes判别 218
11.5 小结 219
11.6 习题 220
第 12章 主成分分析和因子分析 221
12.1 主成分分析 221
12.1.1 主成分的定义 221
12.1.2 主成分的求解 222
12.1.3 主成分分析的注意事项 226
12.2 因子分析 226
12.2.1 因子分析模型的定义 226
12.2.2 因子分析模型的求解 227
12.2.3 因子旋转 229
12.2.4 因子分析的注意事项 231
12.3 小结 232
12.4 习题 233
第 13章 临床诊断试验评价 234
13.1 二分类结果的评价指标 234
13.1.1 灵敏度和特异度 234
13.1.2 预测值 235
13.1.3 图解灵敏度、特异度、阳性预测值和阴性预测值 235
13.1.4 诊断试验的综合评价指标 236
13.2 ROC及曲线下面积 237
13.2.1 单个ROC分析 237
13.2.2 两个ROC的比较 240
13.2.3 Logistic回归的ROC曲线 241
13.3 联合试验 243
13.4 小结 244
13.5 习题 244
第 14章 Meta分析 245
14.1 Meta分析的基本步骤 245
14.2 Meta分析的常用统计方法 246
14.3 二分类变量资料的Meta分析 247
14.3.1 OR、RR或RD的合并 248
14.3.2 发表偏倚的识别 251
14.3.3 敏感性分析 253
14.4 连续型变量资料的Meta分析 254
14.5 Meta分析的注意事项 255
14.6 小结 256
14.7 习题 256
习题参考答案 258
参考文献 273
函数索引 274
猜您喜欢