书籍详情
预测模型实战:基于R、SPSS和Stata
作者:武松 著
出版社:清华大学出版社
出版时间:2023-11-01
ISBN:9787302639411
定价:¥118.00
购买这本书可以去
内容简介
本书包括四大块,一是预测模型的基础知识,二是基于Logistic回归的临床预测模型实战, 是预测模型中其他 要技术;特色:(1)白话统计:统计难教难学难应用,讲解统计需要 语言行传授或表达,本书作者有20年一线统计教学的经验,可以将统计以为通俗易懂 案例行讲解,而非标准数据,让读者有处理真实数据的感觉;(3)软件优势:本书撰写 度 低,非常适合广大的非统计学专业的从业人员学习;(4)自编插件:针对数据处理中 繁琐的分析过程,可以实现一键实现, 大降低读者的学习难度!
作者简介
武松(松哥统计),安徽中医药大学副教授,中国疾病预防控制中心流行病与卫生统计学博士,世界中联临床科研统计学会理事,国家高级统计分析师,SPSS高级数据分析师。擅长SPSS、SAS、R、Stata等多种统计软件,国内多家杂志编委。目前为止主持课题8项,协作子课题12项,出版SPSS统计软件专著2部,均为畅销书,参与编写了7部图书,参与过“十一五” “国家自然基金” “卫生部专项基金”等数十项课题数据分析,经验丰富。在国家级刊物作为第一作者或通讯作者发表文章40余篇,获得国家发明专利1项,获得计算机软件著作权5项,获得上海市出入境检验检疫局科技兴检三等奖1项。
目录
目录
第1章 临床预测模型基础 / 1
1.1 三种建模策略解读 / 1
1.1.1 风险因素发现模型 / 1
1.1.2 风险因素验证模型 / 2
1.1.3 临床预测模型 / 3
1.2 临床预测模型分类与分型 / 5
1.2.1 预测模型目的分类 / 5
1.2.2 预测模型数据来源分类 / 6
1.2.3 数据集分类 / 7
1.3 区分度-C指数 / 8
1.4 净重新分类指数 / 10
1.5 综合判别改善指数 / 12
1.6 校准度 / 13
1.6.1 Hosmer-Lemeshow检验 / 13
1.6.2 Calibration plot / 13
1.7 临床决策曲线 / 16
1.8 模型可视化(Visualization) / 18
1.9 交叉验证 / 19
1.9.1 简单交叉验证(Simple Cross Validation) / 20
1.9.2 K折交叉验证(K-Folder Cross Validation) / 20
1.9.3 留一法交叉验证(Leave-one-out
Cross Validation) / 20
1.10 自助抽样法 / 20
1.11 LASSO回归 / 21
1.12 临床预测模型报告规范 / 23
第2章 模型构建相关问题 / 26
2.1 单变量进入模型的形式 / 26
2.1.1 数值变量进入模型的形式 / 26
2.1.2 等级变量进入模型的形式 / 27
2.1.3 分类变量进入模型的形式 / 28
2.2 模型构建策略探讨 / 29
2.2.1 先单后多法 / 29
2.2.2 全部进入法 / 29
2.2.3 百分之十改变量法 / 29
2.2.4 LASSO回归法 / 29
2.3 统计建模 / 30
2.3.1 危险因素筛选模型 / 30
2.3.2 风险因素验证模型 / 30
2.3.3 临床预测模型 / 30
第3章 SPSS临床预测模型实战 / 31
3.1 SPSS在诊断模型中的应用 / 31
3.1.1 数据拆分 / 32
3.1.2 统计建模 / 33
3.1.3 模型评价 / 38
3.2 SPSS在预后模型中的应用 / 42
第4章 Stata诊断模型实战 / 46
4.1 Logistic回归模型构建 / 46
4.1.1 先单因素分析 / 46
4.1.2 后多因素分析 / 50
4.1.3 正式后多因素分析 / 51
4.1.4 模型比较 / 54
4.1.5 最终模型 / 56
4.1.6 预测概率 / 57
4.2 Logistic回归模型区分度评价 / 57
4.2.1 训练集的AUC分析 / 58
4.2.2 训练集ROC曲线分析 / 58
4.2.3 验证集AUC 分析 / 59
4.2.4 验证集ROC分析 / 60
4.2.5 多条ROC曲线 / 60
4.3 Logistic回归模型校准度评价:HL检验
与校准曲线 / 61
4.3.1 基于HL函数的校准度 / 61
4.3.2 校准曲线加强版 / 63
4.3.3 Bootstrap校准曲线 / 67
4.4 Logistic回归模型临床适用性评价:临
床决策曲线(DCA) / 69
4.4.1 训练集临床决策曲线 / 70
4.4.2 验证集临床决策曲线 / 70
4.4.3 决策曲线优化 / 71
4.4.4 净减少曲线(Net Reduction) / 72
4.5 Logistic回归模型可视化:Nomo图 / 73
4.6 NRI和IDI / 75
4.6.1 NRI(净重新分类指数) / 75
4.6.2 IDI(综合判别改善指数) / 77
4.7 如何利用别人文章的模型 / 78
4.8 交叉验证 / 79
4.9 Bootstrap / 81
4.10 LASSO-Logit / 85
4.10.1 LASSO回归 / 86
4.10.2 路径图 / 88
4.10.3 CV-LASSO / 91
4.11 缺失值处理 / 93
4.11.1 直接删除法 / 93
4.11.2 单一插补法 / 93
4.11.3 多重插补法 / 93
第5章 Stata预后临床预测模型实战 / 100
5.1 模型构建 / 100
5.1.1 建立时间变量和结局变量 / 101
5.1.2 单因素分析 / 101
5.1.3 多因素分析 / 102
5.1.4 模型比较 / 104
5.1.5 确定最终模型 / 105
5.2 区分度 / 106
5.2.1 C-index / 106
5.2.2 C-index和Somers_D及 95%可信区间 / 107
5.2.3 时点ROC曲线(Time ROC) / 109
5.3 校准度 / 113
5.3.1 建立模型 / 113
5.3.2 训练集时点校准曲线 / 113
5.3.3 验证集时点校准曲线 / 114
5.3.4 训练集校准曲线加强版 / 114
5.3.5 验证集校准曲线加强版 / 115
5.4 决策曲线 / 117
5.4.1 建立模型 / 117
5.4.2 设立时间节点死亡概率 / 117
5.4.3 模型组与验证组DCA / 117
5.4.4 多模型DCA曲线 / 119
5.4.5 净获益的数据 / 120
5.5 Nomo图 / 120
5.5.1 构建模型 / 120
5.5.2 命令绘制Nomo图 / 120
5.5.3 窗口Nomo绘制 / 122
5.6 NRI与IDI / 123
5.6.1 NRI / 123
5.6.2 IDI / 125
5.7 Bootstrap / 126
第6章 R语言诊断临床预测模型实战 / 129
6.1 Logistic回归模型构建 / 129
6.1.1 单因素分析 / 129
6.1.2 多因素分析 / 138
6.2 Logistic回归模型区分度评价 / 154
6.2.1 训练集AUC与ROC / 155
6.2.2 验证集AUC和ROC / 159
6.2.3 绘制多条ROC曲线 / 163
6.2.4 两条ROC曲线比较 / 165
6.2.5. Bootstrap法ROC内部验证 / 166
6.3 Logistic回归校准度评价:HL检验与校
准曲线 / 168
6.3.1 calibrate包val.prob函数校准曲线实现 / 168
6.3.2 Hosmer-Lemeshow test检验 / 170
6.3.3 riskRegression包plotCalibration函数校准曲
线实现 / 171
6.3.4 lrm calibrate plot校准曲线实现 / 172
6.3.5 校准曲线方法四(Bootstrap法) / 174
6.4 Logistic回归模型临床决策曲线
(DCA) / 175
6.4.1 软件准备工作 / 176
6.4.2 rmda包决策曲线实现 / 176
6.4.3 临床影响曲线(clinical impact curve) / 180
6.4.4 DCA及可信区间 / 182
6.4.5 交叉验证DCA / 182
6.4.6 DCA包临床决策曲线绘制 / 183
6.5 Logistic回归模型可视化:Nomo图 / 185
6.5.1 rms包常规普通列线图回归 / 186
6.5.2 regplot包绘制交互列线图 / 187
6.5.3 普通列线图变种 / 189
6.5.4 DynNom包动态列线图 / 190
6.5.5 制作网络版动态列线图 / 193
6.6 Logistic回归模型诊断效果评价 / 197
6.6.1 诊断试验评价 / 198
6.6.2 ROC曲线比较 / 198
6.6.3 Logistic回归分析 / 199
6.7 NRI和IDI / 200
6.7.1 净重新分类指数 / 200
6.7.2 综合判别改善指数 / 202
6.8 如何验证别人已经发表的模型 / 204
6.9 LASSO在Logistic回归中应用 / 205
6.9.1 软件包准备 / 205
6.9.2 数据准备 / 205
6.9.3 LASSO-Logit / 205
6.9.4 CV-LASSO / 207
6.10 交叉验证与Bootstrap / 209
6.10.1 简单交叉验证 / 210
6.10.2 十重交叉验证 / 211
6.10.3 留一法交叉验证 / 212
6.10.4 Bootstrap CV / 213
6.10.5 Bootstrap ROC / 214
第7章 R语言预后临床预测模型实战 / 216
7.1 COX回归模型构建 / 217
7.1.1 数据读取 / 217
7.1.2 软件包准备 / 218
7.1.3 先单因素分析 / 218
7.1.4 后多因素分析 / 219
7.1.5 批量单因素分析 / 220
7.1.6 多因素分析 / 222
7.1.7 模型比较 / 226
7.2 预后模型区分度分析 / 229
7.2.1 Concordance index / 229
7.2.2 Time-ROC / 234
7.2.3 时间依赖AUC / 239
7.3 预后模型校准度分析 / 244
7.3.1 基于rms包的校准曲线 / 244
7.3.2 基于pec包的校准曲线 / 250
7.4 预后模型决策曲线分析 / 255
7.4.1 基于stdca.R的决策曲线 / 257
7.4.2 基于dcurves包的决策曲线 / 263
7.4.3 基于ggDCA包的决策曲线 / 270
7.5 交叉验证 / 274
7.6 预后模型Nomo展示 / 277
7.6.1 普通生存概率列线图 / 277
7.6.2 中位生存时间列线图 / 279
7.6.3 网格线列线图 / 280
7.6.4 动态列线图 / 280
7.7 NRI和IDI / 283
7.7.1 NRI(净重新分类指数) / 283
7.7.2 IDI / 285
7.8 LASSO-COX / 286
7.8.1 数据准备 / 286
7.8.2 LASSO-COX / 286
7.8.3 CV-LASSO / 288
7.9 模型效果验证 / 290
7.9.1 风险分组后KM曲线 / 290
7.9.2 风险得分图 / 293
7.10 生存分析数值变量分类方法 / 295
7.10.1 Time-ROC / 295
7.10.2 X-Tile / 297
参考资料 / 299
第1章 临床预测模型基础 / 1
1.1 三种建模策略解读 / 1
1.1.1 风险因素发现模型 / 1
1.1.2 风险因素验证模型 / 2
1.1.3 临床预测模型 / 3
1.2 临床预测模型分类与分型 / 5
1.2.1 预测模型目的分类 / 5
1.2.2 预测模型数据来源分类 / 6
1.2.3 数据集分类 / 7
1.3 区分度-C指数 / 8
1.4 净重新分类指数 / 10
1.5 综合判别改善指数 / 12
1.6 校准度 / 13
1.6.1 Hosmer-Lemeshow检验 / 13
1.6.2 Calibration plot / 13
1.7 临床决策曲线 / 16
1.8 模型可视化(Visualization) / 18
1.9 交叉验证 / 19
1.9.1 简单交叉验证(Simple Cross Validation) / 20
1.9.2 K折交叉验证(K-Folder Cross Validation) / 20
1.9.3 留一法交叉验证(Leave-one-out
Cross Validation) / 20
1.10 自助抽样法 / 20
1.11 LASSO回归 / 21
1.12 临床预测模型报告规范 / 23
第2章 模型构建相关问题 / 26
2.1 单变量进入模型的形式 / 26
2.1.1 数值变量进入模型的形式 / 26
2.1.2 等级变量进入模型的形式 / 27
2.1.3 分类变量进入模型的形式 / 28
2.2 模型构建策略探讨 / 29
2.2.1 先单后多法 / 29
2.2.2 全部进入法 / 29
2.2.3 百分之十改变量法 / 29
2.2.4 LASSO回归法 / 29
2.3 统计建模 / 30
2.3.1 危险因素筛选模型 / 30
2.3.2 风险因素验证模型 / 30
2.3.3 临床预测模型 / 30
第3章 SPSS临床预测模型实战 / 31
3.1 SPSS在诊断模型中的应用 / 31
3.1.1 数据拆分 / 32
3.1.2 统计建模 / 33
3.1.3 模型评价 / 38
3.2 SPSS在预后模型中的应用 / 42
第4章 Stata诊断模型实战 / 46
4.1 Logistic回归模型构建 / 46
4.1.1 先单因素分析 / 46
4.1.2 后多因素分析 / 50
4.1.3 正式后多因素分析 / 51
4.1.4 模型比较 / 54
4.1.5 最终模型 / 56
4.1.6 预测概率 / 57
4.2 Logistic回归模型区分度评价 / 57
4.2.1 训练集的AUC分析 / 58
4.2.2 训练集ROC曲线分析 / 58
4.2.3 验证集AUC 分析 / 59
4.2.4 验证集ROC分析 / 60
4.2.5 多条ROC曲线 / 60
4.3 Logistic回归模型校准度评价:HL检验
与校准曲线 / 61
4.3.1 基于HL函数的校准度 / 61
4.3.2 校准曲线加强版 / 63
4.3.3 Bootstrap校准曲线 / 67
4.4 Logistic回归模型临床适用性评价:临
床决策曲线(DCA) / 69
4.4.1 训练集临床决策曲线 / 70
4.4.2 验证集临床决策曲线 / 70
4.4.3 决策曲线优化 / 71
4.4.4 净减少曲线(Net Reduction) / 72
4.5 Logistic回归模型可视化:Nomo图 / 73
4.6 NRI和IDI / 75
4.6.1 NRI(净重新分类指数) / 75
4.6.2 IDI(综合判别改善指数) / 77
4.7 如何利用别人文章的模型 / 78
4.8 交叉验证 / 79
4.9 Bootstrap / 81
4.10 LASSO-Logit / 85
4.10.1 LASSO回归 / 86
4.10.2 路径图 / 88
4.10.3 CV-LASSO / 91
4.11 缺失值处理 / 93
4.11.1 直接删除法 / 93
4.11.2 单一插补法 / 93
4.11.3 多重插补法 / 93
第5章 Stata预后临床预测模型实战 / 100
5.1 模型构建 / 100
5.1.1 建立时间变量和结局变量 / 101
5.1.2 单因素分析 / 101
5.1.3 多因素分析 / 102
5.1.4 模型比较 / 104
5.1.5 确定最终模型 / 105
5.2 区分度 / 106
5.2.1 C-index / 106
5.2.2 C-index和Somers_D及 95%可信区间 / 107
5.2.3 时点ROC曲线(Time ROC) / 109
5.3 校准度 / 113
5.3.1 建立模型 / 113
5.3.2 训练集时点校准曲线 / 113
5.3.3 验证集时点校准曲线 / 114
5.3.4 训练集校准曲线加强版 / 114
5.3.5 验证集校准曲线加强版 / 115
5.4 决策曲线 / 117
5.4.1 建立模型 / 117
5.4.2 设立时间节点死亡概率 / 117
5.4.3 模型组与验证组DCA / 117
5.4.4 多模型DCA曲线 / 119
5.4.5 净获益的数据 / 120
5.5 Nomo图 / 120
5.5.1 构建模型 / 120
5.5.2 命令绘制Nomo图 / 120
5.5.3 窗口Nomo绘制 / 122
5.6 NRI与IDI / 123
5.6.1 NRI / 123
5.6.2 IDI / 125
5.7 Bootstrap / 126
第6章 R语言诊断临床预测模型实战 / 129
6.1 Logistic回归模型构建 / 129
6.1.1 单因素分析 / 129
6.1.2 多因素分析 / 138
6.2 Logistic回归模型区分度评价 / 154
6.2.1 训练集AUC与ROC / 155
6.2.2 验证集AUC和ROC / 159
6.2.3 绘制多条ROC曲线 / 163
6.2.4 两条ROC曲线比较 / 165
6.2.5. Bootstrap法ROC内部验证 / 166
6.3 Logistic回归校准度评价:HL检验与校
准曲线 / 168
6.3.1 calibrate包val.prob函数校准曲线实现 / 168
6.3.2 Hosmer-Lemeshow test检验 / 170
6.3.3 riskRegression包plotCalibration函数校准曲
线实现 / 171
6.3.4 lrm calibrate plot校准曲线实现 / 172
6.3.5 校准曲线方法四(Bootstrap法) / 174
6.4 Logistic回归模型临床决策曲线
(DCA) / 175
6.4.1 软件准备工作 / 176
6.4.2 rmda包决策曲线实现 / 176
6.4.3 临床影响曲线(clinical impact curve) / 180
6.4.4 DCA及可信区间 / 182
6.4.5 交叉验证DCA / 182
6.4.6 DCA包临床决策曲线绘制 / 183
6.5 Logistic回归模型可视化:Nomo图 / 185
6.5.1 rms包常规普通列线图回归 / 186
6.5.2 regplot包绘制交互列线图 / 187
6.5.3 普通列线图变种 / 189
6.5.4 DynNom包动态列线图 / 190
6.5.5 制作网络版动态列线图 / 193
6.6 Logistic回归模型诊断效果评价 / 197
6.6.1 诊断试验评价 / 198
6.6.2 ROC曲线比较 / 198
6.6.3 Logistic回归分析 / 199
6.7 NRI和IDI / 200
6.7.1 净重新分类指数 / 200
6.7.2 综合判别改善指数 / 202
6.8 如何验证别人已经发表的模型 / 204
6.9 LASSO在Logistic回归中应用 / 205
6.9.1 软件包准备 / 205
6.9.2 数据准备 / 205
6.9.3 LASSO-Logit / 205
6.9.4 CV-LASSO / 207
6.10 交叉验证与Bootstrap / 209
6.10.1 简单交叉验证 / 210
6.10.2 十重交叉验证 / 211
6.10.3 留一法交叉验证 / 212
6.10.4 Bootstrap CV / 213
6.10.5 Bootstrap ROC / 214
第7章 R语言预后临床预测模型实战 / 216
7.1 COX回归模型构建 / 217
7.1.1 数据读取 / 217
7.1.2 软件包准备 / 218
7.1.3 先单因素分析 / 218
7.1.4 后多因素分析 / 219
7.1.5 批量单因素分析 / 220
7.1.6 多因素分析 / 222
7.1.7 模型比较 / 226
7.2 预后模型区分度分析 / 229
7.2.1 Concordance index / 229
7.2.2 Time-ROC / 234
7.2.3 时间依赖AUC / 239
7.3 预后模型校准度分析 / 244
7.3.1 基于rms包的校准曲线 / 244
7.3.2 基于pec包的校准曲线 / 250
7.4 预后模型决策曲线分析 / 255
7.4.1 基于stdca.R的决策曲线 / 257
7.4.2 基于dcurves包的决策曲线 / 263
7.4.3 基于ggDCA包的决策曲线 / 270
7.5 交叉验证 / 274
7.6 预后模型Nomo展示 / 277
7.6.1 普通生存概率列线图 / 277
7.6.2 中位生存时间列线图 / 279
7.6.3 网格线列线图 / 280
7.6.4 动态列线图 / 280
7.7 NRI和IDI / 283
7.7.1 NRI(净重新分类指数) / 283
7.7.2 IDI / 285
7.8 LASSO-COX / 286
7.8.1 数据准备 / 286
7.8.2 LASSO-COX / 286
7.8.3 CV-LASSO / 288
7.9 模型效果验证 / 290
7.9.1 风险分组后KM曲线 / 290
7.9.2 风险得分图 / 293
7.10 生存分析数值变量分类方法 / 295
7.10.1 Time-ROC / 295
7.10.2 X-Tile / 297
参考资料 / 299
猜您喜欢