书籍详情

因果推断：原理解析与应用实践

作者：赵永贺等

出版社：电子工业出版社

出版时间：2023-12-01

ISBN：9787121466250

定价：¥69.00

购买这本书可以去

当当网

¥51.70

内容简介

　　本书全面介绍了最新的因果推断方法，并以实践应用为辅，方便读者理解。本书化繁为简，层层深入地引导读者了解因果推断方法发展的历程和现状。通过本书，读者可以获得关于因果推断方法的全局视角。本书共5章，以递进的方式展开对因果推断方法的介绍。第1章从广泛熟悉的相关关系出发，通过介绍相关关系与因果关系的联系与区别过渡到对因果关系的探索。在明确因果关系概念的基础上，第2章主要介绍洞察因果关系的金标准：随机对照试验。基于随机对照试验的原理和不同的应用场景，本书将因果推断方法分为3类：基于设计思想的因果推断方法、基于潜在结果框架的因果推断方法和基于结构因果模型的因果推断方法。第3章～第5章分别对这3类方法进一步详细分类，并进行解析。同时，这3类方法的应用场景也呈现递进的关系。本书适合有一定统计知识背景的读者，特别是希望深入研究因果推断方法并将其应用于各领域实践的相关研究者。同时，本书也适合对因果推断方法感兴趣的在校学生和业界工作人员。

作者简介

　　赵永贺网易原数据分析师，吉林大学博士生。主要研究方向为因果推断算法的理论扩展和跨学科实践应用。曾获永洪YVP数据分析最具影响力专家奖。孙慧妍吉林大学人工智能学院研究员，博士生导师。主要研究方向为因果推断、机器学习、系统生物学。任吉林省人工智能学会理事、中国生物信息学会（筹）系统生物学专委会常务委员、计算机学会生物信息学专委会通讯委员等。曾获ACM SIGBIO CHINA 2022新星奖。吴思威本科毕业于大连海事大学网络工程专业，现于吉林大学人工智能学院计算机科学与技术专业攻读硕士研究生，研究方向为因果推断、生物信息学。

第1章相关关系和因果关系 1
1.1　相关关系 1
1.2　因果关系 3
1.3　相关关系与因果关系之间的迷雾 6
1.3.1 混杂 6
1.3.2 样本的选择性偏差 7
1.4　因果推断方法 9
1.4.1 符号和表示工具 9
1.4.2 本书涉及的因果推断方法 10
参考文献 12
第2章随机对照试验 14
2.1　随机对照试验的统计学原理 14
2.1.1 基本概念 14
2.1.2 随机对照试验的核心思想 15
2.1.3 统计学的反证思维：假设检验 16
2.2　总体方差未知的情况 17
2.3　两类统计错误 19
2.4　随机对照试验流程 21
2.4.1 最小样本容量 22
2.4.2 试验结果分析 24
2.5　本章小结 25
参考文献 26
第3章基于设计思想的因果推断方法 28
3.1　双重差分法 28
3.1.1 DID模型的原理 29
3.1.2 DID模型的有效性检验 30
3.1.3 DID法的注意事项 32
3.1.4 DID法案例分析 33
3.2　合成控制法 39
3.2.1 构建潜在的合成控制组 40
3.2.2 求解合成控制组的权重 41
3.2.3 合成控制组的应用 42
3.2.4 合成控制法的评价 43
3.2.5 合成控制法案例分析 44
3.3　断点回归法 48
3.3.1 设计原理 49
3.3.2 确定分组变量和断点 49
3.3.3 精确断点与模糊断点 51
3.3.4 断点回归法的有效性检验 52
3.3.5 断点回归法的结果分析 52
3.3.6 断点回归法的评价 53
3.3.7 断点回归法案例分析 54
3.4　工具变量法 61
3.4.1 工具变量的定义 61
3.4.2 工具变量的前提假设 62
3.4.3 工具变量的有效性 63
3.4.4 工具变量的实践方式 64
3.4.5 工具变量法案例分析 66
3.5　主分层法 72
3.5.1 随机对照试验中的不依从问题 72
3.5.2 主分层法的原理 73
3.5.3 主分层法的前提假设 75
3.6　本章小结 76
参考文献 77
第4章基于潜在结果框架的因果推断方法 80
4.1　POF 80
4.1.1 POF的基本构成元素 80
4.1.2 POF的因果指标 81
4.1.3 POF的运行规则 82
4.2　均衡的样本子空间 88
4.2.1 分层方法 88
4.2.2 匹配方法 90
4.2.3 基于决策树的子空间划分 94
4.3　重加权的样本空间 96
4.3.1 逆倾向得分权重 96
4.3.2 双鲁棒估计方法 97
4.3.3 基于提升方法的泛化倾向得分权重 98
4.3.4 协变量均衡倾向得分权重 100
4.3.5 泛化的协变量均衡倾向得分权重 101
4.4　去混杂的表征空间 104
4.4.1 均衡表征学习 104
4.4.2 局部相似表征学习 107
4.5　基于潜在结果框架的因果推断方法的综合试验 112
4.5.1 数据生成 112
4.5.2 对照试验：估计ATE的常规方法 114
4.5.3 试验一：分层方法 115
4.5.4 试验二：匹配方法 117
4.5.5 试验三：基于决策树的子空间划分 119
4.5.6 试验四：逆倾向得分权重 120
4.5.7 试验五：双鲁棒估计方法 121
4.5.8 试验六：基于提升方法的泛化倾向得分权重 122
4.5.9 试验七：协变量均衡倾向得分权重 123
4.5.10 试验八：泛化的协变量均衡倾向得分权重 124
4.5.11 试验九：均衡表征学习和局部相似表征学习 124
4.5.12 总结 127
4.6　本章小结 127
参考文献 128
第5章基于结构因果模型的因果推断方法 132
5.1　因果层级 132
5.2　结构因果模型 134
5.2.1 因果图 134
5.2.2 因果图的基本节点结构 135
5.2.3 因果图上的概率分布 137
5.2.4 因果图上结构方程 139
5.2.5 结构因果模型小结 141
5.3　干预推断 142
5.3.1 后门调整 142
5.3.2 前门调整 143
5.3.3 do演算 144
5.4　干预的可识别性和识别算法 147
5.4.1 基本概念和定义 147
5.4.2 Px(v)的可识别性 150
5.4.3 Px(s)的可识别性 163
5.4.4 Pt(s)的可识别性 179
5.4.5 半马尔可夫模型向马尔可夫模型的进化 183
5.5　反事实预测 184
5.6　本章小结 186
参考文献 186

猜您喜欢

开放环境下的度量学习研究

西游趣味造物记

数学文献用开放标记格式得