书籍详情

可解释机器学习：模型、方法与实践

作者：索信达控股，邵平，杨健颖，苏思达等著

出版社：机械工业出版社

出版时间：2021-12-01

ISBN：9787111695714

定价：¥79.00

购买这本书可以去

内容简介

　　本书先从背景出发，阐述黑盒模型存在的问题以及不解决黑盒问题模型可能带来的后果，引出可解释机器学习的重要性；随后，我们从可解释机器学习的研究方向，分为内在可解释模型算法和模型事后解析方法两部分进行介绍，阐述不同模型的原理、应用及其可解释性。z后通过三个不同的应用场景，介绍在银行实战中的数据挖掘方法，由问题、处理方法出发，结合可解释机器学习模型结果，证明模型的有效性和实用性，期望读者通过对本书的阅读，可以更快更好的解决实际业务问题，而非纸上谈兵。业务场景均为业内的典型案例，希望能够对读者有所启发。同时，本书中还会有大量的公式与代码，保证内容的丰富与严谨，经得起推敲，使得读者知其然且知其所以然。

作者简介

　　邵平资深数据科学家，索信达控股金融AI实验室总监。在大数据、人工智能领域有十多年技术研发和行业应用经验。技术方向涉及可解释机器学习、深度学习、时间序列预测、智能推荐、自然语言处理等。现主要致力于可解释机器学习、推荐系统、银行智能营销和智能风控等领域的技术研究和项目实践。杨健颖云南财经大学统计学硕士，高级数据挖掘工程师，一个对数据科学有坚定信念的追求者，目前重点研究机器学习模型的可解释性。苏思达美国天普大学统计学硕士，机器学习算法专家，长期为银行提供大数据与人工智能解决方案和技术服务。主要研究方向为可解释机器学习与人工智能，曾撰写《可解释机器学习研究报告》和多篇可解释机器学习相关文章。

前言
第一部分　背景
第1章　引言2
　1.1　可解释机器学习研究背景2
1.1.1　机器学习面临的挑战2
1.1.2　黑盒模型存在的问题4
　1.2　模型可解释性的重要性8
　1.3　国内外的模型监管政策10
　1.4　本章小结11
第2章　可解释机器学习12
　2.1　模型的可解释性12
2.1.1　可解释性的定义13
2.1.2　可解释性的分类14
2.1.3　可解释机器学习的研究方向16
　2.2　可解释性的作用18
2.2.1　产生信任19
2.2.2　提供因果关系依据19
2.2.3　帮助模型诊断20
2.2.4　安全使用模型22
2.2.5　避免发生偏见与歧视22
　2.3　可解释性的实现23
2.3.1　建模前的可解释性实现23
2.3.2　建模中的可解释性实现26
2.3.3　建模后的可解释性实现28
　2.4　本章小结29
第二部分　理论
第3章　内在可解释机器学习模型32
　3.1　传统统计模型33
3.1.1　线性回归33
3.1.2　广义线性模型37
3.1.3　广义加性模型41
3.1.4　决策树48
　3.2　EBM模型52
3.2.1　模型定义52
3.2.2　识别二阶交互项53
3.2.3　实现算法56
3.2.4　模型解释性59
3.2.5　模型的优势与不足62
　3.3　GAMINet模型63
3.3.1　模型定义64
3.3.2　GAMINet的3个重要准则66
3.3.3　实现算法70
3.3.4　模型解释性72
3.3.5　模型的优势与不足77
　3.4　RuleFit模型77
3.4.1　模型定义78
3.4.2　规则提取79
3.4.3　实现算法81
3.4.4　模型解释性81
3.4.5　模型的优势与不足84
　3.5　Falling Rule Lists模型85
3.5.1　模型定义85
3.5.2　模型参数估计87
3.5.3　实现算法88
3.5.4　模型解释性89
3.5.5　模型的优势与不足90
　3.6　GAMMLI模型91
3.6.1　传统推荐算法的不足92
3.6.2　交互项效应拟合方法94
3.6.3　自适应软填充95
3.6.4　模型解释性97
3.6.5　模型的优势与不足99
　3.7　本章小结99
第4章　复杂模型事后解析方法101
　4.1　部分依赖图102
4.1.1　部分依赖函数102
4.1.2　估计方法103
4.1.3　部分依赖图的局限105
4.1.4　个体条件期望图106
4.1.5　实例演示107
　4.2　累积局部效应图111
4.2.1　从部分依赖图到累积局部效应图112
4.2.2　累积局部效应方程114
4.2.3　实例演示116
4.2.4　ALE方法的优劣118
　4.3　LIME事后解析方法118
4.3.1　局部代理模型119
4.3.2　LIME方法的基本流程120
4.3.3　LIME方法的解释121
4.3.4　LIME方法的优劣123
　4.4　SHAP事后解析方法124
4.4.1　SHAP的基本思想125
4.4.2　Shapley Value126
4.4.3　SHAP的实现算法128
4.4.4　SHAP方法的解释137
4.4.5　SHAP方法的优劣140
4.4.6　扩展阅读141
　4.5　本章小结143
第三部分　实例
第5章　银行VIP客户流失预警及归因分析146
　5.1　案例背景146
　5.2　数据介绍147
　5.3　建模分析148
5.3.1　目标定义148
5.3.2　数据处理149
5.3.3　模型构建150
5.3.4　流失归因151
　5.4　营销建议157
　5.5　代码展示159
　5.6　本章小结162
第6章　银行个人客户信用评分模型研究163
　6.1　案例背景163
　6.2　数据介绍164
　6.3　建模分析165
6.3.1　目标定义165
6.3.2　数据处理166
6.3.3　模型构建167
　6.4　三种方法对比180
　6.5　代码展示182
　6.6　扩展思考：基于规则的特征衍生186
　6.7　本章小结188
第7章　银行理财产品推荐建模分析189
　7.1　场景介绍189
7.1.1　推荐系统190
7.1.2　银行中的推荐系统193
　7.2　数据介绍196
7.2.1　推荐场景数据特点196
7.2.2　Santander数据集197
　7.3　建模分析199
7.3.1　数据处理199
7.3.2　模型构建200
7.3.3　模型结果评估204
　7.4　案例分析208
　7.5　本章小结211

猜您喜欢

机器学习算法入门

MLOps工程实践

机器学习的算法分析和实践