书籍详情
智能风控:评分卡建模原理、方法与风控策略构建
作者:张伟 著
出版社:机械工业出版社
出版时间:2021-12-01
ISBN:9787111695677
定价:¥89.00
购买这本书可以去
内容简介
这是一部系统讲解评分卡建模的智能风控著作,从业务与技术、理论与实践、传统风控与智能风控等角度透彻讲解评分卡建模的原理、流程、方法及其风控策略构建。作者在智能风控领域深耕十余年,既熟悉商业银行传统风控体系思想、方法、技术、工具,又熟悉人工智能背景下的创新智能风控相关解决方案、风险策略和风险建模技术,本书是作者实践经验的系统性总结。本书内容分为六部分。第1部分(第1章)介绍评分卡建模基础知识,包括评分卡模型的概念和定义、评分卡建模全流程、评分卡模型的评价等。第二部分(第2章)介绍银行零售信贷领域产品特征和业务流程,以及信用风险和欺诈风险概念,介绍评分卡的应用场景和业务基础知识。第三部分(第3~11章)系统介绍评分建模的全流程,覆盖需求理解、数据理解、特征工程、模型设计、模型开发、模型验证、模型部署、模型监控、模型优化等模型全生命周期各环节。第四部分(第12~14章)总结了评分建模的关键问题及其解决方案,包括拒绝推断、模型可解释性等,以及模型开发过程中诸如分布不均衡、模型性能下降、模型迭代漂移等问题。第五部分(第15章)介绍了当前业界除评分卡外使用频率Z高的高维机器学习技术,比较了传统评分卡模型和高维机器学习模型,并重点介绍了XGBoost和LightGBM模型。第六部分(第16章)以贷前自动化审批场景为例,介绍基于评分的自动化审批策略构建,帮助读者理解评分卡模型在风险策略设计中的应用。
作者简介
张伟(笔名:上善若愚)金融科技公司技术合伙人、高级风控总监及解决方案专家,前FICO风险评分建模与风控业务策略专家。在金融风险管理和智能风控领域有近15年工作经验,擅长业务策略、量化建模、解决方案、风控体系建设,专注于商业银行、消费金融和金融科技行业,在智能风控策略模型数据决策体系建设、风险业务架构和技术架构、信用风险业务策略与量化模型、信贷资产组合管理、金融资产定价与风险管理、业务安全技术、巴塞尔新资本协议等方面积累了丰富的工作经验。曾作为技术专家或行业专家多次受邀出席上海市政府组织的行业产业联盟研讨调研座谈,多次受邀出席金融科技领域行业论坛并做主题演讲或圆桌讨论,多次接受主流金融科技媒体和财经媒体采访,并受聘为上海交通大学上海高金金融研究院研究员和华东理工大学商学院职业导师。
目录
赞誉
序1
序2
序3
前言
第1章 评分卡建模理论基础 1
1.1 评分卡建模常见面试问题 1
1.2 关于模型的系统性理解 2
1.3 与建模密切相关的4个领域 3
1.3.1 机器学习 3
1.3.2 数据挖掘 4
1.3.3 数据分析 4
1.3.4 统计分析 5
1.3.5 四者之间的联系与区别 5
1.4 评分模型与评分卡模型 6
1.4.1 评分模型和评分卡模型的定义 6
1.4.2 评分卡模型的分类 6
1.4.3 评分卡模型的适用性 7
1.4.4 评分卡模型的价值 8
1.4.5 评分卡模型的应用 9
1.5 评分卡建模全流程 9
1.6 对评分卡模型的评价 10
1.7 本章小结 11
第2章 零售信贷业务基础和风险管理 12
2.1 银行零售信贷产品的产品特征和业务流程 12
2.1.1 个人贷款 13
2.1.2 信用卡 17
2.2 信用与信用风险 21
2.2.1 信用风险识别 22
2.2.2 信用风险评估 23
2.2.3 信用风险监测 24
2.2.4 信用风险控制 24
2.2.5 征信 25
2.3 欺诈与欺诈风险 26
2.3.1 欺诈风险的分类 27
2.3.2 欺诈风险的防范 27
2.3.3 欺诈风险与信用风险比较 27
2.4 本章小结 28
第3章 业务需求理解 29
3.1 业务需求理解概述 29
3.2 明确拟解决问题和分析目标 29
3.3 业务访谈的设计和实施 30
3.4 整体分析方案设计 31
3.5 本章小结 32
第4章 数据基础决定模型效果上限 33
4.1 关于数据的系统性认识 33
4.1.1 数据基本特征 33
4.1.2 常见数据问题 36
4.2 传统信贷业务数据 37
4.2.1 贷款可用数据 38
4.2.2 信用卡可用数据 38
4.3 征信数据 39
4.3.1 征信数据概述 39
4.3.2 一代人行征信 40
4.3.3 二代人行征信 41
4.3.4 一、二代人行征信的差异及映射转换 42
4.3.5 人行征信数据的使用 43
4.4 内外部大数据 44
4.4.1 大数据概述 44
4.4.2 银行内部大数据 45
4.4.3 银行外部大数据 45
4.5 数据质量诊断 46
4.5.1 数据质量诊断目的 46
4.5.2 数据质量诊断方法 47
4.6 业务数据分析 48
4.6.1 业务数据分析目的 48
4.6.2 业务数据分析方法 49
4.7 本章小结 49
第5章 利用特征工程提取有效的风险特征 50
5.1 特征工程概述 50
5.1.1 特征与特征工程 50
5.1.2 数据处理与特征工程流程 51
5.1.3 特征工程的理论体系 51
5.1.4 特征工程的抽象范式 52
5.2 特征预处理与转换 53
5.2.1 常见数据质量问题 53
5.2.2 特征清洗与预处理 53
5.2.3 特征编码 54
5.2.4 特征转换 55
5.3 特征提取与生成 56
5.3.1 业务专家经验定义 56
5.3.2 工程化自动化衍生 56
5.3.3 表征学习 58
5.4 特征评价、选择与降维 62
5.4.1 特征评价 62
5.4.2 特征选择与降维 63
5.5 自动化特征工程技术与工具 65
5.5.1 自动化特征工程概述 65
5.5.2 自动化特征工程工具 66
5.6 本章小结 74
第6章 评分卡模型设计 75
6.1 模型设计概述 75
6.1.1 模型设计的定义 75
6.1.2 模型设计的工作内容 76
6.2 排除规则与样本范围 76
6.2.1 排除规则和样本范围的定义 76
6.2.2 申请评分卡模型排除规则 77
6.2.3 行为评分卡模型排除规则 77
6.2.4 催收评分卡模型排除规则 78
6.3 模型细分 79
6.4 表现期定义与Vintage分析 80
6.4.1 表现期定义 80
6.4.2 Vintage分析 80
6.5 滚动率 83
6.5.1 滚动率定义 83
6.5.2 滚动率分析 84
6.5.3 滚动率计算常见问题 84
6.6 观察期的定义与选择 85
6.6.1 观察期的定义 85
6.6.2 观察期的选择 85
6.7 模型设计汇总计数 86
6.7.1 汇总计数定义 87
6.7.2 汇总计数的特别说明 87
6.8 建模方式和模型原型选择 87
6.9 本章小结 88
第7章 评分卡模型开发 89
7.1 模型开发概述 89
7.2 样本分区 90
7.3 样本抽样 91
7.4 变量预筛选 93
7.5 变量分箱 94
7.6 变量再筛选 96
7.7 变量转换WOE 97
7.8 使用逻辑回归进行模型拟合 97
7.8.1 多重共线性检验 97
7.8.2 逻辑回归建模 98
7.8.3 模型训练结果 100
7.9 模型验证 101
7.9.1 排序性 101
7.9.2 区分能力 101
7.9.3 稳定性 103
7.9.4 分值集中度 103
7.9.5 分值分布 104
7.9.6 离散度 104
7.10 评分标尺 105
7.11 模型导出PMML并测试 107
7.12 评分卡建模专用Python包 108
7.12.1 scorecardpy工具包 108
7.12.2 toad工具包 108
7.12.3 RiskModeler工具包 109
7.13 评分卡建模实例 109
7
序1
序2
序3
前言
第1章 评分卡建模理论基础 1
1.1 评分卡建模常见面试问题 1
1.2 关于模型的系统性理解 2
1.3 与建模密切相关的4个领域 3
1.3.1 机器学习 3
1.3.2 数据挖掘 4
1.3.3 数据分析 4
1.3.4 统计分析 5
1.3.5 四者之间的联系与区别 5
1.4 评分模型与评分卡模型 6
1.4.1 评分模型和评分卡模型的定义 6
1.4.2 评分卡模型的分类 6
1.4.3 评分卡模型的适用性 7
1.4.4 评分卡模型的价值 8
1.4.5 评分卡模型的应用 9
1.5 评分卡建模全流程 9
1.6 对评分卡模型的评价 10
1.7 本章小结 11
第2章 零售信贷业务基础和风险管理 12
2.1 银行零售信贷产品的产品特征和业务流程 12
2.1.1 个人贷款 13
2.1.2 信用卡 17
2.2 信用与信用风险 21
2.2.1 信用风险识别 22
2.2.2 信用风险评估 23
2.2.3 信用风险监测 24
2.2.4 信用风险控制 24
2.2.5 征信 25
2.3 欺诈与欺诈风险 26
2.3.1 欺诈风险的分类 27
2.3.2 欺诈风险的防范 27
2.3.3 欺诈风险与信用风险比较 27
2.4 本章小结 28
第3章 业务需求理解 29
3.1 业务需求理解概述 29
3.2 明确拟解决问题和分析目标 29
3.3 业务访谈的设计和实施 30
3.4 整体分析方案设计 31
3.5 本章小结 32
第4章 数据基础决定模型效果上限 33
4.1 关于数据的系统性认识 33
4.1.1 数据基本特征 33
4.1.2 常见数据问题 36
4.2 传统信贷业务数据 37
4.2.1 贷款可用数据 38
4.2.2 信用卡可用数据 38
4.3 征信数据 39
4.3.1 征信数据概述 39
4.3.2 一代人行征信 40
4.3.3 二代人行征信 41
4.3.4 一、二代人行征信的差异及映射转换 42
4.3.5 人行征信数据的使用 43
4.4 内外部大数据 44
4.4.1 大数据概述 44
4.4.2 银行内部大数据 45
4.4.3 银行外部大数据 45
4.5 数据质量诊断 46
4.5.1 数据质量诊断目的 46
4.5.2 数据质量诊断方法 47
4.6 业务数据分析 48
4.6.1 业务数据分析目的 48
4.6.2 业务数据分析方法 49
4.7 本章小结 49
第5章 利用特征工程提取有效的风险特征 50
5.1 特征工程概述 50
5.1.1 特征与特征工程 50
5.1.2 数据处理与特征工程流程 51
5.1.3 特征工程的理论体系 51
5.1.4 特征工程的抽象范式 52
5.2 特征预处理与转换 53
5.2.1 常见数据质量问题 53
5.2.2 特征清洗与预处理 53
5.2.3 特征编码 54
5.2.4 特征转换 55
5.3 特征提取与生成 56
5.3.1 业务专家经验定义 56
5.3.2 工程化自动化衍生 56
5.3.3 表征学习 58
5.4 特征评价、选择与降维 62
5.4.1 特征评价 62
5.4.2 特征选择与降维 63
5.5 自动化特征工程技术与工具 65
5.5.1 自动化特征工程概述 65
5.5.2 自动化特征工程工具 66
5.6 本章小结 74
第6章 评分卡模型设计 75
6.1 模型设计概述 75
6.1.1 模型设计的定义 75
6.1.2 模型设计的工作内容 76
6.2 排除规则与样本范围 76
6.2.1 排除规则和样本范围的定义 76
6.2.2 申请评分卡模型排除规则 77
6.2.3 行为评分卡模型排除规则 77
6.2.4 催收评分卡模型排除规则 78
6.3 模型细分 79
6.4 表现期定义与Vintage分析 80
6.4.1 表现期定义 80
6.4.2 Vintage分析 80
6.5 滚动率 83
6.5.1 滚动率定义 83
6.5.2 滚动率分析 84
6.5.3 滚动率计算常见问题 84
6.6 观察期的定义与选择 85
6.6.1 观察期的定义 85
6.6.2 观察期的选择 85
6.7 模型设计汇总计数 86
6.7.1 汇总计数定义 87
6.7.2 汇总计数的特别说明 87
6.8 建模方式和模型原型选择 87
6.9 本章小结 88
第7章 评分卡模型开发 89
7.1 模型开发概述 89
7.2 样本分区 90
7.3 样本抽样 91
7.4 变量预筛选 93
7.5 变量分箱 94
7.6 变量再筛选 96
7.7 变量转换WOE 97
7.8 使用逻辑回归进行模型拟合 97
7.8.1 多重共线性检验 97
7.8.2 逻辑回归建模 98
7.8.3 模型训练结果 100
7.9 模型验证 101
7.9.1 排序性 101
7.9.2 区分能力 101
7.9.3 稳定性 103
7.9.4 分值集中度 103
7.9.5 分值分布 104
7.9.6 离散度 104
7.10 评分标尺 105
7.11 模型导出PMML并测试 107
7.12 评分卡建模专用Python包 108
7.12.1 scorecardpy工具包 108
7.12.2 toad工具包 108
7.12.3 RiskModeler工具包 109
7.13 评分卡建模实例 109
7
猜您喜欢