书籍详情
PMML建模标准语言基础
作者:潘风文
出版社:化学工业出版社有限公司
出版时间:2019-06-01
ISBN:9787122342584
定价:¥89.00
购买这本书可以去
内容简介
本书结合实际案例介绍了PMML语言的各个组成元素,包括数据字典、挖掘模式/架构、数据转换、模型定义、输出、目标、模型解释、模型验证等元素,并介绍了表述数据挖掘模型的PMML实例文档创建流程;同时也对各种PMML元素中涉及的一些统计知识做了必要介绍。通过学习,读者可以完整地了解和掌握PMML语言,将其应用于数据挖掘建模。 本书可供从事数据挖掘(机器学习)、人工智能系统开发的软件开发者和爱好者学习使用,也可以作为高等院校大数据等相关专业的教材。
作者简介
暂缺《PMML建模标准语言基础》作者简介
目录
1 XML基础 1
1.1 XML的发展、技术体系及应用 2
1.1.1 标记语言和SGML 2
1.1.2 XML的特点和应用 4
1.1.3 XML技术体系 5
1.1.4 基于XML的应用标准简介 15
1.2 XML文档结构 24
1.2.1 XML文档头部 25
1.2.2 XML文档正文 30
1.3 XML Schema 35
1.3.1 XML Schema文档结构 36
1.3.2 XML Schema数据类型 40
1.3.3 元素内容 57
1.3.4 属性组 61
1.3.5 定义和使用实体 64
1.3.6 注释 65
1.3.7 构建内容模型 66
1.4 命名空间 69
1.4.1 目标命名空间和非限定本地声明 70
1.4.2 限定本地声明 73
1.4.3 全局和局部声明 76
1.4.4 未声明的目标命名空间 77
1.5 XML文档验证 78
1.6 XML Schema使用案例 79
1.6.1 XML处理库lxml的安装 80
1.6.2 使用lxml创建XML文档 80
1.6.3 使用lxml解析XML文档 85
1.6.4 使用lxml验证XML文档 88
本章小结 91
2 数据挖掘与PMML 93
2.1 数据挖掘简介 94
2.2 数据挖掘流程标准 95
2.3 数据挖掘系统 99
2.4 PMML的出现 101
本章小结 103
3 PMML基础知识 104
3.1 PMML概述 105
3.2 PMML文档结构 107
3.2.1 头部Header 110
3.2.2 挖掘任务MiningBuildTask 112
3.2.3 数据字典DataDictionary 113
3.2.4 转换字典TransformationDictionary 127
3.2.5 MODEL-ELEMENT序列 176
3.2.6 扩展Extension 178
3.3 PMML规范中的命名规则 180
3.4 PMML规范中的数据类型 180
3.4.1 基本数据类型 180
3.4.2 简单数组类型 182
3.4.3 稀疏数组类型 184
3.4.4 矩阵类型 186
3.5 变量的作用范围 189
3.6 非评分模型 193
本章小结 194
4 模型的输入和输出 195
4.1 元素MiningSchema 196
4.2 模型目标变量集合 201
4.2.1 目标变量集元素Targets 202
4.2.2 目标变量元素Target 203
4.2.3 目标变量值元素Targetvalue 204
4.2.4 实例介绍 205
4.3 模型输出变量集合 206
4.3.1 结果输出元素Output 207
4.3.2 输出字段元素OutputField 211
4.3.3 决策集元素Decisions 214
4.3.4 模型输出结果表 214
4.3.5 实例介绍 216
本章小结 219
5 模型的统计信息 220
5.1 单元统计元素UnivariateStats 221
5.1.1 计数元素Counts 222
5.1.2 数值信息元素NumericInfo 223
5.1.3 离散变量统计元素DiscrStats 225
5.1.4 连续变量统计元素ContStats 226
5.1.5 实例介绍 227
5.2 单因素方差分析元素Anova 228
5.2.1 单因素方差分析元素Anova的定义 229
5.2.2 方差分析 230
5.2.3 实例介绍 232
5.3 多元统计元素MultivariateStats 234
5.4 分区元素Partition 237
本章小结 241
6 模型验证 242
6.1 模型验证元素ModelVerification 243
6.2 模型验证规则 245
6.3 实例介绍 249
本章小结 255
7 模型解释 256
7.1 单变量统计元素UnivariateStats 258
7.2 分区元素Partition 258
7.3 预测模型质量指标元素PredictiveModelQuality 258
7.4 聚类模型质量指标元素ClusteringModelQuality 262
7.5 混淆矩阵 263
7.5.1 混淆矩阵基本知识 263
7.5.2 混淆矩阵元素ConfusionMatrix 265
7.6 接收者操作特征曲线ROC 267
7.6.1 ROC基本知识 267
7.6.2 ROC曲线元素ROC 269
7.7 增益/提升图 271
7.7.1 增益 272
7.7.2 提升度 272
7.7.3 提升图元素ModelLiftGraph 274
7.8 字段(变量)相关性指标 282
本章小结 285
8 PMML实际案例 287
8.1 构建PMML实例文档 289
8.2 使用PMML实例文档 294
1.1 XML的发展、技术体系及应用 2
1.1.1 标记语言和SGML 2
1.1.2 XML的特点和应用 4
1.1.3 XML技术体系 5
1.1.4 基于XML的应用标准简介 15
1.2 XML文档结构 24
1.2.1 XML文档头部 25
1.2.2 XML文档正文 30
1.3 XML Schema 35
1.3.1 XML Schema文档结构 36
1.3.2 XML Schema数据类型 40
1.3.3 元素内容 57
1.3.4 属性组 61
1.3.5 定义和使用实体 64
1.3.6 注释 65
1.3.7 构建内容模型 66
1.4 命名空间 69
1.4.1 目标命名空间和非限定本地声明 70
1.4.2 限定本地声明 73
1.4.3 全局和局部声明 76
1.4.4 未声明的目标命名空间 77
1.5 XML文档验证 78
1.6 XML Schema使用案例 79
1.6.1 XML处理库lxml的安装 80
1.6.2 使用lxml创建XML文档 80
1.6.3 使用lxml解析XML文档 85
1.6.4 使用lxml验证XML文档 88
本章小结 91
2 数据挖掘与PMML 93
2.1 数据挖掘简介 94
2.2 数据挖掘流程标准 95
2.3 数据挖掘系统 99
2.4 PMML的出现 101
本章小结 103
3 PMML基础知识 104
3.1 PMML概述 105
3.2 PMML文档结构 107
3.2.1 头部Header 110
3.2.2 挖掘任务MiningBuildTask 112
3.2.3 数据字典DataDictionary 113
3.2.4 转换字典TransformationDictionary 127
3.2.5 MODEL-ELEMENT序列 176
3.2.6 扩展Extension 178
3.3 PMML规范中的命名规则 180
3.4 PMML规范中的数据类型 180
3.4.1 基本数据类型 180
3.4.2 简单数组类型 182
3.4.3 稀疏数组类型 184
3.4.4 矩阵类型 186
3.5 变量的作用范围 189
3.6 非评分模型 193
本章小结 194
4 模型的输入和输出 195
4.1 元素MiningSchema 196
4.2 模型目标变量集合 201
4.2.1 目标变量集元素Targets 202
4.2.2 目标变量元素Target 203
4.2.3 目标变量值元素Targetvalue 204
4.2.4 实例介绍 205
4.3 模型输出变量集合 206
4.3.1 结果输出元素Output 207
4.3.2 输出字段元素OutputField 211
4.3.3 决策集元素Decisions 214
4.3.4 模型输出结果表 214
4.3.5 实例介绍 216
本章小结 219
5 模型的统计信息 220
5.1 单元统计元素UnivariateStats 221
5.1.1 计数元素Counts 222
5.1.2 数值信息元素NumericInfo 223
5.1.3 离散变量统计元素DiscrStats 225
5.1.4 连续变量统计元素ContStats 226
5.1.5 实例介绍 227
5.2 单因素方差分析元素Anova 228
5.2.1 单因素方差分析元素Anova的定义 229
5.2.2 方差分析 230
5.2.3 实例介绍 232
5.3 多元统计元素MultivariateStats 234
5.4 分区元素Partition 237
本章小结 241
6 模型验证 242
6.1 模型验证元素ModelVerification 243
6.2 模型验证规则 245
6.3 实例介绍 249
本章小结 255
7 模型解释 256
7.1 单变量统计元素UnivariateStats 258
7.2 分区元素Partition 258
7.3 预测模型质量指标元素PredictiveModelQuality 258
7.4 聚类模型质量指标元素ClusteringModelQuality 262
7.5 混淆矩阵 263
7.5.1 混淆矩阵基本知识 263
7.5.2 混淆矩阵元素ConfusionMatrix 265
7.6 接收者操作特征曲线ROC 267
7.6.1 ROC基本知识 267
7.6.2 ROC曲线元素ROC 269
7.7 增益/提升图 271
7.7.1 增益 272
7.7.2 提升度 272
7.7.3 提升图元素ModelLiftGraph 274
7.8 字段(变量)相关性指标 282
本章小结 285
8 PMML实际案例 287
8.1 构建PMML实例文档 289
8.2 使用PMML实例文档 294
猜您喜欢