书籍详情
数据仓库与数据挖掘
作者:陈文伟,黄金才编著
出版社:人民邮电出版社
出版时间:2004-01-01
ISBN:9787115119025
定价:¥24.00
购买这本书可以去
内容简介
数据仓库(DW)与数据挖掘(DM)是20世纪90年代中期兴起的新技术。数据仓库用于决策分析,数据挖掘用于从数据库中发现知识。数据仓库和数据挖掘的结合为决策支持系统(DSS)开辟了新方向,它们也是商业智能(BI)的主要技术。本书主要介绍数据仓库系统、数据仓库的数据获取与管理、数据仓库的设计和开发、联机分析处理(OLAP)、数据挖掘与文本挖掘、决策树方法、粗糙集方法与关联规则挖掘、公式发现、神经网络与遗传算法、基于案例推理、决策支持系统与商业智能等内容。本书包含了作者多年来在数据仓库与数据挖掘中的研究成果。本书可作大学计算机专业、管理科学与工程专业、系统工程专业等高年级本科生与研究生课程的教材,也可以作有关学科科技人员的参考书。
作者简介
暂缺《数据仓库与数据挖掘》作者简介
目录
第1章 数据仓库与数据挖掘概述 1
1.1 数据仓库概念 1
1.1.1 数据仓库的兴起 1
1.1.2 数据仓库的特点 2
1.1.3 数据集市 3
1.2 知识发现和数据挖掘概念 4
1.2.1 知识发现和数据挖掘的定义 4
1.2.2 数据挖掘任务 5
1.2.3 数据挖掘分类 7
1.2.4 数据挖掘对象 8
1.2.5 数据挖掘的知识表示 10
1.3 数据挖掘方法和技术 13
1.3.1 归纳学习方法 13
1.3.2 仿生物技术 14
1.3.3 公式发现 15
1.3.4 统计分析方法 15
1.3.5 模糊数学方法 16
1.3.6 可视化技术 16
1.4 数据仓库和数据挖掘的发展 16
1.4.1 数据仓库和数据挖掘的结合 16
1.4.2 新决策支持系统和综合决策支持系统 18
1.4.3 商业智能和知识管理 19
习题1 20
第2章 数据仓库系统 22
2.1 数据仓库组织结构 22
2.1.1 数据仓库结构 22
2.1.2 数据仓库系统结构 23
2.1.3 数据仓库的运行结构 24
2.1.4 数据集市结构 25
2.2 数据仓库存储的数据模型 26
2.2.1 星型模型 27
2.2.2 雪花模型 28
2.2.3 星网模型 28
2.3 元数据 28
2.3.1 元数据概念 28
2.3.2 关于数据源的元数据 29
2.3.3 关于数据模型的元数据 30
2.3.4 关于数据仓库映射的元数据 30
2.3.5 关于数据仓库使用的元数据 32
习题2 32
第3章 数据仓库的数据获取与管理 33
3.1 数据仓库的数据获取 33
3.1.1 数据质量 33
3.1.2 数据变换 34
3.1.3 数据清理 35
3.1.4 数据集成 35
3.1.5 聚集和概括 36
3.1.6 装载数据 37
3.2 数据管理 37
3.2.1 数据管理概述 37
3.2.2 脏数据的产生和清理 39
3.2.3 休眠数据 39
3.2.4 元数据管理 40
3.3 系统管理 41
3.3.1 服务水平 42
3.3.2 性能监控 43
3.3.3 存储器管理 46
3.3.4 网络管理 47
3.3.5 安全管理 47
习题3 48
第4章 数据仓库的设计、开发与应用 50
4.1 数据仓库设计 50
4.1.1 “数据驱动”的系统设计方法 50
4.1.2 概念模型设计 51
4.1.3 逻辑模型设计 52
4.1.4 物理模型设计 54
4.2 多维表设计 55
4.2.1 主题与多维表 55
4.2.2 多维表设计步骤 55
4.2.3 多维表设计示例 56
4.3 数据仓库的查询与索引技术 58
4.3.1 数据仓库查询 58
4.3.2 位索引技术 59
4.3.3 标识技术 61
4.3.4 广义索引 63
4.4 数据仓库开发 64
4.4.1 数据仓库规划 64
4.4.2 定义体系结构 64
4.4.3 数据仓库设计 65
4.4.4 源系统分析与数据变换设计 66
4.4.5 建立数据仓库 67
4.4.6 用户访问方法的设计和开发 67
4.5 数据仓库发展阶段与应用实例 68
4.5.1 数据仓库的5个发展阶段 68
4.5.2 数据仓库的应用实例 71
习题4 77
第5章 联机分析处理 78
5.1 OLAP概念 78
5.1.1 OLAP的定义 78
5.1.2 OLAP准则 79
5.1.3 OLAP的基本概念 82
5.1.4 OLAP与OLTP的关系与比较 83
5.2 OLAP的数据组织 84
5.2.1 关系数据组织ROLAP 85
5.2.2 多维数据组织MOLAP 85
5.2.3 两种数据组织的比较 85
5.3 OLAP的多维数据分析 86
5.3.1 基本功能 86
5.3.2 广义OLAP功能 88
5.3.3 OLAP实例 89
5.4 OLAP的体系结构 90
5.4.1 OLAP的多层结构 90
5.4.2 OLAP的Web结构 91
5.5 OLAP工具及评价 94
5.5.1 Oracle OLAP工具 94
5.5.2 OLAP工具评价指标 98
习题5 100
第6章 文本数据挖掘与Web挖掘 101
6.1 文本数据挖掘概述 101
6.1.1 文本挖掘出现 101
6.1.2 文本挖掘的基本概念 101
6.1.3 文本挖掘与信息检索 102
6.2 文本特征表示与提取 103
6.2.1 文本特征的表示 103
6.2.2 文本的特征提取 104
6.3 文本挖掘 105
6.3.1 文本分类 105
6.3.2 关联分析 106
6.3.3 文档聚类 106
6.4 Web挖掘 107
6.4.1 Web信息的特点 107
6.4.2 Web挖掘分类 108
6.4.3 Web结构的挖掘 109
6.4.4 Web使用记录的挖掘 110
习题6 112
第7章 决策树方法 113
7.1 决策树方法综述 113
7.1.1 决策树概念 113
7.1.2 信息论原理 113
7.2 ID3方法 117
7.2.1 ID3基本思想 117
7.2.2 ID3算法 118
7.2.3 实例计算 119
7.2.4 对ID3的讨论 120
7.3 C4.5方法 121
7.3.1 构造决策树 121
7.3.2 连续属性的处理 122
7.3.3 决策树剪枝 123
7.3.4 从决策树抽取规则 123
7.4 IBLE方法 125
7.4.1 IBLE算法 125
7.4.2 简例和实例 129
习题7 135
第8章 粗糙集方法与关联规则挖掘 137
8.1 粗糙集理论 137
8.1.1 粗糙集概念 137
8.1.2 最小属性集 138
8.2 粗糙集的规则获取与应用 139
8.2.1 获取规则 139
8.2.2 应用实例 140
8.3 关联规则挖掘算法 143
8.3.1 关联规则的挖掘原理 143
8.3.2 关联规则的种类 145
8.3.3 关联规则价值的衡量方法 146
8.4 关联规则挖掘算法 147
8.4.1 Apriori算法 147
8.4.2 示例 149
8.5 基于FP-tree的关联规则挖掘算法 150
8.5.1 算法描述 150
8.5.2 示例说明 151
习题8 151
第9章 公式发现 153
9.1 机器发现概述 153
9.2 BACON系统 154
9.2.1 BACON系统简介 154
9.2.2 BACON系统的应用 155
9.3 FDD公式发现算法 156
9.3.1 FDD.1 156
9.3.2 FDD.2 163
9.3.3 FDD.3 167
习题9 172
第10章 神经网络与遗传算法 173
10.1 神经网络的概念及几何意义 173
10.1.1 神经网络概念 173
10.1.2 神经网络的几何意义 174
10.2 反向传播模型(BP) 176
10.2.1 BP网络结构 176
10.2.2 BP网络学习公式推导 177
10.2.3 实例分析 180
10.3 超曲面神经网络 183
10.3.1 超曲面神经网络概念 183
10.3.2 超圆神经元模型CC 183
10.4 遗传算法原理 190
10.4.1 遗传算法处理流程 191
10.4.2 遗传算子 192
10.4.3 遗传算法的特点 196
10.5 基于遗传的分类学习系统 197
10.5.1 概述 197
10.5.2 遗传分类学习系统GCLS的基本原理 197
10.5.3 遗传分类器学习系统GCLS的应用 201
习题10 202
第11章 基于案例推理 204
11.1 基于案例推理(CBR)的概念与原理 204
11.1.1 CBR概念 204
11.1.2 CBR的一般过程 204
11.2 案例表示和案例库 206
11.2.1 案例表示 206
11.2.2 案例库 208
11.3 案例检索与相似匹配 209
11.3.1 案例检索 209
11.3.2 案例相似匹配 210
11.4 专家系统原理与CBR的比较 211
11.4.1 专家系统(ES)原理 211
11.4.2 ES与CBR的比较 213
11.4.3 ES与CBR的结合 213
11.5 医疗事故辅助鉴定与管理系统实例 214
11.5.1 系统综述 214
11.5.2 医疗事故鉴定专家系统 215
11.5.3 基于案例推理(CBR)的医疗事故鉴定 216
习题11 217
第12章 决策支持系统与商业智能 218
12.1 传统决策支持系统 218
12.1.1 传统决策支持系统概念 218
12.1.2 传统决策支持系统的进展 219
12.1.3 传统决策支持系统的关键技术和开发的困难 220
12.2 基于数据仓库、联机分析处理和数据挖掘的新决策支持系统 221
12.2.1 新决策支持系统 221
12.2.2 新决策支持系统实例 222
12.3 综合决策支持系统 224
12.3.1 传统决策支持系统与新决策支持系统的比较 224
12.3.2 综合决策支持系统结构和原理 225
12.4 商业智能和知识管理 227
12.4.1 商业智能 227
12.4.2 知识管理 235
12.4.3 商业智能是知识管理的基础 244
12.5 小结 247
习题12 248
参考文献 249
1.1 数据仓库概念 1
1.1.1 数据仓库的兴起 1
1.1.2 数据仓库的特点 2
1.1.3 数据集市 3
1.2 知识发现和数据挖掘概念 4
1.2.1 知识发现和数据挖掘的定义 4
1.2.2 数据挖掘任务 5
1.2.3 数据挖掘分类 7
1.2.4 数据挖掘对象 8
1.2.5 数据挖掘的知识表示 10
1.3 数据挖掘方法和技术 13
1.3.1 归纳学习方法 13
1.3.2 仿生物技术 14
1.3.3 公式发现 15
1.3.4 统计分析方法 15
1.3.5 模糊数学方法 16
1.3.6 可视化技术 16
1.4 数据仓库和数据挖掘的发展 16
1.4.1 数据仓库和数据挖掘的结合 16
1.4.2 新决策支持系统和综合决策支持系统 18
1.4.3 商业智能和知识管理 19
习题1 20
第2章 数据仓库系统 22
2.1 数据仓库组织结构 22
2.1.1 数据仓库结构 22
2.1.2 数据仓库系统结构 23
2.1.3 数据仓库的运行结构 24
2.1.4 数据集市结构 25
2.2 数据仓库存储的数据模型 26
2.2.1 星型模型 27
2.2.2 雪花模型 28
2.2.3 星网模型 28
2.3 元数据 28
2.3.1 元数据概念 28
2.3.2 关于数据源的元数据 29
2.3.3 关于数据模型的元数据 30
2.3.4 关于数据仓库映射的元数据 30
2.3.5 关于数据仓库使用的元数据 32
习题2 32
第3章 数据仓库的数据获取与管理 33
3.1 数据仓库的数据获取 33
3.1.1 数据质量 33
3.1.2 数据变换 34
3.1.3 数据清理 35
3.1.4 数据集成 35
3.1.5 聚集和概括 36
3.1.6 装载数据 37
3.2 数据管理 37
3.2.1 数据管理概述 37
3.2.2 脏数据的产生和清理 39
3.2.3 休眠数据 39
3.2.4 元数据管理 40
3.3 系统管理 41
3.3.1 服务水平 42
3.3.2 性能监控 43
3.3.3 存储器管理 46
3.3.4 网络管理 47
3.3.5 安全管理 47
习题3 48
第4章 数据仓库的设计、开发与应用 50
4.1 数据仓库设计 50
4.1.1 “数据驱动”的系统设计方法 50
4.1.2 概念模型设计 51
4.1.3 逻辑模型设计 52
4.1.4 物理模型设计 54
4.2 多维表设计 55
4.2.1 主题与多维表 55
4.2.2 多维表设计步骤 55
4.2.3 多维表设计示例 56
4.3 数据仓库的查询与索引技术 58
4.3.1 数据仓库查询 58
4.3.2 位索引技术 59
4.3.3 标识技术 61
4.3.4 广义索引 63
4.4 数据仓库开发 64
4.4.1 数据仓库规划 64
4.4.2 定义体系结构 64
4.4.3 数据仓库设计 65
4.4.4 源系统分析与数据变换设计 66
4.4.5 建立数据仓库 67
4.4.6 用户访问方法的设计和开发 67
4.5 数据仓库发展阶段与应用实例 68
4.5.1 数据仓库的5个发展阶段 68
4.5.2 数据仓库的应用实例 71
习题4 77
第5章 联机分析处理 78
5.1 OLAP概念 78
5.1.1 OLAP的定义 78
5.1.2 OLAP准则 79
5.1.3 OLAP的基本概念 82
5.1.4 OLAP与OLTP的关系与比较 83
5.2 OLAP的数据组织 84
5.2.1 关系数据组织ROLAP 85
5.2.2 多维数据组织MOLAP 85
5.2.3 两种数据组织的比较 85
5.3 OLAP的多维数据分析 86
5.3.1 基本功能 86
5.3.2 广义OLAP功能 88
5.3.3 OLAP实例 89
5.4 OLAP的体系结构 90
5.4.1 OLAP的多层结构 90
5.4.2 OLAP的Web结构 91
5.5 OLAP工具及评价 94
5.5.1 Oracle OLAP工具 94
5.5.2 OLAP工具评价指标 98
习题5 100
第6章 文本数据挖掘与Web挖掘 101
6.1 文本数据挖掘概述 101
6.1.1 文本挖掘出现 101
6.1.2 文本挖掘的基本概念 101
6.1.3 文本挖掘与信息检索 102
6.2 文本特征表示与提取 103
6.2.1 文本特征的表示 103
6.2.2 文本的特征提取 104
6.3 文本挖掘 105
6.3.1 文本分类 105
6.3.2 关联分析 106
6.3.3 文档聚类 106
6.4 Web挖掘 107
6.4.1 Web信息的特点 107
6.4.2 Web挖掘分类 108
6.4.3 Web结构的挖掘 109
6.4.4 Web使用记录的挖掘 110
习题6 112
第7章 决策树方法 113
7.1 决策树方法综述 113
7.1.1 决策树概念 113
7.1.2 信息论原理 113
7.2 ID3方法 117
7.2.1 ID3基本思想 117
7.2.2 ID3算法 118
7.2.3 实例计算 119
7.2.4 对ID3的讨论 120
7.3 C4.5方法 121
7.3.1 构造决策树 121
7.3.2 连续属性的处理 122
7.3.3 决策树剪枝 123
7.3.4 从决策树抽取规则 123
7.4 IBLE方法 125
7.4.1 IBLE算法 125
7.4.2 简例和实例 129
习题7 135
第8章 粗糙集方法与关联规则挖掘 137
8.1 粗糙集理论 137
8.1.1 粗糙集概念 137
8.1.2 最小属性集 138
8.2 粗糙集的规则获取与应用 139
8.2.1 获取规则 139
8.2.2 应用实例 140
8.3 关联规则挖掘算法 143
8.3.1 关联规则的挖掘原理 143
8.3.2 关联规则的种类 145
8.3.3 关联规则价值的衡量方法 146
8.4 关联规则挖掘算法 147
8.4.1 Apriori算法 147
8.4.2 示例 149
8.5 基于FP-tree的关联规则挖掘算法 150
8.5.1 算法描述 150
8.5.2 示例说明 151
习题8 151
第9章 公式发现 153
9.1 机器发现概述 153
9.2 BACON系统 154
9.2.1 BACON系统简介 154
9.2.2 BACON系统的应用 155
9.3 FDD公式发现算法 156
9.3.1 FDD.1 156
9.3.2 FDD.2 163
9.3.3 FDD.3 167
习题9 172
第10章 神经网络与遗传算法 173
10.1 神经网络的概念及几何意义 173
10.1.1 神经网络概念 173
10.1.2 神经网络的几何意义 174
10.2 反向传播模型(BP) 176
10.2.1 BP网络结构 176
10.2.2 BP网络学习公式推导 177
10.2.3 实例分析 180
10.3 超曲面神经网络 183
10.3.1 超曲面神经网络概念 183
10.3.2 超圆神经元模型CC 183
10.4 遗传算法原理 190
10.4.1 遗传算法处理流程 191
10.4.2 遗传算子 192
10.4.3 遗传算法的特点 196
10.5 基于遗传的分类学习系统 197
10.5.1 概述 197
10.5.2 遗传分类学习系统GCLS的基本原理 197
10.5.3 遗传分类器学习系统GCLS的应用 201
习题10 202
第11章 基于案例推理 204
11.1 基于案例推理(CBR)的概念与原理 204
11.1.1 CBR概念 204
11.1.2 CBR的一般过程 204
11.2 案例表示和案例库 206
11.2.1 案例表示 206
11.2.2 案例库 208
11.3 案例检索与相似匹配 209
11.3.1 案例检索 209
11.3.2 案例相似匹配 210
11.4 专家系统原理与CBR的比较 211
11.4.1 专家系统(ES)原理 211
11.4.2 ES与CBR的比较 213
11.4.3 ES与CBR的结合 213
11.5 医疗事故辅助鉴定与管理系统实例 214
11.5.1 系统综述 214
11.5.2 医疗事故鉴定专家系统 215
11.5.3 基于案例推理(CBR)的医疗事故鉴定 216
习题11 217
第12章 决策支持系统与商业智能 218
12.1 传统决策支持系统 218
12.1.1 传统决策支持系统概念 218
12.1.2 传统决策支持系统的进展 219
12.1.3 传统决策支持系统的关键技术和开发的困难 220
12.2 基于数据仓库、联机分析处理和数据挖掘的新决策支持系统 221
12.2.1 新决策支持系统 221
12.2.2 新决策支持系统实例 222
12.3 综合决策支持系统 224
12.3.1 传统决策支持系统与新决策支持系统的比较 224
12.3.2 综合决策支持系统结构和原理 225
12.4 商业智能和知识管理 227
12.4.1 商业智能 227
12.4.2 知识管理 235
12.4.3 商业智能是知识管理的基础 244
12.5 小结 247
习题12 248
参考文献 249
猜您喜欢