书籍详情
数据仓库与数据挖掘
作者:李雄飞,杜钦生,吴昊 著
出版社:机械工业出版社
出版时间:2013-10-01
ISBN:9787111436751
定价:¥39.00
购买这本书可以去
内容简介
《计算机科学与技术学科研究生教材:数据仓库与数据挖掘》第1章介绍数据仓库、数据挖掘的一般知识和应用领域。第2~8章介绍数据仓库和数据挖掘的理论和技术,其中第2、3章侧重数据仓库,重点阐述了数据仓库的架构、OLAP等内容,第4~8章侧重数据挖掘,重点阐述了关联规则、粗糙集、决策树、聚类分析和兴趣度量等内容。第9章给出了数据仓库与数据挖掘方面的应用案例。《计算机科学与技术学科研究生教材:数据仓库与数据挖掘》是为软件工程硕士量身定做的教材,也可作为计算机专业、信息类专业、管理类专业相关课程的教材和教学参考书。
作者简介
暂缺《数据仓库与数据挖掘》作者简介
目录
前言
教学建议
第1章 绪论
1.1 引言
1.2 数据仓库
1.2.1 从数据库到数据仓库
1.2.2 数据仓库的基本概念
1.2.3 数据仓库的体系结构
1.3 数据挖掘
1.3.1 KDD与数据挖掘
1.3.2 数据库与数据挖掘发展历程
1.3.3 数据挖掘的特征与对象
1.3.4 数据挖掘相关领域
1.4 数据仓库与数据挖掘的关系
1.5 应用前景与发展趋势
本章小结
习题
第2章 联机分析处理
2.1 引言
2.2 OLAP的定义
2.3 OLAP的相关概念
2.4 OLAP与OLTP的关系和比较
2.5 OLAP准则
2.6 多维数据分析方法
2.7 关系数据的组织
2.8 多维数据的存储方式
2.9 OLAP体系结构
2.10 OLAP的展现方式
2.11 OLAP工具的评价指标
2.12 OLAP的局限性
本章小结
习题
第3章 数据仓库的设计与开发
3.1 引言
3.2 数据仓库的数据模型概述
3.3 数据仓库的分析与设计
3.3.1 需求分析
3.3.2 概念模型设计
3.3.3 逻辑模型设计
3.3.4 物理模型设计
3.3.5 数据仓库的索引技术
3.4 数据仓库的开发
3.4.1 风险因素
3.4.2 数据仓库系统的生命周期
3.4.3 建立数据仓库系统的思维模式
3.4.4 数据仓库数据库的设计步骤
3.4.5 数据质量与数据清洗
3.4.6 数据粒度与维度建模
3.4.7 选择数据仓库工具
3.4.8 提高数据仓库性能
3.4.9 数据仓库的安全性
3.5 主要的数据仓库产品
本章小结
习题
第4章 关联规则
4.1 引言
4.2 关联规则模型
4.3 Apriori算法
4.3.1 发现频繁项集
4.3.2 生成关联规则
4.4 频繁模式增长算法
4.4.1 建树方法
4.4.2 用FP树挖掘频繁模式
4.5 关联规则模型扩展
4.5.1 多级关联规则
4.5.2 多维关联规则
本章小结
习题
第5章 粗糙集
5.1 引言
5.2 近似空间
5.2.1 近似空间与不可分辨关系
5.2.2 知识与知识库
5.3 近似与粗糙集
5.3.1 基本概念
5.3.2 基本性质
5.4 描述粗糙集的特征的方法
5.4.1 近似精度
5.4.2 拓扑特征
5.5 信息系统
5.5.1 信息系统的定义
5.5.2 约简和核
5.5.3 分辨矩阵与分辨函数
5.5.4 信息系统约简
5.6 决策表
5.6.1 相对约简与知识依赖性
5.6.2 决策表及其约简
5.6.3 近似约简算法
5.6.4 决策规则
本章小结
习题
第6章 决策树
6.1 引言
6.2 构建决策树的理论问题
6.2.1 为当前结点选择属性
6.2.2 过拟合问题
6.3 ID3算法
6.3.1 生成决策树的算法
6.3.2 生成规则和决策
6.4 决策树的剪枝
6.4.1 预剪枝
6.4.2 后剪枝
6.5 C4.5算法
本章小结
习题
第7章 聚类分析
7.1 引言
7.2 聚类分析简介
7.2.1 聚类分析
7.2.2 聚类分析应用领域与算法特征
7.3 数据类型、距离和相似系数
7.3.1 数据类型
7.3.2 距离和相似系数
7.4 聚类方法与聚类分类
7.4.1 聚类方法
7.4.2 聚类方法的分类
7.5 划分方法
7.5.1 k-均值算法
7.5.2 k-中心点算法
7.5.3 关于参数K
7.5.4 EM聚类
7.6 层次方法
7.6.1 层次聚类中的距离度量
7.6.2 分裂方法
7.6.3 凝聚方法
7.7 基于密度的方法
7.7.1 DBSCAN算法
7.7.2 矢量感应聚类算法
7.8 聚类评估
7.8.1 假设检验
7.8.2 聚类评估中的假设检验
7.8.3 相对准则
本章小结
习题
第8章 兴趣度量
8.1 引言
8.2 用于关联规则和分类规则的度量
8.2.1 客观度量
8.2.2 主观度量
8.2.3 语义度量
8.3 用于总结的度量
8.4 分类器的兴趣度
本章小结
习题
第9章 应用案例
9.1 数据仓库应用案例
9.1.1 案例一:网络购物数据仓库
9.1.2 案例二:社会保障卡数据仓库
9.1.3 案例三:医院信息系统数据仓库
9.2 数据挖掘应用案例
9.2.1 案例一:零售商系统货篮数据挖掘
9.2.2 案例二:通信用户满意度指数评测
9.2.3 案例三:城市环境质量评价
本章小结
参考文献
教学建议
第1章 绪论
1.1 引言
1.2 数据仓库
1.2.1 从数据库到数据仓库
1.2.2 数据仓库的基本概念
1.2.3 数据仓库的体系结构
1.3 数据挖掘
1.3.1 KDD与数据挖掘
1.3.2 数据库与数据挖掘发展历程
1.3.3 数据挖掘的特征与对象
1.3.4 数据挖掘相关领域
1.4 数据仓库与数据挖掘的关系
1.5 应用前景与发展趋势
本章小结
习题
第2章 联机分析处理
2.1 引言
2.2 OLAP的定义
2.3 OLAP的相关概念
2.4 OLAP与OLTP的关系和比较
2.5 OLAP准则
2.6 多维数据分析方法
2.7 关系数据的组织
2.8 多维数据的存储方式
2.9 OLAP体系结构
2.10 OLAP的展现方式
2.11 OLAP工具的评价指标
2.12 OLAP的局限性
本章小结
习题
第3章 数据仓库的设计与开发
3.1 引言
3.2 数据仓库的数据模型概述
3.3 数据仓库的分析与设计
3.3.1 需求分析
3.3.2 概念模型设计
3.3.3 逻辑模型设计
3.3.4 物理模型设计
3.3.5 数据仓库的索引技术
3.4 数据仓库的开发
3.4.1 风险因素
3.4.2 数据仓库系统的生命周期
3.4.3 建立数据仓库系统的思维模式
3.4.4 数据仓库数据库的设计步骤
3.4.5 数据质量与数据清洗
3.4.6 数据粒度与维度建模
3.4.7 选择数据仓库工具
3.4.8 提高数据仓库性能
3.4.9 数据仓库的安全性
3.5 主要的数据仓库产品
本章小结
习题
第4章 关联规则
4.1 引言
4.2 关联规则模型
4.3 Apriori算法
4.3.1 发现频繁项集
4.3.2 生成关联规则
4.4 频繁模式增长算法
4.4.1 建树方法
4.4.2 用FP树挖掘频繁模式
4.5 关联规则模型扩展
4.5.1 多级关联规则
4.5.2 多维关联规则
本章小结
习题
第5章 粗糙集
5.1 引言
5.2 近似空间
5.2.1 近似空间与不可分辨关系
5.2.2 知识与知识库
5.3 近似与粗糙集
5.3.1 基本概念
5.3.2 基本性质
5.4 描述粗糙集的特征的方法
5.4.1 近似精度
5.4.2 拓扑特征
5.5 信息系统
5.5.1 信息系统的定义
5.5.2 约简和核
5.5.3 分辨矩阵与分辨函数
5.5.4 信息系统约简
5.6 决策表
5.6.1 相对约简与知识依赖性
5.6.2 决策表及其约简
5.6.3 近似约简算法
5.6.4 决策规则
本章小结
习题
第6章 决策树
6.1 引言
6.2 构建决策树的理论问题
6.2.1 为当前结点选择属性
6.2.2 过拟合问题
6.3 ID3算法
6.3.1 生成决策树的算法
6.3.2 生成规则和决策
6.4 决策树的剪枝
6.4.1 预剪枝
6.4.2 后剪枝
6.5 C4.5算法
本章小结
习题
第7章 聚类分析
7.1 引言
7.2 聚类分析简介
7.2.1 聚类分析
7.2.2 聚类分析应用领域与算法特征
7.3 数据类型、距离和相似系数
7.3.1 数据类型
7.3.2 距离和相似系数
7.4 聚类方法与聚类分类
7.4.1 聚类方法
7.4.2 聚类方法的分类
7.5 划分方法
7.5.1 k-均值算法
7.5.2 k-中心点算法
7.5.3 关于参数K
7.5.4 EM聚类
7.6 层次方法
7.6.1 层次聚类中的距离度量
7.6.2 分裂方法
7.6.3 凝聚方法
7.7 基于密度的方法
7.7.1 DBSCAN算法
7.7.2 矢量感应聚类算法
7.8 聚类评估
7.8.1 假设检验
7.8.2 聚类评估中的假设检验
7.8.3 相对准则
本章小结
习题
第8章 兴趣度量
8.1 引言
8.2 用于关联规则和分类规则的度量
8.2.1 客观度量
8.2.2 主观度量
8.2.3 语义度量
8.3 用于总结的度量
8.4 分类器的兴趣度
本章小结
习题
第9章 应用案例
9.1 数据仓库应用案例
9.1.1 案例一:网络购物数据仓库
9.1.2 案例二:社会保障卡数据仓库
9.1.3 案例三:医院信息系统数据仓库
9.2 数据挖掘应用案例
9.2.1 案例一:零售商系统货篮数据挖掘
9.2.2 案例二:通信用户满意度指数评测
9.2.3 案例三:城市环境质量评价
本章小结
参考文献
猜您喜欢