书籍详情
数据仓库与数据挖掘技术
作者:张兴会 编著
出版社:清华大学出版社
出版时间:2011-06-01
ISBN:9787302247012
定价:¥24.00
购买这本书可以去
内容简介
数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。《数据仓库与数据挖掘技术》系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在SQL 2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。《数据仓库与数据挖掘技术》可以作为计算机类、信息类等相关专业本科生数据挖掘课程的教材,也可以作为其他专业技术人员的自学参考书。
作者简介
暂缺《数据仓库与数据挖掘技术》作者简介
目录
第1章 数据挖掘和数据仓库概述
1.1 数据挖掘引论
1.1.1 数据挖掘的由来
1.1.2 数据挖掘的定义
1.1.3 数据挖掘的功能
1.1.4 数据挖掘的常用方法
1.2 数据仓库引论
1.2.1 数据仓库的产生与发展
1.2.2 数据仓库的定义
1.2.3 数据仓库与数据挖掘的联系与区别
1.3 数据挖掘的应用
1.3.1 数据挖掘的应用领域
1.3.2 数据挖掘案例
1.4 常用数据挖掘工具
1.4.1 数据挖掘工具的种类
1.4.2 评价数据挖掘工具优劣的指标
1.4.3 常用数据挖掘工具
小结
习题
第2章 数据仓库
2.1 数据仓库的基本概念
2.2 数据仓库的体系结构
2.2.1 元数据
2.2.2 粒度的概念
2.2.3 分割问题
2.2.4 数据仓库中的数据组织形式
2.3 数据仓库的数据模型
2.3.1 概念数据模型
2.3.2 逻辑数据模型
2.3.3 物理数据模型
2.3.4 高层数据模型、中间层数据模型和低层数据模型
2.4 数据仓库设计步骤
2.4.1 概念模型设计
2.4.2 技术准备工作
2.4.3 逻辑模型设计
2.4.4 物理模型设计
2.4.5 数据仓库的生成
2.4.6 数据仓库的使用和维护
2.5 利用SQL Server 2005构建数据仓库
小结
习题
第3章 联机分析处理技术
3.1 OLAP概述
3.1.1 OLAP的由来
3.1.2 OLAP的一些基本概念
3.1.3 OLAP的定义与特征
3.2 OLAP中的多维分析操作
3.2.1 钻取
3.2.2 切片和切块
3.2.3 旋转
3.3 OLAP的基本数据模型
3.3.1 多维联机分析处理
3.3.2 关系联机分析处理
3.3.3 MOLAP和ROLAP的比较
3.3.4 混合型联机分析处理
3.4 OLAP的衡量标准
3.5 基于SQL Server 2005的OLAP实现
小结
习题
第4章 数据预处理
4.1 数据预处理概述
4.1.1 原始数据中存在的问题
4.1.2 数据预处理的方法和功能
4.2 数据清洗
4.2.1 属性选择与处理
4.2.2 空缺值处理
4.2.3 噪声数据处理
4.2.4 不平衡数据的处理
4.3 数据集成和变换
4.3.1 数据集成
4.3.2 数据变换
4.4 数据归约
4.4.1 数据归约的方法
4.4.2 数据立方体聚集
4.4.3 维归约
4.4.4 数据压缩
4.4.5 数值归约
4.4.6 离散化与概念分层生成
小结
习题
第5章 关联规则方法
5.1 关联规则的概念和分类
5.1.1 关联规则的概念
5.1.2 关联规则的分类
5.2 Apriori算法
5.2.1 产生频繁项集
5.2.2 产生频繁项集的实例
5.2.3 从频繁项集产生关联规则
5.3 FP-Growth算法
5.3.1 FP-Growth算法计算过程
5.3.2 FP-Growth算法示例
5.4 利用SQL Server 2005进行关联规则挖掘
小结
习题
第6章 决策树方法
6.1 信息论的基本原理
6.1.1 信息论原理
6.1.2 互信息的计算
6.2 常用决策树算法
6.2.1 ID3算法
6.2.2 C4.5算法
6.3 决策树剪枝
6.3.1 先剪枝
6.3.2 后剪枝
6.4 由决策树提取分类规则
6.4.1 获得简单规则
6.4.2 精简规则属性
6.5 利用SQL Server 2005进行决策树挖掘
6.5.1 数据准备
6.5.2 挖掘模型设置
6.5.3 挖掘流程
6.5.4 挖掘结果分析
6.5.5 挖掘性能分析
小结
习题
第7章 统计学习方法
7.1 朴素贝叶斯分类
7.1.1 贝叶斯定理
7.1.2 朴素贝叶斯分类
7.2 贝叶斯信念网络
7.2.1 贝叶斯信念网络
7.2.2 贝叶斯网络的特点
7.2.3 贝叶斯网络的应用
7.3 EM算法
7.3.1 估计k个高斯分布的均值
7.3.2 EM算法的一般表述
7.4 回归分析
7.4.1 一元线性回归
7.4.2 多元线性回归
7.4.3 非线性回归
7.5 利用SQL Server 2005进行线性回归分析
小结
习题
第8章 人工神经网络方法
8.1 人工神经网络的基本概念
8.1.1 人工神经元原理
8.1.2 人工神经网络拓扑结构
8.1.3 人工神经网络学习算法
8.1.4 人工神经网络泛化
8.2 误差反向传播(BP)神经网络
8.2.1 BP神经网络的拓扑结构
8.2.2 BP神经网络学习算法
8.2.3 BP神经网络设计
8.3 自组织特征映射(SOFM)神经网络
8.3.1 SOFM神经网络的拓扑结构
8.3.2 SOFM神经网络聚类的基本算法
8.3.3 SOFM神经网络学习算法分析
8.4 Elman神经网络
8.4.1 Elman神经网络的拓扑结构
8.4.2 Elman神经网络权值计算
8.5 Hopfield神经网络
8.5.1 Hopfield神经网络的拓扑结构
8.5.2 Hopfield神经网络学习算法概述
8.5.3 离散Hopfield神经网络
8.5.4 连续Hopfield神经网络
8.6 利用SQL Server 2005神经网络进行数据挖掘
8.6.1 数据准备
8.6.2 挖掘流程
小结
习题
第9章 聚类分析
9.1 聚类概述
9.1.1 聚类简介
9.1.2 聚类的定义
9.1.3 聚类的要求
9.2 聚类分析中的相异度计算
9.2.1 聚类算法中的数据结构
9.2.2 区间标度变量及其相异度计算
9.2.3 二元变量及其相异度计算
9.2.4 标称型变量及其相异度计算
9.2.5 序数型变量及其相异度计算
9.2.6 比例标度型变量及其相异度计算
9.2.7 混合类型变量的相异度计算
9.3 基于划分的聚类方法
9.3.1 k-平均算法
9.3.2 k-中心点算法
9.4 基于层次的聚类方法
9.5 谱聚类方法
9.5.1 谱聚类的步骤
9.5.2 谱聚类的优点
9.5.3 谱聚类实例
9.6 利用SQL Server 2005进行聚类分析
9.6.1 挖掘流程
9.6.2 结果分析
小结
习题
第10章 粗糙集方法
10.1 粗糙集的基本概念
10.1.1 等价关系与等价类
10.1.2 信息表与决策表
10.1.3 下近似与上近似
10.2 基于粗糙集的属性约简
10.2.1 属性约简的有关概念
10.2.2 基于粗糙集的几种属性约简算法
10.3 基于粗糙集的决策规则约简
10.3.1 决策规则的定义
10.3.2 决策规则的约简
10.4 粗糙集的优缺点
10.4.1 粗糙集的优点
10.4.2 粗糙集的缺点
小结
习题
第11章 复杂结构数据挖掘
11.1 文本数据挖掘
11.1.1 文本数据的特点
11.1.2 文本挖掘的定义
11.1.3 文本挖掘的主要任务
11.1.4 文本挖掘的一般过程
11.1.5 文本挖掘的应用
11.2 Web数据挖掘
11.2.1 Web数据的特点
11.2.2 Web挖掘的定义
11.2.3 Web挖掘分类
11.2.4 Web挖掘过程
11.2.5 Web数据挖掘的应用
11.3 空间数据挖掘
11.3.1 空间数据的复杂性特征
11.3.2 空间数据挖掘的定义
11.3.3 空间数据挖掘知识的类型
11.3.4 空间数据挖掘的用途
11.4 多媒体数据挖掘
11.4.1 多媒体数据挖掘的概念
11.4.2 多媒体挖掘的分类
小结
习题
参考文献
1.1 数据挖掘引论
1.1.1 数据挖掘的由来
1.1.2 数据挖掘的定义
1.1.3 数据挖掘的功能
1.1.4 数据挖掘的常用方法
1.2 数据仓库引论
1.2.1 数据仓库的产生与发展
1.2.2 数据仓库的定义
1.2.3 数据仓库与数据挖掘的联系与区别
1.3 数据挖掘的应用
1.3.1 数据挖掘的应用领域
1.3.2 数据挖掘案例
1.4 常用数据挖掘工具
1.4.1 数据挖掘工具的种类
1.4.2 评价数据挖掘工具优劣的指标
1.4.3 常用数据挖掘工具
小结
习题
第2章 数据仓库
2.1 数据仓库的基本概念
2.2 数据仓库的体系结构
2.2.1 元数据
2.2.2 粒度的概念
2.2.3 分割问题
2.2.4 数据仓库中的数据组织形式
2.3 数据仓库的数据模型
2.3.1 概念数据模型
2.3.2 逻辑数据模型
2.3.3 物理数据模型
2.3.4 高层数据模型、中间层数据模型和低层数据模型
2.4 数据仓库设计步骤
2.4.1 概念模型设计
2.4.2 技术准备工作
2.4.3 逻辑模型设计
2.4.4 物理模型设计
2.4.5 数据仓库的生成
2.4.6 数据仓库的使用和维护
2.5 利用SQL Server 2005构建数据仓库
小结
习题
第3章 联机分析处理技术
3.1 OLAP概述
3.1.1 OLAP的由来
3.1.2 OLAP的一些基本概念
3.1.3 OLAP的定义与特征
3.2 OLAP中的多维分析操作
3.2.1 钻取
3.2.2 切片和切块
3.2.3 旋转
3.3 OLAP的基本数据模型
3.3.1 多维联机分析处理
3.3.2 关系联机分析处理
3.3.3 MOLAP和ROLAP的比较
3.3.4 混合型联机分析处理
3.4 OLAP的衡量标准
3.5 基于SQL Server 2005的OLAP实现
小结
习题
第4章 数据预处理
4.1 数据预处理概述
4.1.1 原始数据中存在的问题
4.1.2 数据预处理的方法和功能
4.2 数据清洗
4.2.1 属性选择与处理
4.2.2 空缺值处理
4.2.3 噪声数据处理
4.2.4 不平衡数据的处理
4.3 数据集成和变换
4.3.1 数据集成
4.3.2 数据变换
4.4 数据归约
4.4.1 数据归约的方法
4.4.2 数据立方体聚集
4.4.3 维归约
4.4.4 数据压缩
4.4.5 数值归约
4.4.6 离散化与概念分层生成
小结
习题
第5章 关联规则方法
5.1 关联规则的概念和分类
5.1.1 关联规则的概念
5.1.2 关联规则的分类
5.2 Apriori算法
5.2.1 产生频繁项集
5.2.2 产生频繁项集的实例
5.2.3 从频繁项集产生关联规则
5.3 FP-Growth算法
5.3.1 FP-Growth算法计算过程
5.3.2 FP-Growth算法示例
5.4 利用SQL Server 2005进行关联规则挖掘
小结
习题
第6章 决策树方法
6.1 信息论的基本原理
6.1.1 信息论原理
6.1.2 互信息的计算
6.2 常用决策树算法
6.2.1 ID3算法
6.2.2 C4.5算法
6.3 决策树剪枝
6.3.1 先剪枝
6.3.2 后剪枝
6.4 由决策树提取分类规则
6.4.1 获得简单规则
6.4.2 精简规则属性
6.5 利用SQL Server 2005进行决策树挖掘
6.5.1 数据准备
6.5.2 挖掘模型设置
6.5.3 挖掘流程
6.5.4 挖掘结果分析
6.5.5 挖掘性能分析
小结
习题
第7章 统计学习方法
7.1 朴素贝叶斯分类
7.1.1 贝叶斯定理
7.1.2 朴素贝叶斯分类
7.2 贝叶斯信念网络
7.2.1 贝叶斯信念网络
7.2.2 贝叶斯网络的特点
7.2.3 贝叶斯网络的应用
7.3 EM算法
7.3.1 估计k个高斯分布的均值
7.3.2 EM算法的一般表述
7.4 回归分析
7.4.1 一元线性回归
7.4.2 多元线性回归
7.4.3 非线性回归
7.5 利用SQL Server 2005进行线性回归分析
小结
习题
第8章 人工神经网络方法
8.1 人工神经网络的基本概念
8.1.1 人工神经元原理
8.1.2 人工神经网络拓扑结构
8.1.3 人工神经网络学习算法
8.1.4 人工神经网络泛化
8.2 误差反向传播(BP)神经网络
8.2.1 BP神经网络的拓扑结构
8.2.2 BP神经网络学习算法
8.2.3 BP神经网络设计
8.3 自组织特征映射(SOFM)神经网络
8.3.1 SOFM神经网络的拓扑结构
8.3.2 SOFM神经网络聚类的基本算法
8.3.3 SOFM神经网络学习算法分析
8.4 Elman神经网络
8.4.1 Elman神经网络的拓扑结构
8.4.2 Elman神经网络权值计算
8.5 Hopfield神经网络
8.5.1 Hopfield神经网络的拓扑结构
8.5.2 Hopfield神经网络学习算法概述
8.5.3 离散Hopfield神经网络
8.5.4 连续Hopfield神经网络
8.6 利用SQL Server 2005神经网络进行数据挖掘
8.6.1 数据准备
8.6.2 挖掘流程
小结
习题
第9章 聚类分析
9.1 聚类概述
9.1.1 聚类简介
9.1.2 聚类的定义
9.1.3 聚类的要求
9.2 聚类分析中的相异度计算
9.2.1 聚类算法中的数据结构
9.2.2 区间标度变量及其相异度计算
9.2.3 二元变量及其相异度计算
9.2.4 标称型变量及其相异度计算
9.2.5 序数型变量及其相异度计算
9.2.6 比例标度型变量及其相异度计算
9.2.7 混合类型变量的相异度计算
9.3 基于划分的聚类方法
9.3.1 k-平均算法
9.3.2 k-中心点算法
9.4 基于层次的聚类方法
9.5 谱聚类方法
9.5.1 谱聚类的步骤
9.5.2 谱聚类的优点
9.5.3 谱聚类实例
9.6 利用SQL Server 2005进行聚类分析
9.6.1 挖掘流程
9.6.2 结果分析
小结
习题
第10章 粗糙集方法
10.1 粗糙集的基本概念
10.1.1 等价关系与等价类
10.1.2 信息表与决策表
10.1.3 下近似与上近似
10.2 基于粗糙集的属性约简
10.2.1 属性约简的有关概念
10.2.2 基于粗糙集的几种属性约简算法
10.3 基于粗糙集的决策规则约简
10.3.1 决策规则的定义
10.3.2 决策规则的约简
10.4 粗糙集的优缺点
10.4.1 粗糙集的优点
10.4.2 粗糙集的缺点
小结
习题
第11章 复杂结构数据挖掘
11.1 文本数据挖掘
11.1.1 文本数据的特点
11.1.2 文本挖掘的定义
11.1.3 文本挖掘的主要任务
11.1.4 文本挖掘的一般过程
11.1.5 文本挖掘的应用
11.2 Web数据挖掘
11.2.1 Web数据的特点
11.2.2 Web挖掘的定义
11.2.3 Web挖掘分类
11.2.4 Web挖掘过程
11.2.5 Web数据挖掘的应用
11.3 空间数据挖掘
11.3.1 空间数据的复杂性特征
11.3.2 空间数据挖掘的定义
11.3.3 空间数据挖掘知识的类型
11.3.4 空间数据挖掘的用途
11.4 多媒体数据挖掘
11.4.1 多媒体数据挖掘的概念
11.4.2 多媒体挖掘的分类
小结
习题
参考文献
猜您喜欢