书籍详情
数据仓库与数据挖掘教程(第2版)
作者:陈文伟 编著
出版社:清华大学出版社
出版时间:2011-11-01
ISBN:9787302259138
定价:¥29.50
购买这本书可以去
内容简介
数据仓库与数据挖掘是决策支持的两项重要技术,它们共同的特点是都需要利用大量的数据资源,并从数据资源中提取信息和知识。由于数据资源丰富,因此数据仓库与数据挖掘的决策支持效果显著。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘教程(第2版)》系统介绍数据仓库原理,联机分析处理,数据仓库设计与开发,数据仓库的决策支持,数据挖掘原理,基于信息论的决策树方法,基于集合论的粗糙集方法、K-均值聚类、关联规则挖掘,仿生物技术的神经网络,遗传算法,公式发现,知识挖掘,文本挖掘与Web挖掘。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘教程(第2版)》从数据仓库的兴起来说明决策支持的特点,从数据挖掘的理论基础来说明数据挖掘的方法,并通过实例来详细讲解。希望读者在学习之后,亲自在计算机上去实践,这样才能更有效地掌握数据挖掘的方法。
作者简介
暂缺《数据仓库与数据挖掘教程(第2版)》作者简介
目录
第1章 数据仓库与数据挖掘概述
1.1 数据仓库的兴起
1.1.1 从数据库到数据仓库
1.1.2 从OLTP到OLAP
1.1.3 数据字典与元数据
1.1.4 数据仓库的定义与特点
1.2 数据挖掘的兴起
1.2.1 从机器学习到数据挖掘
1.2.2 数据挖掘含义
1.2.3 数据挖掘与OLAP的比较
1.2.4 数据挖掘与统计学
1.3 数据仓库和数据挖掘的结合
1.3.1 数据仓库和数据挖掘的区别与联系
1.3.2 基于数据仓库的决策支持系统
1.3.3 数据仓库与商业智能
习题
第2章 数据仓库原理
2.1 数据仓库结构体系
2.1.1 数据仓库结构
2.1.2 数据集市及其结构
2.1.3 数据仓库系统结构
2.1.4 数据仓库的运行结构
2.2 数据仓库数据模型
2.2.1 星型模型
2.2.2 雪花模型
2.2.3 星网模型
2.2.4 第三范式
2.3 数据抽取、转换和装载
2.3.1 数据抽取
2.3.2 数据转换
2.3.3 数据装载
2.3.4 ETL工具
2.4 元数据
2.4.1 元数据的重要性
2.4.2 关于数据源的元数据
2.4.3 关于数据模型的元数据
2.4.4 关于数据仓库映射的元数据
2.4.5 关于数据仓库使用的元数据
习题
第3章 联机分析处理
3.1 OLAP概念
3.1.1 OLAP的定义
3.1.2 OLAP准则
3.1.3 OLAP的基本概念
3.2 OLAP的数据模型
3.2.1 MOLAP数据模型
3.2.2 ROLAP数据模型
3.2.3 MOLAP与ROLAP的比较
3.2.4 HOLAP数据模型
3.3 多维数据的显示
3.3.1 多维数据显示方法
3.3.2 多维类型结构
3.3.3 多维数据的分析视图
3.4 OALP的多维数据分析
3.4.1 多维数据分析的基本操作
3.4.2 多维数据分析实例
3.4.3 广义OLAP功能
3.4.4 数据立方体
3.4.5 多维数据分析的MDX语言及其应用
习题
第4章 数据仓库设计与开发
4.1 数据仓库分析与设计
4.1.1 需求分析
4.1.2 概念模型设计
4.1.3 逻辑模型设计
4.1.4 物理模型设计
4.1.5 数据仓库的索引技术
4.2 数据仓库开发
4.2.1 数据仓库开发过程
4.2.2 数据质量与数据清洗
4.2.3 数据粒度与维度建模
4.3 数据仓库技术与开发的困难
4.3.1 数据仓库技术
4.3.2 数据仓库开发的困难
习题
第5章 数据仓库的决策支持
5.1 数据仓库的用户
5.1.1 数据仓库的信息使用者
5.1.2 数据仓库的探索者
5.2 数据仓库的决策支持与决策支持系统
5.2.1 查询与报表
5.2.2 多维分析与原因分析
5.2.3 预测未来
5.2.4 实时决策
5.2.5 自动决策
5.2.6 决策支持系统
5.3 数据仓库应用实例
5.3.1 航空公司数据仓库决策支持系统简例
5.3.2 统计业数据仓库系统
5.3.3 沃尔玛数据仓库系统
习题
第6章 数据挖掘原理
6.1 数据挖掘综述
6.1.1 数据挖掘与知识发现
6.1.2 数据挖掘对象
6.1.3 数据挖掘任务
6.1.4 数据挖掘分类
6.1.5 不完全数据处理
6.1.6 数据库的数据浓缩
6.2 数据挖掘方法和技术
6.2.1 归纳学习的信息论方法
6.2.2 归纳学习的集合论方法
6.2.3 仿生物技术的神经网络方法
6.2.4 仿生物技术的遗传算法
6.2.5 数值数据的公式发现
6.2.6 可视化技术
6.3 数据挖掘的知识表示
6.3.1 规则知识
6.3.2 决策树知识
6.3.3 知识基(浓缩数据)
6.3.4 神经网络权值
6.3.5 公式知识
6.3.6 案例
习题
第7章 信息论方法
7.1 信息论原理
7.1.1 信道模型和学习信道模型
7.1.2 信息熵与条件熵
7.1.3 互信息与信息增益
7.1.4 信道容量与译码准则
7.2 决策树方法
7.2.1 决策树概念
7.2.2 ID3方法基本思想
7.2.3 ID3算法
7.2.4 实例与讨论
7.2.5 C4.5方法
7.3 决策规则树方法
7.3.1 IBLE方法基本思想
7.3.2 IBLE算法
7.3.3 IBLE方法实例
习题
第8章 集合论方法
8.1 粗糙集方法
8.1.1 粗糙集概念
8.1.2 属性约简的粗糙集理论
8.1.3 属性约简的粗糙集方法
8.1.4 粗糙集方法的规则获取
8.1.5 粗糙集方法的应用实例
8.2 K-均值聚类
8.2.1 聚类方法简介
8.2.2 K-均值聚类方法与实例
8.3 关联规则挖掘
8.3.1 关联规则的挖掘原理
8.3.2 Apriori算法基本思想
8.3.3 Apriori算法程序
8.3.4 基于FP-tree的关联规则挖掘算法
习题
第9章 神经网络
9.1 神经网络概念与感知机
9.1.1 神经网络原理
9.1.2 感知机网络
9.1.3 感知机实例与讨论
9.2 反向传播网络
9.2.1 反向传播网络结构
9.2.2 BP网络学习公式推导
9.2.3 BP网络的典型实例
9.3 径向基函数网络
9.3.1 径向基函数RBF网络原理
9.3.2 RBF网络算法与分析
9.4 神经网络的几何意义
9.4.1 神经网络的超平面含义
9.4.2 异或问题的实例分析
习题
第10章 遗传算法与进化计算
10.1 遗传算法
10.1.1 遗传算法基本原理
10.1.2 遗传算子
10.1.3 遗传算法简例
10.1.4 遗传算法的特点
10.2 基于遗传算法的分类学习系统
10.2.1 概述
10.2.2 遗传分类学习系统GCLS的基本原理
10.2.3 遗传分类学习系统GCLS的应用
10.3 进化计算
10.3.1 进化计算概述
10.3.2 进化策略与进化规划
10.3.3 进化计算小结
习题
第11章 公式发现
11.1 公式发现概述
11.1.1 曲线拟合与发现学习
11.1.2 启发式与数据驱动启发式
11.2 科学定律重新发现系统
11.2.1 BACON系统基本原理
11.2.2 BACON系统实例
11.2.3 BACON系统的进展
11.3 经验公式发现系统
11.3.1 FDD系统基本原理
11.3.2 FDD.1系统
11.3.3 FDD.2系统
11.3.4 FDD.3系统
习题
第12章 知识挖掘
12.1 变换规则的知识挖掘
12.1.1 适应变化环境的变换和变换规则
12.1.2 变换规则的知识挖掘的理论基础
12.1.3 变换规则的知识推理
12.1.4 变换规则链的知识挖掘
12.1.5 适应变化环境的变换规则元知识
12.2 软件进化规律的知识挖掘
12.2.1 数值计算的进化
12.2.2 计算机程序的进化
12.2.3 数据存储的进化
12.2.4 知识处理的进化
12.2.5 进化规律的知识挖掘
习题
第13章 文本挖掘与Web挖掘
13.1 文本挖掘概述
13.1.1 文本挖掘的基本概念
13.1.2 文本特征的表示
13.1.3 文本特征的提取
13.2 文本挖掘
13.2.1 文本挖掘功能层次
13.2.2 文本关联分析
13.2.3 文本聚类
13.2.4 文本分类
13.3 Web挖掘
13.3.1 Web挖掘概述
13.3.2 Web内容挖掘
13.3.3 Web结构挖掘
13.3.4 Web应用(访问信息)挖掘
13.3.5 Web日志分析与实例
习题
参考文献
1.1 数据仓库的兴起
1.1.1 从数据库到数据仓库
1.1.2 从OLTP到OLAP
1.1.3 数据字典与元数据
1.1.4 数据仓库的定义与特点
1.2 数据挖掘的兴起
1.2.1 从机器学习到数据挖掘
1.2.2 数据挖掘含义
1.2.3 数据挖掘与OLAP的比较
1.2.4 数据挖掘与统计学
1.3 数据仓库和数据挖掘的结合
1.3.1 数据仓库和数据挖掘的区别与联系
1.3.2 基于数据仓库的决策支持系统
1.3.3 数据仓库与商业智能
习题
第2章 数据仓库原理
2.1 数据仓库结构体系
2.1.1 数据仓库结构
2.1.2 数据集市及其结构
2.1.3 数据仓库系统结构
2.1.4 数据仓库的运行结构
2.2 数据仓库数据模型
2.2.1 星型模型
2.2.2 雪花模型
2.2.3 星网模型
2.2.4 第三范式
2.3 数据抽取、转换和装载
2.3.1 数据抽取
2.3.2 数据转换
2.3.3 数据装载
2.3.4 ETL工具
2.4 元数据
2.4.1 元数据的重要性
2.4.2 关于数据源的元数据
2.4.3 关于数据模型的元数据
2.4.4 关于数据仓库映射的元数据
2.4.5 关于数据仓库使用的元数据
习题
第3章 联机分析处理
3.1 OLAP概念
3.1.1 OLAP的定义
3.1.2 OLAP准则
3.1.3 OLAP的基本概念
3.2 OLAP的数据模型
3.2.1 MOLAP数据模型
3.2.2 ROLAP数据模型
3.2.3 MOLAP与ROLAP的比较
3.2.4 HOLAP数据模型
3.3 多维数据的显示
3.3.1 多维数据显示方法
3.3.2 多维类型结构
3.3.3 多维数据的分析视图
3.4 OALP的多维数据分析
3.4.1 多维数据分析的基本操作
3.4.2 多维数据分析实例
3.4.3 广义OLAP功能
3.4.4 数据立方体
3.4.5 多维数据分析的MDX语言及其应用
习题
第4章 数据仓库设计与开发
4.1 数据仓库分析与设计
4.1.1 需求分析
4.1.2 概念模型设计
4.1.3 逻辑模型设计
4.1.4 物理模型设计
4.1.5 数据仓库的索引技术
4.2 数据仓库开发
4.2.1 数据仓库开发过程
4.2.2 数据质量与数据清洗
4.2.3 数据粒度与维度建模
4.3 数据仓库技术与开发的困难
4.3.1 数据仓库技术
4.3.2 数据仓库开发的困难
习题
第5章 数据仓库的决策支持
5.1 数据仓库的用户
5.1.1 数据仓库的信息使用者
5.1.2 数据仓库的探索者
5.2 数据仓库的决策支持与决策支持系统
5.2.1 查询与报表
5.2.2 多维分析与原因分析
5.2.3 预测未来
5.2.4 实时决策
5.2.5 自动决策
5.2.6 决策支持系统
5.3 数据仓库应用实例
5.3.1 航空公司数据仓库决策支持系统简例
5.3.2 统计业数据仓库系统
5.3.3 沃尔玛数据仓库系统
习题
第6章 数据挖掘原理
6.1 数据挖掘综述
6.1.1 数据挖掘与知识发现
6.1.2 数据挖掘对象
6.1.3 数据挖掘任务
6.1.4 数据挖掘分类
6.1.5 不完全数据处理
6.1.6 数据库的数据浓缩
6.2 数据挖掘方法和技术
6.2.1 归纳学习的信息论方法
6.2.2 归纳学习的集合论方法
6.2.3 仿生物技术的神经网络方法
6.2.4 仿生物技术的遗传算法
6.2.5 数值数据的公式发现
6.2.6 可视化技术
6.3 数据挖掘的知识表示
6.3.1 规则知识
6.3.2 决策树知识
6.3.3 知识基(浓缩数据)
6.3.4 神经网络权值
6.3.5 公式知识
6.3.6 案例
习题
第7章 信息论方法
7.1 信息论原理
7.1.1 信道模型和学习信道模型
7.1.2 信息熵与条件熵
7.1.3 互信息与信息增益
7.1.4 信道容量与译码准则
7.2 决策树方法
7.2.1 决策树概念
7.2.2 ID3方法基本思想
7.2.3 ID3算法
7.2.4 实例与讨论
7.2.5 C4.5方法
7.3 决策规则树方法
7.3.1 IBLE方法基本思想
7.3.2 IBLE算法
7.3.3 IBLE方法实例
习题
第8章 集合论方法
8.1 粗糙集方法
8.1.1 粗糙集概念
8.1.2 属性约简的粗糙集理论
8.1.3 属性约简的粗糙集方法
8.1.4 粗糙集方法的规则获取
8.1.5 粗糙集方法的应用实例
8.2 K-均值聚类
8.2.1 聚类方法简介
8.2.2 K-均值聚类方法与实例
8.3 关联规则挖掘
8.3.1 关联规则的挖掘原理
8.3.2 Apriori算法基本思想
8.3.3 Apriori算法程序
8.3.4 基于FP-tree的关联规则挖掘算法
习题
第9章 神经网络
9.1 神经网络概念与感知机
9.1.1 神经网络原理
9.1.2 感知机网络
9.1.3 感知机实例与讨论
9.2 反向传播网络
9.2.1 反向传播网络结构
9.2.2 BP网络学习公式推导
9.2.3 BP网络的典型实例
9.3 径向基函数网络
9.3.1 径向基函数RBF网络原理
9.3.2 RBF网络算法与分析
9.4 神经网络的几何意义
9.4.1 神经网络的超平面含义
9.4.2 异或问题的实例分析
习题
第10章 遗传算法与进化计算
10.1 遗传算法
10.1.1 遗传算法基本原理
10.1.2 遗传算子
10.1.3 遗传算法简例
10.1.4 遗传算法的特点
10.2 基于遗传算法的分类学习系统
10.2.1 概述
10.2.2 遗传分类学习系统GCLS的基本原理
10.2.3 遗传分类学习系统GCLS的应用
10.3 进化计算
10.3.1 进化计算概述
10.3.2 进化策略与进化规划
10.3.3 进化计算小结
习题
第11章 公式发现
11.1 公式发现概述
11.1.1 曲线拟合与发现学习
11.1.2 启发式与数据驱动启发式
11.2 科学定律重新发现系统
11.2.1 BACON系统基本原理
11.2.2 BACON系统实例
11.2.3 BACON系统的进展
11.3 经验公式发现系统
11.3.1 FDD系统基本原理
11.3.2 FDD.1系统
11.3.3 FDD.2系统
11.3.4 FDD.3系统
习题
第12章 知识挖掘
12.1 变换规则的知识挖掘
12.1.1 适应变化环境的变换和变换规则
12.1.2 变换规则的知识挖掘的理论基础
12.1.3 变换规则的知识推理
12.1.4 变换规则链的知识挖掘
12.1.5 适应变化环境的变换规则元知识
12.2 软件进化规律的知识挖掘
12.2.1 数值计算的进化
12.2.2 计算机程序的进化
12.2.3 数据存储的进化
12.2.4 知识处理的进化
12.2.5 进化规律的知识挖掘
习题
第13章 文本挖掘与Web挖掘
13.1 文本挖掘概述
13.1.1 文本挖掘的基本概念
13.1.2 文本特征的表示
13.1.3 文本特征的提取
13.2 文本挖掘
13.2.1 文本挖掘功能层次
13.2.2 文本关联分析
13.2.3 文本聚类
13.2.4 文本分类
13.3 Web挖掘
13.3.1 Web挖掘概述
13.3.2 Web内容挖掘
13.3.3 Web结构挖掘
13.3.4 Web应用(访问信息)挖掘
13.3.5 Web日志分析与实例
习题
参考文献
猜您喜欢