书籍详情
数据仓库与数据挖掘
作者:廖开际 主编
出版社:北京大学出版社
出版时间:2008-11-01
ISBN:9787301143131
定价:¥28.00
购买这本书可以去
内容简介
《数据仓库与数据挖掘》比较系统地介绍数据仓库与数据挖掘的理论体系和应用。《数据仓库与数据挖掘》总的指导思想是在掌握基本知识和基本理论的基础上,强调实际应用能力的培养。全书力求深入浅出,通过通俗的语言及案例分析,介绍数据仓库及数据挖掘的基本概念及相关理论与方法。从数据仓库的定义、结构、设计、构建方法及联机分析处理应用等方面对数据仓库进行较为详细的介绍;从数据挖掘的定义、数据预处理、数据挖掘中的常用算法等方面对数据挖掘的基本知识和算法等理论进行介绍。《数据仓库与数据挖掘》强调数据仓库和数据挖掘工具的应用,重点介绍SQL Server 2005数据仓库和数据挖掘工具的应用。附录A详细介绍一个简易的数据挖掘工具——Weka,该工具可作为读者学习数据挖掘时的实验工具。《数据仓库与数据挖掘》可作为普通高等学校电子商务、信息管理、计算机应用及其他相关专业的本科教材,也可作为经贸、管理类专业的研究生教材,以及各类管理人员的培训与自学用书。
作者简介
暂缺《数据仓库与数据挖掘》作者简介
目录
第1章 企业数据资源管理
1.1 数据资源的概念
1.1.1 企业资源
1.1.2 数据资源
1.1.3 数据资源管理及其发展历程
1.2 数据资源管理的意义
1.2.1 信息系统进入成熟阶段的重要标志
1.2.2 解决企业内部数据不一致问题的根本途径
1.2.3 数据资源的管理和应用是取得竞争优势的关键
1.3 信息资源管理的相关技术
1.3.1 数据资源管理的技术框架
1.3.2 技术框架中的构成要素
1.3.3 技术框架中各部分的关联
1.4 企业通过数据仓库与数据挖掘获得竞争优势
本章小结
思考与练习
第2章 数据仓库的概念与结构
2.1 数据仓库的概念
2.1.1 数据仓库的定义
2.1.2 数据仓库的特征
2.1.3 数据集市
2.2 数据仓库系统
2.2.1 数据源
2.2.2 数据仓库管理层
2.2.3 数据仓库工具集
2.3 数据仓库中的数据组织
2.3.1 粒度的概念
2.3.2 面向主题的数据组织
2.3.3 数据分割
2.3.4 元数据的管理
本章小结
思考与练习
第3章 数据仓库的设计与开发
3.1 数据仓库的开发过程及特点
3.1.1 数据仓库开发的生命周期
3.1.2 数据仓库开发的特点
3.1.3 数据仓库设计的主要内容
3.2 数据模型设计
3.2.1 概念模型设计
3.2.2 逻辑模型设计
3.2.3 物理模型设计
3.3 数据仓库的粒度设计
3.3.1 设计步骤
3.3.2 设计原则
3.4 创建数据仓库的基本步骤
3.4.1 建立运营环境文档
3.4.2 选择数据仓库的实现技术
3.4.3 设计数据仓库模型
3.4.4 创建数据准备区
3.4.5 创建数据仓库数据库
3.4.6 从操作型系统中抽取数据
3.4.7 清理和转换数据
3.4.8 将数据装入数据仓库数据库
3.4.9 准备显示信息
3.4.10 将数据分发到数据集市
本章小结
思考与练习
第4章 联机分析处理
4.1 OLAP的基本概念
4.1.1 OLAP的发展背景
4.1.2 联机分析处理是数据仓库系统的一个应用
4.2 OLAP与多维分析
4.2.1 OLAP的一些基本概念
4.2.2 理解数据立方
4.2.3 OLAP的基本分析操作
4.3 OLAP的分类
4.3.1 ROLAP
4.3.2 MOLAP
4.3.3 HOLAP
4.4 OLAP的特性与不足
4.4.1 OLAP的特性
4.4.2 OLAP的不足
4.5 SQL Servei 2005统一维度模型
4.5.1 结构
4.5.2 优点
本章小结
思考与练习
第5章 数据挖掘概述
5.1 数据挖掘技术的由来
5.1.1 信息爆炸但知识贫乏
5.1.2 支持数据挖掘技术的基础
5.1.3 从商业数据到商业信息的进化
5.1.4 数据挖掘逐渐演变的过程
5.2 数据挖掘的定义
5.2.1 技术角度的定义
5.2.2 商业角度的定义
5.2.3 数据挖掘与传统分析方法的区别
5.2.4 数据挖掘和数据仓库
5.2.5 数据挖掘和OLAP
5.2.6 数据挖掘、机器学习和统计
5.3 数据挖掘发现的知识类型
5.3.1 广义知识
5.3.2 关联知识
5.3.3 分类知识
5.3.4 预测知识
5.3.5 偏差知识
5.4 数据挖掘流程
5.4.1 知识发现过程
5.4.2 数据挖掘对象
5.4.3 数据挖掘任务
5.4.4 数据挖掘分类
5.4.5 数据预处理
5.5 数据挖掘的方法和技术
5.5.1 信息论方法
5.5.2 集合论方法
5.5.3 神经网络方法
5.5.4 遗传算法
5.5.5 模糊数学
5.5.6 公式发现
5.5.7 可视化技术
5.5.8 知识表示
本章小结
思考与练习
第6章 数据预处理
6.1 数据预处理的目的及方法
6.1.1 原始数据中存在的问题
6.1.2 数据预处理的常用方法
6.2 数据清理
6.2.1 处理空缺值
6.2.2 噪声数据的处理
6.3 数据集成
6.3.1 模式匹配
6.3.2 数据冗余
6.3.3 数据冲突
6.4 数据变换
6.5 数据归约
6.5.1 数据立方体聚集
6.5.2 维归约
6.5.3 数据压缩
6.5.4 数值归约
6.5.5 离散化和概念分层
本章小结
思考与练习
第7章 数据挖掘中的常用算法
7.1 Apriori算法
7.1.1 基本原理
7.1.2 Apriori算法的基本思想与分析
7.1.3 从频繁项集产生关联规则
7.2 决策树算法
7.2.1 信息论的基本原理
7.2.2 ID3算法
7.2.3 树剪枝
7.2.4 由决策树提取分类规则
7.3 神经网络算法
7.3.1 神经网络的基本原理
7.3.2 反向传播模型
7.3.3 定义神经网络拓扑结构
7.3.4 神经网络的工作过程
7.4 聚类分析
7.4.1 聚类分析的概念
7.4.2 聚类分析中的数据类型
7.4.3 几种主要的聚类分析方法
7.4.4 K means聚类分析算法
本章小结
思考与练习
第8章 SQL Server数据仓库与数据挖掘工具及其应用
8.1 SQL Server 2005的功能构架
8.2 SQL Server数据仓库设计与数据挖掘准备
8.2.1 SQL Server数据仓库创建思路
8.2.2 SQL Server数据挖掘过程
8.2.3 案例数据准备
8.3 SQL Server集成服务
8.3.1 SQL Server集成服务的作用
8.3.2 控制流
8.3.3 数据流
8.3.4 设计和使用ETL
8.4 SQL Server分析服务
8.4.1 创建Analysis Services项目
8.4.2 定义数据源
8.4.3 定义数据源视图
8.4.4 用Analysis Services创建维与多维数据集
8.4.5 部署Analysis Services项目
8.5 SQL Server中的数据挖掘工具与应用
8.6 SQL Server报表服务
8.6.1 创建报表
8.6.2 使用报表
本章小结
思考与练习
附录A 一个简易的数据挖掘工具——Weka
参考文献
1.1 数据资源的概念
1.1.1 企业资源
1.1.2 数据资源
1.1.3 数据资源管理及其发展历程
1.2 数据资源管理的意义
1.2.1 信息系统进入成熟阶段的重要标志
1.2.2 解决企业内部数据不一致问题的根本途径
1.2.3 数据资源的管理和应用是取得竞争优势的关键
1.3 信息资源管理的相关技术
1.3.1 数据资源管理的技术框架
1.3.2 技术框架中的构成要素
1.3.3 技术框架中各部分的关联
1.4 企业通过数据仓库与数据挖掘获得竞争优势
本章小结
思考与练习
第2章 数据仓库的概念与结构
2.1 数据仓库的概念
2.1.1 数据仓库的定义
2.1.2 数据仓库的特征
2.1.3 数据集市
2.2 数据仓库系统
2.2.1 数据源
2.2.2 数据仓库管理层
2.2.3 数据仓库工具集
2.3 数据仓库中的数据组织
2.3.1 粒度的概念
2.3.2 面向主题的数据组织
2.3.3 数据分割
2.3.4 元数据的管理
本章小结
思考与练习
第3章 数据仓库的设计与开发
3.1 数据仓库的开发过程及特点
3.1.1 数据仓库开发的生命周期
3.1.2 数据仓库开发的特点
3.1.3 数据仓库设计的主要内容
3.2 数据模型设计
3.2.1 概念模型设计
3.2.2 逻辑模型设计
3.2.3 物理模型设计
3.3 数据仓库的粒度设计
3.3.1 设计步骤
3.3.2 设计原则
3.4 创建数据仓库的基本步骤
3.4.1 建立运营环境文档
3.4.2 选择数据仓库的实现技术
3.4.3 设计数据仓库模型
3.4.4 创建数据准备区
3.4.5 创建数据仓库数据库
3.4.6 从操作型系统中抽取数据
3.4.7 清理和转换数据
3.4.8 将数据装入数据仓库数据库
3.4.9 准备显示信息
3.4.10 将数据分发到数据集市
本章小结
思考与练习
第4章 联机分析处理
4.1 OLAP的基本概念
4.1.1 OLAP的发展背景
4.1.2 联机分析处理是数据仓库系统的一个应用
4.2 OLAP与多维分析
4.2.1 OLAP的一些基本概念
4.2.2 理解数据立方
4.2.3 OLAP的基本分析操作
4.3 OLAP的分类
4.3.1 ROLAP
4.3.2 MOLAP
4.3.3 HOLAP
4.4 OLAP的特性与不足
4.4.1 OLAP的特性
4.4.2 OLAP的不足
4.5 SQL Servei 2005统一维度模型
4.5.1 结构
4.5.2 优点
本章小结
思考与练习
第5章 数据挖掘概述
5.1 数据挖掘技术的由来
5.1.1 信息爆炸但知识贫乏
5.1.2 支持数据挖掘技术的基础
5.1.3 从商业数据到商业信息的进化
5.1.4 数据挖掘逐渐演变的过程
5.2 数据挖掘的定义
5.2.1 技术角度的定义
5.2.2 商业角度的定义
5.2.3 数据挖掘与传统分析方法的区别
5.2.4 数据挖掘和数据仓库
5.2.5 数据挖掘和OLAP
5.2.6 数据挖掘、机器学习和统计
5.3 数据挖掘发现的知识类型
5.3.1 广义知识
5.3.2 关联知识
5.3.3 分类知识
5.3.4 预测知识
5.3.5 偏差知识
5.4 数据挖掘流程
5.4.1 知识发现过程
5.4.2 数据挖掘对象
5.4.3 数据挖掘任务
5.4.4 数据挖掘分类
5.4.5 数据预处理
5.5 数据挖掘的方法和技术
5.5.1 信息论方法
5.5.2 集合论方法
5.5.3 神经网络方法
5.5.4 遗传算法
5.5.5 模糊数学
5.5.6 公式发现
5.5.7 可视化技术
5.5.8 知识表示
本章小结
思考与练习
第6章 数据预处理
6.1 数据预处理的目的及方法
6.1.1 原始数据中存在的问题
6.1.2 数据预处理的常用方法
6.2 数据清理
6.2.1 处理空缺值
6.2.2 噪声数据的处理
6.3 数据集成
6.3.1 模式匹配
6.3.2 数据冗余
6.3.3 数据冲突
6.4 数据变换
6.5 数据归约
6.5.1 数据立方体聚集
6.5.2 维归约
6.5.3 数据压缩
6.5.4 数值归约
6.5.5 离散化和概念分层
本章小结
思考与练习
第7章 数据挖掘中的常用算法
7.1 Apriori算法
7.1.1 基本原理
7.1.2 Apriori算法的基本思想与分析
7.1.3 从频繁项集产生关联规则
7.2 决策树算法
7.2.1 信息论的基本原理
7.2.2 ID3算法
7.2.3 树剪枝
7.2.4 由决策树提取分类规则
7.3 神经网络算法
7.3.1 神经网络的基本原理
7.3.2 反向传播模型
7.3.3 定义神经网络拓扑结构
7.3.4 神经网络的工作过程
7.4 聚类分析
7.4.1 聚类分析的概念
7.4.2 聚类分析中的数据类型
7.4.3 几种主要的聚类分析方法
7.4.4 K means聚类分析算法
本章小结
思考与练习
第8章 SQL Server数据仓库与数据挖掘工具及其应用
8.1 SQL Server 2005的功能构架
8.2 SQL Server数据仓库设计与数据挖掘准备
8.2.1 SQL Server数据仓库创建思路
8.2.2 SQL Server数据挖掘过程
8.2.3 案例数据准备
8.3 SQL Server集成服务
8.3.1 SQL Server集成服务的作用
8.3.2 控制流
8.3.3 数据流
8.3.4 设计和使用ETL
8.4 SQL Server分析服务
8.4.1 创建Analysis Services项目
8.4.2 定义数据源
8.4.3 定义数据源视图
8.4.4 用Analysis Services创建维与多维数据集
8.4.5 部署Analysis Services项目
8.5 SQL Server中的数据挖掘工具与应用
8.6 SQL Server报表服务
8.6.1 创建报表
8.6.2 使用报表
本章小结
思考与练习
附录A 一个简易的数据挖掘工具——Weka
参考文献
猜您喜欢