书籍详情
数据挖掘原理与技术
作者:张云涛,龚玲著
出版社:电子工业出版社
出版时间:2004-04-01
ISBN:9787505397385
定价:¥23.00
购买这本书可以去
内容简介
数据挖掘将数据转化为知识,是数据管理、信息处理领域研究、开发和应用的最活跃的分支之一。本书全面地论述了数据挖掘领域的基本概念、基本原理和基本方法,内容包括数据挖掘领域的经典理论和前沿发展。全书共分14章,并含有1个附录。全面系统地介绍了数据挖掘的概念和过程、数据预处理技术;深入地叙述了各种数据挖掘技术,包括关联规则、决策树、聚类、基于样例的学习、贝叶斯学习、粗糙集、神经网络、遗传算法、统计分析;并讨论了数据挖掘的典型应用,如分类、文本和Web挖掘,以及数据挖掘的应用和发展趋势;并在第14章中给出了一个具体的商业智能解决方案实例。通过本书的学习,读者可以对数据挖掘的整体结构、概念、原理、技术和发展有深入的了解和认识。本书既可以作为相关专业的高年级本科生和研究生教材,也可作为数据挖掘领域的研究者和开发者的参考书。
作者简介
暂缺《数据挖掘原理与技术》作者简介
目录
第1章 绪论
1-1 什么是数据挖掘
1-2 为何进行数据挖掘
1-3 数据挖掘和统计分析的关系
1-4 数据挖掘与数据仓库的关系
1-5 数据挖掘系统和其他系统的比较
1-5-1 数据挖掘系统与专家系统的比较
1-5-2 数据挖掘和OLAP的比较
1-6 数据挖掘系统的分类
第2章 数据挖掘过程
2-1 问题定义与主题分析
2-2 数据准备
2-2-1 数据清理
2-2-2 数据集成
2-2-3 数据选择
2-2-4 数据变换
2-2-5 数据归约
2-2-6 数据质量分析
2-3 建立模型
2-3-1 模型是什么
2-3-2 模型的精确度
2-3-3 模型的验证
2-4 模式评估
2-4-1 模式是什么
2-4-2 挖掘结果的评价和验证
2-5 数据可视化和知识管理
2-5-1 可视化表示
2-5-2 知识管理
第3章 关联规则
3-1 概述
3-1-1 啤酒和尿布问题
3-1-2 基本概念
3-2 关联规则
3-2-1 概念分层
3-2-2 兴趣度
3-2-3 数据库中关联规则的发现
3-3 关联规则学习的Apriori算法
3-3-1 使用候选项集找频繁项集
3-3-2 由频繁项集产生关联规则
3-4 挖掘关联规则的多策略方法
3-4-1 多层关联规则
3-4-2 多维关联规则
第4章 决策树
4-1 什么是决策树
4-2 决策树的原理
4-2-1 归纳学习
4-2-2 决策树的表示
4-2-3 决策树学习
4-2-4 ID3算法
4-2-5 树剪枝
4-3 决策树的应用
4-3-1 规则提取
4-3-2 分类
4-4 决策树的优缺点
第5章 聚类分析
5-1 概述
5-1-1 什么是聚类分析
5-1-2 聚类分析的预备知识
5-1-3 聚类方法的分类
5-2 基于划分的聚类算法
5-2-1 基于划分的评价函数
5-2-2 k-平均方法
5-2-3 k-中心点方法
5-3 层次聚类
5-3-1 凝聚方法
5-3-2 分裂方法
5-4 孤立点分析
5-4-1 基于统计的孤立点检测
5-4-2 基于距离的孤立点检测
5-4-3 基于偏离的孤立点检测
第6章 基于样例的学习
6-1 概述
6-2 k-最近邻算法
6-2-1 基本思想
6-2-2 k-最近邻算法
6-2-3 距离加权最近邻算法
6-3 基于样例的推理
6-3-1 CBR过程
6-3-2 样例的表示
6-3-3 相似性关系
6-3-4 样例的修正和调整
第7章 贝叶斯学习
7-1 贝叶斯理论
7-1-1 贝叶斯理论的基本理念
7-1-2 贝叶斯定理
7-1-3 极大似然和最小误差平方假设
7-2 相素贝叶斯分类
7-3 贝叶斯信念网络
7-3-1 贝叶斯信念网络的结构
7-3-2 贝叶斯信念网络的训练
7-4 贝叶斯分类的应用
第8章 粗糙集
8-1 关于知识的观点
8-2 粗糙集理论的知识发现
8-3 决策表的定义
8-4 数据离散化
8-5 决策规则的获取
8-6 粗糙集的化简
8-6-1 属性的化简
8-6-2 一致决策的化简
8-6-3 属性重要性试题
第9章 神经网络
9-1 什么是神经网络
9-2 神经网络的表示和学习
9-2-1 基本神经元模型
9-2-2 基本的神经网络模型
9-2-3 感知器
9-2-4 神经网络的学习
9-3 多层前馈神经网络
9-3-1 前馈神经网络模型和表征能力
9-3-2 后向传播算法
9-3-3 后向传播法则的推导
9-4 反馈式神经网络
9-4-1 离散型神经网络
9-4-2 连续型神经网络
9-5 神经网络的应用之一——聚类
第10章 遗传算法
10-1 遗传算法概述
10-1-1 基本思想和术语
10-1-2 遗传算法的基础
10-1-3 遗传算法的特点
10-2 基本遗传算法
10-3 遗传算法的实现技术
10-3-1 编码方法
10-3-2 适应性度量
10-3-3 选择策略
10-3-4 交叉和变变异遗传算子
10-4 遗传算法的理论分析
10-4-1 模式定理
10-4-2 积木块假设与欺骗问题
10-4-3 隐并行性
10-4-4 遗传算法的收敛性分析
10-5 遗传算法的应用实例
第11章 统计分析
11-1 样本和统计推理
11-1-1 通过概率分布和密度描述数据
11-1-2 置信区间的推导
11-2 回归分析
11-2-1 具有线性结构的回归模型
11-2-2 最小二乘法拟合
11-2-3 多元线性回归
11-2-4 非线性回归数据分析
11-3 及成分分析
11-3-1 高维数据综合简化的思想和原则
11-3-2 主成分分析的算法推导
第12章 文本和Web挖掘
12-1 概述
12-1-1 文本挖掘的任务
12-1-2 Web挖掘的特点
12-1-3 Web挖掘的任务
12-2 文本挖掘技术
12-2-1 文本的向量空间表示
12-2-2 文本特征的提取
12-2-3 文本信息挖掘系统
12-3 Web数据挖掘技术
12-3-1 Web结构挖掘
12-3-2 Web使用记录的挖掘
12-3-3 Web内容挖掘
12-3-4 个人偏好建模
12-4 文本和Web挖掘的应用
12-4-1 文档分类
12-4-2 自动推荐系统
第13章 数据挖掘的应用和发展趋势
13-1 空间数据挖掘
13-1-1 空间数据库
13-1-2 空间数据挖掘发现的知识类型
13-1-3 空间数据挖掘方法
13-2 图像检索和挖掘
13-2-1 基于内容的检索
13-2-2 图像数据库挖掘
13-3 时间序列和序列检索
13-3-1 序列模式分析
13-3-2 时间序列数据
13-3-3 趋势分析
13-3-4 时序分析
13-4 隐私面临的挑战
第14章 商业智能解决方案实例分析
14-1 商业智能概述
14-1-1 传统的信息系统的不足
14-1-2 什么是商业智能
14-2 商业智能系统的处理流程和框架
14-2-1 商业智能系统的处理流程
14-2-2 商业智能系统的框架
14-3 商业智能解决方案
14-3-1 概述
14-3-2 数据仓库
14-3-3 数据仓库管理
14-3-4 数据清洗和转换
14-3-5 在线分析
14-3-6 前端工具
14-3-7 数据挖掘
附录A IBM DB2 Intelligent Miner简介
A-1 DB2 Intelligent Miner功能简介
A-2 DB2 Intelligent Miner for Data使用简介
A-2-1 业务定义
A-2-2 定义数据对象
A-3 创建模型
A-4 模型应用
A-5 创建统计函数
A-6 解释挖掘结果
参考文献
1-1 什么是数据挖掘
1-2 为何进行数据挖掘
1-3 数据挖掘和统计分析的关系
1-4 数据挖掘与数据仓库的关系
1-5 数据挖掘系统和其他系统的比较
1-5-1 数据挖掘系统与专家系统的比较
1-5-2 数据挖掘和OLAP的比较
1-6 数据挖掘系统的分类
第2章 数据挖掘过程
2-1 问题定义与主题分析
2-2 数据准备
2-2-1 数据清理
2-2-2 数据集成
2-2-3 数据选择
2-2-4 数据变换
2-2-5 数据归约
2-2-6 数据质量分析
2-3 建立模型
2-3-1 模型是什么
2-3-2 模型的精确度
2-3-3 模型的验证
2-4 模式评估
2-4-1 模式是什么
2-4-2 挖掘结果的评价和验证
2-5 数据可视化和知识管理
2-5-1 可视化表示
2-5-2 知识管理
第3章 关联规则
3-1 概述
3-1-1 啤酒和尿布问题
3-1-2 基本概念
3-2 关联规则
3-2-1 概念分层
3-2-2 兴趣度
3-2-3 数据库中关联规则的发现
3-3 关联规则学习的Apriori算法
3-3-1 使用候选项集找频繁项集
3-3-2 由频繁项集产生关联规则
3-4 挖掘关联规则的多策略方法
3-4-1 多层关联规则
3-4-2 多维关联规则
第4章 决策树
4-1 什么是决策树
4-2 决策树的原理
4-2-1 归纳学习
4-2-2 决策树的表示
4-2-3 决策树学习
4-2-4 ID3算法
4-2-5 树剪枝
4-3 决策树的应用
4-3-1 规则提取
4-3-2 分类
4-4 决策树的优缺点
第5章 聚类分析
5-1 概述
5-1-1 什么是聚类分析
5-1-2 聚类分析的预备知识
5-1-3 聚类方法的分类
5-2 基于划分的聚类算法
5-2-1 基于划分的评价函数
5-2-2 k-平均方法
5-2-3 k-中心点方法
5-3 层次聚类
5-3-1 凝聚方法
5-3-2 分裂方法
5-4 孤立点分析
5-4-1 基于统计的孤立点检测
5-4-2 基于距离的孤立点检测
5-4-3 基于偏离的孤立点检测
第6章 基于样例的学习
6-1 概述
6-2 k-最近邻算法
6-2-1 基本思想
6-2-2 k-最近邻算法
6-2-3 距离加权最近邻算法
6-3 基于样例的推理
6-3-1 CBR过程
6-3-2 样例的表示
6-3-3 相似性关系
6-3-4 样例的修正和调整
第7章 贝叶斯学习
7-1 贝叶斯理论
7-1-1 贝叶斯理论的基本理念
7-1-2 贝叶斯定理
7-1-3 极大似然和最小误差平方假设
7-2 相素贝叶斯分类
7-3 贝叶斯信念网络
7-3-1 贝叶斯信念网络的结构
7-3-2 贝叶斯信念网络的训练
7-4 贝叶斯分类的应用
第8章 粗糙集
8-1 关于知识的观点
8-2 粗糙集理论的知识发现
8-3 决策表的定义
8-4 数据离散化
8-5 决策规则的获取
8-6 粗糙集的化简
8-6-1 属性的化简
8-6-2 一致决策的化简
8-6-3 属性重要性试题
第9章 神经网络
9-1 什么是神经网络
9-2 神经网络的表示和学习
9-2-1 基本神经元模型
9-2-2 基本的神经网络模型
9-2-3 感知器
9-2-4 神经网络的学习
9-3 多层前馈神经网络
9-3-1 前馈神经网络模型和表征能力
9-3-2 后向传播算法
9-3-3 后向传播法则的推导
9-4 反馈式神经网络
9-4-1 离散型神经网络
9-4-2 连续型神经网络
9-5 神经网络的应用之一——聚类
第10章 遗传算法
10-1 遗传算法概述
10-1-1 基本思想和术语
10-1-2 遗传算法的基础
10-1-3 遗传算法的特点
10-2 基本遗传算法
10-3 遗传算法的实现技术
10-3-1 编码方法
10-3-2 适应性度量
10-3-3 选择策略
10-3-4 交叉和变变异遗传算子
10-4 遗传算法的理论分析
10-4-1 模式定理
10-4-2 积木块假设与欺骗问题
10-4-3 隐并行性
10-4-4 遗传算法的收敛性分析
10-5 遗传算法的应用实例
第11章 统计分析
11-1 样本和统计推理
11-1-1 通过概率分布和密度描述数据
11-1-2 置信区间的推导
11-2 回归分析
11-2-1 具有线性结构的回归模型
11-2-2 最小二乘法拟合
11-2-3 多元线性回归
11-2-4 非线性回归数据分析
11-3 及成分分析
11-3-1 高维数据综合简化的思想和原则
11-3-2 主成分分析的算法推导
第12章 文本和Web挖掘
12-1 概述
12-1-1 文本挖掘的任务
12-1-2 Web挖掘的特点
12-1-3 Web挖掘的任务
12-2 文本挖掘技术
12-2-1 文本的向量空间表示
12-2-2 文本特征的提取
12-2-3 文本信息挖掘系统
12-3 Web数据挖掘技术
12-3-1 Web结构挖掘
12-3-2 Web使用记录的挖掘
12-3-3 Web内容挖掘
12-3-4 个人偏好建模
12-4 文本和Web挖掘的应用
12-4-1 文档分类
12-4-2 自动推荐系统
第13章 数据挖掘的应用和发展趋势
13-1 空间数据挖掘
13-1-1 空间数据库
13-1-2 空间数据挖掘发现的知识类型
13-1-3 空间数据挖掘方法
13-2 图像检索和挖掘
13-2-1 基于内容的检索
13-2-2 图像数据库挖掘
13-3 时间序列和序列检索
13-3-1 序列模式分析
13-3-2 时间序列数据
13-3-3 趋势分析
13-3-4 时序分析
13-4 隐私面临的挑战
第14章 商业智能解决方案实例分析
14-1 商业智能概述
14-1-1 传统的信息系统的不足
14-1-2 什么是商业智能
14-2 商业智能系统的处理流程和框架
14-2-1 商业智能系统的处理流程
14-2-2 商业智能系统的框架
14-3 商业智能解决方案
14-3-1 概述
14-3-2 数据仓库
14-3-3 数据仓库管理
14-3-4 数据清洗和转换
14-3-5 在线分析
14-3-6 前端工具
14-3-7 数据挖掘
附录A IBM DB2 Intelligent Miner简介
A-1 DB2 Intelligent Miner功能简介
A-2 DB2 Intelligent Miner for Data使用简介
A-2-1 业务定义
A-2-2 定义数据对象
A-3 创建模型
A-4 模型应用
A-5 创建统计函数
A-6 解释挖掘结果
参考文献
猜您喜欢