书籍详情
数据挖掘技术
作者:朱玉全、杨鹤标、孙蕾
出版社:东南大学出版社
出版时间:2006-11-01
ISBN:9787564105945
定价:¥25.00
购买这本书可以去
内容简介
数据采集和存储技术的进步导致了数据规模的日益增加,数据是一种宝贵的信息资源,但这种资源同矿藏一样,只有通过管理、分析、挖掘、提炼等操作,才能使潜在的资源变成可用的财富。 本书系统地介绍了数据挖掘技术的产生、发展、应用及相关原理和算法,其主要内容包括:数据挖掘基本知识、数据挖掘处理流程、数据仓库和联机分析处理、关联规则发现方法、序列模式挖掘方法、决策树分类方法、贝叶斯分类法、各种聚类方法、Web挖掘以及分类方法在医学图像中的应用。本书包含了作者多年来在数据挖掘中的研究成果。 本书可作为计算机专业、自动化专业、生物医学专业等高年级本科生与研究生课程的教材,也可作为需要了解数据挖掘有关方法与技术的研究、设计和开发人员的参考书。
作者简介
暂缺《数据挖掘技术》作者简介
目录
1绪论
1.1数据管理
1.1.1人工管理阶段
1.1.2文件系统阶段
1.1.3数据库系统阶段
1.2数据仓库和联机分析处理
1.3数据挖掘和知识发现
1.3.1数据挖掘的发展
1.3.2数据挖掘的对象
1.3.3数据挖掘的目的
1.3.4数据挖掘过程
1.3.5数据挖掘的分类
1.3.6数据挖掘方法和技术
1.3.7数据挖掘技术的难点
1.4数据挖掘工具
1.4.1数据挖掘工具的选择
1.4.2数据挖掘原型系统
1.4.3主要商业产品介绍
1.5本章小结
2数据仓库和联机分析处理
2.1数据仓库概念
2.1.1数据仓库的产生
2.1.2数据仓库的定义
2.2数据仓库中的数据组织
2.2.1数据仓库的数据组织结构
2.2.2数据仓库的系统结构
2.3数据仓库的基本数据模型
2.3.1星型模型
2.3.2雪花模型
2.4数据仓库的实现策略
2.5数据仓库与联机分析处理
2.6联机分析处理
2.6.1基本概念
2.6.2多维分析的基本分析动作
2.6.3OLAP结构
2.6.4OLTP和OLAP的比较
2.7数据仓库与数据挖掘
2.8本章小结
3关联规则挖掘
3.1基本概念
3.2关联规则的Apriori算法
3.2.1Apriori算法
3.2.2AptioriTid算法
3.2.3AprioriI-tybrid算法
3.3Apriori的改进算法
3.3.1基于散列(Hash)的方法
3.3.2基于数据分割(Partition)的方法
3.3.3基于采样(Sampling)的方法
3.4基于FP—tree的关联规则挖掘算法FP—growth
3.4.1算法描述
3.4.2示例说明
3.5多层关联规则挖掘
3.6多维关联规则挖掘
3.7基于约束的关联规则挖掘
3.8数量关联规则挖掘
3.8.1基本概念
3.8.2数量关联规则的分类
3.8.3数量关联规则挖掘的一般步骤
3.8.4数值属性离散化问题
3.9最大频繁项目集挖掘
3.9.1最大频繁项目集
3.9.2基于Apriori的最大频繁项目集挖掘算法
3.9.3基于FP-tree的最大频繁项目集挖掘算法
3.10关联规则更新挖掘算法
3.10.1数据集的增量性更新挖掘算法
3.10.2算法参数的相似性更新挖掘算法
3.10.3基于FP-tree的关联规则更新挖掘算法
3.10.4基于FP-tree的最大频繁项目集更新算法
3.11一种新的支持度计算方法
3.11.1基本概念
3.11.2候选频繁项目集的生成
3.11.3项目集支持数计算方法
3.12负关联规则挖掘算法
3.12.1基本概念
3.12.2基于Apriori的负关联规则挖掘算法
3.12.3基于频繁模式树的负关联规则挖掘算法
3.13加权关联规则挖掘算法
3.13.1加权关联规则模型
3.13.2加权关联规则的发现
3.14本章小结
4序列模式挖掘
4.1问题描述
4.2类Apriori(Apriori—based)方法
4.3GSP算法
4.4基于投影的序列模式挖掘算法PrefixSpan
4.4.1基本概念
4.4.2算法描述
4.4.3示例说明
4.5SPADE方法
4.5.1基本理论
4.5.2支持数(度)计算
4.5.3基于前缀分类的格分解
4.5.4频繁序列模式搜索
4.5.5SPADE算法的设计和实现
4.6序列模式增量式更新算法
4.6.1基本概念
4.6.2算法描述
4.6.3示例说明
4.7本章小结
5分类
5.1分类概述
5.2决策树(DecisionTree)方法
5.2.1决策树方法概述
5.2.2决策树方法的理论基础
5.2.3决策树的表示
5.2.4决策树的生成
5.3ID3决策树方法
5.3.1ID3算法的决策属性选择方法
5.3.2ID3算法示例
5.3.3ID3的特点
5.4C4.5方法
5.4.1C4.5方法中决策树的构造
5.4.2处理未知属性值的训练样本
5.4.3连续属性的处理
5.4.4决策树修剪
5.4.5交叉验证
5.4.6规则的抽取
5.5IBLE决策规则树方法
5.6SLIQ:一种快速可扩展的分类算法
5.6.1算法的扩展性
5.6.2SLlQ分类器
5.6.3算法流程
5.7SPRINT:一种可扩展的并行分类器
5.8贝叶斯方法
5.8.1贝叶斯理论
5.8.2朴素贝叶斯分类
5.9本章小结
6聚类分析
6.1什么是聚类分析
6.2距离和相似系数
6.2.1距离
6.2.2相似系数
6.3聚类分析的过程
6.3.1数据准备
6.3.2特征生成
6.3.3聚类分析
6.4聚类分析算法的分类
6.4.1划分法
6.4.2层次方法
6.4.3基于密度的方法
6.4.4基于网格的方法
6.4.5基于模型的方法
6.4.6基于变换的聚类算法
6.5常用的聚类算法
6.5.1划分法
6.5.2层次方法
6.5.3基于密度的方法
6.5.4基于网格的聚类方法
6.5.5基于模型的聚类方法
6.5.6模糊聚类算法FCM
6.5.7聚类算法性能评价
6.6孤立点分析
6.7高维空间聚类问题
6.8本章小结
7Web挖掘
7.1Web挖掘概述
7.2Web挖掘基本流程
7.3Web挖掘分类
7.3.1Web内容挖掘
7.3.2Web结构挖掘
7.3.3Web用法挖掘
7.4Web挖掘的应用前景
7.5本章小结
8基于数据挖掘的医学图像分类
8.1分类模型的基本框架
8.2医学图像的特征描述
8.3医学图像分割及局部组织特征的提取
8.3.1医学图像分割
8.3.2局部组织特征的提取
8.4关联分类规则
8.4.1关联分类规则
8.4.2频繁关联分类规则挖掘算法
8.4.3精确关联分类规则挖掘算法
8.5规则比较与分析
8.6本章小结
参考文献
1.1数据管理
1.1.1人工管理阶段
1.1.2文件系统阶段
1.1.3数据库系统阶段
1.2数据仓库和联机分析处理
1.3数据挖掘和知识发现
1.3.1数据挖掘的发展
1.3.2数据挖掘的对象
1.3.3数据挖掘的目的
1.3.4数据挖掘过程
1.3.5数据挖掘的分类
1.3.6数据挖掘方法和技术
1.3.7数据挖掘技术的难点
1.4数据挖掘工具
1.4.1数据挖掘工具的选择
1.4.2数据挖掘原型系统
1.4.3主要商业产品介绍
1.5本章小结
2数据仓库和联机分析处理
2.1数据仓库概念
2.1.1数据仓库的产生
2.1.2数据仓库的定义
2.2数据仓库中的数据组织
2.2.1数据仓库的数据组织结构
2.2.2数据仓库的系统结构
2.3数据仓库的基本数据模型
2.3.1星型模型
2.3.2雪花模型
2.4数据仓库的实现策略
2.5数据仓库与联机分析处理
2.6联机分析处理
2.6.1基本概念
2.6.2多维分析的基本分析动作
2.6.3OLAP结构
2.6.4OLTP和OLAP的比较
2.7数据仓库与数据挖掘
2.8本章小结
3关联规则挖掘
3.1基本概念
3.2关联规则的Apriori算法
3.2.1Apriori算法
3.2.2AptioriTid算法
3.2.3AprioriI-tybrid算法
3.3Apriori的改进算法
3.3.1基于散列(Hash)的方法
3.3.2基于数据分割(Partition)的方法
3.3.3基于采样(Sampling)的方法
3.4基于FP—tree的关联规则挖掘算法FP—growth
3.4.1算法描述
3.4.2示例说明
3.5多层关联规则挖掘
3.6多维关联规则挖掘
3.7基于约束的关联规则挖掘
3.8数量关联规则挖掘
3.8.1基本概念
3.8.2数量关联规则的分类
3.8.3数量关联规则挖掘的一般步骤
3.8.4数值属性离散化问题
3.9最大频繁项目集挖掘
3.9.1最大频繁项目集
3.9.2基于Apriori的最大频繁项目集挖掘算法
3.9.3基于FP-tree的最大频繁项目集挖掘算法
3.10关联规则更新挖掘算法
3.10.1数据集的增量性更新挖掘算法
3.10.2算法参数的相似性更新挖掘算法
3.10.3基于FP-tree的关联规则更新挖掘算法
3.10.4基于FP-tree的最大频繁项目集更新算法
3.11一种新的支持度计算方法
3.11.1基本概念
3.11.2候选频繁项目集的生成
3.11.3项目集支持数计算方法
3.12负关联规则挖掘算法
3.12.1基本概念
3.12.2基于Apriori的负关联规则挖掘算法
3.12.3基于频繁模式树的负关联规则挖掘算法
3.13加权关联规则挖掘算法
3.13.1加权关联规则模型
3.13.2加权关联规则的发现
3.14本章小结
4序列模式挖掘
4.1问题描述
4.2类Apriori(Apriori—based)方法
4.3GSP算法
4.4基于投影的序列模式挖掘算法PrefixSpan
4.4.1基本概念
4.4.2算法描述
4.4.3示例说明
4.5SPADE方法
4.5.1基本理论
4.5.2支持数(度)计算
4.5.3基于前缀分类的格分解
4.5.4频繁序列模式搜索
4.5.5SPADE算法的设计和实现
4.6序列模式增量式更新算法
4.6.1基本概念
4.6.2算法描述
4.6.3示例说明
4.7本章小结
5分类
5.1分类概述
5.2决策树(DecisionTree)方法
5.2.1决策树方法概述
5.2.2决策树方法的理论基础
5.2.3决策树的表示
5.2.4决策树的生成
5.3ID3决策树方法
5.3.1ID3算法的决策属性选择方法
5.3.2ID3算法示例
5.3.3ID3的特点
5.4C4.5方法
5.4.1C4.5方法中决策树的构造
5.4.2处理未知属性值的训练样本
5.4.3连续属性的处理
5.4.4决策树修剪
5.4.5交叉验证
5.4.6规则的抽取
5.5IBLE决策规则树方法
5.6SLIQ:一种快速可扩展的分类算法
5.6.1算法的扩展性
5.6.2SLlQ分类器
5.6.3算法流程
5.7SPRINT:一种可扩展的并行分类器
5.8贝叶斯方法
5.8.1贝叶斯理论
5.8.2朴素贝叶斯分类
5.9本章小结
6聚类分析
6.1什么是聚类分析
6.2距离和相似系数
6.2.1距离
6.2.2相似系数
6.3聚类分析的过程
6.3.1数据准备
6.3.2特征生成
6.3.3聚类分析
6.4聚类分析算法的分类
6.4.1划分法
6.4.2层次方法
6.4.3基于密度的方法
6.4.4基于网格的方法
6.4.5基于模型的方法
6.4.6基于变换的聚类算法
6.5常用的聚类算法
6.5.1划分法
6.5.2层次方法
6.5.3基于密度的方法
6.5.4基于网格的聚类方法
6.5.5基于模型的聚类方法
6.5.6模糊聚类算法FCM
6.5.7聚类算法性能评价
6.6孤立点分析
6.7高维空间聚类问题
6.8本章小结
7Web挖掘
7.1Web挖掘概述
7.2Web挖掘基本流程
7.3Web挖掘分类
7.3.1Web内容挖掘
7.3.2Web结构挖掘
7.3.3Web用法挖掘
7.4Web挖掘的应用前景
7.5本章小结
8基于数据挖掘的医学图像分类
8.1分类模型的基本框架
8.2医学图像的特征描述
8.3医学图像分割及局部组织特征的提取
8.3.1医学图像分割
8.3.2局部组织特征的提取
8.4关联分类规则
8.4.1关联分类规则
8.4.2频繁关联分类规则挖掘算法
8.4.3精确关联分类规则挖掘算法
8.5规则比较与分析
8.6本章小结
参考文献
猜您喜欢