书籍详情
智能数据挖掘
作者:于晓梅,王红 著
出版社:清华大学出版社
出版时间:2018-07-01
ISBN:9787302499855
定价:¥49.00
购买这本书可以去
内容简介
本书全面总结了不确定数据环境下频繁模式挖掘领域的主要研究成果,从数据模型、问题定义、常用算法等方面系统介绍不确定频繁项集挖掘、不确定序列模式挖掘、不确定频繁子图模式挖掘、不确定高效用项集挖掘和不确定加权频繁项集挖掘技术。重点针对两类典型的不确定数据,即概率数据和容错数据,进行概率频繁模式挖掘和近似频繁模式挖掘的研究,并应用于传统中医药数据环境下,从主观不确定性和客观不确定性两个方面提出相应的解决方案,实现基于不确定数据的高效频繁模式挖掘,并通过实验验证了它们的有效性和实用性。 本书主要面向对数据挖掘和机器学习感兴趣的科研人员和学生,特别适合从事不确定数据挖掘、频繁模式挖掘和关联规则发现以及相关研究领域的广大科技工作者和研究人员使用,也可以作为数据挖掘和机器学习相关课程的教学参考书。
作者简介
暂缺《智能数据挖掘》作者简介
目录
目录
第1章不确定频繁模式挖掘概述1
1.1不确定数据挖掘1
1.2不确定频繁模式挖掘研究背景2
1.3相关工作5
1.3.1完整的频繁项集挖掘6
1.3.2频繁闭项集挖掘8
1.3.3最大频繁项集挖掘9
1.3.4Topk频繁模式挖掘10
1.3.5近似频繁模式挖掘11
1.4研究内容与本书贡献12
1.4.1研究内容12
1.4.2本书贡献13
1.5本书结构15第2章不确定频繁模式挖掘技术17
2.1数据不确定性的原因17
2.2可能性世界理论和概率数据库18
2.3不确定频繁项集挖掘19
2.3.1基于概率数据的不确定数据模型20
2.3.2基于水平数据格式的挖掘方法21/智能数据挖掘——面向不确定数据的频繁模式目录/2.3.3基于垂直数据格式的挖掘方法22
2.4不确定序列模式挖掘24
2.4.1不确定序列数据模型25
2.4.2不确定序列模式挖掘技术28
2.5不确定频繁子图模式挖掘32
2.5.1不确定图数据模型33
2.5.2不确定频繁子图模式挖掘技术37
2.6不确定高效用项集挖掘41
2.6.1不确定高效用数据模型41
2.6.2不确定高效用项集挖掘技术44
2.7不确定加权频繁项集挖掘46
2.7.1不确定加权数据模型47
2.7.2不确定加权频繁项集挖掘技术48
2.8本章小结52第3章Eclat框架下基于支持度的双向排序策略53
3.1基于垂直数据格式的Eclat算法53
3.1.1存在的问题53
3.1.2支持度性质及证明54
3.2基于支持度排序的双向处理策略56
3.2.1支持度升序排列阶段56
3.2.2支持度降序排列阶段57
3.2.3频繁项集挖掘中的双向处理策略57
3.2.4BiEclat算法58
3.2.5BiEclat算法示例59
3.3概率频繁模式挖掘中的双向排序策略61
3.3.1基于概率数据的不确定频繁模式挖掘61
3.3.2基于概率频度的双向排序策略64
3.4实验结果及分析65
3.4.1实验数据集65
3.4.2实验结果分析67
3.5本章小结76第4章Eclat框架下的概率频繁项集挖掘算法77
4.1概率频繁项集挖掘相关概念77
4.2概率频繁项集精确挖掘算法79
4.2.1相关工作80
4.2.2Tidlist数据结构81
4.2.3概率频度计算模块81
4.2.4UBEclat算法83
4.3概率频繁项集近似挖掘算法85
4.3.1近似挖掘理论基础85
4.3.2近似挖掘相关工作86
4.3.3NDUEclat算法88
4.4实验结果及分析89
4.4.1实验数据集90
4.4.2正态分布数据集中的性能分析90
4.4.3长尾分布数据集中的性能分析92
4.5本章小结95第5章基于粗糙集理论的近似频繁模式挖掘96
5.1容错数据中的频繁模式挖掘理论96
5.1.1容错数据模型96
5.1.2容错数据的挑战96
5.1.3粗糙集理论及相关概念99
5.1.4粗糙集理论在数据挖掘中的应用99
5.2面向容错数据的近似频繁模式挖掘101
5.2.1事务信息系统构建阶段101
5.2.2等价类生成阶段103
5.2.3下近似和上近似的定义104
5.2.4近似频繁模式挖掘阶段106
5.2.5精确度和覆盖度的定义108
5.3实验结果及分析109
5.3.1模拟数据集上的性能分析109
5.3.2真实数据集上的性能分析111
5.4本章小结115第6章在传统中医药数据集中挖掘Topk近似频繁闭模式116
6.1相关工作116
6.1.1面临的问题117
6.1.2近似频繁模式挖掘算法118
6.2基于粗糙集理论的Topk近似频繁闭模式挖掘123
6.2.1事务类划分阶段124
6.2.2核模式产生阶段126
6.2.3Topk近似频繁闭模式挖掘阶段129
6.3实验结果和分析131
6.3.1基于支持度的聚类算法性能分析131
6.3.2Topk近似频繁闭模式挖掘算法性能分析135
6.3.3实验结果分析138
6.4本章小结138第7章总结和展望140
7.1本书总结140
7.2研究展望141参考文献143
第1章不确定频繁模式挖掘概述1
1.1不确定数据挖掘1
1.2不确定频繁模式挖掘研究背景2
1.3相关工作5
1.3.1完整的频繁项集挖掘6
1.3.2频繁闭项集挖掘8
1.3.3最大频繁项集挖掘9
1.3.4Topk频繁模式挖掘10
1.3.5近似频繁模式挖掘11
1.4研究内容与本书贡献12
1.4.1研究内容12
1.4.2本书贡献13
1.5本书结构15第2章不确定频繁模式挖掘技术17
2.1数据不确定性的原因17
2.2可能性世界理论和概率数据库18
2.3不确定频繁项集挖掘19
2.3.1基于概率数据的不确定数据模型20
2.3.2基于水平数据格式的挖掘方法21/智能数据挖掘——面向不确定数据的频繁模式目录/2.3.3基于垂直数据格式的挖掘方法22
2.4不确定序列模式挖掘24
2.4.1不确定序列数据模型25
2.4.2不确定序列模式挖掘技术28
2.5不确定频繁子图模式挖掘32
2.5.1不确定图数据模型33
2.5.2不确定频繁子图模式挖掘技术37
2.6不确定高效用项集挖掘41
2.6.1不确定高效用数据模型41
2.6.2不确定高效用项集挖掘技术44
2.7不确定加权频繁项集挖掘46
2.7.1不确定加权数据模型47
2.7.2不确定加权频繁项集挖掘技术48
2.8本章小结52第3章Eclat框架下基于支持度的双向排序策略53
3.1基于垂直数据格式的Eclat算法53
3.1.1存在的问题53
3.1.2支持度性质及证明54
3.2基于支持度排序的双向处理策略56
3.2.1支持度升序排列阶段56
3.2.2支持度降序排列阶段57
3.2.3频繁项集挖掘中的双向处理策略57
3.2.4BiEclat算法58
3.2.5BiEclat算法示例59
3.3概率频繁模式挖掘中的双向排序策略61
3.3.1基于概率数据的不确定频繁模式挖掘61
3.3.2基于概率频度的双向排序策略64
3.4实验结果及分析65
3.4.1实验数据集65
3.4.2实验结果分析67
3.5本章小结76第4章Eclat框架下的概率频繁项集挖掘算法77
4.1概率频繁项集挖掘相关概念77
4.2概率频繁项集精确挖掘算法79
4.2.1相关工作80
4.2.2Tidlist数据结构81
4.2.3概率频度计算模块81
4.2.4UBEclat算法83
4.3概率频繁项集近似挖掘算法85
4.3.1近似挖掘理论基础85
4.3.2近似挖掘相关工作86
4.3.3NDUEclat算法88
4.4实验结果及分析89
4.4.1实验数据集90
4.4.2正态分布数据集中的性能分析90
4.4.3长尾分布数据集中的性能分析92
4.5本章小结95第5章基于粗糙集理论的近似频繁模式挖掘96
5.1容错数据中的频繁模式挖掘理论96
5.1.1容错数据模型96
5.1.2容错数据的挑战96
5.1.3粗糙集理论及相关概念99
5.1.4粗糙集理论在数据挖掘中的应用99
5.2面向容错数据的近似频繁模式挖掘101
5.2.1事务信息系统构建阶段101
5.2.2等价类生成阶段103
5.2.3下近似和上近似的定义104
5.2.4近似频繁模式挖掘阶段106
5.2.5精确度和覆盖度的定义108
5.3实验结果及分析109
5.3.1模拟数据集上的性能分析109
5.3.2真实数据集上的性能分析111
5.4本章小结115第6章在传统中医药数据集中挖掘Topk近似频繁闭模式116
6.1相关工作116
6.1.1面临的问题117
6.1.2近似频繁模式挖掘算法118
6.2基于粗糙集理论的Topk近似频繁闭模式挖掘123
6.2.1事务类划分阶段124
6.2.2核模式产生阶段126
6.2.3Topk近似频繁闭模式挖掘阶段129
6.3实验结果和分析131
6.3.1基于支持度的聚类算法性能分析131
6.3.2Topk近似频繁闭模式挖掘算法性能分析135
6.3.3实验结果分析138
6.4本章小结138第7章总结和展望140
7.1本书总结140
7.2研究展望141参考文献143
猜您喜欢