书籍详情
大数据环境下局部模式挖掘关键技术研究
作者:姜涛 著
出版社:经济管理出版社
出版时间:2021-08-01
ISBN:9787509680766
定价:¥75.00
购买这本书可以去
内容简介
随着以高通量测序技术为代表的新技术得到发展和广泛应用,越来越多可利用的密集型数据开始出现。同时,大数据技术也处于如火如荼的发展中。在大数据环境下处理密集型数据成为可能,而其处理性能也是信息技术能否成功应用的关键。《大数据环境下局部模式挖掘关键技术研究》首先综述了从以基因表达数据为代表的密集型数据中挖掘局部模式的方法:并围绕局部模式并行挖掘的执行性能问题,提出了大数据环境下减少数据交互量的计算框架,在此基础上设计挖掘多种类型的局部模式的并行算法。其次,为了从源数据中直接搜索符合特定要求的多类型的局部模式,提出了基于前缀树索引的查询方法,进而提升了密集型数据的分析效率;然后针对局部模式的挖掘、索引与查询问题,设计了一个名为OEMGA的原型系统。最后,提出了利用领域知识的约束查询方法来提升局部模式查询的相关性。《大数据环境下局部模式挖掘关键技术研究》为大数据环境下密集型数据的有效分析提供了切实可行的解决方案,具有重要的理论意义和应用价值。
作者简介
姜涛,西北工业大学工学博士,现为河南财经政法大学计算机学院教师、硕士生导师。目前从事大数据管理、数据挖掘、信息检索等方面的研究。在国内外重要会议与期刊上发表论文多篇,其中CCFB类会议2篇、CCFC类会议2篇、CCFC类期刊1篇、《软件学报》1篇、《计算机研究与发展》1篇、中科院二区期刊1篇。主持国家自然科学基金青年项目1项、河南省科技攻关项目2项、河南省高等学校重点科研项目1项;参与国家自然科学基金重大项目、国家自然科学基金重点项目、国家自然科学基金青年项目以及各类省部级项目10余项。
目录
1 绪论
1.1 研究背景
1.2 基因表达数据挖掘
1.3 基因表达数据挖掘研究现状概述
1.3.1 基于定量测度的双聚类
1.3.2 基于定性测度的双聚类
1.3.3 基于查询的双聚类
1.3.4 约束型双聚类
1.3.5 存在的问题
1.4 主要工作
1.5 组织结构
2 基因表达数据中的局部模式挖掘研究综述
2.1 引言
2.2 问题定义
2.3 局部模式类型与标准
2.4 研究现状
2.4.1 基于定量测度的双聚类
2.4.2 基于定性测度的双聚类
2.4.3 基于查询的双聚类
2.4.4 约束型双聚类
2.4.5 存在的问题
2.5 未来研究方向
2.6 小结
3 基于蝶形网络的基因表达数据并行分割与挖掘方法
3.1 引言
3.2 问题定义与分析
3.2.1 问题定义
3.2.2 优缺点分析
3.3 并行分割方法
3.3.1 基于蝶形网络的HamaBSP框架
3.3.2 基于分布式哈希表的去冗余方法
3.3.3 结果完整性的证明
3.4 实验评估
3.4.1 分布式并行方法与单机实现的比较
3.4.2 分布式并行框架的比较
3.5 相关工作
3.6 小结
……
4 OPSM的索引与查询
5 OMEGA:OPSM的挖掘、索引与查询工具
6 基因表达数据中OPSM的约束查询
7 基于数字签名与Trie的OPSM约束查询
8 总结与展望
参考文献
1.1 研究背景
1.2 基因表达数据挖掘
1.3 基因表达数据挖掘研究现状概述
1.3.1 基于定量测度的双聚类
1.3.2 基于定性测度的双聚类
1.3.3 基于查询的双聚类
1.3.4 约束型双聚类
1.3.5 存在的问题
1.4 主要工作
1.5 组织结构
2 基因表达数据中的局部模式挖掘研究综述
2.1 引言
2.2 问题定义
2.3 局部模式类型与标准
2.4 研究现状
2.4.1 基于定量测度的双聚类
2.4.2 基于定性测度的双聚类
2.4.3 基于查询的双聚类
2.4.4 约束型双聚类
2.4.5 存在的问题
2.5 未来研究方向
2.6 小结
3 基于蝶形网络的基因表达数据并行分割与挖掘方法
3.1 引言
3.2 问题定义与分析
3.2.1 问题定义
3.2.2 优缺点分析
3.3 并行分割方法
3.3.1 基于蝶形网络的HamaBSP框架
3.3.2 基于分布式哈希表的去冗余方法
3.3.3 结果完整性的证明
3.4 实验评估
3.4.1 分布式并行方法与单机实现的比较
3.4.2 分布式并行框架的比较
3.5 相关工作
3.6 小结
……
4 OPSM的索引与查询
5 OMEGA:OPSM的挖掘、索引与查询工具
6 基因表达数据中OPSM的约束查询
7 基于数字签名与Trie的OPSM约束查询
8 总结与展望
参考文献
猜您喜欢