书籍详情
大数据相似查询关键技术研究
作者:孙佶 著
出版社:机械工业出版社
出版时间:2023-08-01
ISBN:9787111727330
定价:¥49.00
购买这本书可以去
内容简介
《大数据相似查询关键技术研究》由清华大学计算机科学与技术系博士、华为数据库专家孙佶撰写。全书首先介绍了相似查询问题的现实应用和价值,以及面临的技术挑战;然后提出一个相似查询系统,并且介绍了高效相似查询索引、相似查询代价估算及人在回路实体相似匹配的核心技术和创新思考。全书提供了丰富的实验数据和结果,分析了各种技术的优劣,也为实际产品的技术选型提供了重要参考。《大数据相似查询关键技术研究》共五章:第1章绪论,介绍了全书的研究背景、研究内容及主要贡献,并概述了全书的结构安排。第2章分布式内存相似查询系统Dima,介绍了分布式内存相似查询系统Dima。第3章基于学习的相似查询基数估计,提出了一种基于学习的相似查询技术估计技术,使用这种基数可以帮助相似查询系统进行查询执行计划优化。第4章基于相似查询的数据融合规则生成,介绍了一种基于相似查询的人在回路实体融合系统。第5章总结与展望,总结了全书的主要研究工作,并对未来的工作做出展望。
作者简介
孙佶,华为数据库专家,于2016年在北京邮电大学计算机科学与技术学院获得工学学士学位,并于2021年在清华大学计算机科学与技术系获得工学博士学位。主要研究方向包括基于智能技术的数据库系统性能优化(AI4Sys)、基于SQL的数据库内大规模数据分析(DB4AI)等。在SIGMOD、VLDB、ICDE等国际会议及IEEE TKDE等期刊上发表论文10余篇,被引500余次,申请专利4项,曾获得SIGMOD Programming Contest优胜奖,北京市普通高等学校优秀毕业生,CCF优秀博士学位论文奖,清华大学计算机科学与技术系优秀博士学位论文奖等。
目录
第1章 绪论
1.1 研究背景 1
1.2 标记增强简介 5
1.3 研究内容 7
1.4 组织结构 9
第2章 标记增强研究进展
2.1 引言 11
2.2 多标记学习 14
2.2.1 学习任务 14
2.2.2 学习方法 15
2.2.3 评价指标 22
2.3 标记分布学习 29
2.3.1 学习任务 31
2.3.2 学习方法 33
2.3.3 评价指标 39
2.4 标记增强 40
2.4.1 基于先验知识的标记增强 42
2.4.2 基于模糊方法的标记增强 45
2.4.3 基于图的标记增强 48
第3章 标记增强理论框架
3.1 引言 52
3.2 标记分布内在生成机制 54
3.3 标记分布质量评价 62
3.4 标记增强对分类器泛化性能的提升 66
3.5 实验结果与分析 68
3.5.1 标记分布恢复实验 68
3.5.2 消融实验 80
3.6 本章小结 85
第4章 面向标记分布学习的标记增强
4.1 引言 86
4.2 GLLE方法 87
4.2.1 优化框架 88
4.2.2 拓扑空间结构的引入 89
4.2.3 标记相关性的利用 90
4.2.4 优化策略 92
4.3 实验结果与分析 94
4.3.1 标记分布恢复实验 94
4.3.2 标记分布学习实验 103
4.3.3 标记相关性验证 107
4.4 本章小结 109
第5章 标记增强在其他学习问题上的应用
5.1 引言 111
5.2 多标记学习 112
5.2.1 LEMLL方法 113
5.2.2 实验结果与分析 118
5.3 偏标记学习 126
5.3.1 PLLE方法 128
5.3.2 实验结果与分析 132
5.4 本章小结 149
第6章 总结与展望
6.1 总结 151
6.2 下一步研究的方向 153
1.1 研究背景 1
1.2 标记增强简介 5
1.3 研究内容 7
1.4 组织结构 9
第2章 标记增强研究进展
2.1 引言 11
2.2 多标记学习 14
2.2.1 学习任务 14
2.2.2 学习方法 15
2.2.3 评价指标 22
2.3 标记分布学习 29
2.3.1 学习任务 31
2.3.2 学习方法 33
2.3.3 评价指标 39
2.4 标记增强 40
2.4.1 基于先验知识的标记增强 42
2.4.2 基于模糊方法的标记增强 45
2.4.3 基于图的标记增强 48
第3章 标记增强理论框架
3.1 引言 52
3.2 标记分布内在生成机制 54
3.3 标记分布质量评价 62
3.4 标记增强对分类器泛化性能的提升 66
3.5 实验结果与分析 68
3.5.1 标记分布恢复实验 68
3.5.2 消融实验 80
3.6 本章小结 85
第4章 面向标记分布学习的标记增强
4.1 引言 86
4.2 GLLE方法 87
4.2.1 优化框架 88
4.2.2 拓扑空间结构的引入 89
4.2.3 标记相关性的利用 90
4.2.4 优化策略 92
4.3 实验结果与分析 94
4.3.1 标记分布恢复实验 94
4.3.2 标记分布学习实验 103
4.3.3 标记相关性验证 107
4.4 本章小结 109
第5章 标记增强在其他学习问题上的应用
5.1 引言 111
5.2 多标记学习 112
5.2.1 LEMLL方法 113
5.2.2 实验结果与分析 118
5.3 偏标记学习 126
5.3.1 PLLE方法 128
5.3.2 实验结果与分析 132
5.4 本章小结 149
第6章 总结与展望
6.1 总结 151
6.2 下一步研究的方向 153
猜您喜欢