书籍详情
实体识别关键技术的研究
作者:黎玲利
出版社:哈尔滨工业大学出版社
出版时间:2023-08-01
ISBN:9787576709254
定价:¥48.00
内容简介
实体识别在数据质量管理中起着重要作用,它是数据质量管理的重要研究方向。实体识别的目的是识别出数据集中描述同一真实世界实体的元组。实体识别的结果可以在数据质量管理的其他阶段(如数据清洗阶段和数据质量评估阶段)得到广泛应用。在一个或多个数据库中,同一个现实世界实体可能具有多种描述方式,这一问题在各种应用领域的信息系统中普遍存在。本书以信息集成和互联网搜索为背景,介绍对数据质量管理中实体识别的关键技术的 研究成果,以 化实体识别结果 度、 小化时间复杂性为目标,研究基于图模型的实体识别、基于规则的实体识别、基于距离度量的实体识别和对冗余元组中实体描述的冲突评估。本书可作为科研机构数据质量管理方面的参考用书。
作者简介
暂缺《实体识别关键技术的研究》作者简介
目录
第1章 绪论
1.1 研究背景
1.2 研究现状及分析
1.3 本书的研究内容
第2章 基于图模型的实体识别
2.1 引言
2.2 基于图模型的实体识别框架
2.3 基于EIF的作者识别算法
2.4 实验评估
2.5 本章小结
第3章 基于规则的实体识别
3.1 引言
3.2 实体识别规则
3.3 实体识别规则的发现
3.4 基于规则的实体识别
3.5 规则的 新
3.6 实验评估
3.7 本章小结
第4章 基于距离度量的实体识别
4.1 引言
4.2 背景介绍
4.3 实体识别的度量学习
4.4 基于距离度量的实体识别
4.5 实验评估
4.6 本章小结
第5章 对冗余元组中实体描述的冲突评估
5.1 引言
5.2 实体描述冲突模型
5.3 edc范围计算问题
5.4 edc范围计算框架
5.5 实验评估
5.6 本章小结
参考文献
1.1 研究背景
1.2 研究现状及分析
1.3 本书的研究内容
第2章 基于图模型的实体识别
2.1 引言
2.2 基于图模型的实体识别框架
2.3 基于EIF的作者识别算法
2.4 实验评估
2.5 本章小结
第3章 基于规则的实体识别
3.1 引言
3.2 实体识别规则
3.3 实体识别规则的发现
3.4 基于规则的实体识别
3.5 规则的 新
3.6 实验评估
3.7 本章小结
第4章 基于距离度量的实体识别
4.1 引言
4.2 背景介绍
4.3 实体识别的度量学习
4.4 基于距离度量的实体识别
4.5 实验评估
4.6 本章小结
第5章 对冗余元组中实体描述的冲突评估
5.1 引言
5.2 实体描述冲突模型
5.3 edc范围计算问题
5.4 edc范围计算框架
5.5 实验评估
5.6 本章小结
参考文献
猜您喜欢