书籍详情
面向web数据的信息抽取及融合技术研究
作者:王君泽 著
出版社:华中科技大学出版社
出版时间:2021-06-01
ISBN:9787568068291
定价:¥68.00
购买这本书可以去
内容简介
随着Web数据的不断扩充,如何从Web数据中抽取信息并融合成指导决策的情报,已成为广泛关注的领域。面向Web数据的信息抽取和融合可以通过统计、在线分析处理、情报检索、机器学习、专家系统、模式识别等诸多方法来实现上述目标。本书是信息抽取领域的学术著作,旨在从情报检索的视角介绍面向非限定领域的Web数据分析及处理方法。本书从基本概念讲解信息抽取以及融合,涉及词、句、篇章等层面的分析和处理策略,特别是针对情报处理的需要,以“事件”为切入点,将包括中文分词、词性标注、组块划分、句法分析、*大熵模型、条件随机域模型、马尔科夫模型等各类相关的处理模型和技术融入事件抽取、事件类型及元素识别、事件信息融合等领域的具体处理任务中加以介绍,并对信息抽取及融合等领域的发展状况及代表性处理手段进行介绍。
作者简介
王君泽,1982年生,工学博士,管理学博士后,华中科技大学公共管理学院硕士生导师。2010年毕业于华中科技大学电子与信息工程系,获博士学位。主要研究方向为网络舆情、国家信息安全、公共情报管理等。目前已经在IEEE Intelligent Systems、《新闻与传播研究》、《管理世界》、《情报学报》等国内外权威刊物上发表论文多篇。主持自然科学基金项目一项。
目录
章Web数据在情报分析中的效用研究/ 1节情报分析中的Web数据使用/ 1
第二节Web数据效用发挥面临的挑战/ 4
第三节小结/ 6
第二章中文分词及词性标注/ 8节中文自动分词的难点/ 8
第二节中文分词的基本方法/ 10
第三节中文词性标注的难点/ 14
第四节中文词性标注的基本方法/ 15
第三章中文句法分析/ 21节完全句法分析技术/ 21
第二节浅层句法分析/ 26
第四章语料库与词汇知识库/ 28节语料库技术/ 28
第二节词汇知识库/ 34
第五章Web数据消重/ 39节引言/ 39
第二节相关工作与研究框架/ 40
第三节算法流程分析/ 41
第四节算法效果评估/ 44
第五节基于网页转载关系识别的舆情传播态势分析/ 47
第六章基于熵模型的中文事件抽取方法研究/ 49节引言/ 49
第二节相关工作/ 51
第三节基于熵模型的事件类型及元素标注/ 52
第四节基于组块分析的标注单元划分/ 54
第五节实验及结果分析/ 56
第七章共指事件的事件表象可信度评估模型研究/ 58目录面向Web数据的信息抽取及融合技术研究节引言/ 58
第二节相关工作/ 59
第三节事件表象信任网络/ 61
第四节基于信任网络的事件表象可信度计算/ 63
第五节实验与分析/ 64
第八章面向新闻文本的事件表象融合策略研究/ 68节引言/ 68
第二节相关研究工作/ 69
第三节事件表象之间的共指关系识别/ 70
第四节基于Opinosis图结构的共指事件表象融合/ 74
第五节实验与结果分析/ 77
第九章面向共指事件识别的同义表述模式抽取研究/ 79节引言/ 79
第二节相关研究工作/ 80
第三节词级别同义表述模式抽取/ 82
第四节语句级别同义表述模式抽取/ 86
第五节实验/ 91
第十章基于共指事件识别的同义词集构建研究/ 96节研究背景/ 96
第二节相关工作/ 97
第三节共指事件表述识别/ 99
第四节同义词抽取及筛选策略/ 103
第五节实验/ 105
第十一章基于评论针对性的评论排序/ 108节问题定义与分析/ 109
第二节评论针对性的计算策略/ 111
第三节实验/ 114
第四节分析和讨论/ 116第十二章裁判文书类案推送中的案情相似度计算模型研究/ 118节背景介绍/ 118
第二节相关研究工作/ 119
第三节模型构建/ 120
第四节实验/ 126
第十三章舆情数据中的话题分析研究/ 130节PLSA介绍/ 130
第二节数据相关工作/ 132
第三节结果/ 134
第四节讨论/ 139
参考文献/ 141
第二节Web数据效用发挥面临的挑战/ 4
第三节小结/ 6
第二章中文分词及词性标注/ 8节中文自动分词的难点/ 8
第二节中文分词的基本方法/ 10
第三节中文词性标注的难点/ 14
第四节中文词性标注的基本方法/ 15
第三章中文句法分析/ 21节完全句法分析技术/ 21
第二节浅层句法分析/ 26
第四章语料库与词汇知识库/ 28节语料库技术/ 28
第二节词汇知识库/ 34
第五章Web数据消重/ 39节引言/ 39
第二节相关工作与研究框架/ 40
第三节算法流程分析/ 41
第四节算法效果评估/ 44
第五节基于网页转载关系识别的舆情传播态势分析/ 47
第六章基于熵模型的中文事件抽取方法研究/ 49节引言/ 49
第二节相关工作/ 51
第三节基于熵模型的事件类型及元素标注/ 52
第四节基于组块分析的标注单元划分/ 54
第五节实验及结果分析/ 56
第七章共指事件的事件表象可信度评估模型研究/ 58目录面向Web数据的信息抽取及融合技术研究节引言/ 58
第二节相关工作/ 59
第三节事件表象信任网络/ 61
第四节基于信任网络的事件表象可信度计算/ 63
第五节实验与分析/ 64
第八章面向新闻文本的事件表象融合策略研究/ 68节引言/ 68
第二节相关研究工作/ 69
第三节事件表象之间的共指关系识别/ 70
第四节基于Opinosis图结构的共指事件表象融合/ 74
第五节实验与结果分析/ 77
第九章面向共指事件识别的同义表述模式抽取研究/ 79节引言/ 79
第二节相关研究工作/ 80
第三节词级别同义表述模式抽取/ 82
第四节语句级别同义表述模式抽取/ 86
第五节实验/ 91
第十章基于共指事件识别的同义词集构建研究/ 96节研究背景/ 96
第二节相关工作/ 97
第三节共指事件表述识别/ 99
第四节同义词抽取及筛选策略/ 103
第五节实验/ 105
第十一章基于评论针对性的评论排序/ 108节问题定义与分析/ 109
第二节评论针对性的计算策略/ 111
第三节实验/ 114
第四节分析和讨论/ 116第十二章裁判文书类案推送中的案情相似度计算模型研究/ 118节背景介绍/ 118
第二节相关研究工作/ 119
第三节模型构建/ 120
第四节实验/ 126
第十三章舆情数据中的话题分析研究/ 130节PLSA介绍/ 130
第二节数据相关工作/ 132
第三节结果/ 134
第四节讨论/ 139
参考文献/ 141
猜您喜欢