书籍详情
跨语言信息检索中的双语主题模型及算法研究
作者:罗远胜 著
出版社:复旦大学出版社
出版时间:2015-12-01
ISBN:9787309119435
定价:¥38.00
购买这本书可以去
内容简介
《跨语言信息检索中的双语主题模型及算法研究》是基于双语主题空间的跨语言信息检索总体框架研究,在统一的框架下,从双语平行语料库抽取出一系列的主题构成每种语言的主题空间。每种语言的主题空间独立存在,且通过双语语义对应关系建立双语主题空间。双语主题空间反映了文档与文档、文档与词、词与词的语义对应关系,揭示了语言之间、语言内部的固有结构和内在联系,是抽象的概念空间,是各语言原始文档的中间表示。表示方式可以是线性或者非线性的。从数学原理上来说,两个主题空间是近似等价的。我们将查询和文档投影到双语主题空间上,不需要直接翻译,可以实现跨语言的检索、分类和聚类。
作者简介
暂缺《跨语言信息检索中的双语主题模型及算法研究》作者简介
目录
图目录
表目录
1引言
1.1研究背景和意义
1.1.1研究背景
1.1.2研究意义
1.2国内外研究现状
1.2.1跨语言信息检索的概念
1.2.2跨语言检索方法研究
1.2.3跨语言文本分类方法研究
1.2.4跨语言文本聚类方法研究
1.2.5研究现状述评
1.3主要研究内容
1.4本书的基本结构
1.5本章小结
2基于双语主题空间的跨语言信息检索总体框架
2.1相关理论概述
2.1.1常用信息检索模型
2.1.2偏最小二乘统计理论
2.2跨语言检索问题的提出
2.3基于双语主题空间的CLIR总体框架
2.3.1基本思路
2.3.2总体框架
2.3.3跨语言检索过程
2.3.4跨语言文本分类过程
2.3.5跨语言文本聚类过程
2.4本章小结
3面向跨语言信息检索的中英平行语料库构建
3.1相关工作
3.2构建中英语料库的基本流程
3.3中英平行语料库构建
3.3.1中英平行语料库
3.3.2跨语言信息检索评测语料库
3.3.3跨语言文本分类评测语料库
3.3.4构建TREC—9中英平行语料库
3.4本章小结
4基于主题对偶空间的跨语言检索模型
4.1相关工作和问题的提出
4.2主题对偶空间的构建
4.3主题对偶空间模型的推导和算法实现
4.3.1模型推导
4.3.2算法设计
4.3.3算法复杂度分析
4.4实验结果和分析
4.4.1实验设计方案
4.4.2中英文词的翻译结果分析
4.4.3TDS模型抽取双语主题结果分析
4.4.4文档配对搜索性能对比分析
4.4.5跨语言检索性能对比分析
4.4.6模型参数敏感性分析
4.5本章小结
5跨语言中的双语主题相关性检索模型
5.1问题的提出
5.2双语主题空间的构建
5.3BiTC模型的推导和算法分析
5.3.1模型推导
5.3.2BiTC模型的跨语言信息检索过程
5.3.3算法复杂度分析
5.4实验结果和分析
5.4.1实验设计方案
5.4.2BiTC模型抽取双语相关主题结果分析
5.4.3文档配对搜索性能对比分析
5.4.4伪查询跨语言检索性能对比分析
5.4.5TREC—9中英平行文档集上的性能分析
5.5本章小结
6基于双语语义对应分析的跨语言文本分类/聚类方法
6.1相关工作和问题的提出
6.2方法推导和算法实现
6.2.1方法推导
6.2.2跨语言文本分类/聚类过程
6.2.3算法复杂度分析
6.3实验结果和分析
6.3.1实验设计方案
6.3.2小数据集举例分析
6.3.3BiSCAN抽取的双语主题数对分类性能的影响
6.3.4各方法的跨语言文本分类性能对比分析
6.3.5跨语言文本聚类性能对比分析
6.4本章小结
7总结与展望
7.1本书总结
7.2研究展望
参考文献
后记
表目录
1引言
1.1研究背景和意义
1.1.1研究背景
1.1.2研究意义
1.2国内外研究现状
1.2.1跨语言信息检索的概念
1.2.2跨语言检索方法研究
1.2.3跨语言文本分类方法研究
1.2.4跨语言文本聚类方法研究
1.2.5研究现状述评
1.3主要研究内容
1.4本书的基本结构
1.5本章小结
2基于双语主题空间的跨语言信息检索总体框架
2.1相关理论概述
2.1.1常用信息检索模型
2.1.2偏最小二乘统计理论
2.2跨语言检索问题的提出
2.3基于双语主题空间的CLIR总体框架
2.3.1基本思路
2.3.2总体框架
2.3.3跨语言检索过程
2.3.4跨语言文本分类过程
2.3.5跨语言文本聚类过程
2.4本章小结
3面向跨语言信息检索的中英平行语料库构建
3.1相关工作
3.2构建中英语料库的基本流程
3.3中英平行语料库构建
3.3.1中英平行语料库
3.3.2跨语言信息检索评测语料库
3.3.3跨语言文本分类评测语料库
3.3.4构建TREC—9中英平行语料库
3.4本章小结
4基于主题对偶空间的跨语言检索模型
4.1相关工作和问题的提出
4.2主题对偶空间的构建
4.3主题对偶空间模型的推导和算法实现
4.3.1模型推导
4.3.2算法设计
4.3.3算法复杂度分析
4.4实验结果和分析
4.4.1实验设计方案
4.4.2中英文词的翻译结果分析
4.4.3TDS模型抽取双语主题结果分析
4.4.4文档配对搜索性能对比分析
4.4.5跨语言检索性能对比分析
4.4.6模型参数敏感性分析
4.5本章小结
5跨语言中的双语主题相关性检索模型
5.1问题的提出
5.2双语主题空间的构建
5.3BiTC模型的推导和算法分析
5.3.1模型推导
5.3.2BiTC模型的跨语言信息检索过程
5.3.3算法复杂度分析
5.4实验结果和分析
5.4.1实验设计方案
5.4.2BiTC模型抽取双语相关主题结果分析
5.4.3文档配对搜索性能对比分析
5.4.4伪查询跨语言检索性能对比分析
5.4.5TREC—9中英平行文档集上的性能分析
5.5本章小结
6基于双语语义对应分析的跨语言文本分类/聚类方法
6.1相关工作和问题的提出
6.2方法推导和算法实现
6.2.1方法推导
6.2.2跨语言文本分类/聚类过程
6.2.3算法复杂度分析
6.3实验结果和分析
6.3.1实验设计方案
6.3.2小数据集举例分析
6.3.3BiSCAN抽取的双语主题数对分类性能的影响
6.3.4各方法的跨语言文本分类性能对比分析
6.3.5跨语言文本聚类性能对比分析
6.4本章小结
7总结与展望
7.1本书总结
7.2研究展望
参考文献
后记
猜您喜欢