书籍详情

基于潜在语义的个性化搜索关键技术研究

基于潜在语义的个性化搜索关键技术研究

作者:陈冬玲 著

出版社:中国水利水电出版社

出版时间:2013-08-01

ISBN:9787517010319

定价:¥36.00

购买这本书可以去
内容简介
《基于潜在语义的个性化搜索关键技术研究》包括以下几个方面:
  (1)在计算机研究领域内,从哲学、心理学角度剖析用户搜索行为,并从认知学的角度,提出了基于概率潜在语义动机分析的用户行为模型,高度概括了各种具体搜索行为,从抽象的角度去理解用户的搜索行为。该模型的提出为进一步研究个性化搜索提供了新的思路。
  (2)在文档潜在语义空间中,应用Zipf分布与概率潜在语义分析算法相结合的方式进行文档潜在主题提取,改善了文档潜在主题提取的质量。
  (3)以狄氏先验的有限混合模型理论为基础,提出了高效无监督的网页聚类算法。可以有效克服一般的文本聚类算法无法有效应对的高维性、稀疏性文本,以及文本数据之间的相似性函数定义困难,聚类质量和效率低等不足,改善了聚类效果,提高了捕获用户兴趣潜在主题需求的能力。
  (4)提出了一种新的基于用户潜在语义分析的查询扩展技术。即将通用搜索中查询扩展的技术与用户动机挖掘技术相结合,而开发出的一种新的查询扩展技术,解决了搜索引擎由于通用的性质而缺乏面向用户的个性化的信息处理的能力,从了解用户的语义上的搜索动机以及了解认知与心理相互作用的角度出发,从根本上解决了查询过程中的一词多义及多词同义等问题,在个性化搜索过程中有效的进行语义消歧。
  (5)针对面向查询的排名算法的不足提出了面向用户的重排名算法。即在原有网页排序算法的基础上,根据用户的兴趣偏好而提出的一种局部优化排序算法,既符合用户的个性化需求,又不影响搜索结果的查全率,尽可能做到其排序结果与用户语义动机相符合。
作者简介
陈冬玲,女,汉族,1973年12月生于吉林省四平市。1992年考入东北帅范大学计算机科学系计算机教育专业,1996年7月毕业,获得理学学士学位。同年,到沈阳大学师范学院任教,教授计算机专业课程:“汇编语言”、“数据结构”、“数据库原理”等。并于2002年9月考取东北大学信息与工程学院计算机应用专业硕士,于2005年7月毕业并获硕士学位,同年考取东北大学信息与工程学院计算机软件与理论专业博士研究生。
  在攻读博士期间,一直致力于用户行为分析与动机挖掘工作,曾作为主要参与人员参加国家自然基金课题(No.60573090)“面向新一代搜索引擎的用户动机推演模型的研究”,2006.1~2008.12,并作为主要参与人员参加辽宁省自然科学基金项目(No.20062032)“新一代搜索引擎中用户模型关键技术的研究”,2006.10-2008.12。
  攻读博士期间还发表多篇文章,包括APWEB/WAIM2007、DEWEB2008.Joumal of Computational In for mation System、东北大学学报(自然科学版),小型微型计算机系统等著名国际会议和国内著名杂志论文。其中,第一作者EI索引论文5篇,ISTP索引的论文3篇。
目录
前言
第1章 绪论
1.1 搜索引擎体系结构及功能
1.1.1 信息的收集
1.1.2 信息预处理
1.1.3 查询服务
1.2 个性化搜索引擎
1.2.1 个性化搜索引擎的体系结构
1.2.2 个性化搜索关键技术
1.2.3 个性化搜索研究现状
1.2.4 个性化搜索面临的问题与挑战
1.3 本文研究的主要内容
1.4 本文的组织结构

第2章 基于概率潜在语义的用户模型构造
2.1 问题提出
2.2 用户模型研究综述
2.2.1 用户模型的创建技术研究
2.2.2 用户模型的学习与更新技术研究
2.2.3 用户模型应用技术的研究
2.3 用户搜索行为的理论分析
2.3.1 从认知角度分析用户的搜索行为
2.3.2 用户搜索行为的不确定性
2.3.3 用户搜索行为分析的逻辑框架
2.4 用户动机分析的两类不确定问题
2.5 基于PLSA的潜在概念获取与用户模型构建
2.5.1 概率潜在语义分析
2.5.2 潜在语义空间的Zipf分布
2.5.3 基于PLSA的用户动机建模
2.5.4 用户模型的学习与更新
2.6 实验及评价
2.6.1 数据集
2.6.2 评价标准
2.6.3 实验结果及分析
2.7 本章小结

第3章 基于有限混合模型的文本聚类
3.1 问题提出
3.2 传统聚类算法的概述
3.2.1 基于相似性的聚类方法
3.2.2 基于模型的聚类
3.2.3 各类算法的对比分析
3.3 传统聚类方式在个性化搜索中存在的问题
3.4 基于有限混合主题模型的文档聚类分析
3.4.1 有限混合模型
3.4.2 EM算法
3.4.3 基于有限混合模型的文档聚类
3.5 实验及评价
3.5.1 实验数据集
3.5.2 评价标准
3.5.3 实验结果及分析
3.6 本章小结

第4章 基于用户潜在语义动机的查询扩展
4.1 问题提出
4.2 现有的查询扩展方法概述
4.2.1 基于大规模语料库的查询扩展方法
4.2.2 基于语义关系/语义结构的查询扩展方法
4.3 目前查询扩展方法的不足
4.4 基于潜在语义动机的查询扩展
4.4.1 ULSM-QE的框架
4.4.2 查询词处理
4.4.3 查询语义动机分析
4.4.4 相关度计算
4.4.5 查询词的语义消歧
4.4.6 生成新查询
4.5 实验及评价
4.5.1 数据集
4.5.2 评价标准
4.5.3 实验结果及分析
4.6 本章小结

第5章 基于用户偏好的网页排序局部优化策略
5.1 问题提出
5.2 传统网页排序算法介绍
5.2.1 PageRank算法及其衍生算法
5.2.2 HITS算法
5.3 传统排序算法存在的问题
5.4 基于用户偏好的网页排序
5.4.1 UP-PR.框架
5.4.2 查询词的主题分类
5.4.3 网页的主题分类
5.4.4 参数的选择
5.5 实验及评价
5.5.1 数据集
5.5.2 评价标准
5.5.3 实验结果及分析
5.6 本章小结

第6章 结论
6.1 本文的主要贡献与结论
6.2 进一步的工作
参考文献
作者简介
猜您喜欢

读书导航