书籍详情

网络信息检索

网络信息检索

作者:董守斌,袁华 著

出版社:西安电子科技大学出版社

出版时间:2010-04-01

ISBN:9787560623788

定价:¥32.00

购买这本书可以去
内容简介
  《网络信息检索》详细介绍了网络信息检索的原理和技术,内容包括信息检索模型、网络信息的自动获取、网络信息预处理和索引、查询语言和查询优化等。针对网络信息检索的广泛应用,书中对搜索引擎、中文和跨语言信息检索、多媒体检索、并行和分布式信息检索、信息分类和聚类、信息提取与自动问答等重要应用的关键技术也进行了深入的探讨。《网络信息检索》层次分明,深入浅出;既有原理阐述和理论推导,也有大量的实例分析,阐述力求系统性和科学性。《网络信息检索》可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的高年级本科生或研究生的教科书和参考书,对广大从事网络信息检索、数字图书馆、信息管理、人工智能、Web数据挖掘等研究和应用开发的科技人员也有较大的参考价值。
作者简介
暂缺《网络信息检索》作者简介
目录
第1章 绪论
1.1 网络信息检索概述
1.1.1 网络信息
1.1.2 信息检索
1.1.3 网络信息检索
1.2 信息检索的发展
1.2.1 手工检索
1.2.2 脱机批处理检索
1.2.3 联机检索
1.2.4 网络信息检索
1.3 网络信息检索的应用
1.3.1 搜索引擎
1.3.2 多媒体信息检索
1.3.3 话题识别与跟踪
1.3.4 信息过滤
1.3.5 问题回答
思考题
参考文献
第2章 信息检索模型
2.1 检索模型定义
2.2 布尔模型
2.3 向量模型
2.3.1 索引项权重
2.3.2 相似度量
2.3.3 计算方法
2,4 概率模型
2.5 扩展的布尔模型
2.5.1 模糊集合模型
2.5.2 扩展布尔模型
2.6 扩展的向量模型
2.6.1 广义向量空间模型
2.6.2 潜语义标引模型
2.6.3 神经网络模型
2.7 扩展的概率模型
2.7.1 推理网络模型
2.7.2 信任度网络模型
2.7.3 语言模型
2.8 小结
思考题
习题
参考文献
第3章 网络信息的自动搜集
3.1 网络信息的特点
3.1.1 Web的组成
3.1.2 Web的特点
3.2 网络信息搜集的原理
3.2.1 信息搜集的基本流程
3.2.2 遍历策略
3.2.3 页面解析
3.3 网络信息搜集的礼貌原则
3.3.1 机器人排斥协议
3.3.2 机器人元标签
3.4 高性能信息搜集
3.4.1 并行搜集
3.4.2 DNS优化
3.4.3 优先搜集策略
3.4.4 网页更新
3.4.5 网页消重
3.4.6 避免蜘蛛陷阱
3.5 专题信息搜集
3.5.1 网页的主题特性
3.5.2 专题信息搜集算法
3.6 小结
思考题
习题
参考文献
第4章 网页文本处理和索引
4.1 文本的特性
4.1.1 信息熵
4.1.2 统计定律
4.2 网页信息的特征
4.2.1 网页结构
4.2.2 网页类型
4.3 网页去噪
4.3.1 基于网页结构的方法
4.3.2 基于模板的方法
4.4 文本处理
4.4.1 词汇分析
4.4.2 排除停用词
4.4.3 词干提取
4.4.4 索引词选择
4.5 索引
4.5.1 Trie树
4.5.2 后缀树
4.5.3 签名档
4.5.4 倒排文件
4.6 小结
思考题
习题
参考文献
第5章 查询语言与查询处理
5.1 Web查询语言
5.1.1 WebSQL查询语言
5.1.2 W3QL查询语言
5.1.3 WebOQL查询语言
5.2 查询方式
5.2.1 基于关键字的查询
5.2.2 模式匹配
5.3 相关反馈
5.3.1 向量空间模型中的相关反馈
5.3.2 概率模型中的相关反馈
5.4 查询扩展
5.4.1 基于字典的简单查询扩展
5.4.2 自动局部分析
5,4.3 自动全局分析
5.5 小结
思考题
习题
参考文献
第6章 信息检索性能评价
6.1 信息检索评价指标
6.1.1 查全率和查准率
6.1.2 其他评价指标
6.2 信息检索评价基准
6.2.1 基准测试
6.2.2 TREC评测
6.2.3 Web检索评价
6.2.4 CWIRF评测
6.3 小结
思考题
习题
参考文献
第7章 搜索引擎
7.1 概述
7.1.1 发展概况
7.1,2 术语与定义
7.1.3 工作原理
7.2 链接分析
7.2.1 PageRank
7.2.2 HITS
7.2.3 算法比较
7.3 相关排序
7.3.1 Lucene检索模型
7.3.2 Nutch排序算法
7.4 大规模搜索引擎
7.4.1 体系架构
7.4.2 数据结构
7.4.3 检索算法
7.4.4 相关排序
7.5 小结
思考题
习题
参考文献
第8章 并行和分布式信息检索
8.1 并行信息检索
8.1.1 并行计算的概念
8.1.2 并行信息检索体系架构
8.1.3 并行编程
8.1.4 数据并行
8.2 分布式信息检索
8.3 元搜索引擎
8.3.1 系统架构
8.3.2 资源选择
8.3.3 文档选择
8.3.4 信息融合
8.4 P2P网络信息检索
8.4.1 P2P网络信息检索的原理
8.4.2 非结构化P2P网络信息检索
8.4.3 结构化P2P网络信息检索
8.5 小结
思考题
习题
参考文献
第9章 中文和跨语言信息检索
9.1 中文预处理
9.1.1 中文编码及转换
9.1.2 中文分词
9.2 中文信息检索
9.2.1 中文检索模型
9.2.2 中文索引
9.3 跨语言信息检索
9.3.1 基本原理
9.3.2 基于GVSM的跨语言检索
9.3.3 基于LSI的跨语言检索
9,4 小结
思考题
习题
参考文献
第10章 多媒体信息检索
10.1 基于内容的图像信息检索
10.2 图像特征提取
10.2.1 颜色特征
10.2.2 形状特征提取
10.2.3 纹理特征提取
10.3 图像相似量度
10.4 基于内容的视频信息检索
10.4.1 镜头分割
10.4.2 关键帧提取
10.5 基于内容的音频信息检索
10.6 小结
思考题
习题
参考文献
第11章 信息分类与聚类
11.1 基本知识
11.1.1 类的概念
11.1.2 对象特征描述
11.1.3 文档相似性
11.1.4 类间距离
11.2 特征描述及提取
11.2.1 特征提取
11.2.2 特征选择
11.3 聚类方法
11.3.1 划分聚类法
11.3.2 层次聚类法
11.3.3 其他聚类方法
11.4 分类方法
11.4.1 NaiveBayes算法
11.4.2 kNN算法
11.4.3 Rocchio算法
11.4.4 SVM算法
11.5 方法评测
11.5.1 聚类方法评测
11.5.2 分类方法评测
11.5.3 显著性检验
11.6 小结
思考题
习题
参考文献
第12章 Web信息抽取与问答系统
12.1 信息抽取概述
12.1.1 信息抽取的发展
12.1.2 信息抽取的评价指标
12.2 Web信息抽取
12.2.1 基于关键字的Web信息抽取
12.2.2 基于模式的Web信息抽取
12.2.3 基于样本的Web信息抽取
12.3 问答系统
12.3.1 问题分析
12.3.2 信息检索
12.3.3 答案抽取
12.6 小结
思考题
参考文献
猜您喜欢

读书导航