书籍详情
多媒体信息处理与检索技术
作者:朱学芳著
出版社:电子工业出版社
出版时间:2002-11-01
ISBN:9787505383098
定价:¥25.00
购买这本书可以去
内容简介
本书在介绍多媒体信息处理技术的基础上,重点讲述了多媒体信息的检索技术。涉及的内容有语音信号、图像信号和视频信号的处理与检索,以及文字图像分离处理等技术。本书从研究和技术实现的角度出发,既包含较深的理论研究,又包含具体的技术实现过程。具有较高的学术水平和实用价值。可作为高等院校信号与信息处理、通信、模式识别与人工智能、信息管理等专业与学科的研究生教学参考书,也可供这些领域的科研及工程技术人员参考。
作者简介
朱学芳:南京大学信息管理系副教授,IEEE会员,CSIAM会员,中国计算机学会高级会员,中国图像图形学会理事,中国电子学会高级会员。朱先生生于1962年,1994年7月毕业于北京应用数学专业,获博士学位。1994年至1996年在南京大学物理学博士后流动站工作,2000年5月至11月在北京大学担任访问学者。他的研究领域涉及模式识别、计算机图形处理、多媒体信息处理及检索等。近几年他发表了30多篇论文和专著,曾获电子工业部“先进奖”,北京大学“光华奖”等,主持完成8项基金项目、2项其他项目。他的代表作有:《手写数字图像识别及模式分析》、《计算机图像处理导论》等。
目录
第1章 多媒体检索技术概述
1.1 基于内容的多媒体数据检索
1.2 基于内容的检索特点
1.3 系统构成
1.4 多媒体数据基于内容查询
1.4.1 提交查询的方式
1.4.2 查询类型
第2章 语音处理技术
2.1 语音信号的时域特性显示
2.1.1 语音的WAV 文件格式
2.1.2 时域特性及表示
2.1.3 时域特性显示程序
2.2 自动分段
2.2.1 自动分段过程
2.2.2 寂静段. 有声段子程序. 自动分段结果
2.3 语音信号的频域显示及声谱差特征
2.3.1 傅氏变换及语谱图
2.3.2 语谱图显示程序
2.3.3 语谱图显示
2.3.4 声谱差特征
2.4 语音信号的非均匀采样的实现
2.4.1 分段信号频率的获取
2.4.2 重采样的实现
2.4.3 实验结果及分析
2.5 语音非均匀重采样值的重构实现技术
2.5.1 重构的实现技术
2.5.2 重构实验结果
第3章 音频检索的技术实现
3.1 音频检索
3.2 系统设计框架
3.2.1 基于语音的特征相似度的算法
3.2.2 基于语音数据相关性的算法
3.3 数据预处理
3.3.1 数据预处理的实现
3.3.2 特征抽取模块
3.3.3 检索匹配
3.3.4 波形显示程序
3.3.5 匹配结果显示
3.4 基于相关检索的程序设计
3.4.1 均值和均方值的计算
3.4.2 检索和匹配
3.4.3 语音检索系统界面
第4章 图像检索技术
4.1 图像检索技术概述
4.1.1 基于图像外部特征的检索方法
4.1.2 基于文本描述的方法
4.1.3 传统图像检索方法的局限性
4.2 新型图像检索技术——基于内容的图像检索技术
4.2.1 基于内容的图像检索技术简介
4.2.2 基于内容的图像检索技术概念模型
4.3 静态图像检索技术
4.3.1 基于颜色特征的检索
4.3.2 基于形状特征的检索
4.3.3 基于纹理特征的检索
4.3.4 基于空间位置关系特征的检索
4.3.5 基于对象特征的检索
4.4 基于内容的图像检索系统
4.4.1 基于内容的图像检索系统效果评价
4.4.2 基于内容的图像检索典型系统介绍
4.5 目前图像检索技术研究的热点问题
4.5.1 两类图像检索技术的结合
4.5.2 对基于内容编码技术的研究
4.5.3 对用户查询接口的研究
4.5.4 对图像数据库的研究
4.6 图像检索实例
4.6.1 基于色彩直方图的检索实例
4.6.2 基于区域形状的检索实例
第5章 多媒体信息检索平台
5.1 Windows环境下的图像处理
5.1.1 位图操作的函数简介
5.1.2 BMP图像的读取
5.1.3 位图的显示
5.1.4 图像数据的数组化获取
5.2 平台界面及功能介绍
5.2.1 总体功能介绍
5.2.2 程序界面及功能介绍
5.3 程序的实现代码
5.3.1 BMP图像文件和位图的处理
5.3.2 平台界面的部分类介绍
5.3.3 界面相关功能的实现
第6章 版面分析
6.1 彩色图像特性统计分析
6.2 编程实现过程
6.2.1 程序框架
6.2.2 图像的处理过程及中间结果
6.3 文字分离实验结果
6.3.1 无表格情况时的分离结果
6.3.2 有表格情况时的分离结果
6.4 流程图及部分源程序
6.4.1 主流程图
6.4.2 主流程图对应的源程序
6.4.3 设置输出矩形框的流程图
6.4.4 基于直方图的分析流程图
6.4.5 基于直方图的分析源程序
6.4.6 后处理流程图
第7章 彩色图像放大重构
7.1 彩色图像重采样方法
7.2 彩色图像的重构
7.3 彩色图像重采样. 重构实验
7.4 Hermite插值技术实现图像放大
7.4.1 两点三次Hermite插值
7.4.2 图像信号的重构与放大显示
第8章 图像分割
8.1 图像分割的一般概念
8.1.1 图像分割的一般模型
8.1.2 图像分割的一般算法
8.1.3 图像分割的方法特点
8.2 图像边缘提取
8.2.1 微分算子法
8.2.2 梯度算子
8.2.3 Sobel算子
8.2.4 Kirsh算子
8.2.5 Laplacian算子
8.2.6 Prewitt算子
8.2.7 Marr算子
8.3 分割系统的程序设计
8.3.1 采用区域中灰度范围分割
8.3.2 基于子区域的区域增长算法
8.3.3 待分割图像的预处理
8.3.4 程序结果后处理
8.4 软件系统的编程环境和框架
8.4.1 CDIB类
8.4.2 CMainFrame类
8.4.3 CSplitmapDoc类
8.4.4 CSplitMapView类
8.4.5 Process.cpp文件
8.4.6 主要函数流程图
8.5 分割结果
8.5.1 系统主界面
8.5.2 直方图
8.5.3 模拟彩色图分割
8.5.4 实际彩色图分割
8.5.5 区域图的处理
8.5.6 抽样分割
第9章 视频信号处理基础
9.1 视频信号格式基础
9.1.1 RIFF文件
9.1.2 视频交互文件AVI格式
9.1.3 AVI文件头
9.1.4 对AVI格式的说明补充
9.2 播放AVI的程序实现
9.2.1 MCIWnd
9.2.2 程序实现
9.3 接入摄像头的程序实现
9.4 缩小AVI的程序实现
9.5 视频放大的程序实现
第10章 目标图像跟踪
10.1 简介
10.1.1 数字图像的处理和匹配技术
10.1.2 彩色模型
10.2 现有算法
10.2.1 模板匹配法
10.2.2 其他匹配算法
10.2.3 快速匹配算法
10.2.4 关于彩色图像
10.3 系统介绍
10.3.1 系统的主要过程框图
10.3.2 设计思路
10.3.3 系统界面
10.4 实验及结果比较
10.4.1 动画
10.4.2 自然摄制图像
10.4.3 多目标跟踪
10.4.4 压缩图像
10.4.5 算法的执行时间
10.4.6 跟踪中的漂移现象
第11章 视频流浏览与查询
11.1 视频特征分析
11.1.1 视频基础知识
11.1.2 视频特征
11.2 镜头分割
11.3 代表帧
11.4 视频信息的查询
11.4.1 基于内容检索的特点
11.4.2 基于内容的视频检索模块
11.4.3 视频检索类型
参考文献
后记
1.1 基于内容的多媒体数据检索
1.2 基于内容的检索特点
1.3 系统构成
1.4 多媒体数据基于内容查询
1.4.1 提交查询的方式
1.4.2 查询类型
第2章 语音处理技术
2.1 语音信号的时域特性显示
2.1.1 语音的WAV 文件格式
2.1.2 时域特性及表示
2.1.3 时域特性显示程序
2.2 自动分段
2.2.1 自动分段过程
2.2.2 寂静段. 有声段子程序. 自动分段结果
2.3 语音信号的频域显示及声谱差特征
2.3.1 傅氏变换及语谱图
2.3.2 语谱图显示程序
2.3.3 语谱图显示
2.3.4 声谱差特征
2.4 语音信号的非均匀采样的实现
2.4.1 分段信号频率的获取
2.4.2 重采样的实现
2.4.3 实验结果及分析
2.5 语音非均匀重采样值的重构实现技术
2.5.1 重构的实现技术
2.5.2 重构实验结果
第3章 音频检索的技术实现
3.1 音频检索
3.2 系统设计框架
3.2.1 基于语音的特征相似度的算法
3.2.2 基于语音数据相关性的算法
3.3 数据预处理
3.3.1 数据预处理的实现
3.3.2 特征抽取模块
3.3.3 检索匹配
3.3.4 波形显示程序
3.3.5 匹配结果显示
3.4 基于相关检索的程序设计
3.4.1 均值和均方值的计算
3.4.2 检索和匹配
3.4.3 语音检索系统界面
第4章 图像检索技术
4.1 图像检索技术概述
4.1.1 基于图像外部特征的检索方法
4.1.2 基于文本描述的方法
4.1.3 传统图像检索方法的局限性
4.2 新型图像检索技术——基于内容的图像检索技术
4.2.1 基于内容的图像检索技术简介
4.2.2 基于内容的图像检索技术概念模型
4.3 静态图像检索技术
4.3.1 基于颜色特征的检索
4.3.2 基于形状特征的检索
4.3.3 基于纹理特征的检索
4.3.4 基于空间位置关系特征的检索
4.3.5 基于对象特征的检索
4.4 基于内容的图像检索系统
4.4.1 基于内容的图像检索系统效果评价
4.4.2 基于内容的图像检索典型系统介绍
4.5 目前图像检索技术研究的热点问题
4.5.1 两类图像检索技术的结合
4.5.2 对基于内容编码技术的研究
4.5.3 对用户查询接口的研究
4.5.4 对图像数据库的研究
4.6 图像检索实例
4.6.1 基于色彩直方图的检索实例
4.6.2 基于区域形状的检索实例
第5章 多媒体信息检索平台
5.1 Windows环境下的图像处理
5.1.1 位图操作的函数简介
5.1.2 BMP图像的读取
5.1.3 位图的显示
5.1.4 图像数据的数组化获取
5.2 平台界面及功能介绍
5.2.1 总体功能介绍
5.2.2 程序界面及功能介绍
5.3 程序的实现代码
5.3.1 BMP图像文件和位图的处理
5.3.2 平台界面的部分类介绍
5.3.3 界面相关功能的实现
第6章 版面分析
6.1 彩色图像特性统计分析
6.2 编程实现过程
6.2.1 程序框架
6.2.2 图像的处理过程及中间结果
6.3 文字分离实验结果
6.3.1 无表格情况时的分离结果
6.3.2 有表格情况时的分离结果
6.4 流程图及部分源程序
6.4.1 主流程图
6.4.2 主流程图对应的源程序
6.4.3 设置输出矩形框的流程图
6.4.4 基于直方图的分析流程图
6.4.5 基于直方图的分析源程序
6.4.6 后处理流程图
第7章 彩色图像放大重构
7.1 彩色图像重采样方法
7.2 彩色图像的重构
7.3 彩色图像重采样. 重构实验
7.4 Hermite插值技术实现图像放大
7.4.1 两点三次Hermite插值
7.4.2 图像信号的重构与放大显示
第8章 图像分割
8.1 图像分割的一般概念
8.1.1 图像分割的一般模型
8.1.2 图像分割的一般算法
8.1.3 图像分割的方法特点
8.2 图像边缘提取
8.2.1 微分算子法
8.2.2 梯度算子
8.2.3 Sobel算子
8.2.4 Kirsh算子
8.2.5 Laplacian算子
8.2.6 Prewitt算子
8.2.7 Marr算子
8.3 分割系统的程序设计
8.3.1 采用区域中灰度范围分割
8.3.2 基于子区域的区域增长算法
8.3.3 待分割图像的预处理
8.3.4 程序结果后处理
8.4 软件系统的编程环境和框架
8.4.1 CDIB类
8.4.2 CMainFrame类
8.4.3 CSplitmapDoc类
8.4.4 CSplitMapView类
8.4.5 Process.cpp文件
8.4.6 主要函数流程图
8.5 分割结果
8.5.1 系统主界面
8.5.2 直方图
8.5.3 模拟彩色图分割
8.5.4 实际彩色图分割
8.5.5 区域图的处理
8.5.6 抽样分割
第9章 视频信号处理基础
9.1 视频信号格式基础
9.1.1 RIFF文件
9.1.2 视频交互文件AVI格式
9.1.3 AVI文件头
9.1.4 对AVI格式的说明补充
9.2 播放AVI的程序实现
9.2.1 MCIWnd
9.2.2 程序实现
9.3 接入摄像头的程序实现
9.4 缩小AVI的程序实现
9.5 视频放大的程序实现
第10章 目标图像跟踪
10.1 简介
10.1.1 数字图像的处理和匹配技术
10.1.2 彩色模型
10.2 现有算法
10.2.1 模板匹配法
10.2.2 其他匹配算法
10.2.3 快速匹配算法
10.2.4 关于彩色图像
10.3 系统介绍
10.3.1 系统的主要过程框图
10.3.2 设计思路
10.3.3 系统界面
10.4 实验及结果比较
10.4.1 动画
10.4.2 自然摄制图像
10.4.3 多目标跟踪
10.4.4 压缩图像
10.4.5 算法的执行时间
10.4.6 跟踪中的漂移现象
第11章 视频流浏览与查询
11.1 视频特征分析
11.1.1 视频基础知识
11.1.2 视频特征
11.2 镜头分割
11.3 代表帧
11.4 视频信息的查询
11.4.1 基于内容检索的特点
11.4.2 基于内容的视频检索模块
11.4.3 视频检索类型
参考文献
后记
猜您喜欢