书籍详情
数字语音处理
作者:姚天任编著
出版社:华中理工大学出版社
出版时间:1992-01-01
ISBN:9787560906188
定价:¥20.00
购买这本书可以去
内容简介
《研究生用书:数字语音处理》系统全面地讨论了语言信号数字处理的理论基础、各种方法和某些重要应用领域。全书十章,分别论及语音信号的基本性质和数字模型,短时时域处理技术,短时傅里叶分析,语音波形数字编码,同态语音处理和倒谱分析,线性预测编码,矢量量化,隐马尔柯夫模型,以及语音压缩、语音合成、语音识别和语音增强等典型应用领域。《研究生用书:数字语音处理》主要是为研究生和本科高年级学生写的,但也可作为工程技术人员和科学研究工作者的一本有用的参考书。
作者简介
姚天任,1962年毕业于北京清华大学无线电电子学系。1982年至1984年为美国辛辛那提大学访问学者。现任华中科技大学教授、博士生导师,中国电子学会信号处理分会副理事长《信号处理》学报编委会副主编。作者主要著作有《高频电子线路》、《数字信号处理》、《数字语音处理》和《现代数字信号处理》,分别获全国高等学校优秀教材奖、原电子部优秀教材一等奖、湖北省科技进步三等奖。主要科研成果有“数论变换和多项式变换的理论和应用”等4项国家自然科学基金项目,“蓝绿激光对潜通信”等3项“八五”和“九五”国防科技重点预研项目,分别获中船总科技进步一等奖。在国内外重要刊物和学术会议上发表论文百余篇。作者目前的主要研究方向是多媒体信息处理和通信、现代数字信号处理、语音压缩编码、汉语语音识别和语音增强等。
目录
第一章 绪论
1. 1 数字语音处理研究的内容
1. 2 语音处理的发展历史
1. 3 本书的内容
第二章 语音信号产生的数字模型
2. 1 人类的语言器官
2. 2 语音产生过程
2. 3 语音信号产生的数字模型
2. 4 语音信号的特性
2. 4. 1 语音的声学特性
2. 4. 2 语音的时间波形和频谱特性
2. 4. 3 语音信号的统计特性
2. 5 人类的听觉功能
第三章 语音波形的数字编码
3. 1 脉冲编码调制(PCM)
3. 1. 1 语音信号的取样
3. 1. 2 取样语音信号的量化
3. 1. 3 减小量化噪声影响的方法
3. 2 差分脉冲编码调制(DPCM)
3. 2. 1 DPCM原理
3. 2. 2 DPCM的信噪比
3. 2. 3 预测系数对差分增益的影响
3. 3 增量调制(DM)
3. 3. 1 DM原理
3. 3. 2 DM的斜率过载失真和颗粒噪声
3. 3. 3 DM的信噪比
3. 4 自适应技术在语音波形编码中的应用
3. 4. 1 一般原理
3. 4. 2 自适应量化
3. 4. 3 自适应增量调制(ADM)
3. 4. 4 自适应线性预测
3. 5 压缩比特率的其它方法
3. 5. 1 残差信号压缩
3. 5. 2 噪声整形
3. 5. 3 多脉冲技术
第四章 短时时域处理技术
4. 1 语音信号的短时处理方法
4. 2 短时能量和短时平均幅度
4. 2. 1 短时能量
4. 2. 2 短时平均幅度
4. 3 短时平均过零率
4. 4 短时自相关函数
4. 4. 1 短时自相关函数的定义
4. 4. 2 减少短时自相关函数计算量的方法
4. 4. 3 语音信号的短时自相关函数的实例
4. 4. 4 短时自相关函数的另一种计算方法
4. 4. 5 短时平均幅度差函数
4. 5 短时时域处理技术应用举例
4. 5. 1 语音段起止端点判别
4. 5. 2 基音周期的估计
4. 6 中值滤波在语音短时时域处理中的应用
第五章 短时傅里叶分析
5. 1 短时傅里叶变换的定义
5. 1. 1 定义
5. 1. 2 移动窗形状对短时傅里叶变换的影响
5. 1. 3 窗宽对短时频谱的影响
5. 1. 4 结论
5. 2 短时傅里叶变换的某些性质
5. 3 短时傅里叶变换的线性滤波实现
5. 4 短时傅里叶谱的取样
5. 4. 1 短时傅里叶变换的时域取样
5. 4. 2 短时傅里叶变换的频域取样
5. 4. 3 短时傅里叶变换时域和频域总取样率
5. 5 语音的短时合成技术
5. 5. 1 语音短时合成的滤波器组相加法
5. 5. 2 短时傅里叶变换的欠速率取样
5. 5. 3 语音短时合成的叠接相加法
5. 5. 4 短时频谱变化对合成结果的影响
5. 6 短时分析-合成数字滤波器组的设计
5. 6. 1 设计中需要考虑的实际问题
5. 6. 2 IIR滤波器组的设计
5. 6. 3 FIR带通滤波器组的设计
5. 7 用快速傅里叶变换进行短时傅里叶分析
5. 7. 1 基本原理
5. 7. 2 减少计算量的其它考虑
5. 7. 3 用FFT节省短时谱合成语音信号的计算量
第六章 语音信号的线性预测
6. 1 线性预测基本原理
6. 2 线性预测和信号模型之间的关系
6. 3 Levinson-Durbin算法
6. 4 格型滤波器
6. 4. 1 前向预测和反向预测
6. 4. 2 格型滤波器的结构
6. 4. 3 格型滤波器的性质
6. 5 由已知数据计算预测系数的方法
6. 5. 1 自相关法或Yule-Walker法
6. 5. 2 协方差法
6. 5. 3 Burg法
6. 6 线性预测的频域解释
6. 6. 1 最小预测误差
6. 6. 2 线性预测谱匹配性质
6. 7 线性预测模型的局限性
6. 7. 1 基音频率对预测系数的影响
6. 7. 2 高频损失问题
6. 8 线性预测分析应用举例
6. 8. 1 基音检测
6. 8. 2共振峰估计
6. 9 对数面积比(LAR)参数
第七章 语音信号的同态滤波和倒谱分析
7. 1 广义叠加原理
7. 2 卷积同态系统
7. 3 复倒谱的定义
7. 3. 1 复对数的多值性问题
7. 3. 2 X(z)的解析性问题
7. 4 复倒谱的性质和计算方法
7. 4. 1 复倒谱的性质
7. 4. 2 复倒谱的计算方法
7. 5 语音的倒谱分析
第八章 矢量量化
8. 1 矢量量化基本原理
8. 1. 1 矢量量化过程
8. 1. 2 失真的测度
8. 1. 3 码本的设计
8. 1. 4 计算量和存贮量的估计
8. 1. 5 几个例子
8. 2 矢量量化器的理论性能
8. 2. 1 率-失真理论
8. 2. 2 率-失真理论的一些结果
8. 2. 3 标量量化
8. 2. 4 矢量量化的一些理论结果
8. 3 矢量源的标量量化和矢量量化
8. 3. 1 比特分配
8. 3. 2 相关源的矢量旋转
8. 3. 3 标量量化和矢量量化的比较
8. 4 减少矢量量化中计算量和存贮量的方法
8. 4. 1 二叉树搜索
8. 4. 2 多级矢量量化
8. 4. 3 乘积码
8. 5 码本的训练和测试
8. 6 码本的鲁棒性
8. 7 时间依赖矢量量化
8. 7. 1 选帧传送
8. 7. 2 分段量化
8. 7. 3 自适应矢量量化器
8. 8 语音波形矢量量化
8. 8. 1 波形标量量化
8. 8. 2 波形矢量量化
第九章 隐马尔柯夫模型(HMM)
9. 1 隐马尔柯夫模型的定义
9. 1. 1 信号模型
9. 1. 2 离散马尔柯夫过程
9. 1. 3 隐马尔柯夫模型的概念
9. 1. 4 隐马尔柯夫模型的参数
9. 2 隐马尔柯夫模型的三个基本问题
9. 2. 1 三个基本问题的提出
9. 2. 2 第1个问题的求解
9. 2. 3 第2个问题的求解
9. 2. 4 第3个问题的求解
9. 3 隐马尔柯夫模型的类型
9. 3. 1 隐马尔柯夫模型中的连续观测密度
9. 3. 2 自回归隐马尔柯夫模型
9. 3. 3 隐马尔柯夫模型的变型
9. 3. 4 含有状态持续时间密度显函数的隐马尔柯夫模型
9. 3. 5 最佳判据
9. 3. 6 隐马尔柯夫模型的比较
9. 4 隐马尔柯夫模型的实现问题
9. 4. 1 定标
9. 4. 2 多个观测序列
9. 4. 3 隐马尔柯夫模型参数的初始估计
9. 4. 4 训练数据不够的影响
9. 4. 5 模型选择
第十章 数字语音处理的应用
10. 1 语音压缩
10. 1. 1 声码器的基本结构
10. 1. 2 通道声码器
10. 1. 3 共振峰声码器
10. 1. 4 线性预测编码声码器
10. 1. 5 矢量量化在语音压缩中的应用
10. 2 语音合成
10. 2. 1 以单词为基础的合成方法
10. 2. 2 以音节为基础的合成方法
10. 2. 3 以音素为基础的合成方法
10. 2. 4 语音合成器芯片和语音合成系统
10. 3 浯音识别
10. 3. 1 孤立单词语音识别
10. 3. 2 线性时间归一化
10. 3. 3 非线性时间归一化
10. 3. 4 采用DTW的孤立单词语音识别
10. 3. 5 隐马尔柯夫模型在孤立单词语音识别中的应用
10. 3. 6 连续语音识别
10. 4 语音增强
参考文献
1. 1 数字语音处理研究的内容
1. 2 语音处理的发展历史
1. 3 本书的内容
第二章 语音信号产生的数字模型
2. 1 人类的语言器官
2. 2 语音产生过程
2. 3 语音信号产生的数字模型
2. 4 语音信号的特性
2. 4. 1 语音的声学特性
2. 4. 2 语音的时间波形和频谱特性
2. 4. 3 语音信号的统计特性
2. 5 人类的听觉功能
第三章 语音波形的数字编码
3. 1 脉冲编码调制(PCM)
3. 1. 1 语音信号的取样
3. 1. 2 取样语音信号的量化
3. 1. 3 减小量化噪声影响的方法
3. 2 差分脉冲编码调制(DPCM)
3. 2. 1 DPCM原理
3. 2. 2 DPCM的信噪比
3. 2. 3 预测系数对差分增益的影响
3. 3 增量调制(DM)
3. 3. 1 DM原理
3. 3. 2 DM的斜率过载失真和颗粒噪声
3. 3. 3 DM的信噪比
3. 4 自适应技术在语音波形编码中的应用
3. 4. 1 一般原理
3. 4. 2 自适应量化
3. 4. 3 自适应增量调制(ADM)
3. 4. 4 自适应线性预测
3. 5 压缩比特率的其它方法
3. 5. 1 残差信号压缩
3. 5. 2 噪声整形
3. 5. 3 多脉冲技术
第四章 短时时域处理技术
4. 1 语音信号的短时处理方法
4. 2 短时能量和短时平均幅度
4. 2. 1 短时能量
4. 2. 2 短时平均幅度
4. 3 短时平均过零率
4. 4 短时自相关函数
4. 4. 1 短时自相关函数的定义
4. 4. 2 减少短时自相关函数计算量的方法
4. 4. 3 语音信号的短时自相关函数的实例
4. 4. 4 短时自相关函数的另一种计算方法
4. 4. 5 短时平均幅度差函数
4. 5 短时时域处理技术应用举例
4. 5. 1 语音段起止端点判别
4. 5. 2 基音周期的估计
4. 6 中值滤波在语音短时时域处理中的应用
第五章 短时傅里叶分析
5. 1 短时傅里叶变换的定义
5. 1. 1 定义
5. 1. 2 移动窗形状对短时傅里叶变换的影响
5. 1. 3 窗宽对短时频谱的影响
5. 1. 4 结论
5. 2 短时傅里叶变换的某些性质
5. 3 短时傅里叶变换的线性滤波实现
5. 4 短时傅里叶谱的取样
5. 4. 1 短时傅里叶变换的时域取样
5. 4. 2 短时傅里叶变换的频域取样
5. 4. 3 短时傅里叶变换时域和频域总取样率
5. 5 语音的短时合成技术
5. 5. 1 语音短时合成的滤波器组相加法
5. 5. 2 短时傅里叶变换的欠速率取样
5. 5. 3 语音短时合成的叠接相加法
5. 5. 4 短时频谱变化对合成结果的影响
5. 6 短时分析-合成数字滤波器组的设计
5. 6. 1 设计中需要考虑的实际问题
5. 6. 2 IIR滤波器组的设计
5. 6. 3 FIR带通滤波器组的设计
5. 7 用快速傅里叶变换进行短时傅里叶分析
5. 7. 1 基本原理
5. 7. 2 减少计算量的其它考虑
5. 7. 3 用FFT节省短时谱合成语音信号的计算量
第六章 语音信号的线性预测
6. 1 线性预测基本原理
6. 2 线性预测和信号模型之间的关系
6. 3 Levinson-Durbin算法
6. 4 格型滤波器
6. 4. 1 前向预测和反向预测
6. 4. 2 格型滤波器的结构
6. 4. 3 格型滤波器的性质
6. 5 由已知数据计算预测系数的方法
6. 5. 1 自相关法或Yule-Walker法
6. 5. 2 协方差法
6. 5. 3 Burg法
6. 6 线性预测的频域解释
6. 6. 1 最小预测误差
6. 6. 2 线性预测谱匹配性质
6. 7 线性预测模型的局限性
6. 7. 1 基音频率对预测系数的影响
6. 7. 2 高频损失问题
6. 8 线性预测分析应用举例
6. 8. 1 基音检测
6. 8. 2共振峰估计
6. 9 对数面积比(LAR)参数
第七章 语音信号的同态滤波和倒谱分析
7. 1 广义叠加原理
7. 2 卷积同态系统
7. 3 复倒谱的定义
7. 3. 1 复对数的多值性问题
7. 3. 2 X(z)的解析性问题
7. 4 复倒谱的性质和计算方法
7. 4. 1 复倒谱的性质
7. 4. 2 复倒谱的计算方法
7. 5 语音的倒谱分析
第八章 矢量量化
8. 1 矢量量化基本原理
8. 1. 1 矢量量化过程
8. 1. 2 失真的测度
8. 1. 3 码本的设计
8. 1. 4 计算量和存贮量的估计
8. 1. 5 几个例子
8. 2 矢量量化器的理论性能
8. 2. 1 率-失真理论
8. 2. 2 率-失真理论的一些结果
8. 2. 3 标量量化
8. 2. 4 矢量量化的一些理论结果
8. 3 矢量源的标量量化和矢量量化
8. 3. 1 比特分配
8. 3. 2 相关源的矢量旋转
8. 3. 3 标量量化和矢量量化的比较
8. 4 减少矢量量化中计算量和存贮量的方法
8. 4. 1 二叉树搜索
8. 4. 2 多级矢量量化
8. 4. 3 乘积码
8. 5 码本的训练和测试
8. 6 码本的鲁棒性
8. 7 时间依赖矢量量化
8. 7. 1 选帧传送
8. 7. 2 分段量化
8. 7. 3 自适应矢量量化器
8. 8 语音波形矢量量化
8. 8. 1 波形标量量化
8. 8. 2 波形矢量量化
第九章 隐马尔柯夫模型(HMM)
9. 1 隐马尔柯夫模型的定义
9. 1. 1 信号模型
9. 1. 2 离散马尔柯夫过程
9. 1. 3 隐马尔柯夫模型的概念
9. 1. 4 隐马尔柯夫模型的参数
9. 2 隐马尔柯夫模型的三个基本问题
9. 2. 1 三个基本问题的提出
9. 2. 2 第1个问题的求解
9. 2. 3 第2个问题的求解
9. 2. 4 第3个问题的求解
9. 3 隐马尔柯夫模型的类型
9. 3. 1 隐马尔柯夫模型中的连续观测密度
9. 3. 2 自回归隐马尔柯夫模型
9. 3. 3 隐马尔柯夫模型的变型
9. 3. 4 含有状态持续时间密度显函数的隐马尔柯夫模型
9. 3. 5 最佳判据
9. 3. 6 隐马尔柯夫模型的比较
9. 4 隐马尔柯夫模型的实现问题
9. 4. 1 定标
9. 4. 2 多个观测序列
9. 4. 3 隐马尔柯夫模型参数的初始估计
9. 4. 4 训练数据不够的影响
9. 4. 5 模型选择
第十章 数字语音处理的应用
10. 1 语音压缩
10. 1. 1 声码器的基本结构
10. 1. 2 通道声码器
10. 1. 3 共振峰声码器
10. 1. 4 线性预测编码声码器
10. 1. 5 矢量量化在语音压缩中的应用
10. 2 语音合成
10. 2. 1 以单词为基础的合成方法
10. 2. 2 以音节为基础的合成方法
10. 2. 3 以音素为基础的合成方法
10. 2. 4 语音合成器芯片和语音合成系统
10. 3 浯音识别
10. 3. 1 孤立单词语音识别
10. 3. 2 线性时间归一化
10. 3. 3 非线性时间归一化
10. 3. 4 采用DTW的孤立单词语音识别
10. 3. 5 隐马尔柯夫模型在孤立单词语音识别中的应用
10. 3. 6 连续语音识别
10. 4 语音增强
参考文献
猜您喜欢