书籍详情

数字语音处理

数字语音处理

作者:姚天任编著

出版社:华中理工大学出版社

出版时间:1992-01-01

ISBN:9787560906188

定价:¥20.00

购买这本书可以去
内容简介
  《研究生用书:数字语音处理》系统全面地讨论了语言信号数字处理的理论基础、各种方法和某些重要应用领域。全书十章,分别论及语音信号的基本性质和数字模型,短时时域处理技术,短时傅里叶分析,语音波形数字编码,同态语音处理和倒谱分析,线性预测编码,矢量量化,隐马尔柯夫模型,以及语音压缩、语音合成、语音识别和语音增强等典型应用领域。《研究生用书:数字语音处理》主要是为研究生和本科高年级学生写的,但也可作为工程技术人员和科学研究工作者的一本有用的参考书。
作者简介
  姚天任,1962年毕业于北京清华大学无线电电子学系。1982年至1984年为美国辛辛那提大学访问学者。现任华中科技大学教授、博士生导师,中国电子学会信号处理分会副理事长《信号处理》学报编委会副主编。作者主要著作有《高频电子线路》、《数字信号处理》、《数字语音处理》和《现代数字信号处理》,分别获全国高等学校优秀教材奖、原电子部优秀教材一等奖、湖北省科技进步三等奖。主要科研成果有“数论变换和多项式变换的理论和应用”等4项国家自然科学基金项目,“蓝绿激光对潜通信”等3项“八五”和“九五”国防科技重点预研项目,分别获中船总科技进步一等奖。在国内外重要刊物和学术会议上发表论文百余篇。作者目前的主要研究方向是多媒体信息处理和通信、现代数字信号处理、语音压缩编码、汉语语音识别和语音增强等。
目录
第一章  绪论                  
 1. 1  数字语音处理研究的内容                  
 1. 2  语音处理的发展历史                  
 1. 3  本书的内容                  
 第二章  语音信号产生的数字模型                  
 2. 1  人类的语言器官                  
 2. 2  语音产生过程                  
 2. 3  语音信号产生的数字模型                  
 2. 4  语音信号的特性                  
 2. 4. 1  语音的声学特性                  
 2. 4. 2  语音的时间波形和频谱特性                  
 2. 4. 3  语音信号的统计特性                  
 2. 5  人类的听觉功能                  
 第三章  语音波形的数字编码                  
 3. 1  脉冲编码调制(PCM)                  
 3. 1. 1  语音信号的取样                  
 3. 1. 2  取样语音信号的量化                  
 3. 1. 3  减小量化噪声影响的方法                  
 3. 2  差分脉冲编码调制(DPCM)                  
 3. 2. 1  DPCM原理                  
 3. 2. 2  DPCM的信噪比                  
 3. 2. 3  预测系数对差分增益的影响                  
 3. 3  增量调制(DM)                  
 3. 3. 1  DM原理                  
 3. 3. 2  DM的斜率过载失真和颗粒噪声                  
 3. 3. 3  DM的信噪比                  
 3. 4  自适应技术在语音波形编码中的应用                  
 3. 4. 1  一般原理                  
 3. 4. 2  自适应量化                  
 3. 4. 3  自适应增量调制(ADM)                  
 3. 4. 4  自适应线性预测                  
 3. 5  压缩比特率的其它方法                  
 3. 5. 1  残差信号压缩                  
 3. 5. 2  噪声整形                  
 3. 5. 3  多脉冲技术                  
 第四章  短时时域处理技术                  
 4. 1  语音信号的短时处理方法                  
 4. 2  短时能量和短时平均幅度                  
 4. 2. 1  短时能量                  
 4. 2. 2  短时平均幅度                  
 4. 3  短时平均过零率                  
 4. 4  短时自相关函数                  
 4. 4. 1  短时自相关函数的定义                  
 4. 4. 2  减少短时自相关函数计算量的方法                  
 4. 4. 3  语音信号的短时自相关函数的实例                  
 4. 4. 4  短时自相关函数的另一种计算方法                  
 4. 4. 5  短时平均幅度差函数                  
 4. 5  短时时域处理技术应用举例                  
 4. 5. 1  语音段起止端点判别                  
 4. 5. 2  基音周期的估计                  
 4. 6  中值滤波在语音短时时域处理中的应用                  
 第五章  短时傅里叶分析                  
 5. 1  短时傅里叶变换的定义                  
 5. 1. 1  定义                  
 5. 1. 2  移动窗形状对短时傅里叶变换的影响                  
 5. 1. 3  窗宽对短时频谱的影响                  
 5. 1. 4  结论                  
 5. 2  短时傅里叶变换的某些性质                  
 5. 3  短时傅里叶变换的线性滤波实现                  
 5. 4  短时傅里叶谱的取样                  
 5. 4. 1  短时傅里叶变换的时域取样                  
 5. 4. 2  短时傅里叶变换的频域取样                  
 5. 4. 3  短时傅里叶变换时域和频域总取样率                  
 5. 5  语音的短时合成技术                  
 5. 5. 1  语音短时合成的滤波器组相加法                  
 5. 5. 2  短时傅里叶变换的欠速率取样                  
 5. 5. 3  语音短时合成的叠接相加法                  
 5. 5. 4  短时频谱变化对合成结果的影响                  
 5. 6  短时分析-合成数字滤波器组的设计                  
 5. 6. 1  设计中需要考虑的实际问题                  
 5. 6. 2  IIR滤波器组的设计                  
 5. 6. 3  FIR带通滤波器组的设计                  
 5. 7  用快速傅里叶变换进行短时傅里叶分析                  
 5. 7. 1  基本原理                  
 5. 7. 2  减少计算量的其它考虑                  
 5. 7. 3  用FFT节省短时谱合成语音信号的计算量                  
 第六章  语音信号的线性预测                  
 6. 1  线性预测基本原理                  
 6. 2  线性预测和信号模型之间的关系                  
 6. 3  Levinson-Durbin算法                  
 6. 4  格型滤波器                  
 6. 4. 1  前向预测和反向预测                  
 6. 4. 2  格型滤波器的结构                  
 6. 4. 3  格型滤波器的性质                  
 6. 5  由已知数据计算预测系数的方法                  
 6. 5. 1  自相关法或Yule-Walker法                  
 6. 5. 2  协方差法                  
 6. 5. 3  Burg法                  
 6. 6  线性预测的频域解释                  
 6. 6. 1  最小预测误差                  
 6. 6. 2  线性预测谱匹配性质                  
 6. 7  线性预测模型的局限性                  
 6. 7. 1  基音频率对预测系数的影响                  
 6. 7. 2  高频损失问题                  
 6. 8  线性预测分析应用举例                  
 6. 8. 1  基音检测                  
 6. 8. 2共振峰估计                  
 6. 9  对数面积比(LAR)参数                  
 第七章  语音信号的同态滤波和倒谱分析                  
 7. 1  广义叠加原理                  
 7. 2  卷积同态系统                  
 7. 3  复倒谱的定义                  
 7. 3. 1  复对数的多值性问题                  
 7. 3. 2  X(z)的解析性问题                  
 7. 4  复倒谱的性质和计算方法                  
 7. 4. 1  复倒谱的性质                  
 7. 4. 2  复倒谱的计算方法                  
 7. 5  语音的倒谱分析                  
 第八章  矢量量化                  
 8. 1  矢量量化基本原理                  
 8. 1. 1  矢量量化过程                  
 8. 1. 2  失真的测度                  
 8. 1. 3  码本的设计                  
 8. 1. 4  计算量和存贮量的估计                  
 8. 1. 5  几个例子                  
 8. 2  矢量量化器的理论性能                  
 8. 2. 1  率-失真理论                  
 8. 2. 2  率-失真理论的一些结果                  
 8. 2. 3  标量量化                  
 8. 2. 4  矢量量化的一些理论结果                  
 8. 3  矢量源的标量量化和矢量量化                  
 8. 3. 1  比特分配                  
 8. 3. 2  相关源的矢量旋转                  
 8. 3. 3  标量量化和矢量量化的比较                  
 8. 4  减少矢量量化中计算量和存贮量的方法                  
 8. 4. 1  二叉树搜索                  
 8. 4. 2  多级矢量量化                  
 8. 4. 3  乘积码                  
 8. 5  码本的训练和测试                  
 8. 6  码本的鲁棒性                  
 8. 7  时间依赖矢量量化                  
 8. 7. 1  选帧传送                  
 8. 7. 2  分段量化                  
 8. 7. 3  自适应矢量量化器                  
 8. 8  语音波形矢量量化                  
 8. 8. 1  波形标量量化                  
 8. 8. 2  波形矢量量化                  
 第九章  隐马尔柯夫模型(HMM)                  
 9. 1  隐马尔柯夫模型的定义                  
 9. 1. 1  信号模型                  
 9. 1. 2  离散马尔柯夫过程                  
 9. 1. 3  隐马尔柯夫模型的概念                  
 9. 1. 4  隐马尔柯夫模型的参数                  
 9. 2  隐马尔柯夫模型的三个基本问题                  
 9. 2. 1  三个基本问题的提出                  
 9. 2. 2  第1个问题的求解                  
 9. 2. 3  第2个问题的求解                  
 9. 2. 4  第3个问题的求解                  
 9. 3  隐马尔柯夫模型的类型                  
 9. 3. 1  隐马尔柯夫模型中的连续观测密度                  
 9. 3. 2  自回归隐马尔柯夫模型                  
 9. 3. 3  隐马尔柯夫模型的变型                  
 9. 3. 4  含有状态持续时间密度显函数的隐马尔柯夫模型                  
 9. 3. 5  最佳判据                  
 9. 3. 6  隐马尔柯夫模型的比较                  
 9. 4  隐马尔柯夫模型的实现问题                  
 9. 4. 1  定标                  
 9. 4. 2  多个观测序列                  
 9. 4. 3  隐马尔柯夫模型参数的初始估计                  
 9. 4. 4  训练数据不够的影响                  
 9. 4. 5  模型选择                  
 第十章  数字语音处理的应用                  
 10. 1  语音压缩                  
 10. 1. 1  声码器的基本结构                  
 10. 1. 2  通道声码器                  
 10. 1. 3  共振峰声码器                  
 10. 1. 4  线性预测编码声码器                  
 10. 1. 5  矢量量化在语音压缩中的应用                  
 10. 2  语音合成                  
 10. 2. 1  以单词为基础的合成方法                  
 10. 2. 2  以音节为基础的合成方法                  
 10. 2. 3  以音素为基础的合成方法                  
 10. 2. 4  语音合成器芯片和语音合成系统                  
 10. 3  浯音识别                  
 10. 3. 1  孤立单词语音识别                  
 10. 3. 2  线性时间归一化                  
 10. 3. 3  非线性时间归一化                  
 10. 3. 4  采用DTW的孤立单词语音识别                  
 10. 3. 5  隐马尔柯夫模型在孤立单词语音识别中的应用                  
 10. 3. 6  连续语音识别                  
 10. 4  语音增强                  
 参考文献                  

猜您喜欢

读书导航