首页>>语音识别技术


特征参数提取

作者:admin   发表时间:2006-9-4 14:44:47   点击次数:


特征参数提取的目的是对语音信号进行分析处理,从而突出所载荷的语言声音信息的特征,尽可能抑制与语言声音信息无关的特征,同时压缩特征的数据量。语音识别系统主要提取以短时谱为基础的各种表征,最为成功的典型特征包括线性预测倒谱系数LPCEPSTRA和美倒谱系数MFCC。
LP谱表示的技术基础是语音信号产生的声源—滤波器理论。在这种理论框架下,语言声音信息主要由声道滤波器的传输函数来载荷,并且可以通过线性预测的方法从语音信号本身获取声道滤波器的传输函数。
美谱表示的核心思想是把人的听觉系统对频率感知的非线性特征用于语音识别特征中,具体地说,在1千赫兹以下的低频段,人耳对频率感知是线性的;在1千赫兹以上频段,人耳对频率感知呈现对数非线性的。
LP谱或美谱经过倒谱变换成为倒谱系数,使得倒谱系数之间的相关性进一步降低。这样提取的倒谱系数在HMM模型中可以使协方差矩阵简化为对角矩阵,从而减小计算代价。
特征参数提取的目的是对语音信号进行分析处理,从而突出所载荷的语言声音信息的特征,尽可能抑制与语言声音信息无关的特征,同时压缩特征的数据量。语音识别系统主要提取以短时谱为基础的各种表征,最为成功的典型特征包括线性预测倒谱系数LPCEPSTRA和美倒谱系数MFCC。
LP谱表示的技术基础是语音信号产生的声源—滤波器理论。在这种理论框架下,语言声音信息主要由声道滤波器的传输函数来载荷,并且可以通过线性预测的方法从语音信号本身获取声道滤波器的传输函数。
美谱表示的核心思想是把人的听觉系统对频率感知的非线性特征用于语音识别特征中,具体地说,在1千赫兹以下的低频段,人耳对频率感知是线性的;在1千赫兹以上频段,人耳对频率感知呈现对数非线性的。
LP谱或美谱经过倒谱变换成为倒谱系数,使得倒谱系数之间的相关性进一步降低。这样提取的倒谱系数在HMM模型中可以使协方差矩阵简化为对角矩阵,从而减小计算代价。