首页>>语音识别技术


语音识别基本原理

作者:admin   发表时间:2006-9-4 14:44:13   点击次数:



现有的自动语音识别技术是建立在对人的语音交互过程的坚实但又不完全理解的基础之上的。语音交互技术的研究具有高度的学科交叉性质,广泛涉及信号处理、语音声学、模式识别、通信和信息理论、语言学、生理学、计算机科学、心理学等学科的原理和方法。利用这些学科知识的综合,可以概括构成自动语音识别技术基础的三个原理:第一,语音信号中的语言信息是按照短时幅度谱的时间变化模式来编码的;第二,语音是可以阅读的,即它的声学信号可以在不考虑说话人试图传达的信息内容的情况下用数十个具有区别性的、离散的符号来表示;第三,语音交互是一个认知过程,因而不能与语言的语法、语义和语用结构割裂开来。
这三个原理是对这一领域广泛而又详实的知识的高度概括。例如,幅度谱的重要性是被听觉的生理机能及其模仿、语音产生的声道解剖及其模仿、语音信号的谱图研究这三项相互独立的研究所证实的,这些研究导致了声码器诞生;语音的可阅读性是语音声学的核心内容,主要研究对言语的声学表征、语音、音位以及音位配列的结构进行数学形式化,乔姆斯基和哈勒的研究构成了这种理论的一个完备体系;言语的认知研究主要是心理学研究的范畴,其中心理物理学对语音编码,尤其是在语音、语词的句法等方面进行某些重要的表示和操作提供了大量的依据。
按照这三个基本原理,一个语音识别系统可以从下述的三个方面来认识。