论文部分内容阅读
作为人与人之间最自然的交流方式,语音操作方式显然是人机交互时的最佳选择之一。语音识别作为模式识别的一个分支,涉及生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,其最终目标是实现人与机器之间的自然语言通信。
今天,语音识别技术在实际中得到广泛应用,正在不断地改变着我们的生活。根据美国国际数据集团(International Data Group)的统计数据,语音识别应用软件连续几年在全球范围内取得60%的增长率,而同期的销售额也达到25%的平均增幅。这两组数据充分说明,语音识别技术及市场正在飞速发展。
虽然目前语音识别的研究主流是大词汇量的非特定人的连续语音系统,但是事实上,对于实际许多应用来说,一个语音识别系统只要用一组词汇或命令,就可能为用户提供一个有效的工具。因此利用孤立词语音识别系统来进行操作命令的语音输入是一个十分理想的人机接口方式,应用前景非常广阔。
论文对语音识别技术进行了一些研究,探讨了语音识别技术在情报科学领域的应用,目的在于促进语音识别技术在情报科学领域的更广泛应用,优化情报部门的服务质量。论文工作主要从两个方面展开,一方面从语音识别的研究角度,探讨了语音识别的基本原理,分别利用两种算法实现了实验室环境下小词汇量孤立词语音识别实验系统;另一个方面从语音识别的应用角度,讨论了语音识别技术的发展历史和现状研究以及在情报科学领域的应用。
论文第一章介绍了语音识别的国内外研究与发展状况,在语音识别的发展历史与现状,目前研究热点等方面做了很好的总结,为进一步的语音识别学习打下了良好的基础。第二章介绍了语音识别的基本概念及原理,一般语音识别系统的结构及所涉及的各种理论技术。并对各种语音特征参数进行了系统分析,重点研究了反映语音倒谱特征的线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)两种常用语音特征参数的提取方法。分析目前常用的一系列语音识别算法,对DTW算法进行了深入的研究。第三章根据第二章介绍的理论和算法,从实验研究角度利用Deiphi7.0在Windows操作系统上分别实现了基于声谱差算法和DTW算法的孤立词语音识别系统。论文第四章重点探讨了语音识别在情报科学领域的应用。其中包括语音识别技术在馆藏数字化、信息服务、参考咨询、图书馆远程教育与语音信息检索等方面的应用现状与前景。第五章对全文进行了总结,并提出了课题改进和发展的方向。