嵌入式语音翻译系统的识别技术研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:a954862
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嵌入式语音翻译机由语音识别,文本翻译以及语音合成等组成。本文根据嵌入式语音翻译机的要求,在深入分析嵌入式系统下语音识别系统的特点以及面临的主要问题的基础上,针对语音检测、口音适应、语言模型和系统实现等问题都做了较深入的探讨和研究,主要进行了以下几个方面的研究。 首先在语音端点检测方面,本文提出了一种结合多子带能量特征和最优化边缘检测判决准则的算法。该算法的突出优点在于:其一,子带的选择是根据噪声和语音的能量分布特点来选择,增加了语音和噪声的区分性;其二在不同信噪比情况下,其端点检测滤波器的输出基本不变,从而避免了门限调整所带来的困难。实验结果表明,这种算法在多种噪声环境下都能够达到较好的语音检出效果,它克服了传统语音端点检测以短时能量、基频、过零率等作为检测特征时,需要动态调整门限且在低信噪比情况下鲁棒性较差的缺点。 其次探讨了如何建立一个描述特定地方口音发音特点的音节发音变异字典,进行特定地方口音自适应,以及如何同重估声学模型参数的MLLR自适应方法相结合从而进一步提高系统的性能。本章采用分析与统计相结合的方法,研究汉语口语中的由于口音以及口语化带来的发音变异现象,以提高语音识别系统的鲁榜性,实验也表明在中小词汇量的语音识别系统中,音节发音变异字典能够提高语音识别的鲁棒性。 再次分析了影响统计语言模型性能的各种因素、常用的平滑方法和评价语言模型性能方法,建立了基于统计语言模型的音字转换平台,对语言模型中的多音字处理进行了分析和处理。嵌入式系统中的语音识别一般为领域相关的识别系统,很难收集到足够的训练语料,我们提出了采用规则和词类的方法来扩展词间的连接,在有限的训练语料情况下语言模型能够覆盖更多的语言现象,以提高语音识别系统的性能。 最后:在嵌入式PDA平台下,建立了一个语音翻译平台,在识别方面探讨了嵌入式系统下语音识别系统的具体实现问题,我们从定点特征的实时提取,声学模型的建立和压缩,高斯函数概率计算等方面进行了研究,在PDA系统下实现了一个完整的识别系统。在翻译方面采用关键词及其依赖关系查找实例的方法,以确保在有些识别错误而关键词正确的情况下也能得到正确的翻译,以此提高语音翻译机的性能。
其他文献
本文针对非线性对象,首先利用T-S 模糊模型建模,将非线性问题转化为本质非线性的T-S 线性模型的基础上,根据满意控制的设计思想提出了一种满足多项性能指标要求的H_∞满意控
论文首先详细介绍了常用的数字图像格式,并对JPEG及JPEG2000压缩标准进行了探讨。接着,依据《中华人民共和国公共安全行业标准》,详细介绍了公民身份证相片的拍摄标准,对数据库中
随着找矿主体对象由地表矿、浅部矿、易识别矿向隐伏矿、深部矿、难识别矿的逐渐转变,寻找一种有效的隐伏矿定位预测的方法已经成为当前成矿学与成矿预测学的前沿与热点,同时
Web虚拟仪器是实现网络化远程测量与监控、构建测控网络的关键技术之一。本文旨在通过Web虚拟仪器技术解决锡精炼过程中关键设备电热连续结晶机的远程网络监控问题。 本文
本文介绍了在虹膜图像质量评价、虹膜定位与提取、虹膜纹理归一化及虹膜编码与识别方面进行的研究。 在虹膜图像质量评价方面,提出了包含图像清晰度、内外偏心度、虹膜可见
本文就是针对山东某地税局在实际应用中提出将决策支持系统和GIS功能结合,以提供丰富、准确和可视化决策信息的需求,提出了基于GIS的税务DSS应用研究的课题。 本文主要介绍
浮子流量传感器是一种典型的变截面积流量传感器,具有工作可靠性高、结构简单、成本低廉、应用面广等优点,因此被广泛应用于食品、化工、冶金、轻工、石油等领域。流体粘性变
学位
机器人以其耐疲劳、精度高和适应恶劣环境的能力强等优势,在外科手术领域具有得天独厚的优势.国外研究机构首先进行了这方面的研究,并取得相当骄人的成果,其产品己实现商用.
随着全球能源危机和环境污染的日益严峻,开发利用新能源和可再生能源已成为世界各国解决能源问题的主要方法,光伏发电系统也由此得到迅速的发展。但是,光伏并网发电系统的发