【摘 要】
:
该文基于语音产主的模型,从时域、频域,特别是从倒谱出发,对语音信号进行分析,并结合模式识别的理论,论述语音识别的基本理论.HTK是剑桥大学语音组开发的一个极方便的、使用
论文部分内容阅读
该文基于语音产主的模型,从时域、频域,特别是从倒谱出发,对语音信号进行分析,并结合模式识别的理论,论述语音识别的基本理论.HTK是剑桥大学语音组开发的一个极方便的、使用连续密度函数隐Markov模型来创建语音识别系统的软件工具包.因此,该文以HTK为框架,创建了国内第一个蒙古语语音识别系统.该系统运用了5个状态的混和高斯密度的隐Mrkov模型,分别用Baum-Welch重估算法和基于Token Passing的N-Best算法作为模型的训练和识别算法.该系统分别采用音素、三音子和音节作为识别单元,训练出了三套不同的HMM模型,并在基于特定人、非特定人、环境噪音较大等情况下分别测试识别系统的性能.在每种条件下,用相同的测试数据对三套模型进行识别测试,记录并比较三种识别单元选取方法所训练得到的模型的识别率.
其他文献
文档相似性度量是信息检索领域最重要的研究方向之一。单词移动距离(Word Movers Distance,WMD)是最近提出的一种能够有效衡量文档相似性的度量方式,其融合了基于神经网络的Wor
随着计算机在日常工作中的广泛应用,人们的许多工作已经依靠计算机来完成,与此同时,各种类型的信息系统也被广泛使用来支持这些工作。但是这些系统基本上是独立运行的,相互之间缺乏必要的交互、协作与感知,从而使得它们在协调多个人的活动、以协同完成某个共同的任务方面有较严重的不足。这也就是工作流管理系统WFMS从90年代以来吸引来自研究机构和产业界广泛关注的重要原因。 作为计算机支持的协同工作CSCW研
本文综合三维可视化技术,流视频技术和分布式技术,设计和实现了面向WEB服务的三维医学影像渲染系统。系统基于分布式管理框架Zookeeper和GPU渲染集群,实现了可用性和扩展能力平
足迹是一类重要的现场痕迹.如何快速、准确、科学地进行足迹检验,从而提高办案效率是当前足迹检验工作中迫切需要解决的问题,也是刊事技术理论与实践发展的新课题.该论文以平
该文从研究分形图像编码和零树编码各自的优劣点以及之间的结合点出发,寻找了建立在图像纹理分析基础上的一种新的混合编码模式,其目的在于充分利用景物特征和人眼的视觉特性
该文首先分析了雷达对抗所面临的威胁和目前国内外雷达辐射源的识别方法,讨论了最具有爆发性的新兴学科——人工神经网络技术在未来军事系统中所起的作用.该文又提出一种雷达
随着信息全球化时代的到来,博物馆的管理和运作模式受到了巨大的冲击.数字化馆藏的迫切要求、资源共享的发展趋势以及日益多样化的文化传播方式,成为传统博物馆面临的严峻挑
在石油、化工等行业中,广泛使用各种螺旋杆机械,其中的螺旋转子制造技术则是多年来一直困扰其发展的关键难题。从1994年起,沈阳工业大学数控研究中心即对复杂异形螺旋面加工进行
在如今的大数据时代,Web2.0技术与社交网络的蓬勃发展为数据分析领域的研究者们提供了海量的用户生成内容。这些海量数据以文本、图像、视频、音频等多种模态的形式表达与呈现