基于语音识别的旅游用语言检索翻译系统研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:ososa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于语音识别的旅游用语言检索翻译系统,是一个以语音识别为技术支持,旅游翻译系统为应用背景,机器翻译为目标的应用研究。 在语音识别技术方面,本论文提出了一种基于仿生模式识别的新的模式识别方法,即基于矢量量化的仿生模式识别。仿生模式识别是一种先认识,后划分的模式识别,区别于传统的先戈分再识别的模式识别,它能做到单模板识别,大大降低了误识率。仿生模式识别模拟人类认识事物的过程,对不能识别的样本,做到了拒识,因此从某种程度上提高了识别率。且相对于语音识别中常用的隐马尔可夫HMM模型,它的识别速度较快,算法易于运行,便于在手机等小型通用设备上集成。为了易于系统的集成,本文在特征选取上,对传统的特征量进行了变换,使用算法速度较快的特征进行样本训练,提高了系统整体的运行速度。 在翻译系统方面,由于真正的机器翻译是集语音识别、机器翻译、语音合成为一体的,由于语种复杂多变,种类繁多,目前机器翻译仍旧是科技界的一大难题。所以本文提出的语言检索翻译系统,是在语音识别技术的基础上,通过数据库的检索,来达到关键语意翻译的目的。且本文的系统是应用于旅游,因此也大大降低了数据库中词汇的容量。现今,旅游已成为人们休闲度假的首选,日益增多的旅游胜地,多语种的交流使得语言沟通成为一大问题。如果能够用手机等便携设备实现翻译,那将大大减少人们旅途中语言的障碍。因此本文提出的所有技术,包括识别方法,特征提取的变换,数据库语言检索都是基于能够让系统易于集成这个目的。 本论文的主要工作集中在以下几个方面:1.对语音识别预处理中的语音端点检测,提出了一种新的方法,它使用图像处理来检测语音端点,并结合传统的检测方法,提高了端点检测的精度。2.对语音识别的特征进行了改进,在使用传统特征参数的基础上,增加了特征变换,在保证特征精确度的前提下使算法的速度加快。3.通常的连续语音流中关键词识别采用的HMM(隐马尔克夫模型)来进行模式识别,本文根据仅仅提取关键词这一特点,采用了基于矢量量化的仿生模式识别的方法,对样本群先识别再划分,而不是传统意义上的直接样本划分,提出了具体算法,从而提高了识别率。最后介绍了翻译系统,针对目前直接翻译不能实现,本文采用了语言检索的方法来实现关键语意的检索翻译。
其他文献
期刊
期刊
随着计算机进入后PC时代,计算机网络和嵌入式技术不断进步,融合实时操作系统和专用处理器的通信控制系统正在成为通信领域中的应用热点。MPC860是性能优良,支持多种通信规程
网络安全是一个系统的概念,有效的安全策略或方案的制定,是网络信息安全的首要目标。网络安全技术主要有认证授权、数据加密、访问控制、安全审计等。入侵检测技术是安全审计
期刊
流量工程(TE)是当前IETF和网络业务提供者(ISP)所讨论的一个热门话题。流量工程旨在通过对ISP路由选择域内的业务流的控制,来提高网络资源的利用率和改善网络服务性能。MPLS网
目前在我国,数字电视机顶盒已成为模拟电视向数字电视过渡的最好的“桥梁”,是模拟广播与数字广播同播期阶段不可缺少的环节。虽然机顶盒只是一个过渡产品,但这个过渡产品包含了
CDMA、GPRS和WLAN等无线网络近年来在我国发展迅速,无线网络的可利用带宽越来越大,覆盖范围越来越广。但目前单一模式的无线传输仍然受网络覆盖及传输带宽等因素的影响,应用范围
随着网络以及计算机技术的不断进步,网络规模迅速扩大,越来越多的网络业务应用被人们所接受。为了支持和开展各种业务,信息系统在企业运行中全面渗透,企业建立各种应用系统。但各
近几年,网络速度的快速提高对千兆网络数据处理提出了新的挑战。数据包分类技术是千兆网络数据处理中的关键。对于数据包分类系统的研究,成为一个重要课题。本文提出了一种软