面向移动GIS的语音识别技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:bdwldy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络通信技术和多媒体技术的飞速发展,新型的人机交互(Human Computer Interaction,HCI)技术已成为当前计算机科学领域一个十分活跃的研究课题。针对移动地理信息系统(mobile GIS)终端设备普遍存在的诸如有限的屏幕空间、输入方式和内存等不足,以及在移动过程常常出现的“手忙”和“眼忙”等问题,采用语音方式已被业内普遍视为一种主要的解决方案而得到高度的重视。语音识别研究对于增强计算机的智能化和人性化,开发新型人机环境,以及推动生理学、声学、语言学等学科的发展,有着重要的现实意义,并将产生很大经济效益和社会效益。   语音识别是机器通过理解和识别过程把人类的语音信号转变为相应的文本或命令的技术。其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。在语音识别领域中,特征提取的好坏直接影响到识别的结果。因此选用合适的语音特征参数就显得尤为重要了。   研究人员普遍认为在语音识别领域中,人耳听觉模型对低频声音敏感,而对中高频声音不敏感。本文从频谱信息表示的观点出发,以符合人耳听觉模型的梅尔倒谱系数(MFCC)为基础,根据不同频率段的频谱特征,设计了新型的混合MFCC算法。又由于LPCC参数能很好的体现人的声道特性,而MFCC参数能很好的模拟人耳的听觉效应,可以将两者参数的融合起来,可以起到很好的识别效果。实验结果表明,改进之后的算法能够达到令人满意的识别性能。   本文还针对现有的汉语语音ASR/TTS引擎,研究和构建顾及移动GIS服务应用特点的分布式汉语语音I/O模块。研究汉语语言与GIS语言的相互转换和交互以及语音信息的增强再确认处理技术,设计了语音识别技术在移动GIS中的应用系统功能框架。
其他文献
对等(P2P)计算在管理和利用日益增长的分布式信息和计算资源方面表现出了良好的性能,所以基于P2P计算的新型分布式系统(P2P系统)成为Internet最流行的系统之一。特别是Gnutell
近年来,恶性肿瘤(癌症)的发病率和死亡率均呈上升趋势,已成为严重威胁人类生命健康的主要疾病。放射治疗作为肿瘤治疗的三大主要手段之一,在肿瘤治疗中发挥着重要的作用,功能影像
随着计算机技术的发展和各种电子信息交互活动在现实生活中的不断深入,计算机犯罪的类型和领域也在增加和扩大,电子证据正悄然走近司法领域。与传统证据相比,由于电子证据极容易
随着计算机技术的发展和各种电子信息交互活动在现实生活中的不断深入,计算机犯罪的类型和领域也在增加和扩大。目前大规模的数字取证调查至少存在两个基本挑战。第一是如何满
位置管理是蜂窝通信网中的一个重要问题,随着移动用户数量的快速增加,移动用户的漫游将导致巨大的系统资源消耗,因此对现有的移动性管理算法进行调整和优化是十分重要的。  
伴随着互联网数据爆炸式地增长,各种类型的数据以流的形式源源不断产生。静态数据上的挖掘技术已不能满足现实问题分析的需要,应运而生了各种数据流挖掘技术,同时数据流挖掘
随着网络技术的飞速发展,信息快速增长与人们个性化需求的矛盾在不断地增加,而Web用户访问路径聚类正是解决这一矛盾的有效手段之一。通过对Web用户访问路径聚类,可以发现用户兴
随着计算机技术的飞速发展,计算机信息安全问题越来越受关注。无论是电子商务、电子政务、企业信息平台都存在来自系统内外的安全威胁。信息安全已经成为信息时代高度受关注的
模式识别方法已经成功地应用到大量的目标识别任务中,其中人脸识别已成为模式识别和计算机视觉领域的一大研究方向。近年来的研究成果表明,人脸图像很可能位于一个非线性流形上
科学技术和工业生产的发展,对质量要求越来越高。五十年代以来,火箭、人造卫星、宇宙飞船等大型、复杂、精密的产品出现,对产品的安全性、可靠性、经济性等要求越来越高,因此产品