基于云计算的语音输入方案研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:heqigao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然不是所有的应用软件都适合用云计算来实现,但云计算的易捷性让很多企业看到了一种新的提供软件和存储服务的模式。网络环境的改善加上云计算自身在安全方面的突破和标准的统一将会把计算和存储放在云端服务器完成的云时代带到我们眼前。目前语音识别的算法研究稳定在隐马尔科夫模型算法上,几乎所有的健壮语音识别系统都基于隐马尔科夫模型。语音识别的应用场景有很多,但作为一种和个人电脑人机交互的方法却很少被人采用。一方面是因为语音识别的准确率达不到作为输入解决方案的要求,另一方面是因为语音识别程序往往比较大,是现在流行键盘输入法程序的几十倍,不方便用户获取和安装到电脑上。本文尝试把语音识别在云计算上实现以解决第二方面的问题。本文将基于隐马尔科夫模型的Sphinx 4开源语音识别系统移植到Google的云计算开放平台GAE(Google Application Engine)上,使得语音识别程序在浏览器中通过一个URL地址就能获取到。本地运行的Java applet采集语音数据然后发送到Google的云端(GAE)上由servlet完成语音识别处理,然后返回识别结果给用户。这样的语音识别解决方案不仅使得语音识别程序很容易获取,而且任何对源码的改动都会在不需要用户的配合下立即展现在用户面前。
其他文献
视频编解码技术、嵌入式操作系统以及网络技术的进步,极大地推动了视频监控技术向数字化和网络化的发展。编解码技术极大地节省了视频数据的存储空间,网络化实现了异地监控及
异构网络针对重载和宏蜂窝小区边缘用户吞吐量低,通过添加新的节点如毫微微蜂窝基站和微微蜂窝基站来覆盖宏蜂窝小区解决此问题。对于现有研究,毫微微蜂窝基站关注于室内覆盖
随着移动通信技术的发展和人们对定位信息的需求,获取移动台位置信息的无线定位技术及其算法已经成为当前的研究热点。在3G时代中,无线定位技术也必将成为第三代移动通信系统中
随着视频技术的迅速发展和应用,用2D视频描述的世界已不能满足观众日益增长的视觉需求。而3D视频描述的世界与人的视觉更加匹配,使人们在观看时能获得丰富的立体感和沉浸感。
目前中国已经成为世界上移动通信发展最快的国家,拥有世界上最大的移动通信网(包括GSM和CDMA网)。对于GSM网络,在经历了前一阶段大规模的投资建设之后,运营商的工作重心已经
高光谱遥感图像凭借其较高的光谱分辨率,具有区分微小光谱差异地物的能力,且不需要任何先验光谱信息,因而具有较强的实用性,现已成为目标检测领域中的一个研究热点,受到国内外学者的高度重视。本文在深入分析高光谱图像数据结构及特点的基础上,运用现代信号处理技术,针对高光谱图像异常检测中的高数据维、波段间非线性相关性、混合像元中背景信息对异常检测的干扰等问题,做了以下三方面的研究:首先,在研究高光谱图像数据降
随着Internet技术的飞速发展,在Internet上进行语音交互变得越来越普及。VoIP技术已成为网络界受关注最多、发展最快的技术之一。然而作为IP语音传输媒介的IP网络目前存在着
人类有个理想,让机器具有“听”、“说”人类语言的能力。这个理想,在信息时代正逐步变成现实。语音识别正是解决机器“听”懂人类语言的一项研究。孤立词语音识别实现简单、
Rootkit是攻击者在入侵系统后为了保持对系统的超级用户访问权限,创建后门和隐藏攻击痕迹而常采用的一种技术。Rootkit主要有两个功能:隐藏自身和信息窃取。Rootkit可以存在
正交频分复用(OFDM,Orthogonal Frequency Division Multiplexing)是目前频谱利用率最高的一种技术,适合在多径传播和多普勒频移的无线移动信道中传输高速数据。OFDM能有效对