自动语音识别相关论文
互联网时代,视频是重要的数据载体之一,对于非母语者或者有听力障碍的人,字幕可以有效地帮助他们理解视频内容。随着人工智能的迅......
智能设备的普及,让人们越来越感受到语音交互的便利。作为一种非常自然的人机交互方法,自动语音识别自二十世纪七十年代以来一直是......
为了解决非英语母语学习者在语音识别中出现的语法错误问题,提出了基于神经机器翻译的语法错误检测语音识别中的语言模型。将构建的......
随着注意力机制在自然语言处理等领域的成功应用,基于注意力的端到端语音识别吸引了广泛的关注。然而现有的研究主要是应用于英语......
语音识别技术是人机交互应用的基础,在机器翻译机、人机对话问答系统和智能会议实时字幕等系统上具有重要的应用价值。目前,越南语......
随着各种多媒体如语音和图像的使用变得越来越普遍,这些数字多媒体不可避免地带来了通信信息安全性的问题,而信息隐藏技术有望为信......
自动语音识别(Automatic Speech Recognition,ASR)是一种利用计算机将人类的语音转换为文本的技术。近年来,端到端语音识别系统成......
自动语音识别技术和计算机人工智能技术的迅速发展促进了口语自动评分技术及相关软件和应用产品的快速发展。本文梳理了国内外英语......
电话是当前人们使用最为平常的通讯工具之一。Internet网的出现为人们提供了空前巨大的信息资源,如何用电话来使用Internet资源就显......
自动语音识别系统在噪声环境下的鲁棒性是语音识别系统从实验室走向实际应用的关键,其主要研究目的是为了解决应用环境与训练环境之......
本文主要研究的是自动语音识别中的前端噪声鲁棒性问题。众所周知,语音识别的根本目的就是使机器能够听懂人类的语言。在当前的实......
自动语音识别(ASR,Automatic Speech Recognition)是通过机器识别和理解过程,把人类的语音信号转变为相应的文本或命令的技术。语音......
自动语音识别技术(Automated Speech Recognition,简称ASR),它是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它......
本文以作者参与“中鸿讯统一消息服务系统(ZHX-UMS)”设计与开发工作为背景,在讨论有关UMS的体系结构、关键技术和实现方法等方面问......
本文介绍了语音合成技术、文语转换系统的组成及其实现过程;自动语音识别技术、自动语音识别系统的组成及其实现过程;语音应用程序开......
摘 要:在语音同一鉴定案件中,自动语音识别方法逐渐被采用,但目前某些语音检材存在质量下降无法进行有效语音识别等问题。文章通过研......
人类对语言的感知是多通道的,人在识别和理解他人说话内容时除了利用听觉来感知信息外,常常还利用了视觉信息如唇动来提高准确性。对......
“我现在都用红围脖客户端上新浪微博,因为它有好多新功能,都是之前的那些客户端所没有的.”小朱口中的“红围脖”客户端,是指中国......
提出一种称为“受限线性搜索”的优化方法,并用于语音识别中混合高斯的连续密度隐马尔科夫(CDHMM)模型的区分性训练.该方法可用于......
提出了VoiceXML(Voice eXtensible Markup Language)语音平台的一套性能指标,为找出系统的瓶颈和优化系统性能提供参考,并且通过一......
随着媒体深度融合不断推进,各类新兴媒体持续涌现、遍地开花,广播电视内容监测从传统的广播、电视频道监测扩展到了互联网新兴媒体......
本文提出了一种基于区分性准则的模型结构优化方法,用以调整HMM自动语音识别系统中声学模型各状态混合高斯核成分数量的分配。通过......
基于语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算......
在变强噪音的情况下,语音识别的正确率会迅速下降;当噪声较强并且强度不断发生变化的时候,端点检测是一个难题;提出了两种方法保证......
提出一种语音控制汽车智能电器系统的总体结构框架,包括语音识别和驾驶员意图识别的运算平台及汽车智能电器系统。在车载环境下,利用......
<正>意法半导体的X-CUBE-AVS软件包让亚马逊的Alexa语音服务(AVS)能够运行在STM32微控制器上,使具有云智能功能(自动语音识别和自......
为了提高PSPL(position specific posterior lattices)作为语音文档索引时的检索性能,提出一种基于音位属性检测的PSPL改进方法。该方......
语音浏览器系统能够提供更易为人们所接受的网络浏览模式,拓展了Internet的发展空间。VoiceXML语言是XML语言在语音浏览器方面的应......
大规模语料库的手工韵律标注消耗大量的时间和人力。这篇论文的目的在于研究如何充分利用少量的手工标注数据训练得到尽可能精确的......
为了提高绘图软件使用的快捷性,提出了一种语音绘图的方案,并在系统级芯片So C(System on a Chip)上进行了实现。在保留了传统绘图软......
VoiceXML语音应用程序使人们可以通过电话查询网络上的信息和服务,实现了语音网络和数据网络的融合,是电子商务今后发展的一个方向......
针对当前基于N—gram的语言模型在特定领域的数据稀缺(如歌手名、音乐名等),提出了基于特定领域的词类扩充方法,从而有效解决特定领域......
1电信级的业务解决方案随着现代通信的高速发展,人们对信息的需求也与日俱增,然而在Internet网络成为最为普通的信息载体的今天,调......
为提高索引覆盖率并获得更多的候选路径,提出一种在词格上融合音位属性的语音文档索引方法。通过基于音位属性检测的语音识别系统......
在强噪音的情况下,语音信号的端点检测是一个难题[1].以前用过的传统算法在这时都失去作用,因此需要寻找端点检测的新方法.文中提......
自从人们可以生产和利用各种机器以来,就一直有个伟大的设想,那就是让各种机器能够“听”懂人类的语言,并且能够使机器按照人类的......
言语障碍通常指的是包括语言能力、说话能力和听觉等沟通问题的总称。在我国儿童群体中,言语障碍的发病率较高,且研究表明,言语障......
听觉系统是语音信号处理过程不可分割的组成部分,听学计算模型对自动语音识别研究具有非常重要的意义,简要评述了听觉计算模型近30年的......
随着基于统计模型的模式分类理论不断发展完善,自动语音识别技术近年来取得了长足的进步。区分性训练已经成为自动语音识别中声学......
现阶段基于链接时序分类技术的端到端的大规模连续语音识别成为研究热点,文中将其应用于藏语识别中,取得优于主流的双向长短时记忆......
近年来,基于多模态信息的语音识别系统逐渐成为研究热点。单纯依赖单模的声音信息的语音识别在无噪音环境的条件下性能较好,然而,......
介绍实现商用自动语音识别的系统架构及其功能,阐述应用自动语音识别技术实现的新通信增值业务.应用自动语言识别技术可以实现语音......
针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模......
语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术:VXML技......
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
文中利用Eesen框架声学建模简化了现有的自动语音识别(ASR),通过训练单个递归神经网络(RNN)来预测上下文无关的目标(音素或字符)。......