自动语音识别相关硕士博士期刊学术论文

自动语音识别相关论文

基于语音识别的视频字幕自动生成系统设计

互联网时代,视频是重要的数据载体之一,对于非母语者或者有听力障碍的人,字幕可以有效地帮助他们理解视频内容。随着人工智能的迅......

学位

视频字幕自动生成自动语音识别基于联结时序分类器与注意力机制词掩蔽

基于端到端的语音识别模型研究及系统构建

智能设备的普及,让人们越来越感受到语音交互的便利。作为一种非常自然的人机交互方法,自动语音识别自二十世纪七十年代以来一直是......

学位

端到端模型自动语音识别 Transformer Conformer 语音识别系统

基于机器翻译的语法错误检测语音识别模型

为了解决非英语母语学习者在语音识别中出现的语法错误问题，提出了基于神经机器翻译的语法错误检测语音识别中的语言模型。将构建的......

期刊

自动语音识别语言建模神经机器翻译语法错误检测

基于注意力机制的普通话语音识别研究与应用

随着注意力机制在自然语言处理等领域的成功应用,基于注意力的端到端语音识别吸引了广泛的关注。然而现有的研究主要是应用于英语......

学位

自动语音识别深度学习端到端注意力机制

语音识别GPU异构算法研究

随着科技的发展进步,高性能计算早已经渗透到人类生活的各个领域,不仅包括互联网、大数据、云计算、人工智能等新兴领域,也涉及国......

学位

高性能计算自动语音识别 WFST解码 GPU并行计算关键词检索

基于多粒度纠错的越南语语音识别方法研究

语音识别技术是人机交互应用的基础,在机器翻译机、人机对话问答系统和智能会议实时字幕等系统上具有重要的应用价值。目前,越南语......

学位

自动语音识别端到端越南语纠错多粒度

基于DNN语音识别模型的信息隐藏方法研究

随着各种多媒体如语音和图像的使用变得越来越普遍,这些数字多媒体不可避免地带来了通信信息安全性的问题,而信息隐藏技术有望为信......

学位

信息隐藏深度神经网络自动语音识别隐藏容量不可感知性安全性

端到端语音识别中的语速自适应方法研究

自动语音识别(Automatic Speech Recognition,ASR)是一种利用计算机将人类的语音转换为文本的技术。近年来,端到端语音识别系统成......

学位

端到端语音识别系统语速自适应信息实现自适应方法实验结果识别性能 Speech Recognition Neural Network 自动语音识别在

国内外英语口语自动评分研究综述

自动语音识别技术和计算机人工智能技术的迅速发展促进了口语自动评分技术及相关软件和应用产品的快速发展。本文梳理了国内外英语......

期刊

口语自动评分自动语音识别特征参数提取效度

基于VoiceXML的语音浏览器的研究与应用

电话是当前人们使用最为平常的通讯工具之一。Internet网的出现为人们提供了空前巨大的信息资源，如何用电话来使用Internet资源就显......

学位

VoiceXML 可扩展标记语言语音浏览器语音合成自动语音识别国际互联网联盟 VoiceXML体系结构

自动语音识别噪声鲁棒性方法研究

自动语音识别系统在噪声环境下的鲁棒性是语音识别系统从实验室走向实际应用的关键，其主要研究目的是为了解决应用环境与训练环境之......

学位

噪声鲁棒语音识别端点检测语音增强特征提取 HMM模型

基于特征补偿的自动语音识别的研究

本文主要研究的是自动语音识别中的前端噪声鲁棒性问题。众所周知,语音识别的根本目的就是使机器能够听懂人类的语言。在当前的实......

学位

自动语音识别噪声鲁棒性矢量泰勒级数特征补偿实用化多高斯建模

基于HTK的汉语连续语音识别研究

自动语音识别(ASR，Automatic Speech Recognition)是通过机器识别和理解过程，把人类的语音信号转变为相应的文本或命令的技术。语音......

学位

HTK工具包隐马尔科夫模型决策树状态绑定三音素模型自动语音识别

小波变换在语音识别系统的研究与实现

自动语音识别技术（Automated Speech Recognition，简称ASR），它是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域，它......

学位

语音识别小波变换

UMS中的TTS/ASR技术研究

本文以作者参与“中鸿讯统一消息服务系统(ZHX-UMS)”设计与开发工作为背景，在讨论有关UMS的体系结构、关键技术和实现方法等方面问......

学位

统一消息服务系统语音技术文本－语音转换自动语音识别

基于语音的应用程序的开发——彩铃业务

本文介绍了语音合成技术、文语转换系统的组成及其实现过程；自动语音识别技术、自动语音识别系统的组成及其实现过程；语音应用程序开......

学位

文本语音转换自动语音识别彩铃业务增强智能外设语音技术

基于窄带VoIP网络的说话人识别

摘要：在语音同一鉴定案件中，自动语音识别方法逐渐被采用，但目前某些语音检材存在质量下降无法进行有效语音识别等问题。文章通过研......

期刊

自动语音识别质量下降窄带网络 MFCC特征鲁棒性

计算机唇读技术研究

人类对语言的感知是多通道的，人在识别和理解他人说话内容时除了利用听觉来感知信息外，常常还利用了视觉信息如唇动来提高准确性。对......

学位

感兴趣区域特征提取数据融合自动语音识别计算机唇读计算机视觉图像处理模式识别

“红围脖”:开创微博沟通新方式

“我现在都用红围脖客户端上新浪微博,因为它有好多新功能,都是之前的那些客户端所没有的.”小朱口中的“红围脖”客户端,是指中国......

期刊

客户端自动语音识别独特功能中国联通联合开发新浪网新方式搜索输入手机视频服务

一种针对区分性训练的受限线性搜索优化方法

提出一种称为“受限线性搜索”的优化方法,并用于语音识别中混合高斯的连续密度隐马尔科夫(CDHMM)模型的区分性训练.该方法可用于......

期刊

自动语音识别区分性训练受限线性搜索(CLS)

VoiceXML语音平台性能指标研究

提出了VoiceXML(Voice eXtensible Markup Language)语音平台的一套性能指标,为找出系统的瓶颈和优化系统性能提供参考,并且通过一......

期刊

VOICEXML 性能指标文本语音转换自动语音识别

智能语音识别分析在广播电视内容监测中的应用探讨

随着媒体深度融合不断推进,各类新兴媒体持续涌现、遍地开花,广播电视内容监测从传统的广播、电视频道监测扩展到了互联网新兴媒体......

期刊

智能语义分析自动语音识别内容监测

一种基于区分性准则的模型结构优化方法

本文提出了一种基于区分性准则的模型结构优化方法,用以调整HMM自动语音识别系统中声学模型各状态混合高斯核成分数量的分配。通过......

期刊

计算机应用中文信息处理自动语音识别声学模型模型结构优化 computer application Chinese information proces

基于语速调整和音位属性后验概率的音素识别

基于语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算......

期刊

语速调整音位属性检测隐马尔可夫模型自动语音识别 Speaking Rate Adaptation Phonological Attributes Det

噪声环境下的语音识别性能研究

在变强噪音的情况下,语音识别的正确率会迅速下降;当噪声较强并且强度不断发生变化的时候,端点检测是一个难题;提出了两种方法保证......

期刊

端点检测低短时能量比自动语音识别去噪 endpoint detection low short- time energy ratio ASR noi

汽车语控智能电器系统

提出一种语音控制汽车智能电器系统的总体结构框架，包括语音识别和驾驶员意图识别的运算平台及汽车智能电器系统。在车载环境下，利用......

期刊

语音控制自动语音识别驾驶员意图识别智能电器系统 Speech control Automatic speech recognition Driver

意法半导STM32软件包让物联网产品具有Alexa技术

<正>意法半导体的X-CUBE-AVS软件包让亚马逊的Alexa语音服务(AVS)能够运行在STM32微控制器上,使具有云智能功能(自动语音识别和自......

期刊

Alexa STM32 AVS 微控制器物联网智能功能智能家电固件库

基于音位属性检测的PSPL改进方法

为了提高PSPL（position specific posterior lattices）作为语音文档索引时的检索性能，提出一种基于音位属性检测的PSPL改进方法。该方......

期刊

语音文档检索语音文档索引 PSPL 自动语音识别音位属性检测 spoken document retrieval spoken document inde

基于VoiceXML的语音浏览器的研究与实现

语音浏览器系统能够提供更易为人们所接受的网络浏览模式，拓展了Internet的发展空间。VoiceXML语言是XML语言在语音浏览器方面的应......

期刊

语音浏览器可扩展标识语言 VoiceXML语音合成自动语音识别 Voice Browser XML VoiceXML Text-To-Speech(TT

训练数据有限的英文语音重音标注研究

大规模语料库的手工韵律标注消耗大量的时间和人力。这篇论文的目的在于研究如何充分利用少量的手工标注数据训练得到尽可能精确的......

期刊

自动重音检测自动韵律标注自动语音识别 automatic stress detection automalic prosody labeler automa

基于SoC的语音绘图系统

为了提高绘图软件使用的快捷性,提出了一种语音绘图的方案,并在系统级芯片So C（System on a Chip）上进行了实现。在保留了传统绘图软......

期刊

SOC 自动语音识别语音听写麦克风侦听语音绘图 SoC automatic speech recognition iFly auto transfor

用VoiceXML开发语音商务网站

VoiceXML语音应用程序使人们可以通过电话查询网络上的信息和服务,实现了语音网络和数据网络的融合,是电子商务今后发展的一个方向......

期刊

语音商务网站语音应用程序语音用户界面自动语音识别本文语音转换 VOICEXML 语音浏览器 Voice Application Voice User I

词类扩充方法在语音识别中的应用

针对当前基于N—gram的语言模型在特定领域的数据稀缺（如歌手名、音乐名等），提出了基于特定领域的词类扩充方法，从而有效解决特定领域......

期刊

自动语音识别听写语言模型 N-GRAM WFST CMN ASR dictation LM N-Gram WFST CMN

华为Voice Internet业务—带给您全新的感受

1电信级的业务解决方案随着现代通信的高速发展,人们对信息的需求也与日俱增,然而在Internet网络成为最为普通的信息载体的今天,调......

期刊

VOICE Internet 华为公司语音互联网文语转换自动语音识别

一种融合音位属性的语音文档索引方法

为提高索引覆盖率并获得更多的候选路径,提出一种在词格上融合音位属性的语音文档索引方法。通过基于音位属性检测的语音识别系统......

期刊

语音文档检索语音文档索引自动语音识别音位属性检测词格信息融合 Spoken Document Retrieval（SDR） spoken docum

强噪音情况下的多种端点检测方法研究

在强噪音的情况下,语音信号的端点检测是一个难题[1].以前用过的传统算法在这时都失去作用,因此需要寻找端点检测的新方法.文中提......

期刊

端点检测低短时能量比自动语音识别去噪 endpoint detection low short-time energy ratio ASR nois

基于Transformer的语音识别研究

自从人们可以生产和利用各种机器以来,就一直有个伟大的设想,那就是让各种机器能够“听”懂人类的语言,并且能够使机器按照人类的......

学位

自动语音识别循环神经网络 Transformer 语音翻译文本到语音

基于语音技术的学前儿童言语功能自动评估系统研究

言语障碍通常指的是包括语言能力、说话能力和听觉等沟通问题的总称。在我国儿童群体中,言语障碍的发病率较高,且研究表明,言语障......

学位

言语功能自动评估自动语音识别学前儿童语速扰动音量扰动

听觉计算模型在自动语音识别中的作用

听觉系统是语音信号处理过程不可分割的组成部分，听学计算模型对自动语音识别研究具有非常重要的意义，简要评述了听觉计算模型近３０年的......

期刊

听觉计算模型语音信号处理自动语音识别

基于深度神经网络的语音去混响方法研究

室内混响声会严重影响音频信号的清晰度和可懂度,进而影响语音识别,助听器和声源定位的性能。此时,切实有效的混响消除方法就变得......

学位

语音去混响深度神经网络混响时间感知麦克风阵列自动语音识别

区分性训练和区分性自适应在自动语音识别声学模型优化中的应用

随着基于统计模型的模式分类理论不断发展完善,自动语音识别技术近年来取得了长足的进步。区分性训练已经成为自动语音识别中声学......

学位

自动语音识别声学模型区分性训练自适应区分性特征变换

基于端到端技术的藏语语音识别

现阶段基于链接时序分类技术的端到端的大规模连续语音识别成为研究热点,文中将其应用于藏语识别中,取得优于主流的双向长短时记忆......

期刊

端到端藏语自动语音识别链接时序分类

基于视听信息融合的语音识别研究

近年来,基于多模态信息的语音识别系统逐渐成为研究热点。单纯依赖单模的声音信息的语音识别在无噪音环境的条件下性能较好,然而,......

学位

自动语音识别视听信息决策融合隐马尔可夫模型决策层融合

应用自动语音识别技术实现通信增值业务

介绍实现商用自动语音识别的系统架构及其功能,阐述应用自动语音识别技术实现的新通信增值业务.应用自动语言识别技术可以实现语音......

期刊

通信自动语音识别增值业务 communication ASR value-added services

基于自适应心理声学模型的智能语音识别系统

针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模......

期刊

梅尔频率倒谱系数耳声发射自适应心理声学滤波器自动语音识别 AURORA2数据库前向掩蔽侧向抑制

基于VXML技术的语音门户研究

语音门户可以通过电话来浏览网络信息，而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术：VXML技......

期刊

语音门户 VXML 自动语音识别语音合成 voice portal XML ASR TTS

基于加权有限状态机的动态匹配词图生成算法

由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素......

期刊

自动语音识别加权有限状态机词图生成关键词检索

应用多核DSP的SOC实现个人手持设备的语音应用

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

会议

DSP SOC 自动语音识别

DSP技术在手机语音识别中的应用

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

会议

自动语音识别语音文本数字信号处理

基于RNN和WFST译码的自动语音识别研究

文中利用Eesen框架声学建模简化了现有的自动语音识别(ASR),通过训练单个递归神经网络(RNN)来预测上下文无关的目标(音素或字符)。......

期刊

自动语音识别 Eesen 递归神经网络加权有限状态换能器连接时间分类 automatic speech recognitionEesenrecurrent

看过本文同时还关注