【摘 要】
:
随着人工智能技术的发展,在未来智能时代,人机交互将如同人与人交互一般。要实现这种交互方式,语音识别技术是机器所必须掌握的技能。因此在人工智能的发展历程中,对语音识别
论文部分内容阅读
随着人工智能技术的发展,在未来智能时代,人机交互将如同人与人交互一般。要实现这种交互方式,语音识别技术是机器所必须掌握的技能。因此在人工智能的发展历程中,对语音识别技术的研究显得尤为重要。研究发现,不同的口音往往会导致异常的发音,进而使得语音识别的准确率大大下降。本文研究的英语口音识别是一种使用计算机自动识别英语语音所属国家的语言识别技术。目前,有效的英语口音识别方法是提取语音特征,利用这些特征训练机器学习模型,进行英语口音类别判定。当前,英语口音识别研究多使用传统的声学及韵律特征,而这些特征粒度不够精细或者特征维度过高;在模型构建上,RNN取得了一定的效果,但离应用还有很大的差距。本文针对以上问题展开研究,主要工作如下:(1)提出了一种基于CNN的英语口音识别方法。考虑到表征口音的主要特征往往出现在语音中的某些片段,CNN利用其卷积特性,围绕着这些片段归纳局部信息,最后在高层将这些信息汇总,总结出口音类别。实验表明,该方法可以很好地提取语音中表征口音信息的特征。(2)提出了一种基于CNN-BiRNN的英语口音识别方法。在CNN口音识别方法中,由于卷积的局限性,CNN处理长序列问题的能力尚显不足。考虑到语音是一种具有“流属性”的数据,分类过程不仅要考虑局部特性信息,还需考虑时间序列中各时间点的数据之间的先后次序关系。基于CNN英语口音特征提取方法,再结合BiRNN抓取这些特征间的次序关系,进而达到识别口音类别的目的。实验表明,通过BiRNN对CNN提取的口音特征进行序列数据信息汇总,能很好的区分英语口音类别。(3)提出了一种基于CNN-BiRNN-Attention的英语口音识别方法。在CNNBiRNN口音识别方法中,由于BiRNN汇总序列特征信息时无法区分序列中各个部分的不同重要程度。因此,在本方法中,首先通过CNN提取出表征口音的局部特征,再利用BiRNN对这些特征进行序列编码,而该序列特征的各部分在整个语音序列特征中对判别口音所属类别的贡献不尽相同,因此,利用注意力机制的特性,为这些特征分配不同的关注权重,从而使得这些特征能更好的表征口音。实验表明,注意力机制通过为口音序列特征的各部分分配不同的关注度,能更好的完成英语口音识别任务。
其他文献
“企业间融资性买卖”在商品交易领域较多被作为规避法律风险的融资渠道所采用,但在司法实务中,却较难对其进行识别和定性。日照港运销部与山西焦煤公司借款合同纠纷案及相关案例中,法律关系的界定就难以定性。具体到主案例,其核心争点集中在两个方面:肇庆公司是否已代山西焦煤公司返还日照港运销部的预付款、企业间融资性买卖的法律关系如何确定。首先,民事诉讼主体应当坚持诚实信用,禁止在诉讼程序作出前后不一致的诉讼行为
本文选取了2015年至2019年的国务院总理两会记者会讲话及其汉英口译内容,对其中流水句的译法进行了案例分析。基于前人总结的汉语流水句翻译策略,笔者总结归纳了一些外交口译流水句的常见问题和实用方法。首先,根据文献调查和实例分析,笔者认为在汉语流水句翻译处理方面存在几大问题或挑战:第一,信息大的流水句较难准确表达;第二,流水句小句间的逻辑关系较难厘清;第三,口译流水句的信息不分主次。其次,通过汉语流
展会联络口译员通常负责翻译常规问答和非正式的商务对话。联络口译及商务会话这一特定的环境要求译员承担多种角色,而不仅仅是译员。尽管许多学者已经总结出诸多译员所承担的常见角色,但这些角色只是一种笼统的指南,并且先前的研究大多是从对话双方及译员的语言互动来探究译员在其中所承担的角色。因此,本报告旨在找出展会中联络口译员所应扮演的合适的角色,探究影响译员角色选择的语言及非语言因素以及译员应如何扮演好这些角
目的:探究HO-1修饰BMSC治疗大鼠无心跳体肺移植IRI的保护机制。方法:首先,以SD大鼠构建NHBD肺移植IRI的动物模型,以此来模拟临床NHBD肺移植IRI的情况,并以HO-1为目的基因通过慢病毒为载体来修饰BMSC,构建HO-1-BMSC,然后以肺动脉细针穿刺法将HO-1-BMSC注入受体。设立手术对照(Ⅰ组)、单纯BMSC(Ⅱ组)、慢病毒空载体-BMSC(Ⅲ组),HO-1修饰BMSC(Ⅳ
目的探讨高压氧对轻度认知功能障碍模型大鼠ERK信号通路的变化及认知功能的影响。方法SD雄性成年大鼠48只随机分为四组(n=12):空白对照组、MCI组、高压氧组(HBO组)、U0126组。连
在人才竞争激烈的背景下,教育发展成为各国关切问题。在发展本国教育的同时借鉴国外教育的优秀教育经验也是必不可少的。该翻译实践报告选取了Reinventing Education in America一书进行英汉翻译,希望对国内教育工作者以及家长有所启发,从而更好地进行儿童教育。本翻译实践报告以笔者参与的英汉翻译实践为基础,以目的论为指导,探讨文本翻译中专业术语及长难句等问题的应对策略及翻译技巧。在翻
背景:STAT3(信号转导和转录激活因子3)在肿瘤的发生和发展中起着非常重要的作用。口腔鳞状细胞癌(OSCC)是头颈部鳞状细胞癌最常见的类型。STAT3在头颈部鳞状细胞癌中的表达显
自然类在最近几十年来一直是吸引哲学家们关注的一个重要问题。什么是自然类,它是否可通过本质来定义,它是否真实存在于自然界中?关于这些问题,当代哲学家们展开激烈争论,并
在中国经济发展的新时期,转变发展方式、优化经济结构、转换增长动能等任务尤为艰巨、突出和迫切。基于产业融合的跨界并购是新时期并购重组的重要特征和发展趋势,与传统意义
生物特征识别技术由于其便捷和安全性已经被广泛地应用在当今社会中,而语音作为一种重要的生物特征,蕴含了非常丰富的信息,且由于智能设备的普及,说话人语音的采集成本也非常低廉。因此,对说话人的语音进行分析具有重大的实际应用价值。本文主要讨论了基于深度学习的说话人的声纹识别,并拓展讨论了语音的情绪识别。声纹识别部分又分为说话人辨认和说话人确认两个任务,而语音情绪识别将直接处理为一个多分类的问题。为了利用不