基于改进极限学习机的口音识别

来源 :东华大学 | 被引量 : 0次 | 上传用户:chongqingyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非母语说话人用英语讲话时,会表现出不同的口音或非英语母语口音的特点,基于该特点可识别出说话人的口音及其母语。外国口音的自动识别在众多语音系统中具有重要作用,如辨认说话人、数字学习、电话银行、语音邮件、语音转换和移民筛选等,此外,在保证自动语音识别(ASR)系统的鲁棒性方面也十分重要。但是,自动化的口语识别也面临很多困难,主要包括口音特征往往和语言内容、韵律、环境噪声以及说话人自身语音特点混杂,需要搭建复杂和非线性的口音识别模型。另外,包含大量样本的口音语料库也需耗费大量时力。本论文通过对语言学发音方法的研究,获得有效体现母语的发音特征,并采用改进的极限学习机算法,获取较为权威和丰富的英语方言语料库,分别实现二元口音分类和多元口音分类识别模型,获得了较好的识别结果。本文首先通过研究阿拉伯人在英语辅音方面的发音差异,提出了基于极限学习机(ELM)的口音识别模型。将切分好的辅音音素的梅尔倒频谱系数(MFCC)作为声学特征输入,对ELM分类器进行训练。分类器采用KFold验证的方式表现出更快的学习效率和性能,其精度可达88%,标准偏差为0.0167而SVM和DBN分类器的精度分别只有76%和64%。进一步与采用基于单词进行MFCC特征提取的SVM和DBN模型,进行对比,发现本文所提出方法较之精度分别提高了11%和16%。进一步,针对传统模型通常是为二值分类而设计,且在二值分类方面具有较好表现,但在多元分类方面则效果较差,模型总体性能表现和能够达到的准确度有限,本文提出了基于多核极限学习机(MKELM)的包括英语、阿拉伯语、汉语、韩语、法语和西班牙语的多类外国口音进行识别。该模型首先将MFCC和韵律特征结合作为原始输入特征,对两两成对的二元分类器分别进行训练,然后采用加权方案对所有的二元分类器结果进行集成判别,从而实现对六种不同母语的英语口语进行分类。本文提出的多元口音口音分类模型采用成对加权方案后可使准确率达到82.75%,好于SVM的71%和KELM的81.2%。相比于传统的多元分类模型,本文提出的模型准确率达到82.5.5%,而SVM,ANN,LSTM,ELM,MLEMM和KELM模型分别为39%,21%,27.1%,32%,37%,65%。在模型性能方面,本文提出的模型花费时间较少,只需45s,而SVM模型则要多花一倍的时间,约92s。通过性能和准确率的整体比较,可得本文所提模型在多元分类方面具有较大优势。
其他文献
随着交互艺术的发展以及心理体验时代的到来,交互艺术的心理体验逐渐成为研究的热点,通过分析交互艺术的心理体验及应用可以更好的为体验者带来兴趣、启发性和愉悦感。对于一件成功的交互艺术作品来讲,参与者心理体验的重要性是显而易见的,它往往是一件作品思想是否被传达的重要依据,也是作品外在形式与内涵的直接体现。交互艺术最大的特点是互动性,为了使体验者在与艺术作品互动过程中对作品进行深入思考,了解作品的思想情感
近几十年来,脉冲功率技术和高能电子束产生技术取得了长足的发展,高功率微波技术的研究与探索也随着取得了巨大的成就,各国的学者研究出来了各式各样的高功率微波源被。在这
科技的飞速发展引领智能化时代的到来,计算机视觉在人工智能化领域占有重要地位,实现图像理解是计算机视觉的最终目标,其中目标跟踪技术是实现图像理解技术中不可或缺的元素
合作记忆同时起到抑制和促进作用:合作对记忆的抑制作用表现为合作抑制,即合作组的正确回忆量显著低于名义组;合作对记忆的促进作用表现为错误修剪和合作后记忆优势;上述合作的影响在项目记忆和来源记忆中均得以证实。与中性刺激相似,情绪刺激也能记录到合作对记忆的抑制和促进作用,并且有研究者发现情绪刺激的合作抑制更强。然而现有的合作记忆研究均基于比较情绪刺激与中性刺激记忆绩效的角度,尚未有研究关注到两类刺激之间
学位
随着数据获取手段的不断增加,地球系统科学也进入“大数据时代”,如何能让不同专业、不同研究领域的研究人员从纷繁复杂的地球系统科学数据中获取到自己想要的数据成为值得探
目前,随着无线通信网络的兴起和移动终端设备的指数增长,无线频谱资源已日趋耗尽,能源消耗也呈指数上升。可见光通信(Visible Light Communication,VLC)由于其频谱资源丰富、
棉花作物是国民生活的重要物资,棉花产业的发展直接影响着人们的生活及国家经济的繁荣。新疆是我国主要的棉花生产基地,同时,棉花产业是新疆大部分农户的主要经济来源。近些年新疆棉花生产受到自然灾害频发、植棉成本攀升、棉花价格剧烈波动等负面影响,导致未能将生产优势有效转变为经济优势,棉花生产受到严重威胁。为了保护棉花产业的持续发展,保障棉花资源的有效供给以及棉农的收入,政府也一直在探索促进棉花产业发展的扶持
学位
准确实时掌握枣树的长势和精确评估枣园产量可以减轻农业生产风险。传统方法费时费力、时效性差;定量遥感评估方法缺乏机理性;作物生长模拟方法用于果树产量评估报道较少,当作物模型应用区域尺度时输入参数的不确定性将影响产量评估精度。遥感数据同化技术在一定程度上可以降低输入参数或状态变量的不确定性,有望提高枣园产量评估精度。目前缺乏针对骏枣的遥感数据同化系统,因此实现田间尺度骏枣产量评估的遥感同化系统软件对枣
农业用水资源短缺是南疆农业可持续发展与后备耕地资源开发利用的障碍因素。然而高定额冬春季灌溉在缓解耕地盐渍化同时产生大量农田排水,排水资源直接排入河流,未得到有效利用。因此,农田排水资源化利用即可缓解农业用水资源紧缺,也可提升水资源利用率,针对南疆农田排水水质特征研究十分必要。目前关于南疆农田排水水质特征研究较少,本文以南疆阿拉尔垦区为研究区域,选择连片棉田定点采集冬灌前、冬灌后、生育期灌、排水样,
随着“一带一路”倡议的提出,新疆生产建设兵团(以下简称兵团)作为陆上丝绸之路的核心地带也迎来了诸多发展机遇。作为兵团三大产业中占比较重的农业,拥有巨大的发展空间和资源优势,兵团企业无论是贸易规模还是经营效益都呈现出快速增长态势,兵团“走出去”涉农企业逐步具备发展潜力。税收是国家政策工具之一,是影响经贸和投资的重要变量,合理的税收政策、良好的营商环境及和谐的征纳关系是有效提升兵团“走出去”涉农企业经
学位