【摘 要】
:
语音端点检测是一种从掺杂有背景噪声的语音信号中区分出语音和非语音信号的技术,它直接影响着语音识别、语音增强等语音处理技术的性能。因此,语音端点检测算法的研究对语音处理技术性能的提高有着关键性的作用。目前,语音端点检测算法主要有基于特征阈值和基于模型匹配两类。其中,基于特征阈值的端点检测算法通过对比提取的语音信号的特征值和实验前设定的阈值进行比较,从而实现语音和噪声的判定。基于模型匹配的端点检测算法
论文部分内容阅读
语音端点检测是一种从掺杂有背景噪声的语音信号中区分出语音和非语音信号的技术,它直接影响着语音识别、语音增强等语音处理技术的性能。因此,语音端点检测算法的研究对语音处理技术性能的提高有着关键性的作用。目前,语音端点检测算法主要有基于特征阈值和基于模型匹配两类。其中,基于特征阈值的端点检测算法通过对比提取的语音信号的特征值和实验前设定的阈值进行比较,从而实现语音和噪声的判定。基于模型匹配的端点检测算法先通过训练数据集样本训练分类器,然后利用训练好的分类器判定每帧信号为语音或噪声,从而达到语音端点检测的目的。随着神经网络技术的发展,基于神经网络的语音端点检测算法在诸多基于模型匹配的语音端点检测算法中异军突起。藏语语音端点检测是藏语语音处理的基础性工作,但相对于汉语和英语等语种,藏语语音端点检测技术还处于初级发展阶段。一方面,藏语语音端点检测算法目前还停留在基于特征阈值的端点检测算法上,并且藏语在该类算法上应用也比较少;另一方面,基于模型匹配的语音端点检测算法还没有在藏语中进行应用。因此,藏语语音端点检测技术还有很大的发展空间。本文针对藏语语音端点检测技术发展现状,分别采用基于特征阈值和基于模型匹配的两类端点检测算法进行了藏语语音端点检测技术研究。同时,本文提出了基于一维卷积神经网络的藏语语音端点检测算法。首先,本文将三种常用的基于特征阈值的端点检测算法应用在连续藏语语音上。实验对比发现,在该类算法中基于短时能量和过零率的端点检测算法和基于谱熵的端点检测算法在高信噪比环境下准确率较高,但随着信噪比的降低,它们的准确率表现出急剧下降的现象。相对而言,基于梅尔频率倒谱系数的藏语语音端点检测算法的准确率在不同噪声和信噪比环境下都具有较好的表现。其次,为进一步提升复杂噪声环境下端点检测算法在藏语语料上的准确率和鲁棒性,本文提出了基于一维卷积神经网络的语音端点检测算法并将其应用在藏语上。该算法的主要思想是在保留二维卷积神经网络的局部观察、权值共享及高层聚合等特性的同时,将二维卷积神经网络的输入层、卷积层和池化层由二维结构置为一维。本文算法在简化神经网络结构的同时,实现了复杂噪声环境下藏语语音端点的准确检测。仿真实验表明,与基于梅尔频率倒谱系数的语音端点检测算法和基于二维卷积神经网络的语音端点检测算法相比,本文提出的语音端点检测算法准确率更高、鲁棒性更强。
其他文献
目的与贝那普利比较,观察沙库巴曲缬沙坦对射血分数中间值慢性心力衰竭患者的临床疗效及安全性,为射血分数中间值的慢性心力衰竭患者的治疗提供数据支持。方法选取2019年10月~2020年7月在沈阳医学院附属中心医院心血管内科收治的110例慢性心力衰竭患者,入选标准:年龄≥18岁,根据中国心力衰竭诊断和治疗指南2018诊断流程,病史>6个月,纽约心脏协会(NYHA)心功能分级为II-IV级,左室射血
目的:了解HIV/AIDS合并AKI患者临床特征,预后分析及中医证型的研究。方法:选取2018年1月至8月在新疆医科大学第八附属医院就诊的83例HIV/AIDS合并AKI患者,按照是否抗病毒治疗分为两组进行随访2年,记录相关临床资料,CD4+T计数、血清肌酐(Scr)、尿素(UREA)、尿酸(UA)水平、患者预后及中医证型。结果:(1)83例HIV/AIDS合并AKI病人中,再次住院患者63例,构
结核病(Tuberculosis,TB)是一种主要由结核分枝杆菌(Mycobacterium tuberculosis,M.tuberculosis)感染引起的传染性疾病。预防和控制结核分枝杆菌感染的最佳方式是接种有效的疫苗。卡介苗(Bacille Calmette-Guerin,BCG)虽然能有效保护儿童免于结核分枝杆菌感染,但是随着年龄的增加,其保护效果不断下降。因此,为了控制结核病,我们需要
家庭暴力作为严重的社会问题,一直受到世界各国的广泛关注。在我国,受传统观念的影响以及客观情况的限制,社会及学界对家庭暴力的关注大多集中在妇女权益保护上,对儿童遭受家庭暴力问题有所忽视。近年来,家暴儿童案件的频频曝光,显示出我国在防治家暴儿童问题上存在欠缺。儿童作为身心发育不成熟的个体,家庭暴力对其产生的伤害很大,甚至会产生不可逆转的后果。虽然《反家庭暴力法》的出台打破了固有观念,突出了儿童保护,但
初中函数知识丰富,蕴含数学核心素养内容,而且初中函数不仅是初等函数的重大分支,同时对高中函数的学习也有很大影响,但是对于学生而言,函数内容的学习却非常困难。在核心素养的背景下,数学教学不仅要注重学生知识的学习、能力的发展,还要注重数学核心素养的培养。所以本论文以此立意,探究初中函数的教学,力求以数学核心素养指导初中函数教学,以初中函数教学为切入点来推进数学核心素养的培养。本论文首先通过文献研究法对
中国现代诗歌也叫“白话诗”,起源于清末,相对于古典诗歌,现代诗歌的格式和韵律更加自由。现代诗歌教学是初中语文教学重要的一部分,但因为各种原因,并未成为语文教学的重点。很多教师虽然迫切想提高现代诗歌的教学水平,但不知道如何教给学生正确的鉴赏诗歌方法。为解决这一难题,本文提出应当在现代诗歌的教学中引入接受美学理论。在现今的教学模式下,我们需要拓展学生期待视野的基础,激发学生的定向期待和创新期待,帮助学
藏族鱼棋游戏主要流传于我国甘肃、四川和青藏高原地区,是一种传统的棋类游戏,其规则分布局阶段和对局阶段,以围堵在直角区域判定吃子,以棋子比例判定输赢。博弈规则类似于围棋,规模和难度小于围棋。现阶段有益的电子化在线藏棋游戏系统少之又少,为此,若从规则相对简单的藏族鱼棋入手,研发具有博弈功能的藏族鱼棋在线系统,为更好地挖掘、传承和弘扬藏棋文化,为藏棋爱好者提供智能化的藏棋智力游戏平台,以及可以让其他民族
情感是认知过程中重要的一环,使计算机像人一样具有感知各种情感的能力,是人工智能领域的一个全新课题。语音情感识别(Speech emotion recognition,SER)是情感识别领域的重要研究方向,旨在让计算机能够领悟人的情感,实现人与机器之间的顺畅沟通。但语音情感识别领域当前存在诸如:缺乏有效的情感特征集、缺乏有效的情感识别模型等问题。本文从提升语音情感识别模型的识别性能出发,进行了基于深