一种噪声环境下的复杂声音识别方法

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:luoqiaoshui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会已进入人工智能的时代,语音识别技术已经相当成熟。而对于实际生活中的复杂声音,由于其声源的复杂性和多样性,加之背景噪声的干扰,目前对于这一领域的识别研究还远远不够成熟,仍然存在许多问题和缺陷。因此对噪声环境下复杂声音的识别研究具有非常重大的实践价值和理论价值。复杂声音是指这样一类包含多种声音类型且这些声音之间的边界难以区分的声音信号。目前对于这类声音的检测方法主要沿用传统的语音识别技术,语音信号发音方式较为固定且能量平稳,而复杂声音种类繁多,发音原理各不相同,瞬间能量也较大,而且还会被环境噪音所干扰,因此仅仅采用传统的语音识别技术不能够较好地应用于复杂声音的识别。针对噪声环境下这一类声音识别准确率低的问题,本文主要进行了如下研究工作:(1)首先主要介绍了声音识别中常用的几种时频域特征,通过提取和分析复杂声音样本的特征参数,提出了由时频域特征组合的方式来共同描述复杂声音,并进行了多种混合特征的对比实验。(2)在对噪声环境下的复杂声音识别方法研究过程中,针对人工选择训练样本的困难,提出了一种基于聚类标注的训练样本选择算法,能够更加快速精准地选择出训练样本代表集,并进行了不同聚类方法的对比实验。(3)最后提出了基于隐马尔可夫模型(Hidden Markov Mode1,HMM)的复杂声音识别框架,并进行了训练和识别。通过对列车声音以及鸟叫声两种不同类型的复杂声音进行仿真实验,结果表明,利用时域特征短时自相关函数以及频域特征梅尔频率倒谱系数组合的混合特征参数表示复杂声音特征,使用本文提出的基于近邻传播聚类标注的训练样本选择算法,以及通过HMM模型识别框架进行建模,可以显著提高噪声环境下复杂声音的识别准确率和效率。
其他文献
悲翠贻贝是亚热带暖水性经济贝类,近几年来人工养殖发展迅速,为了充分利用海区自然苗种资源,1992-1993年我们在围头湾进行了海区半人工采苗试验。结果是悲翠贻贝1993年附苗期在5月25日至8月初,高峰
本文报道了厦门岛岩相潮间带生物276种,其中藻类、软体动物和其他动物占总数的65.21%。夏季和冬季平均生物量为1365.09g/m2,平均栖息密度为3110个/m2。生物量以甲壳动物居首位,软体动
余华被不少人认为是"跟鲁迅走得最近的人。"从余华的小说中探寻鲁迅因子,探寻余华在文化精神和创作上对鲁迅的继承。余华在对弱势群体中的农民、知识分子、妇女、儿童的生存
<正>1临床资料患儿男性,12岁,腮腺反复肿胀、触痛15d,其母述孩子感觉腮部不适在3~5min内腮腺很快肿胀起来,触痛,有时一侧有时两侧,多以右侧为主,持续2~3h缓解,一天出现2-3次,或
本文以11家在华外资银行为调查样本,对加入WTO以来特别是"法人导向"政策实施后外资银行在华发展战略的变化进行了研究,分析归纳出外资银行目前采取的三大类战略选择,以及影响
近年来,教学方式随着新课程的不断改革发展,小学音乐教学可以利用多媒体信息技术进行全面的整合,促进整个音乐课堂教学更好的实施,信息技术把声音、动画、图像和文字融合到音
<正>一网名,乱室佳人。26岁属虎的。家住怒江,傈僳族。22岁走出大山到深圳打工。因为长得黑,大家都叫我黑妞或黑社会。嘻嘻,叫我黑妞姑奶奶我也没意见。黑妞第一次对我介绍自
职校教师的学习特点除具备教师学习的一般特点外,还呈现出灵活性、广泛性、开放性和实践性等就业导向的学习特点。要改变职校教师学习动力不足、目的不明、内容不符的现象,应
本文根据1994年9月16日台湾海峡7.3级强震序多州空间活动图象变化特征,结合历史地震资料,比较分析了台湾海峡区域史今地震活动的总体演变过程,表明该区强震发生与周边地区的台湾、日本及菲律宾大地震,在时间进程、强度变化和地域分布关系上存在着地球物理场变化的影响。进而深入讨论了台湾海峡强震发生的空间环境及可能的动力影响因素,较客观地判断了台湾海峡强震的区划归属。
本文分析测定了闽南近海常见鲨鳐类肝油的理化常数和角鲨烯含量。尖头斜齿鲨肝油的碘值特别高,说明其中脂肪酸的不饱和程度很高;非皂化物含量很低,约占肝油重的38×10-3(m/m);角鲨烯