基于循环神经网络的声学车型识别研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fattingmore
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车辆车型识别作为智能交通运输系统中比较基本的研究方向,一直以来备受国内外相关研究者关注。经历了四十多年的发展,车型识别仍然存在识别率低、抗干扰差及数据采集处理难度大等问题,导致车型识别距离实际场景应用还有一定差距。本文从不同车型车内噪声存在区别为出发点,参考有反馈神经网络在声音识别领域取得的显著成果,提出了基于循环神经网络的车辆噪声识别方法。为参考数据长时间背景信息,充分提取不同车辆噪声的特征信息,本文以有反馈神经网络中的循环神经网络为研究重点,根据循环神经网络的发展现状引入循环神经网络演变形式双向LSTM(Long Short-Term Memory)网络作为车辆噪声识别模型。该识别模型内部隐含层单元选用包含输入,输出及重置控制三个门结构的LSTM单元,各个单元构成了该模型前向传播层和后向传播层两个互不相连的特殊结构层且各单元与输入层为全连接方式。这种网络连接方式能够解决长时间步长双向背景信息参考问题和常见梯度爆炸或消失问题;在最终的识别输出阶段网络采用CTC(Connectionist Temporal Classification)叠加输出的方式,通过最大概率解码方法得到网络最终的标签输出。由于该结构的标签缩减算法可以消除识别后的重复和无效标签,所以避免了网络训练识别过程中需要标签和数据一一对应问题,简化了数据处理过程。网络训练测试数据具体获取方面,本文采用随机样本起始位置点获取方法得到每个训练样本。首先,在原始录取的连续声音信号中选取随机点作为训练样本开始位置点;其次,随机点具体选取采用随原始录音信号长度均匀分布的随机函数得到;最后,从选取的随机位置点开始复制目标长度的声音采样数据作为单个样本。在后续数据预处理过程中,我们仍旧选取传统声音识别所采用的信号特征预处理方法,将声音信号的梅尔倒谱系数作为最终的训练测试数据。最终实验表明,基于双向LSTM和CTC网络结构的车辆噪声识别模型经过交叉验证后,网络识别率没有出现大的波动且网络结构稳定可靠。与传统的高斯混合模型和无反馈神经网络声学识别模型相比,该模型的识别效果更好。并且,在不同程度噪声影响条件下,该模型可以满足基本的识别任务。
其他文献
研究几种高、低分子化合物对冻干瑞士乳杆菌的保护作用。以冻干后的活菌存活率和凝乳时间为考察指标,先进行单因素试验筛选出保护效果最好的4种物质甘油、葡萄糖、组氨酸和牛
在构建社会主义和谐社会、坚持依法治国与以德治国相结合之大背景下,借纪念中国人民抗日战争暨世界反法西斯战争胜利70周年之契机,依法特赦,既符合中国当前国家治理的实际,也
本论文通过深入研究对扎赉特蒙古族民歌的内容、题材和民歌的发展情况决定了主要研究对象。论文除了绪论和结论外,共四个部分组成。绪论部分简述了扎赉特蒙古族民歌的研究方
选择大豆浆为稳定剂,蔗糖液为甜味剂,以沉淀率、浮层厚度、香气和味感为指标,采用混料设计优化配方,分析二者对花生蛋白饮料稳定性的影响。结果表明,大豆浆和蔗糖都能够提高
从自然发酵的辣椒酱中分离出产酸量高、生长良好的菌株,经过形态学鉴定、生理生化特性及发酵性能试验,最终选定Lact.1和Lact.2两株适用于发酵辣椒试验的乳酸菌。鉴定结果表明
桡骨远端骨折是常见的骨折,发生率约占所有骨折类型的16.67%,且多见于老年人群。桡骨远端骨折的临床表现复杂,需要借助影像学检查以明确损伤类型,为治疗提供依据[1]。传统的X
为解决CVD设备在工艺过程中有时存在工艺参数周期性波动的现象,进行了相关分析。发现使用高压钢瓶存储的高纯气态源时,常使用单个调压阀和质量流量计(MFC)来减压和控制流量。而高
本文主要阐述培养邮轮乘务专业学生英语自主学习能力的策略,引导学生在校期间养成自主学习习惯,工作后继续坚持自主学习,提升自己的英语水平。
今天晚上十点从杨玉圣教授所主持的学术批评网上得知晓芒师原先的三部著作<灵之舞><人之镜>以及<灵魂之旅>首次结集,2005年1月由湖北人民出版社出版,题为<邓晓芒文学与文化三
阐明生态用地的涵义,剖析我国大面积水土流失的原因,即生态型用地利用不当地过伐过垦过笔过围行为,针对性地提出了我国生态型用地途管制的重点及实施对策。