【摘 要】
:
为了解决语音情感识别中数据集样本分布不平衡的问题,提出一种结合数据平衡和注意力机制的卷积神经网络(CNN)和长短时记忆单元(LSTM)的语音情感识别方法.该方法首先对语音情
【机 构】
:
浙江理工大学机械与自动控制学院,台州学院智能信息处理研究所
【基金项目】
:
国家自然科学基金(61976149),浙江省自然科学基金(LZ20F020002)。
论文部分内容阅读
为了解决语音情感识别中数据集样本分布不平衡的问题,提出一种结合数据平衡和注意力机制的卷积神经网络(CNN)和长短时记忆单元(LSTM)的语音情感识别方法.该方法首先对语音情感数据集中的语音样本提取对数梅尔频谱图,并根据样本分布特点对进行分段处理,以便实现数据平衡处理,通过在分段的梅尔频谱数据集中微调预训练好的CNN模型,用于学习高层次的片段语音特征.随后,考虑到语音中不同片段区域在情感识别作用的差异性,将学习到的分段CNN特征输入到带有注意力机制的LSTM中,用于学习判别性特征,并结合LSTM和Softm
其他文献
以液压挖掘机工作装置为研究对象,建立其运动学和动力学理论模型。采用多体机械系统仿真软件对工作装置进行运动学和动力学仿真分析,得到各杆件之间铰接点的位移与速度曲线,
搭建大功率LED前照灯散热系统试验平台,分别用水和液态金属进行温控效果评估试验,研究结果表明液态金属具有更为显著的冷却效果。在蠕动泵转速为100 r/min时,液态金属的对流
金属切削过程中,刀具磨损对刀具寿命有着显著影响,而切削试验是研究刀具磨损的常用方法,但是存在周期长、成本高等问题。因此,通过切削仿真平台对优化设计的涂层硬质合金车刀
在研究风沙流动方面,光滑粒子流体动力学方法(SPH)的无网格性有着独有的优势。利用SPH方法研究风沙流动时,需要将整个计算区域离散成数量庞大的单个粒子,因此计算规模大、计
旋转超声波加工设备可以采用非接触电能传输耦合器为高速旋转的超声振子提供电能,以取代传统的接触式碳刷滑环,这种非接触电能传输方式安全、稳定,且对转速没有限制。但由于
基于AMESim仿真计算,综合软件中机械元件库、液压元件库及液阻库,建立了矿用液压缸动载加载系统的仿真模型,对动载条件下液压缸无杆腔的压力特性进行模拟分析,进行了液压缸动
在数字图像相关测量计算过程中,直接参与互相关计算的是散斑子图,而散斑子图质量对测量精度具有重要影响。因此,如何有效评价散斑子图质量是数字图像相关方法研究的热点问题。将信息论中用于衡量信息量的"熵"概念引入散斑子图评价,提出以图像熵为评价参数的散斑子图质量评价方法。为验证该评价参数的有效性,对采用不同方法采集的3幅不同类型散斑图进行位移测量实验。实验结果表明:位移测量精度与散斑子图熵有紧密的关系,散
道岔区的动力学性能是决定行车速度和安全的主要因素之一,而车轮多边形磨耗会显著影响轮轨相互作用力及转向架关键部位的振动特性。以18号可动心轨道岔作为研究对象,建立车辆
针对轴承早期故障信号非线性、非平稳和故障特征难以提取的问题,提出一种变分模态分解(VMD)与流形学习相结合的特征提取方法。该方法应用VMD将信号分解成包含不同故障信息的
为研究新建卫星厅对中转旅客的航班衔接的影响,分析中转旅客的换乘紧张程度,提高机场资源利用效率,本文对登机口分配问题进行研究.在最小化登机口使用个数的前提下,考虑了中