【摘 要】
:
语音情感识别是计算机理解人类情感最直接的方式,是实现人机交互智能化的重要渠道,但识别模型的性能需要进一步提升.为实现这一目标,提出一种基于循环卷积神经网络的语音情感识别模型ARCNN-GAP.其中,循环卷积层具有弹性路径,在确保网络深度的同时能保证优化时的梯度回传,提取更加有效的情感特征;全局平均池化运算可以在减少计算复杂度的同时降低过拟合风险;而注意力机制能够使模型更多关注情感相关特征.使用韵律特征和谱特征的融合特征在CASIA和EMO-DB数据库上进行研究,分别取得了83.29%和75.28%的识别率
【机 构】
:
青海师范大学计算机学院,青海 西宁 810008;藏语智能信息处理及应用国家重点实验室,青海 西宁 810008
论文部分内容阅读
语音情感识别是计算机理解人类情感最直接的方式,是实现人机交互智能化的重要渠道,但识别模型的性能需要进一步提升.为实现这一目标,提出一种基于循环卷积神经网络的语音情感识别模型ARCNN-GAP.其中,循环卷积层具有弹性路径,在确保网络深度的同时能保证优化时的梯度回传,提取更加有效的情感特征;全局平均池化运算可以在减少计算复杂度的同时降低过拟合风险;而注意力机制能够使模型更多关注情感相关特征.使用韵律特征和谱特征的融合特征在CASIA和EMO-DB数据库上进行研究,分别取得了83.29%和75.28%的识别率.实验结果表明:ARCNN-GAP具有更好的识别性能和泛化性.
其他文献
机载激光雷达能够及时准确地获取大量具有精确三维位置信息的三维点云数据,在数字城市、森林防火、智能交通等领域有着广泛的应用.城市中心区域的三维点云数据往往会因为高大树木或植被的遮挡,造成建筑物等人造目标识别特别困难.本文通过直接的二次多项式拟合方式提取高大树木等植被与建筑物目标典型局部区域的区域信息,构建区域目标敏感的结构特征,进而,通过模糊逻辑即可完成三维点云数据的建筑物目标敏感的分类任务.实验结果表明,该方法能够快速有效地实现较大尺度范围内LiDAR点云数据的分类,具有较好的应用前景和推广能力.
电力信息系统应用智能电网来管理电力设备.随着社会用电总量的增加和智能电网的推广与发展,电力网络的规模逐渐变大且管理复杂,然而,保障电力信息系统的安全是重要的.网络入侵检测技术可以有效避免来自网络的入侵行为和攻击,进而保障系统的安全.本文采用深度强化学习方法中的Dueling-DDQN算法解决网络中存在的入侵检测问题,智能体根据试错式的学习获得奖赏值来训练算法以提高网络入侵检测的效率且同时降低人工成本.最后使用NLS-KDD数据集进行对比实验,实验结果表明基于Dueling-DDQN的网络入侵检测算法可以提
由于密度不同的雨对图像造成的遮挡不同,图像去雨一直都是一项极具挑战性的任务.目前,基于深度学习的图像去雨算法已经成为主流.然而,多数深度学习的架构都是通过堆叠卷积层来设计的,执行去雨任务后图像仍存在着大小不一的雨痕,这些方法并不能很好地关注训练中雨图的局部信息和上下文信息.为了解决上述问题,本文设计一种基于多通道分离整合的卷积神经网络用于图像去雨.第一步通过通道分离,再利用卷积层间的层级连接,构成多尺度模块,最终将不同通道的输出进行整合.该模块可以增大感受野,探索特征图之间的空间信息,更好地提取特征.第二
针对苹果栽培品种识别分类问题,提供一个包含多个苹果果树品种的叶片图像原始数据集,并且研究构建一种新的深度卷积神经网络分类模型,对其分类准确性、泛化性能和稳定性进行对比验证,以期对苹果栽培品种简便、快速、准确的识别分类提供理论依据和技术支持.以甘肃省平凉市静宁县果树果品研究所苹果良种苗木繁育基地作为实验基地,在其中选取14个苹果果树品种.每个品种选取10棵左右树龄、树势、长势都存在差异的果树,采摘100片左右成熟的、无机械损伤的叶片,然后拍摄叶片图像建立数据集,进而利用卷积神经网络训练识别分类模型.本文针对
视频快照压缩感知基于压缩感知理论,仅在一次曝光过程中将多帧画面投影至二维快照测量,进而实现高速成像.为了从二维快照测量信号恢复出原视频信号,经典的重建算法基于视频的稀疏性先验进行迭代优化求解,但重建质量较低,且耗时过长.深度学习因优异的学习能力而受到广泛关注,基于深度学习的视频快照压缩重建方法也得到关注,但现有深度方法缺乏对于时空特征的有效表达,重建质量仍有待进一步提高.本文提出视频快照压缩感知重建的多尺度融合重构网络(MSF-Net),该网络从横向的卷积深度和纵向的分辨率2个维度展开,分辨率维度利用三维
电网工程图纸矢量化识别是实现电网领域基础图纸数字化的一种重要技术途径.由于电网中的电气元件类别多,其中部分图像背景模糊,电气元件的旋转角度不一致,从而对图纸中的电气元件的识别造成一定挑战.本文提出一种基于深度学习中Faster RCNN网络架构的电气元件识别和训练方法,将需要训练的样本数据进行预处理和特征提取,在预处理过程进行平滑去噪、二值化、分割等操作,在特征提取过程采用VGG16网络,利用深度学习方法对电网图元进行识别.在包含9类电网图元的真实数据集上的实验结果表明,本文方法对电网工程图纸中的电气元件
针对紧凑型卷积神经网络在部署现有注意力机制存在计算量或参数开销大的问题,提出一种改进的超轻量化子空间注意模块.首先,深度连接的子空间注意模块(Deep Connected Subspace Attention Mechanism,DCSAM)划分特征图为若干特征子空间,为每个特征子空间推导不同的注意特征图;其次,改进特征子空间进行空间校准的方式;最后,建立前后特征子空间的连接,实现前后特征子空间的信息流动.该子空间注意机制能够学习到多尺度、多频率的特征表示,更适合细粒度分类任务,且与现有视觉模型中的注意力
在机器人流程自动化(Robotic Process Automation,RPA)软件中,经常采用序列推荐系统让机器人完成判断、选择等人工处理的任务.然而常用的序列推荐系统受限于序列信息的提取困难等问题,难以得到广泛应用.为了解决这一问题,构建一种基于Inception的卷积序列推荐模型,把时间和潜在空间中的用户行为序列信息嵌入进一幅“图像”中,并通过动态和静态2种不同的卷积层提取其中的局部特征,全面地提取用户的短期兴趣偏好,同时将用户嵌入矩阵作为用户的长期兴趣偏好嵌入到卷积层的输出中,共同构建完整的用户
随着汽车的普及,交通拥堵问题日益严重,依靠传统云计算的智慧交通系统虽能在一定程度上缓解交通压力,但已无法满足辅助驾驶、自动驾驶等新型车载应用对传输带宽与时延的需求.为了实现海量数据的实时处理,保障公众信息及交通安全,提升交通系统运行效率,将边缘计算应用于智慧交通.首先对智慧交通的发展概况进行整体描述,提出基于边缘计算的智慧交通总体架构,充分利用边缘计算物理邻近、高带宽、低时延、位置认知的特点解决目前交通系统信息传递延迟、数据处理不及时、传输负载大等问题.然后,基于无线传输、信息感知、计算卸载及协同处理等方
针对列车车轮踏面旋转纹理信息无法准确、有效提取的问题,提出一种基于Radon变换和双树复小波变换(DT-CWT)的列车车轮踏面特征提取方法.首先,对车轮踏面图像进行Radon变换;然后,对变换后的图像进行DT-CWT分解,使用分解后的各层低频子带系数和高频子带系数模的均值和标准方差构造特征向量,将其作为区分列车车轮踏面是否发生损伤的依据;最后,由支持向量机(SVM)进行分类决策.使用动车所采集的图像及人为加噪声后的图像进行分类实验,结果表明,本文使用的Radon和DT-CWT算法能有效地进行旋转不变纹理的