自注意力机制的短文本分类方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:mzybbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对短文本信息量少导致隐藏的信息难以充分挖掘和深度学习模型易受干扰导致分类准确度下降的问题,提出一种融合对抗训练自注意力多层双向长短期记忆网络(Con-Att-BiLSTMs)短文本分类模型.将文本训练集按不同比例进行分类对抗训练,通过对抗训练提升模型的健壮性;利用多层双向长短期记忆网络对语义进行提取,利用自注意力机制层对语义信息进行加权强化;经过softmax函数使损失率极小化.将该方法与其它模型方法比较,实验结果表明,该方法有效提高了短文本分类的准确度.
其他文献
为分析1090 MHz信道具体占用情况,提出一种1090 MHz信道分析软件设计与实现方法.该软件采用C++语言编程,将接收机接收到的1090 MHz统计数据帧进行解析处理,利用处理后的数据实时监测信道占用情况;创建本地数据库,将数据进行分类存储和统计;使用MFC制作上位机软件界面,调用后台数据库中存储的数据,对全天的信道占用率做可视化显示,与信道内的各帧信号进行分析比较.测试结果表明,使用该方法设计并实现的1090 MHz信道分析软件系统可以实时处理和统计接收的数据,用人机交互方式监测信道实际使用情况并
针对有标签信号样本数目较少的实际环境中,通信辐射源个体识别技术存在识别准确率较低的问题,提出改进的一致性正则半监督辐射源个体识别方法,在一致性正则方法中引入伪标签思想的改进方案,在3种一致性正则模型上分别加入伪标签正则项.实验中设计适合实采信号数据的Inception深度网络,探究实验参数变化对实验结果的影响,实验结果表明,在通信辐射源个体识别问题上,改进方法比全监督方法、伪标签半监督方法、自编码器特征提取方法和经典的一致性正则半监督方法具有更高的识别准确率.
针对现有肝功能分级方法存在有创性、时效性等问题,提出一种基于CT图像多尺度方向数值模式的肝功能分级方法.利用Gabor滤波器提取肝脏感兴趣区域的多尺度纹理特征,对各尺度的主要方向进行数值模式的紧凑编码并分块统计直方图,获取多尺度特征向量,利用支持向量机构建肝功能分级模型.临床数据实验结果表明,该方法有效且可行,具有非侵入性、高效性和可重复性,为患者肝功能评估提供了基于影像学的辅助诊断.
为解决由于过度的量子噪声使低剂量CT重建图像质量产生退化的问题,提出一种基于分区域处理的联合先验低剂量CT统计迭代重建算法.对重建过程中的图像进行区域划分,对图像进行中值滤波并计算滤波图像的梯度,根据梯度划分出图像的边缘区域和平坦区域,分别利用全变分正则化(TV)和高斯马尔可夫随机场(MRF)正则化对不同的区域进行惩罚,将这两种正则项作为联合先验应用到惩罚加权最小二乘重建算法中,使用超松弛迭代算法(SOR)对目标函数进行求解.仿真结果表明,该算法去噪能力强,能有效保护重建图像的边缘细节信息.
为在全比较(ATAC)问题的分布式计算中达到较高的性能,提出一种基于任务驱动启发式的数据分发策略,充分考虑分布式环境中的存储使用、数据本地性和负载平衡.提出两个分发数据的启发式规则;根据相关约束条件和任务需求,所有的数据项均可在本地进行处理,使对于所有计算任务均具备良好的数据本地性.实验结果表明,对于64个节点的集群,所提策略实现了80% 的存储节约量和100% 的数据本地性,获得了理想化线性加速的89%.所提策略在ATAC问题的分布式计算中达到了较高性能.
针对YOLOv3这一目标检测通用方法在人脸检测任务中实时性低,容易漏检且易受环境影响召回率不高的问题,提出一种基于改进YOLOv3的轻量化网络方法.使用MobileNet网络替代YOLOv3中的特征提取网络,大幅度降低参数和计算量;增加SPP结构,尺度不变的同时降低训练中的过拟合;将Self-attention机制与YOLOv3中的FPN机制相融合,提高人脸检测率与召回率;使用DIoU作为边界框回归损失函数,加速模型收敛.实验结果表明,相较原算法,在公开人脸数据集WIDER FACE上mAP提高了9.0个
为解决自动化仪表检测工作中的作业车间调度问题以提高其工作效率,提出一种基于生命力选择的精英鲸鱼优化算法.利用生命力选择方法替换表现较差的个体,克服鲸鱼优化算法在调节搜索范围方面的不足,避免种群陷入局部最优,加快种群向全局最优解收敛的速度.结合标准实例和北京东方计量测试研究所的自动化仪表检测实例,对算法进行仿真分析,验证了精英鲸鱼优化算法在求解作业车间调度问题的有效性和稳定性,其可以满足自动化仪表检测工作中的日常检测任务调度需求.
针对半直接法SLAM方案的回环闭合问题,提出融合全局描述子和半直接法的双目SLAM方案.全局描述子计算模型结合主成分分析法(PCA)和K近邻方法构建关键帧的全局描述子管理模块;在位姿跟踪模块中使用最小化光度误差的半直接法;结合关键帧全局描述子和半直接法完成闭环检测与全局位姿优化.在公开数据集KITTI和Euroc上进行实验,与ORB-SLAM2、OpenVSLAM进行对比,对比结果表明,该方法在大部分有回环的序列中有更小的绝对轨迹误差,在保证有相似定位精度的同时,提高了算法的跟踪帧率.
随着Web服务数量的迅速增长,服务过载的问题逐步显现.为了解决服务过载的问题,基于服务质量(Quality of Service,QoS)感知的服务推荐成为了服务计算领域的研究热点.从起初的基于协同过滤算法到目前基于深度学习的服务推荐算法,这些算法从各个角度提升着服务推荐的精度.文章以算法的改进过程为主线,对主要的服务推荐算法及其存在的弊端进行了分析与总结,并对未来服务推荐算法的发展进行了展望.
光学字符识别(OCR)时,输出的文本行顺序需与实际的顺序相符.文章在字符Blob分析的基础上,对两个字符Blob外接矩形的相对位置关系进行划分,确定了各位置关系下同一文本行的判断方法,据此对排序后的字符Blob进行文本行初次生成和文本行二次合并,实现了任意方向文本行的生成.实际测试结果验证了所述方法生成任意方向文本行的有效性.