基于多头自注意力机制的深度缺陷分派模型

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:ecnuzk2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,缺陷跟踪系统通过缺陷报告实现缺陷与修复者的匹配.然而,以往的缺陷分派模型过于依赖缺陷报告的文本质量,引入自然语言中大量的冗余信息,并忽略了缺陷报告的元字段作为标签属性时存在于修复者之间的社区关系,使得模型结果表现较差.针对以上问题,本文提出一种基于多头自注意力机制的深度缺陷分派模型MSDBT(Multi-head Self-attention Deep Bug Triage).对缺陷报告的文本内容以及根据元字段生成的修复者序列进行向量化;通过多头自注意力机制在内部的输入元素之间进行并行注意力计算.在4个开源软件项目上的实验结果表明,MSDBT在召回率指标上较之前模型具有明显的优势.
其他文献
针对自动化码头船舶配载效率较低的问题,为了提高设备资源利用率,提出了一种基于船舶配载特点设计的固定集搜索(FSS)算法.首先,在考虑一般船舶配载原则的基础上,以桥吊作业计划为依据,引入箱区作业均衡因素,将最小化箱区翻箱量、总装船时间以及尽可能的箱区作业均衡作为目标,建立自动化码头船舶配载混合整数规划模型;其次,通过固定较优解中多次出现的元素来寻求最优解.实验结果表明,不同规模的实例下,FSS算法相较于Cplex,翻箱量和不均衡箱数分别平均减少了22.3%和11.7%,目标函数值平均优化了6.5%;所提固定
针对目前出租车交接班行为识别不够精准的问题,提出了一种基于轨迹数据挖掘的出租车交接班行为精准识别的方法.首先,分析出租车停留状态的数据特性后,提出了一种出租车非运营状态停留点检测方法;然后,对停留点进行聚类,从而得出了潜在的出租车交接班地点;最后,基于出租车交接班事件的判断指标与出租车交接班时间的核密度估计,有效地识别出出租车交接班地点和时间.以福州市4416辆出租车的轨迹数据为实验样本,共识别出了5639个交接班地点,这些交接班地点在市民主要工作区域、交通枢纽、商圈以及风景名胜.而识别出的交接班时间主要
针对航天飞机雷达地形测绘任务(SRTM)中存在由大量尖峰、斑点和多向条纹误差形成的混合噪声对后续应用产生严重干扰的问题,提出了一种基于总变分约束的低秩组稀疏(LRGS_TV)算法.首先,利用数据在局部范围低秩方向上的唯一性来正则化全局多方向条带误差结构,同时使用变分思想进行单向约束;其次,使用加权核范数的非局部自相似性来消除随机噪声,并结合总变分(TV)正则对数据梯度进行约束,以减小局部范围变化差值;最后,使用交替方向乘子优化对低秩组稀疏模型进行求解,从而保证了模型的收敛性.把所提算法与TV、单方向总变分
针对传统的超声血流向量成像(VFM)技术需要专有软件来获取原始多普勒和散斑跟踪数据的限制,提出一种联合深度学习的通用VFM方法.首先,使用速度标尺获取彩色多普勒超声心动图提供的沿声束方向的速度作为径向速度分量;然后,使用U-Net模型自动识别左心室壁轮廓,通过重新训练的PWC-Net模型计算左心室壁速度作为连续性方程的边界条件,并通过求解连续性方程获取各血液质点垂直于声束方向的速度分量(即切向速度分量);最后,合成心脏流场速度矢量图,并实现心脏流场流线图的可视化.实验结果表明,所提方法得到的心脏流场速度矢
脉象识别是中医诊断的重要手段之一.长期以来,依据个人经验进行的脉诊制约了中医的推广与发展.因此,利用传感设备进行脉象识别的研究正在逐步展开.针对神经网络识别脉象的相关研究中,存在需要大量训练数据集,以及存在处理“黑箱”和时间花销较大等问题,在强化学习的框架下,提出了一种采用马尔可夫决策和蒙特卡罗搜索的脉象图分析法.首先依据中医理论对特定的脉象进行路径分类,然后在此基础上为不同的路径选择代表性特征,最终通过对代表性特征的阈值对比完成对脉象的识别.实验结果表明,所提方法可缩减训练时间和所需资源,并可保留完整的
为了提高文本匹配的准确率,针对BERT(Bidirectional Encoder Representations from Transformers)模型和MatchPyra-mid模型在文本匹配中存在的局限性,提出一种基于BERT与图像自注意力机制的文本匹配模型.首先,利用BERT模型将一对文本编码为单词级别的特征向量.其次,根据词向量构建2段文本之间的词与词相似性的匹配矩阵,并将其视为单通道的图像表示.然后,通过图像的自注意力机制生成匹配矩阵的自注意力特征矩阵.最后,将匹配矩阵与自注意力特征矩阵连接
肾移植手术在当今的应用越来越广泛,对于排斥反应的预测变得更加重要.针对排斥反应数据特点中存在的数据的维度高、数据时序性、样本不均衡等问题,将循环神经网络应用于肾移植排斥反应的预测,本文提出一种结合SMOTE(Synthetic Minority Over-sampling Technique)以及RNN(Recurrent Neural Network)的算法.该方法先处理数据,降低正负样本的不平衡度,且解决样本量不足的问题,再根据RNN的学习过程进行关键参数调整、优化.经过实验发现,该方法可以有效提升正
社交媒体的兴起促进了新闻行业的发展,使虚假新闻的传播也变得更为便利,然而多样化的新闻表现形式带来了很多负面影响,比如新闻内容夸大事实、恶意篡改新闻文本或图像内容、构造虚假新闻事实引起社会舆论,这促使了虚假新闻检测工作成为新闻领域新的挑战.为了应对虚假新闻检测工作的研究,将新闻文本与图像信息结合起来,通过多模双线性池化方法,改变传统特征融合方法,构建出基于新特征融合方法的虚假新闻检测模型,并且采用虚假新闻检测领域标准数据集验证模型的性能,实验结果表明,文本与图像的融合特征表现在虚假新闻检测领域不可替代,且所
对于许多在线电商,预测用户购买商品的可能性至关重要.由于用户与商品的交互通常是高维且稀疏的,所以深度因子分解机算法(DeepFM)将因子分解机算法(FM)与深度神经网络(DNN)结合在一起,用FM处理低阶特征组合,用DNN处理高阶特征组合,通过并行的方式组合这2种方法,很好地解决了高维稀疏的问题.但是,它忽略了用户购买商品的先后性问题,也就是时间上下文信息.针对这一缺陷,本文提出一种融合注意力(Attention)与DeepFM的时间上下文推荐模型(DeepAFM),更好地利用用户与商品交互的时间上下文信
工作流的柔性问题已成为工作流系统适应业务需求不断变化的重要问题.工作流系统的应用分为建模阶段和运行阶段.现有工作流系统的静态路径已无法适应当前企业业务过程路径多变的需求,本文通过研究相关的理论方法与技术方案,分析运行阶段的路径变更问题,来提高工作流的柔性特性.本文对现有工作流路径回退算法进行改进,使其支持并行多步回退,解决工作流系统的动态路径问题,此外,还对当前大量应用的审批会签功能进行分析,提出一种运行中动态增加并行分支的解决方案,进一步提升工作流的路径柔性.最后结合实例进行验证,测试结果表明,系统能够