【摘 要】
:
缺陷分派是软件缺陷修复工作中较为重要的一个环节,传统的缺陷分派是由人工来完成,但随着软件项目规模不断扩大、复杂性不断提高,软件的缺陷与日俱增,人工进行缺陷分派会消耗较多的人力资源和时间资源。因此,在软件维护领域,研究软件缺陷自动分派方法很有必要。目前研究者已经提出许多缺陷分派技术,如信息检索、机器学习,但大多研究工作仅使用缺陷文本来进行缺陷自动分派研究,当开发人员之间具有相似特征时分派效果较差。因
论文部分内容阅读
缺陷分派是软件缺陷修复工作中较为重要的一个环节,传统的缺陷分派是由人工来完成,但随着软件项目规模不断扩大、复杂性不断提高,软件的缺陷与日俱增,人工进行缺陷分派会消耗较多的人力资源和时间资源。因此,在软件维护领域,研究软件缺陷自动分派方法很有必要。目前研究者已经提出许多缺陷分派技术,如信息检索、机器学习,但大多研究工作仅使用缺陷文本来进行缺陷自动分派研究,当开发人员之间具有相似特征时分派效果较差。因此在缺陷文本基础上综合利用缺陷的附加数据(如缺陷修复记录、评论列表),提取开发人员活跃度信息,区分具有相似特征的开发人员。主要研究内容如下:1.在分析了不同方法在缺陷分派领域的研究现状基础上,重点开展了结合卷积神经网络(Convolutional Neural Network,CNN)与长短期记忆网络(Long ShortTerm Memory,LSTM)的缺陷分派方法。将CNN与LSTM进行结合,使用卷积神经网络获取缺陷文本局部信息,再输入LSTM中获取缺陷上下文信息,能够更加有效地分类。实验采用Eclipse与Mozilla项目的缺陷作为实验数据,详细阐述了数据处理与训练过程,最后通过实验结果进一步分析了该方法在缺陷分派研究中的有效性。2.构建一种融合开发人员活跃度的缺陷分派方法。该方法通过整合缺陷附件中的缺陷修复记录和缺陷评论列表,将缺陷的修复记录和评论列表中的开发人员按时间进行排序,提取开发人员人名序列,构建开发人员活跃度。使用LSTM结合注意力机制提取开发人员活跃度特征,将得到的开发人员活跃度与缺陷文本特征进行连接,共同训练分类器,得到一组缺陷修复人员推荐列表。此外,在开发人员向量表示中引入社交网络中的节点嵌入方法,使得向量更加稠密,且能反映开发人员间的联系。实验结果显示,在缺陷分派任务中,将缺陷文本与开发人员活跃度融合可以有效提升缺陷分派效果。
其他文献
安全稳定的校园环境是保证师生学习、工作与生活的基础条件。校园安全管理研究已经得到广泛关注,但现行高校校园安全管理模式仍存在管理效率低下和部门协调联动性不足等问题。鉴于此,将网格化管理模式引入到高校校园安全管理中。文章通过梳理高校日常管理机构的设置以及职责划分,结合高校管理模式和运行机制,构建了三级网格化高校校园安全管理队伍、四阶段网格化高校校园安全管理流程、大数据网格化高校校园安全管理信息平台。基
随着人工智能的发展和网络带宽的增加,大数据的深度学习为信息技术的外延应用提供了更多的契机,可以通过高性能计算获得新的运用,然而海量的数据整理分类和制作报表也成为一项庞大而复杂的工作。通过对现有的报表工具的分析,发现其存在使用繁琐、加载速度慢等一系列问题。本文使用了组件方式进行系统开发,就前端组件间接数据获取方式和渲染卡顿问题进行了综合分析,设计并实现了直接获取数据的组件模型,同时结合前端缓存技术,
随着物联网、信息处理技术及移动通信技术的快速发展,物联网设备工作所需的数据量不断增加,在海量数据中设备无法有效获取对自身有用的信息。当设备正常工作消息请求过多时会出现网络拥塞,消息的主动推送能够有效解决这一问题。物联网设备在朝着智能移动终端方向发展时,其业务特征通常具有计算密集型和时延敏感型的特点。移动边缘计算(Mobile Edge Computing,MEC)技术,弥补了智能终端设备在计算、存
在物联网高速发展的时代,电子投票已经成为用户表达意见的重要工具,并且早已应用于社会生活的各个方面。传统的电子投票主要集中于可信服务器或第三方机构,存在中心化程度高的风险。继而易造成重放攻击、选票篡改或者隐私泄露等威胁,公平性缺陷和隐私泄露严重影响了投票安全性和结果准确性。由于不同的投票机制会涉及不同的偏好数据类型,并且所需的安全属性不同,因此如何基于投票机制的数据特性设计合适的投票方案是值得探索的
数学建模是连接现实世界和数学世界的关键桥梁,是把数学工具引入到实际问题的重要步骤。培养学生的数学建模能力是社会发展的实际需要,并且高中数学知识自身带有建模的属性,由此可见,高中数学建模教学十分必要。高中数学建模教学的教学策略包括:充分应用往年的数学建模竞赛试题;教会学生熟悉数学建模的流程;培养学生数学建模能力。
随着物联网技术的高速发展和广泛应用,暴露在网络中的物联网设备数量日益增加。物联网网络设备中存在着大量的隐私信息,这些信息一旦被恶意利用,将会对用户安全乃至网络安全造成严重的威胁。保障设备信息安全是保障物联网安全的重中之重,而对设备的准确识别是保障设备信息安全的前提条件。本文依托于国家重点研发计划“物联网终端评测平台关键技术研究及标准化”,以项目中的终端设备自动测试系统为基础,重点研究了接入网络的物
数据不平衡问题是机器学习领域的一个重要研究课题,指的是数据集类别样本数量不近似相等。数据不平衡处理技术广泛应用于医疗诊断、信用评估、生物信息等领域。数据不平衡问题会造成机器学习模型对不同类别的训练失衡,为降低数据不平衡问题对机器学习分类模型训练的影响,近年很多学者对其进行了深入研究。但是,随着现实场景中更复杂的不平衡数据集出现,数据不平衡研究领域仍然存在着很多的困难与挑战。本研究重点论证了当前数据
近年来,用户经常在社交媒体上表达自己的观点,包括但不限于对产品,服务,组织及事件的态度。因此,对用户生成文本的情绪识别研究可以广泛应用于意见收集、舆论挖掘等各个领域。目前,虽然现有的文本情绪识别研究取得了一定的成果,但用户生成文本具有情绪表达方式多样、情绪信息稀疏的特点,使得现有方法无法准确识别用户生成文本的情绪。本文主要工作如下:(1)针对用户生成文本中的情绪表达存在中英文混合、颜文字、缩写、替
随着无线通信网络的快速发展,接入网络的终端设备以及网络的数据流量呈现指数式增长,使得无线频谱资源越来越紧缺。D2D通信技术的出现能够有效缓解频谱资源紧张的问题。D2D通信通常被部署在授权频段,以信道复用的方式实现频谱资源的最大化利用。然而,信道复用使得D2D通信之间以及蜂窝网络与D2D通信之间产生严重的同频干扰。因此,需要对这种干扰进行有效控制,尽可能地提高频谱利用率。本文主要研究采用先进的机器学