基于卷积神经网络的issue分类研究

来源 :南京邮电大学 | 被引量 : 1次 | 上传用户:liuhu8207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
issue追踪系统作为Github的重要组成部分,越来越多的用户和开发者使用它提交问题报告。这些问题报告可以是项目中存在的缺陷,也可以是期待的新功能等,简称为issue。通过提交issue,一方面可以让开发团队更好地了解用户的需求,另一方面也能促进软件项目的迭代和完善。然而在一个项目中通常有数百个issue,开发人员逐条审阅和处理需要消耗大量的时间和精力。Github提供了标签机制来为加快issue的处理过程,标签可以让开发人员及时了解issue的类型信息,确定处理的优先级顺序,但是标签的使用在Github上依然很少,很大的原因就是标签的分配依赖人工。因此,本文着眼于自动化issue分类研究,为每个issue贴上标签,帮助开发人员提高issue处理效率。本论文的主要工作如下:(1)提出一种基于词向量和主题向量的特征表示方法。issue数据集由issue的标题和描述信息组成,word2vec词向量模型可以把每个单词向量化表示,但这样的表示形式缺乏整体语义上的考量,本文在此基础上加入LDA主题模型,将词向量和issue的主题向量组合起来作为新的输入向量,特征表示更为充分,兼顾了词粒度和issue文本粒度。(2)提出一种基于卷积神经网络的issue分类方法。注意力机制的引入让关键的特征获得更大的注意力权重,卷积神经网络的卷积层设计了不同尺寸的卷积核来提取深层语义特征,池化层采用最大池化方法进行降维和压缩,全连接层连接特征并最终通过softmax分类得到类别信息。实验结果表明,本文模型在准确率、召回率和F-score上分别达到了81.3%、80.6%和80.3%,能够从issue文本中提取到重要的特征信息实现分类,而且本文还进行了一项人工实验来说明生成的分类标签能够有效缩短研究人员审阅issue的时间。
其他文献
近年来,无线充电技术已经被广泛应用于无线传感器网络,发展出无线可充电传感器网络。然而,在大规模多任务传感器网络中,无线充电技术还没有得到很好的应用。对于大规模多任务无线传感器网络,传统的数据收集模式在数据传输上的能量效率较低,这是因为大规模多任务场景可能会导致更高的数据包冲突概率,尤其是在恶劣环境下。移动数据收集是延长网络寿命的有效方式。然而,由于移动收集器的电池容量有限,移动收集器可能会面临电量
学位
光学频率梳(简称OFC)在频域中表现为一系列等间隔且具有稳定相位关系的离散频率分量。OFC作为连接微波和光波的枢纽,其被广泛应用于光通信系统、光学任意波形产生和精密光学测量等领域。在现有的OFC产生方法中,外调制器法易实现,产生的OFC具有频谱稳定和频率间隔可调谐的优势。电吸收调制器(EAM)具有易集成、调制电压低和调制速率高的优势;相对于传统锂铌酸锂电光调制器,EAM的成本更低。本文围绕基于单个
学位
近年来,云计算技术不断地发展成熟,在越来越多的企业与个人中普及。用户将数据资源外包至云服务器存储,在节约计算和存储成本的同时享受了云计算带来的便利性。然而,云计算服务器集中大量数据的同时也伴随着种种风险,不仅云服务器容易遭受外部攻击,云服务器提供商自身的恶意行为有时也可能会导致数据遭受破坏或泄露。为了防止私密数据泄露带来的风险,在外包给云服务器前将数据进行加密是一个可行的方法,在此背景下,可搜索加
学位
随着现代社会结构和社会治安状况的日趋复杂,安防日益显现出其在社会稳定方面的作用。市场上以安防为目的的监控系统大多是基于红外技术,但红外线受户外环境影响很大,且容易被觉察,无法保证监控的隐蔽性。因此,具有探测灵敏度高、受环境影响小且隐蔽性高的安防系统就有着很高的研究价值。本文主要针对安防系统的应用环境,以毫米波雷达传感器为核心,设计完成了一款基于毫米波传感器的安防系统。该系统以点云为呈现方式来显示人
学位
随着社会变迁,我国经济、社会结构的变化,大学生的价值观念、思维方式等发生了显著变化。近年来,在面对学习、人际交往、就业等多方压力和挑战时,大学生群体出现了成就动机总体水平下降、目标不明确等现象,而家庭作为个体成长和适应社会生活的起点,家庭因素潜移默化的影响着大学生的内在动机和目标设定。因此,分析家庭资本对大学生成就动机、目标定向的影响,有针对性的采取措施,提高大学生成就动机、目标水平具有一定的理论
学位
在时代智能化的洪流中,深度学习的应用促进了计算机视觉领域中目标跟踪的快速进步,现有的目标跟踪算法在速度与精度方面都表现出喜人的态势,使其在面对复杂场景环境时,大多数情况能保持良好的性能。近年来更是涌现出许多优秀的孪生网络,他们同时取得了鲁棒性与实时性的平衡。尽管目标跟踪已在各大领域获得突破性成果,但现有的算法仍然面临着两大挑战:目标对象自身的不确定性,外部环境的多变性。本文主要的研究贡献为提出基于
学位
非线性多智能体系统广泛应用于民生和国防领域,如飞行器、机械手和智能电网等。传统非线性多智能体系统的一致控制技术通常采用复杂的控制器结构。对于处理非线性系统中未知动态的神经网络技术,其权值更新律的设计依赖于确定-等价原则,仅有有限的动态调节性能。同时,多智能体系统运行时不可避免的受到执行器故障和有限通信资源的影响。浸入与不变(immersion and invariance,I&I)理论依赖于系统浸
学位
广义测量(Positive Operator-valued Measurements,POVM)在量子信息领域发挥着举足轻重的作用。本文主要针对POVM在测量设备无关量子随机数发生器(Measurement-deviceindependent Quantum Random Number Generator,MDI-QRNG)与量子随机存取码(Quantum Random Access Code,Q
学位
经济调度作为智能电网系统的运行和控制中的关键问题,在能量管理中显得尤为重要,合理有效的完成调度任务对提高电网经济效益有着极大的影响。分布式经济调度是一种新型发电调度策略,能较为灵活、高效的调节发电状态,提升能源利用效率。此外,收敛速率作为评价系统性能的重要指标,直接影响着系统运行质量。常规的收敛时间有渐近时间收敛,有限时间收敛,以及固定时间收敛。渐近时间策略的收敛时间为无穷大,有限时间策略的收敛时
学位
近年来,无人机凭借其灵活性高、实时性强、监测范围大的优势,被广泛应用于农林植保、电力巡检、交通巡查等行业。随着其应用场景的不断扩展,行业前景也越发广阔。城市安防也是无人机应用落地的重要领域之一,无论是春运、晚会等大型活动安保,还是管控防疫等日常巡查,无人机均能大大缓解治安管控压力。然而,现阶段无人机在行业应用中只起到视频采集的作用,对于图像内容的判断还需要依靠大量人力和时间。随着人工智能的飞速发展
学位