基于注意力机制的Graph2Seq代码摘要模型研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:marker1900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码摘要是代码功能的自然语言描述,高质量的摘要能够有效帮助代码的理解和软件的维护工作,代码摘要一直是软件开发中重要的组成部分。然而,在软件工程中,代码缺少摘要导致代码维护工作困难是困扰工业界已久的问题,因此研究如何通过代码自动生成对应的代码摘要具有非常大的研究意义和应用价值。在代码摘要的研究中,我们的主要工作是尝试解决两个问题:问题1,代码是一种强结构化的语言,这和弱结构化的自然语言十分不同,如何充分利用代码的结构化语义信息是代码摘要任务的关键问题;问题2,代码中的变量名,方法名等单词是一种开放性的单词,常规的自然语言处理方法(如使用<UNK>代替低频词)会导致大量的词典外单词的问题。在本论文中,我们对现阶段有关自然语言处理和代码摘要的相关工作进行研究,提出了基于注意力机制的Graph2Seq代码摘要模型。论文的主要贡献点在于,1.为了克服现有的关于基于抽象语法树遍历的代码摘要模型存在的问题,本文提出了一种基于注意力机制的Tree2Seq代码摘要改进模型。2.在此基础上,本文参考当前关于代码和图深度学习的相关研究,在代码的抽象语法树上增加数据流等语义信息,将代码进一步拓展成代码图(Code Graph)的结构,进而提出了基于注意力机制的Graph2Seq代码摘要模型。3.针对于代码中变量名等开放性单词,我们在代码摘要任务中对这类单词使用字节对编码算法将其拆分成子单词,并将子单词添加到代码图中,解决了开放性词表问题。
其他文献
人们生活在一个丰富多彩的信息世界中,每时每刻都离不开信息的获取与交流。由于视觉信息丰富、准确、及时、可靠,自古以来就是人类获取信息最主要的手段。显示技术是将浩如烟
随着信用经济的发展,所有权保留制度逐渐成为现代市场经济活动中广为应用的一种重要的法律制度。作为现代商业活动中一项重要的交易方式,所有权保留因其突出的信用保障功能,
安全工作历来是煤矿的天字号大事,倡导安全文化要以安全教育为主。实践证明;无论何种安全生产事故的发生,都不同程度地暴露出安全教育培训的问题。安全教育培训是提高职工安
针对传统物理习题教学的不足,提出原始物理问题可作为习题教学的有效补充,并介绍了在物理教学中引入原始物理问题的教学实例。
安顺屯堡聚落起源于明朝初年,是明朝军队平定云南元残余势力后,实行屯田制度的产物。在六百余年的封闭发展过程中,其仍然保留着较多源于明代的江淮文化,并在独特的地域环境影响下
新媒体已经渐渐融入到主流媒体的范畴,传媒业正进入到新媒体时代。在这个时代主持人不仅要有传统的电视媒体的主持人形象定位,还应提升互动性,主持人向观众代言人方向转化等
过采样∑⊿ADC采用过采样以及∑⊿调制技术来实现模数转换,非常适合用来实现数字通信系统和信号处理系统中的模拟接口部件。这类模数转换器可充分利用现代VLSI的高速、高集成
思考是心理内在的运作,很难用一种测量工具来界定,因此难以通过观察来判断学生是否进入主动思考的状态。以"认识>、<和="的教学为例,教师可以从有目标的观察、有意义的建构、
毛泽东在中国革命的历史转折关头闯出了一条不同于俄国十月革命的道路,创造性地开辟了农村包围城市、最后夺取全国政权这一独特的革命道路。这不仅说明了毛泽东对中国国情特
牛羊养殖业在我国畜牧业中占据着重要的比例,且随着社会经济的发展,人们对牛羊产品的需求不断增加,牛羊的规模化养殖也在不断发展。但当前由于多种因素的影响,牛羊规模化养殖