【摘 要】
:
在软件开发过程中,性能良好的代码注释工具能够提高开发效率并降低维护成本。部分研究者将代码注释自动生成看作将源代码翻译成自然语言注释的翻译任务,但仅考虑源代码的序列
【机 构】
:
复旦大学计算机科学技术学院上海市数据科学重点实验室
【基金项目】
:
国家自然科学基金(U1636207,91546105,20873999),上海市科学技术委员会科研计划项目(16JC1400801,17511105502)
论文部分内容阅读
在软件开发过程中,性能良好的代码注释工具能够提高开发效率并降低维护成本。部分研究者将代码注释自动生成看作将源代码翻译成自然语言注释的翻译任务,但仅考虑源代码的序列信息而忽略了代码内部的结构特性。为此,在常见端到端翻译模型的基础上,利用代码抽象语法树将源代码的结构信息嵌入到编码器解码器翻译模型中,提出一种基于结构感知的双编码器解码器模型,该模型综合考虑源代码的序列信息与代码内部的结构特性。在真实数据集上的实验结果表明,相比PBMT、Seq2seq模型,该模型的BLEU得分较高,且生成的注释更准确和易读。
其他文献
当今世界恐怖袭击事件频繁发生,通过对嫌疑人进行预测分析,有利于尽早发现新生或者隐藏的恐怖分子并对其进行针对性打击,以减少人员和财产损失。为此,使用机器学习方法,提取
“校长”这个词,对一所学校来说,是一个有着举足轻重意义的称谓。振兴教育,希望在教师,关键是校长。作为学校的管理者和指导者,校长在提高学校的整体办学水平中处于核心地位。因此
为铁道部对卫生资源的统筹规划,合理配置,理顺关系,建立新的卫生管理体制提供科学依据,抽样调查4个铁路地区的卫生资源,卫生机构配置及医院工作效率等,结果显示:铁路卫生资源短缺与浪
通过调查390例吸毒者,分析吸毒人群的社会特征,高复吸率,高犯罪率、低文化水平及无业人员构成的高比例,探讨如何运用社会学的观点方法来加强禁毒。
南方某铁矿选别过程中的湿抛尾矿含有可回收的石榴子石,通过对该尾矿中的石榴子石小型试验、扩大连选以及半工业性试验,最终可以得到稳定合格的石榴子石产品。石榴子石原矿品
目前我国高的防治工作状况令人担忧,高血压防治面临的问题很多,要解决这些问题,首先要转变医学目的,制定以预防为主的高血压防治策略,政府和卫生部门应制定并实施适合我国的高健康
局部投影降噪算法已广泛应用于非线性时间序列的分析中,但受邻域选取的影响较大。提出了一种按照自适应方式选取邻域大小的局部投影降噪算法。首先用时间延迟方法将一维时间序
一、企业经营者管理能力与企业绩效的关系西方新古典经济学为论证市场机制对资源配置的有效性,把企业简化为市场运行的基本细胞,其惟一的特征就是在特定的市场需求环境下追求
从税法的角度看,企业所得税是指国家对企业生产、经营所得和其他所得依法征收的一种税,是国家参与企业利润分配的重要手段.关于企业所得税的性质,有"收益分配观"和"费用观"两
不知她从哪里来也不知道她到哪里去犹如一条绿丝带轻轻地穿过田野静静地绕过家乡