【摘 要】
:
随着互联网技术的发展和开源社区的兴起,开源代码的数量急剧增加,从开源社区中发掘出有用信息需要耗费大量的时间和精力。自动摘要技术广泛地应用于文本主要内容的获取,但针对代码的相关技术研究较少。本文使用深度学习思想解决这一问题,利用卷积神经网络(Convolutional Neural Networks,CNN)模型提取代码特征,从而缓解信息爆炸带给人们的时间精力问题。本文对代码自动摘要问题进行了分析,
论文部分内容阅读
随着互联网技术的发展和开源社区的兴起,开源代码的数量急剧增加,从开源社区中发掘出有用信息需要耗费大量的时间和精力。自动摘要技术广泛地应用于文本主要内容的获取,但针对代码的相关技术研究较少。本文使用深度学习思想解决这一问题,利用卷积神经网络(Convolutional Neural Networks,CNN)模型提取代码特征,从而缓解信息爆炸带给人们的时间精力问题。本文对代码自动摘要问题进行了分析,将问题拆分为代码特征提取和摘要自动生成两个子问题,结合深度学习中端到端的模型设计思想,在设计模型时综合考虑这两个问题,提出了一种基于深度学习的代码自动摘要模型。本文首先对代码特征提取问题进行了研究,本文使用门控卷积神经网络提取代码的文本特征,在门控卷积神经网络中,对输入元素添加位置信息以获取序列中词的位置,引入门控线性单元使模型可以选择对预测有益的词或者特征,利用残差连接解决梯度弥散问题。本文使用抽象语法树卷积神经网络提取代码的结构特征,在抽象语法树卷积神经网络中,使用Tree-Based CNN和Pre-Order CNN相结合的方式,获取语法树中节点的完整信息。本文其次对摘要自动生成问题进行了研究,使用长短期记忆网络(Long Short Term Memory Network,LSTM)学习中的短序列信息。在模型中引入了注意力机制,有效解决了编码器将源句子中的所有信息编码成固定长度矢量的负担问题,从而保留了更多的编码器特征以便于解码器使用。为了验证代码自动摘要模型的可靠性,本文与统计机器翻译模型、基于深度学习的多文档自动摘要模型以及序列到序列模型(Sequence to Sequence,Seq2Seq)和基于卷积神经网络的序列到序列模型(Convolution Sequence to Sequence,Convolution Seq2Seq)两个经典的机器翻译模型进行对比,证明了代码自动摘要模型是有效可靠的。
其他文献
市场需求的持续快速变化,一方面需要产品具有多样性,另一方面又使产品变得复杂,需要经过多道工序共同加工才能完成。本文以多产品关联多工序制造系统为对象,综合考虑产品的多样性以及加工工序的关联性,构建了多产品关联多工序的马尔科夫质量分析模型,并对相关质量特性进行了研究分析包括单调性分析、敏感性分析、生产顺序分析以及质量瓶颈分析。本文主要研究工作如下:(1)建立单产品关联两工序制造系统马尔科夫质量模型。在
减价作为实践中频繁使用的一种违约救济方式,我国《合同法》的相关规定显得较为单薄,为此2012年最高人民法院发布的《关于审理买卖合同纠纷案件适用法律问题的解释》对减价金
随着航空航天技术、精密仪器制造技术、医疗技术及半导体工业等众多领域的发展,对位移传感器灵敏度和稳定性的要求越来越高。电涡流位移传感器以其非接触、便携性、易操作、
ZnO纳米材料有着多种优良的物理性能,被广泛应用于传感器领域。但是,本征的半导体ZnO气体传感器,在灵敏度和选择性等方面仍然不尽如人意,添加贵金属催化剂可以显著提升传感器
化肥农药等无机投入在快速提升农业产出的同时,导致了耕地面源污染问题进一步凸显。不仅影响到农业的持续发展,也对贫困地区实现脱贫和可持续发展带来隐患。耕地面源污染已经
家族信托作为我国财富管理市场上新兴的一项业务,高净值人群对此颇为关注。然而,我国信托业目前以自益信托、资金信托为主导,家族信托并非是一个法律概念,由于法律对什么是“
无线感知技术是通过采集,处理与分析泛在的无线信号,并从中挖掘出其传播环境中诸如身份、手势、动作等目标信息的一种新兴技术。得益于无线信号的物理特性,无线感知技术可以
图像分割是依据一定的相似性准则将图像分为几个有意义的、互不重叠的区域的一种图像处理办法。在同一区域内,图像的特征(如灰度、纹理、色彩)是相似的,而在不同的区域内,图像的特征则明显有所不同。阈值法因其简单实用的优点成为最常用的图像分割方法,但是它只利用了图像的灰度信息,在某些情况不能得到理想的分割结果。研究表明,同时考虑图像的灰度信息和像素间的空间相关性有助于改善分割结果,将像素之间的空间相关性引入
在计算密集型批处理任务中,有一种任务运行时间很长、且要占用大量CPU和内存资源,例如基因测序任务。对于该种类型的任务调度策略来讲,任务完成时间是衡量调度策略好坏的一个重要指标。在任务大小和数量一定时,任务完成时间越小,系统服务质量越高。设计了一种面向计算密集型批处理任务的调度系统。该系统采用一种混合改进遗传模拟退火算法(Improved Genetic Simulated Annealing,IG
主客体化学是超分子化学领域的核心内容,分子自组装是超分子化学的最终目标,现在超分子化学在这两方面的基础上均取得了快速的发展。设计和开发具有大尺寸空腔和特定功能性大