基于句法分析的代码摘要技术

来源 :计算机应用 | 被引量 : 5次 | 上传用户:k88ls06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对词袋模型忽略了词条之间语义关系和概念结构的问题,提出一种基于句法分析的代码摘要技术。首先,该技术利用词性标注识别出最有可能体现代码特性的关键词;然后,通过块分析修正在词性标注过程中可能引入的错误;其次,对标识出的关键词进行降噪,以减少文本噪声带来的不利影响;最后,从关键词中选取若干个权值最高的词以组成代码摘要。实验结果表明,与基于词频-逆文档频率(TF-IDF)和基于TF-IDF扩展的代码摘要技术对比,所提技术生成的代码摘要与参考答案的重叠率(overlap)至少分别提高了9%和6%,说明该技术
其他文献
"加快实现铁路信息化"是实现我国铁路跨跃式发展的重点之一,而作为铁路企业的党校,其教育的信息化建设,理应作为铁路企业信息化的有机组成部分,铁道部部长刘志军在铁道部党校
为主动适应全路直管站段体制改革的形势发展,从去年五月开始,我们先后就“10+1”现场安全管理技能(人本管理、刚性与柔性管理、关键管理、系统管理、精细化管理、零缺陷管理、标
针对已有无线移动自组织网络(MANET)测试方法存在模型简单、成本高、不易重复等问题,提出一种基于NS2的大规模MANET混合模拟测试方法(LHEN)。使用NS2的模拟功能,利用Tap代理完成虚拟分组与实际分组间的嵌套和解嵌,通过网络对象及NS2实时调度器实现虚拟环境和真实环境的通信;采用控制网络无线信号强度的方式模拟真实节点移动,完成对真实网络环境的构建。使用混合模拟和仿真两种方法分别建立大规模
针对克隆代码有害性预测中有害和无害数据分类不平衡的问题,提出一种基于随机下采样(RUS)的能够自动调整分类不平衡的K-Balance算法。首先对克隆代码提取静态特征和演化特征构建样本数据集;然后选取比例不同的分类不平衡新数据集;接着对已选取的新数据集进行有害性预测;最后,通过观察分类器的不同表现自动选择一个最适合的分类不平衡比例值。在7款C语言开源软件共170个版本上对克隆有害性预测模型的性能进行
本文介绍了贵州铝厂氧化铝厂烧结法脱硅乏汽系统的流程改造,有效利用了脱硅乏汽加热沉降洗涤工序用热水和种分母液,解决了脱硅缓冲槽飘碱难题,社会效益和经济效益显著。
针对传统多输入多输出(MIMO)支持向量机(SVM)没有考虑多个输出端之间依赖关系的问题,提出了一种新的基于主曲线的MIMO SVM算法。该算法基于所有输出端的模型参数位于一个流形上的假设,首先在现有的多维支持向量回归机(M-SVR)的基础上,构建一个流形正则化的优化目标,其中正则项为输出端模型参数到通过所有参数集合中间的主曲线的投影距离;其次,由于该优化目标为非凸,采用交替优化的方法,交替计算模
针对内容中心网络(CCN)中的缓存污染攻击问题,提出一种基于多样化存储的缓存污染防御机制。对不同业务内容采取差异化缓存从而减小网络受攻击面,将业务划分为三类并采用不同缓存策略:对隐私及实时性业务不予缓存;对流媒体业务以概率推送至网络边缘缓存;对其他文件类内容业务由上游到边缘逐步推送缓存。在不同节点分别配置不同的缓存污染攻击防御手段:对于边缘节点通过内容请求到达概率的变化对攻击进行检测;对于上游节点
铁路作为我国综合交通运输体系的骨干,在国民经济和社会发展中起着极其重要的作用.全面提高职工的职业道德素质,把客货运服务质量提升到一个新水平,既是铁路适应全面建设小康
<正> 读书如树木清代文学家法式善,写有一首《读书》诗::读书如树木,不可求骤长。植诸空山中,日来而月往。露叶既畅茂,烟打渐苍莽。” 读书如活水南宋哲学家、教育家朱熹《观
列宁晚年口授的五篇文章中,对文化建设问题展开了集中的阐述。本文结合江泽民同志“三个代表”的重要思想,对列宁关于文化建设是社会主义建设的一项划时代的任务、和平的文化组