NTR:一种基于代码嵌入的node包标签推荐方法

来源 :吉林大学 | 被引量 : 0次 | 上传用户:syx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为Node.js默认的Java Script语言开源软件包管理系统,截至2022年,NPM(Node Package Manager)中存在约160万个Node.js软件包。开发人员可以基于NPM完成Node.js软件包的安装、卸载、更新、查看、搜索、发布等操作。其中,NPM通过匹配搜索关键词与包标签的机制帮助开发人员查找想要使用的Node.js包,然而这种匹配机制无法覆盖到没有标签或者被标记得不够完善的开源Node.js包,影响搜索结果的可用性。现有的开源软件包标签推荐方法大多采用文本分析技术基于Readme文档生成标签,但Node.js包的Readme文档中往往缺乏详尽的产品描述信息,且无关的噪声信息繁多,使得如何有效地为Node.js包添加标签成为了当下的研究难点和挑战。为此,本文从Node.js软件包的源代码出发,提出了一种基于代码嵌入的Node.js包标签推荐方法NTR,包含代码嵌入和多标签分类两个模块。1)代码嵌入模块旨在学习Node.js软件包的代码嵌入向量,主要是要借助函数调用关系来表示源码的语义含义。首先NTR借助Madge和ECMAScript开发工具解析Node.js软件包的Java Script源代码,其次,制定7条语法规则定位代码抽象语法树中的函数节点来辅助Node.js软件包函数调用图的构建。然后利用文本卷积神经网络作为嵌入模型并结合词嵌入技术将Node.js软件包的函数调用序列转换为数值向量。2)多标签分类模块用于为Node.js软件包推荐标签。在该模块下,NTR首先使用K-means聚类算法对软件包的标签进行聚类,随后搭建一个多层感知器的神经网络模型进行多标签分类,该模型以Node.js包向量为输入,并在输出层进行标签集群的概率预测,NTR选择概率值靠前的k个标签集群作为候选的标签推荐结果。在实验设计部分,本文选择En Tag Rec和tag CNN标签推荐方法作为对比方法,这两种方法均利用软件包的描述文本进行标签推荐。实验指标是推荐k个标签集群时模型的P值,R值和F值。实验结果证明在Node.js软件包的标签推荐场景下,基于代码嵌入的标签推荐方法NTR表现优于基于描述文本的标签推荐方法En Tag Rec和tag CNN。NTR方法在K为50时,可以取得Recall@5值为0.640,Recall@10值为0.768的表现;在K为100时,可以取得Recall@5值为0.607,Recall@10值为0.715的表现。
其他文献
金属铜(Cu)因具有良好的导电与导热性,被广泛应用于工业领域中。然而,Cu在高温环境中极容易被氧化,从而使其应用受到极大的限制。迄今为止,人们采用了不同的方法来防止Cu的氧化。其中,合金化法因具有操作简单且工艺绿色环保等特点引起了广泛关注。研究表明,向Cu中添加少量Si或Se元素有助于提高其高温抗氧化能力。且借助氢气氛中对Cu-Si和Cu-Se二元合金进行预热处理,可进一步提升其抗氧化能力。Cu-
学位
Skyrme模型提供了一个统一的研究重子、原子核和致密核物质的方法。本论文主要基于拓展的skyrmion晶格模型研究致密核物质的性质。这一推广的Skyrme模型除了包含手征对称性破缺诱导的Nambu-Goldstone玻色子π外,还包含描述核力所必需的矢量介子ω和ρ,以及标量介子σ。矢量介子通过隐藏局域对称性方法引入,而标量介子σ与标度对称性的破缺相联系——看作dilaton。通过将skyrmio
学位
情境是试题的要素之一,其质量优劣直接影响试题的品质。基于试题情境的文献分析,初步构建中考化学试题情境质量的分析框架,通过专家咨询和效度检验形成包括5个维度、15种水平的化学试题情境质量评估框架,并以安徽省2021年中考化学试卷第16题为例进行评估,对教学与评价提出3点建议。
期刊
环境与食品安全是当今国际社会普遍关注的重要问题。近年来,过度使用化肥对环境和人类健康造成了诸多负面影响。因此,研究安全、高效、环保的生物农药是关系农业可持续发展和人类身心健康的时代重大需求。生物防治是利用有益生物或其代谢物杀死或抑制不同病原体的方法。用于防治植物真菌病害的生物防治因素主要包括真菌寄生虫、植物内生菌和诱导抗性生物。如今木霉属真菌被广泛地研究应用,其中哈茨木霉被证明有较高的体外抑菌活性
学位
随着人工智能、互联网+、云时代的到来,电已经成为了上至科学研究、国防建设下至制造业、工业生产、城市治理,大至国家电网、航空航天小至家用电器、精密仪表中不可或缺的要素,承担着现代化建设中极为重要的角色。现代科学的深入研究和现代化工业生产对不同形式、不同范围电流测量的需求越来越广泛,不同国家和不同场合可移动设备等电力、电子装置应用电流的频率也不尽相同。因此,为了简化测量步骤,减少重新定位、重新安装可能
学位
单态氧(Singlet Oxygen)由于其独特的电子结构和较强的氧化性,是一种非常重要的活性氧(reactive oxygen species,ROS),在医学、生物学和大气化学等领域均具有重要作用,对于单态氧的研究,在过去的几十年里受到众多理论与实验化学家的关注。由于自然界中的氧分子主要是以三重态形式存在,单态氧一般需要通过一些特殊的实验手段获得,例如:通过内过氧化物的还原、光敏化方法及一些化
学位
目的:评价化滞柔肝颗粒治疗非酒精性单纯性脂肪肝(湿热中阻证)的安全性和有效性。方法:选取自2020年7月至2021年4月于黑龙江中医药大学附属第二医院消化科门诊就诊的50例符合标准的非酒精性单纯性脂肪肝(湿热中阻证)患者,给予化滞柔肝颗粒口服。观察周期为24周,若用药12周后患者肝/脾CT比值≥1.0,已达到临床研究终点,可出组。观察患者肝/脾CT比值、中医证候积分、血清学指标以及其他安全性指标的
学位
随着不可再生能源不断消耗,以及全球变暖的环境问题不断加剧,石油动力汽车向电动汽车转型是必然趋势,实现模式转型的当务之急是发展性能出色的锂离子电池(LIBs)。目前,石墨仍是LIBs负极的主要材料,其优点在于成本低、矿藏丰富,加之结构稳定性高以及导电性能较好,但是它也存在一定的不足,比如其理论容量仅能达到372 m A h g-1,无法满足当今社会实际使用需求。在碳负极材料中,以生物质为原料制备的碳
学位
随着近年来世界范围对环保问题的日益关注,内燃机排放法规不断加严,作为有限密闭空间内燃烧的必然产物,内燃机的喷雾湿壁现象难以避免,而喷雾湿壁是产生HC、CO问题的重要源头之一。尽管已有理论认为能够通过改善燃烧室形状、组织气流运动方向来减少湿壁,并对湿壁现象加以控制、利用,但目前却鲜有关于湿壁现象后燃油和燃烧室壁面之间流固耦合等微观物理过程发展的研究成果。本文以喷雾湿壁现象为研究对象,主要研究了不同的
学位
氢原子转移(Hydrogen-Atom Transfer,HAT)涉及生命活动、化学化工、能源能量转换等过程的关键步骤。氢原子转移是甲烷活化转化、水裂解制氢研究中的热点问题。随着定向外电场(Oriented External Electric Field,OEEF)作为未来化学中的智能试剂的概念的提出,探索定向电场调控氢原子转移的微观本质成为目前化学领域的非常基础的科学问题之一。因此,本论文发挥计
学位