基于Word2Vec的缺陷定位方法研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户:dongshantongak
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
故障定位是解决软件故障问题的关键。传统的静态缺陷定位方法是使用信息检索的方法计算缺陷报告与源代码文件之间的相似度,但该方法没有考虑到缺陷报告与源代码文件之间词汇不匹配问题,导致准确率低。为了解决上述问题,提出一种基于Word2Vec模型的缺陷定位方法。该方法使用项目相关文档,如项目API说明文档等训练Word2Vec模型,通过Word2Vec模型得到缺陷报告与源代码文件的词向量,使用余弦相似度算法计算缺陷报告与源代码文件之间的语义相似度,向开发人员推荐含有缺陷的源代码文件列表。结果表明,与传统的静态缺陷定
其他文献
木材缺陷会降低其经济价值,造成资源浪费。机器视觉分割模型对木材表面缺陷进行检测处理可以提高利用率,为了研究不同纹理分割模型的特性,采用Markov-ICM与GAC算法对不同木材表面缺陷进行分割对比研究。基于木材纹理信息数据的研究,对带有缺陷的纹理信息进行分析,对相应的分割模型进行改进。实验表明,改进后的GAC模型可以提高分割的准确性与实时性。
随着区块链技术的快速发展,越来越多的机构尝试将区块链融入到自己的应用中,区块链也被分成更细的三种:公有链、联盟链、私有链。联盟链和私有链因无需过多的无意义算力浪费
本文分析了我国陶瓷工业引进外资情况,并就如何利用瓷都优势利用外资发展陶瓷工业问题,提出了自己的看法和建议。
针对特征点稀疏的简单场景下的相机标定,给出一种以相机与标定点对的几何关系和光度误差为模型的优化策略,并给出相应的雅克比矩阵用以找到迭代点的梯度方向,使算法收敛,达到
随着互联网中信息技术的高速发展,各类新媒体应用如Tweet、微博、问答系统等,无时无刻都产生着海量的文本数据,这些文本数据大多为短文本,具有特征稀疏、用词多样、口语化、
通过试验,本文讨论了添加ZrO<sub>2</sub>、SiO<sub>2</sub>、Al<sub>1</sub>O<sub>3</sub>、SnO<sub>2</sub>以及烧结制度对钛酸铝材料强度的影响;研制出了一种以钛酸铝为基
针对基因变异鉴定存在数据规模大、复杂度高、计算时间过长等问题,提出一种基于MapReduce的多样本基因鉴定并行优化模型。该模型主要将基因数据划分为小规模数据组并分配在多
本文对我市招商项目市场建立的必要性、可能性和操作的可行性等问题进行了分析与探讨。
本文对我市引进外资工作的基本情况和特点进行了分析,并提出了加快招商引资工作的措施。
不同的浏览器对于相同网页的解释会有差异,在对跨浏览器兼容性测试时通常需要对网页进行分块,而网页的不兼容性对于用户来说往往需要从视觉层面感知。通过对网页截图进行处理