基于向量空间范围搜索的大型软件相似度检测

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:oppoyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不同软件系统中相近似的代码模块的出现,是理解和重构软件系统的一个重要出发点。就软件工程的角度而言,相似代码模块的检测可以更好的检验系统;可以方便对软件系统进行重构;可以在度量相似和差异的基础上协助版本管理;进而还可以在产品线的层面上,给出量化的版本之间相似度的结果,从而有助于更有效的项目管理。由此可见软件相似度的研究有其重要的现实意义。本文关注于大型软件系统的相似检查。现有的软件相似检测的方法基于对软件相似的不同定义,没有一个坚实的框架来支持大型软件系统的相似分析。本文比较了当前的检测技术,针对大型软件系统相似检测需要,指出了基于度量空间的解决方向。文章在分析软件特征的基础上挑选了适当的软件系统度量,并给出了软件相似度及其量化结果的形式化定义。然后在向量空间搜索的理论框架下探讨了近似搜索算法,得到了适合大型软件向量空间应用的合适算法。最后,本文基于上述解决方案给出了一个大型软件系统相似检测器的设计实现,并在大的模拟样本数据集上进行了实验。对于软件度量空间相似检测时涉及的重要参数,实验分析指出了它们对相似检测结果以及效率的影响,为其它软件系统的度量相似检测实践提供了有力的参考。自此形成了一个对大型软件系统进行相似检测的完整框架。
其他文献
危险与可操作性(Hazard and Operability Analysis HAZOP)分析是一种广泛应用于化学流程工业的危险分析方法。为克服现有的HAZOP分析专家系统在“非常规”分析方面的局限性,
无线传感器网络由大量部署在感知区域进行信息采集的传感器节点组成。无线传感器网络的一个关键问题就是传感器节点的能源有限并且在一些应用中是不可恢复的。所以降低能量消
目前,医学图像三维重建技术获得了国内外医疗和图像处理领域广泛的关注。通过对人体器官或组织进行三维重建,能够更直观、更准确地重现对象的三维结构,辅助医生对病变体及其
随着计算机硬件技术的高速发展和计算机图形学研究的深入,光线跟踪渲染技术越来越得到人们的关注并且成为实时渲染和离线渲染研究的热点问题。动态场景的渲染及如何管理动态
随着计算机技术、通信技术和网络技术的飞速发展,计算机系统的安全性日益受到重视,访问控制作为一种重要的安全技术,已经渗透到操作系统、数据库、网络的各个方面。基于角色的访
信息技术的进一步飞速发展,对信息安全的各项领域提出了更高的要求。计算机硬件、并行计算等方面的发展,使得传统的RSA密码体制受到越来越多的威胁,人们逐渐转向优点众多的椭
建设信息化军队,打赢信息化战争是我军当前肩负的重要历史使命和多年以来确立的战略目标。当前军队搞信息化建设,没有现成的经验可循,只有脚踏实地,在经验中总结,在实践中摸
运动目标的检测和跟踪是计算机视觉、图像处理、模式识别等多领域共同研究的热门课题,近些年来已经取得的很多成果,被广泛地应用到军事导航、监控监视、医学诊断、视频检索等
语音处理技术有着广泛的应用领域,歌声合成是语音处理技术的一个新的应用领域。对歌声合成方法的研究在谱曲作词、唱片制作、娱乐等领域都有很大的应用价值,虽然国际上对歌声
随着国防军队建设的发展,信息化建设凸显其重要性。战场各种信息的变化越来越快,也越来越多样化。军队决策者在尽可能短的时间内依据有效底层数据做出正确决断,将影响整个部