基于向量空间模型的方面挖掘方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:wubo_sz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的编程技术无法模块化实现系统关注点,导致系统关注点的实现代码横切于多个代码模块中,因此这些关注点被命名为横切关注点。面向方面编程技术可以将这些横切关注点单独实现为Aspect,从而解决了采用传统编程技术实现遗产系统难以维护、进化和修改等问题。如何将遗产系统转化为面向方面系统成为当前研究的热点话题。为了实现遗产系统向面向方面系统转化,需要使用方面挖掘技术识别遗产系统中的横切关注点,然后将识别的横切关注点使用重构技术封装成独立的Aspect。本文重点研究了使用向量空间模型标识遗产系统源代码中方法级横切关注点,基于聚类分析技术进行横切关注点识别的自动化方面挖掘方法。本文首先分析了现有的使用向量空间模型的方面挖掘方法的挖掘过程,发现现有的向量空间模型中属性都是基于源代码中类级别的,通过对源代码的进一步分析,依据被调用方法和方法名分解的token字,提出了FIV-class、FIV-method和FIV-method-tokens三个改进的向量空间模型,给出了每个模型的构造算法,描述了使用启发式k-means聚类算法进行方面挖掘的挖掘过程。针对JHotDraw源代码,基于相同的聚类算法,使用现有的向量空间模型和改进的向量空间模型进行方面挖掘,给出了实验过程和实验结果。实验结果表明,相比于现有的向量空间模型,使用本文提出的三个改进向量空间模型进行方面挖掘的挖掘结果在DISP评价指标上有明显的提高。为了进一步提高使用向量空间模型的方面挖掘方法的挖掘效率,本文对现有的两种基于启发式的凝聚聚类算法进行了比较,证明了HAC算法比HACO算法更适合使用向量空间模型的方面挖掘。本文给出了基于HAC算法,使用改进的三个向量空间模型进行方面挖掘的挖掘过程。针对JHotDraw源代码,基于启发式k-means聚类算法和HAC算法,使用现有的向量空间模型和改进的向量空间模型进行方面挖掘,给出了实验过程和实验结果。实验结果表明,相比于现有的使用向量空间的方面挖掘方法,本文提出的基于HAC算法,使用改进向量空间的方面挖掘方法的挖掘结果在DISP和DIV两个评价指标上均有提高,识别横切关注点的准确率和召回率也有明显的提高,同时也证明了基于凝聚的层次聚类比划分式聚类更适合于使用向量空间的方面挖掘。
其他文献
随着多媒体社交网络(Multimedia Social Networks,简称MSNs)的快速发展,用户和数字内容的“爆炸式”增长,方便了用户对数字内容的访问,同时也增加了大量的用户与用户,用户与
随着计算机网络与多媒体技术的迅速发展,人们可以轻易地对数字图像进行篡改及散布。图像信息的完整性、内容的真实性等安全问题已成为亟待解决的问题。因此一种确保图像数据真
云影音智能终端是将个人媒体内容与互联网结合起来,使得所有的媒体内容都可以通过高清平板电视观看的一款三网融合的产品。在云影音智能终端中有海量的音视频资源,用户需要高效
压缩感知是作为一种新的采样理论,根据信号的稀疏特性,利用远低于Nyquist采样率来获取信号的离散样本,并能够通过非线性的重构算法无失真地恢复出原信号。压缩感知理论的出现
随着世界范围内人口的膨胀和城市的发展,出现了越来越多人群密集的公共场所。这些场所在提供人们生活便利的同时,也为犯罪活动提供了地点。因此,公共安全是全世界面临的一个刻不
克隆代码进化研究以软件的多个版本为基础,通过克隆代码检测及跟踪来获取克隆代码进化信息。克隆代码进化研究对于了解克隆代码特征,维护和重构克隆代码、评价克隆代码有害性以
随着互联网的高速发展与不断普及,越来越多的敏感信息在互联网第三方站点上存储与共享,例如云存储和云共享。通常情况下,这些敏感信息并不是以加密的形式进行存储,对敏感信息
近年来,无线传感器网络(Wireless Sensor Network,WSN)相关技术取得了巨大的进步,被广泛应用于军事、医疗、环境等领域。然而,由于传感器节点常被部署在开放环境中,而且其资
近年来随着Android操作系统在各种电子移动终端设备中的迅速普及,数字电视机顶盒采用Android操作系统已经成为目前主流的发展趋势。电视机顶盒的人机交互操作主要依靠遥控器上
分级存储的设计初衷是将数据按访问热度的不同存储于不同性能的存储设备上,最大化存储利用率。当数据的热度发生变化时,便将数据迁移至更符合其当前热度值的存储设备上。因此,对