软件执行轨迹中行为模式挖掘算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:hero_1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件的规模变得越来越庞大,大量的软件数据随之产生。为了从这些数据中挖掘出感兴趣的知识,帮助软件开发者更好地理解和维护软件,数据挖掘正在被广泛地应用到软件行为分析中。从大量的动态执行轨迹中挖掘用户感兴趣的行为模式为分析系统行为、定位系统故障、优化关键路径、查找系统瓶颈等应用提供了量化的依据与可靠的保证。本文主要从动态角度出发,将序列模式挖掘应用到软件执行轨迹中,挖掘软件的行为模式,从而帮助软件人员更好地理解和分析软件,主要工作如下。首先,提出了一种软件执行图中加权频繁遍历模式挖掘算法WFTPMiner。将软件动态执行轨迹转化为软件执行图,定义了加权软件执行图。采用深度优先遍历把加权软件执行图转化为软件路径遍历,提出了一种潜在频繁后缀序列树结构PFSS-Tree和一种最小计数剪枝策略MPS,用来提高算法WFTPMiner的效率。其次,提出了一种软件执行图中Top-k高效用路径模式挖掘算法TUPP。对软件执行图中的节点的效用进行了公式化定义,设计了一种表结构PUAList对模式的效用和索引信息进行存储。为了尽快地挖掘出前k个高效用模式,提出了预先插入和项扩展两种提升阈值的策略来提高TUPP算法的效率。再次,提出了一种直接从软件执行轨迹中挖掘高效用行为模式算法HUPPMiner。由于软件中有循环调用,提出了一种连续迭代模式化简算法CRPE来简化软件执行轨迹。设计了一种存储潜在高效用模式的树HUPP-PL Tree和带效用值的索引表PL-Index-List。利用索引表,一个新的邻接路径模式扩展策略被提出,利用这个策略可以更快地找到高效用的路径模式。最后,对本文提出的算法在Windows平台下用Java语言进行编程实现。通过实验验证算法在运行效率、算法可扩展性、模式数量等方面的性能。
其他文献
智能算法是从自然界得到启发,模仿它的原理而得到的算法。智能算法自产生及发展以来,被广泛应用于解决大规模系统中出现的复杂问题,具有通用、简单、便于并行处理等优点,被认为是
复杂事件处理过程中,决策者需要大量知识作为支撑,如何有效获取知识是成功处理事件的关键,特别对于应急事件处理来说,由于其涉及跨领域的知识获取,如何有效组织、管理和利用
近些年来,国民经济的不断发展对电力系统提出了更高的要求。一方面,随着电网建设规模的不断扩大,系统安全运行面临的场景更加复杂;另一方面,用户需求的多样化和个性化也对电
机器人足球仿真比赛是一种通过计算机模拟的机器人足球比赛。由于其不受限于场地,设备以及资金的优点而成为了一个研究多种智能算法的理想平台并吸引了世界各地的专家学者的参
随着图像镶嵌技术的发展,人们对图像镶嵌算法有了广泛的研究。在研究过程中,我们面临的一个主要问题就是如何解决好镶嵌图像的拼接缝问题。因此为了获得色调一致的镶嵌图像,有必
随着Internet的快速发展,XML已经成为Web数据表示和交换的事实上标准,越来越多的信息处理系统采用XML文档作为信息存储,交换和发布的载体,XML类型的数据已成为当前主流的数据形式
人脸检测和目标跟踪是机器视觉领域一个非常活跃的课题,许多国内外专家学者对其进行了深入的研究,研究出了很多有价值的算法。本论文首先对人脸检测和目标跟踪的国内外研究进行
当今的信息时代,信息交互愈加频繁,XML已经成为信息表示和数据交换的标准。随着大量XML信息的出现,XML数据的处理也逐渐成为人们关注的焦点,由此衍生出XML数据处理的两大研究方向
随着高校招生规模的不断扩大,高考招生录取工作的信息化程度要求越来越高。普通高校招生考试作为全社会关注的焦点,有必要采取一种新的方式加以变革。信息技术的飞速发展,使这种
随着网络时代的蓬勃发展,软件的规模逐渐扩大,软件开发的复杂程度也越来越高,随之而来的就是软件质量和安全性的问题。软件质量和安全性的问题的突出表现就是软件错误。软件