基于软件执行图的行为特性的算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:haisheng1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,软件系统规模与应用领域的日益复杂,使得软件动态执行轨迹需要新的处理模式才能成为具有更强决策力与洞察力的信息资产。因此,如何有效地挖掘软件的内在特征,基于软件动态执行轨迹实现其行为特性的建模与算法的研究,成为软件开发质量的基本保障,有助于软件在适用领域的合理应用及发展。本课题利用数据挖掘技术,从海量的软件执行轨迹中挖掘用户感兴趣的行为模式,以适用于广泛的软件安全分析、软件质量评估、软件漏洞挖掘等领域。首先,提出一种基于软件动态执行轨迹的软件执行图的构建方法。基于软件的不同粒度,使用分布函数生成不同粒度下的单元项权重、序列效用值等参数,采用深度优先遍历的方法构建软件执行序列,将每一条序列作为软件的一次函数执行序列,并最终形成软件动态执行序列集合。其次,提出一种基于有希望扩展的高效用序列模式挖掘算法。该算法将软件执行轨迹序列化,设计了表结构Pre-Utility-List用于存储模式的效用信息和索引。为存储长度为2的序列效用值,提出了PEUS结构,并基于此提出一种潜在高效用模式的剪枝策略,有助于模式效用上界值的降低。再次,提出一种基于软件执行图的Top-k高效用路径模式挖掘算法。基于软件执行序列中函数的调用顺序及依赖关系,提出了预插入策略Pre-insertion,以提高初始效用阈值。排序策略Sorting和过滤策略Filtering的使用有助于较早地扩展潜在高效用模式,以提高算法效率。最后,对本文提出的算法用Java语言在Windows平台下进行实现。通过实验分析算法在运行时间、候选集数量、内存使用空间等方面的性能。
其他文献
随着计算机特别是网络技术的发展,现代企业通过实施信息化能够在管理、生产和经营等各个方面降低成本,提高效率,提高企业的竞争力,但是在企业的发展过程中,企业开发和引进了
近年来,有关Skyline查询的研究工作主要集中在对查询处理过程中计算代价的优化,而对其中涉及到的通信代价优化却却很少涉及。考虑一个“客户机/服务器”(C/S)构架的分布式系
移动自组织网络(MANET)是由一组移动节点通过无线链路动态组成的一个分布式自治网络,具有无中心节点、多跳、自组织性、网络拓扑动态变化等特点,广泛应用于军事领域和民用服
快锻热工炉是特钢厂锻压生产线上的重要热工设备,其生产任务是将钢坯加热到锻造工艺要求的温度水平,以提高钢坯的塑性,降低其变形抗力。热工炉炉温控制质量直接关系到炉子的
椭圆曲线密码算法(ECC)是Victor Miller和Neal Koblitz在1985年分别独立提出的,它的安全性是基于椭圆曲线离散对数问题(ECDLP)求解的困难性,具有安全性更高、密钥长度更短、
容灾是数字存储业务连续运行和数据安全的最后一道防线。如何以最低的成本取得最佳的容灾效果,是每一个信息系统建设应当优先考虑的问题,需要组织机构在宏观与微观两个层面上
人工神经网络(Artificial Neural Network,ANN)是利用计算机模拟生物神经组织的非线性系统。它具有强大的自组织性、自适应学习、并行处理及高容错性能。到目前为止,众多学者
随着计算机和网络的发展,视频在人们生活、工作中的作用也越来越重要,视频处理成为该领域的一个重点,对于特定领域的视频的处理越来越得到研究者的重视。项目组根据特定的视
Petri网不仅可以采用可视化图形描述而且可被形式化的数学方法所支持,是一种形式化、图形化的分布式系统建模和分析工具。它不但能够精确地分析系统的静态特性,而且能够很好
实例推理的核心思想来源于现实中人类处理问题的方式,就是充分利用过去解决问题的经验作为参考来解决同类问题,其中机械产品设计是该思想的一个重要应用领域。基于实例推理的