论文部分内容阅读
随着计算机软件的飞速发展,设计可用性高的软件系统是很必要的。在软件系统的使用过程中,对其进行可用性测试与改进能有效地提高软件的功能。
序列模式挖掘已经在许多领域得到应用,可以把序列模式挖掘用于软件可用性测试与改进分析。首先,介绍了序列模式挖掘和软件可用性的基本概念和方法,作了理论上的准备。然后,在对以往序列模式挖掘算法进行研究的基础上,结合序列模式挖掘和软件可用性评估的方法,对用户使用软件系统的事件序列集进行模式挖掘,研究其用户行为模式,从而从用户的角度来分析和提高软件系统的可用性。
在软件可用性测试中,分析用户行为模式是一个关键的问题。提取的最大频繁事件序列反映了用户对软件系统的功能需求。为解决具有序列长度长、以序列片段为支持度计算依据等特点的用户行为模式挖掘问题,设计实现了一种有效的基于前缀树的频繁事件序列扩展方法,给出了比特图索引表的构造、事件扩展、事务扩展以及支持度计算的算法。在此基础上,设计实现了一种新的挖掘用户行为模式的算法,该算法采用位图索引表的数据格式,并结合有效的剪枝技术,减少了算法的时空开销,明显地加速了最大频繁事件序列的生成。
最后,证明了算法的完整性和正确性,并通过实验证明了算法的可行性和剪枝的有效性。理论和实验都证明该算法对于序列个数和事件个数都很大的数据集是很有效的。