论文部分内容阅读
摘要:Java错误堆栈自动分类的过程中需要比较错误堆栈之间的相似度,该文根据java错误堆栈的特点,提出了一种适用于java错误堆栈相似度比较的方法,在这个过程中对汉明距离进行了改进,最后我们对此算法进行了详细的实验,实验结果表明这种方法具有很明显的效果。
全文查看链接
表一中列出了在不同聚类算法的情况下,我们的算法和其它算法的准确率的信息。通过上表可以看出,我们算法的准确率要明显高于Hamming以及levenshtein距离。而且我们的算法和LCS算法的准确率的差距并不大。这也是我们使用LCS算法而不使用Levenshtein Distance 来计算类名以及函数名相似度的原因。
全文查看链接