论文部分内容阅读
由于XML数据具有半结构化特性,使得面向XML数据的数据挖掘不同于面向关系数据库的数据挖掘,它具有更复杂的层次结构。研究基于DOM树的XML数据频繁模式挖掘算法,提出面向XML数据的频繁模式增量式挖掘算法FreqtTree。该算法首先将XML数据转化戍DOM树,然后从DOM树挖掘所有频繁模式。FreqtTree算法采用最右扩展技术,只在树的最右分支上增加新结点生成新树。同时充分利用已生成的频繁模式信息,使得产生的候选模式数量较少。FreqtTree算法利用频繁k-1模式的支持数计算候选k模式的支持数,该算