论文部分内容阅读
为了挖掘民族文化的传承规律和内涵,根据少数民族文化特点,设计了一种XML子树的序列表示方法,有效保存了XML节点的结构信息。从XML文档的路径、节点层次、权重综合计算出发,提出一种基于子树的XML相似度计算方法,提高了文本相似度计算的准确性,最后设计了一种新的增量式聚类算法应用于少数民族文化挖掘。实验证明了该算法在民族文化挖掘中的可行性。