论文部分内容阅读
可扩展标记语言正在成为Web上各种应用交换信息的标准。对高性能可扩展标记语言数据处理技术的需求正日益增长。现有的大部分可扩展标记语言文档相似度计算方法是基于文档结构特征的。该文提出了一个新的基于综合语义的可扩展标记语言文档相似度计算方法。该方法综合利用了可扩展标记语言文档的结构信息和内容信息,具有一定应用前景。