论文部分内容阅读
随着计算机网络以及数据库技术的快速发展,各领域积累的半结构化数据和信息急剧增加,迫切需要面向知识发现的方法,而数据挖掘的出现与应用,为这一目的提供了强大的工具。通过利用半结构化数据的内容和结构信息,配合数据挖掘算法,可以从大量半结构化数据中提取用于描述结构特征以及内容的信息,并进行综合以对半结构化数据进行深层次的潜在知识发现,而发现的知识能为决策者提供良好的数据支持。半结构化数据有很多类型,而其中XML文档是半结构化数据的典型代表,所以本文以XML文档作为半结构化数据研究对象,并讨论基于XML产品设