论文部分内容阅读
WWW上大量信息的涌现,对信息的查询提出了严峻的挑战.XML作为一种扩展标记语言,具有许多HTML所不具备的优点,使得开展WWW上的深层应用成为可能.对基于XML的搜索引擎中涉及的关键技术进行了研究,并提出了对XML这种半结构化文档建立索引和查询时采用的数据结构和算法.它在不丢失文档中结构信息的情况下,充分利用XML的标签所带来的上下文信息,能够大幅度提高查询的准确率.