论文部分内容阅读
针对XML(可扩展标记语言)文档提出的信息单元和信息特征的概念,利用信息单元作为候选查询结果,以信息特征表征标签信息,结合XML文档的结构语义,在TF*IDF模型的基础上,设计了查询结果的相关度排序策略.该策略同时涉及了查询结果的结构信息和内容信息,计算了信息特征的重要性,且能利用信息特征的重要性衡量不同信息特征下关键字的语义相关度,进而设计并实现了关键字查询算法XRIU.实验结果表明XRIU在查询质量上优于现有的主要算法.