论文部分内容阅读
作为世界上最大的开放内容工程,Wikipedia仅其英文版本就拥有超过200万的条目数以及超过1亿的内部链接。目前,Wikipedia中的相关内容查询是采用关键词匹配的方法,其中丰富的链接结构所蕴涵大量的相关信息未充分利用。利用Wikipedia中的内部链接关系析取语义关系,进而提高查询的精度。定义了一种新的算法,使用词条“相容率”(Mutual Awareness Ratio)来描述词间距及对知识空间节点(词条)进行相关度的重新排序,从而重新构造知识空间。实验证明,此算法有效地提高了查询精度与用户满意度