论文部分内容阅读
为进一步提高Web的检索性能,提出了一种基于微分流型的Web检索算法.该算法的核心思想为:用微分流型描述Web空间,用流型的切平面模拟Web的切空间,将流型上2点之间的测地线距离转化为二维平面上点与点之间的欧氏距离,基于距离的匹配过程由原来的在整个文档集合中进行,转换为仅在查询的邻域内进行,以减少匹配过程的计算量.实验结果表明,该算法的查准率比Google和IIT分别提高35.24% 和40.93%,它更适合于大型异构Web文档集合的检索.