论文部分内容阅读
基于视觉的Web页面分块算法(Vision-based Page Segmentation Algorithm)作为网页分块技术重要的一部分,得到了广泛的应用,然而由于网页视觉特点的复杂性,导致VIPS具有算法规则过于复杂和性能相对不高等缺陷。针对存在的问题,本文用〈table〉标签树对微软提出的VIPS进行改进,提出一种改进算法CTVPS,最后通过实验证明了本文算法的正确性和性能优越性。