基于视觉的Web页面分块算法的改进与实现

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:jeff006902000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视觉的Web页面分块算法(Vision-based Page Segmentation Algorithm)作为网页分块技术重要的一部分,得到了广泛的应用,然而由于网页视觉特点的复杂性,导致VIPS具有算法规则过于复杂和性能相对不高等缺陷。针对存在的问题,本文用〈table〉标签树对微软提出的VIPS进行改进,提出一种改进算法CTVPS,最后通过实验证明了本文算法的正确性和性能优越性。
其他文献
针对目前入侵检测系统不能适应异构网络环境、缺乏协同响应的不足,提出了一种基于CORBA的分布式入侵检测系统模型,结合人工智能思想,实现了一种基于CORBA的入侵检测系统CMDIDS(Co
DoS的思想是用大量的数据包来攻击服务器,降低服务器的性能。SYN Flood攻击是DoS攻击的一种重要形式,它是利用TCP协议3次握手时的漏洞对服务器进行攻击。介绍了SYN Flood的攻
介绍了不同数据抽取方式的优缺点,基于EMC存储联机业务持续性卷BCV数据备份和Oracle LogMiner分析归档日志原理,分析了数据抽取复制方案,实现了省级数据集中应用生产环境到分
依据数字家庭的概念,以及OSGi智能网关技术和服务网关的模型,本文给出了一个基于OSGi网关的GSM短信控制X10设备的系统,通过该系统用户可以方便地使用手机短信控制家庭设备。
如何平衡面向对象数据库(OODB)索引的检索性能、维护开销、实现复杂度已经成为一个影响OODB性能的关键问题。提出一种OODB继承层次索引配置方法。通过开销模型评估各种索引配置
针对网格环境下任务的调度问题,本文提出了一种改进的快速收敛的遗传算法.通过调整算法结构,增加了对染色体的分割与重组操作.使遗传算法能快速收敛.仿真实验表明,与标准调度算法相
针对无线传感器网络在应用中的能耗问题,提出将ZigBee技术应用于无线传感器网络,采用超低功耗单片机和无线模块构成节点的方案,在剖析德州公司发布的免费协议栈Z-Stack基础上,架
在基于目标区域的图像检索中,显著点是一种重要的点特征。针对经典的显著点提取算法SPARSE(Salient Points Auto-Reduction using Segmentation)存在的复杂度高等问题,提出了一种改进算法,利用动态阈值分割算法中的类间方差和类内方差对图像进行分割,然后用三个颜色特征和三个纹理特征对分割出的显著点进行特征标注,最后用欧氏距离对显著点特征向量进行相似性度量。实
射频识别技术是一种非接触式的自动识别技术,对RFID的现有技术进行了分析,对现存问题做了改进,并在此基础上提出了一种空中接口通信安全认证算法,通过ID更新来保证标签的匿名性,并且解决了一般RFID空中接口算法中采用ID刷新机制容易导致的数据更新不同步问题。
失效检测器是分布式系统容错的重要手段,失效检测器性能直接影响到分布式系统的容错能力。本文针对根据分布式系统中的失效类型,对相应的失效检测器进行了研究,介绍失效检测