网页爬取相关论文
网页识别组件是实现网页搜索集子系统中根据url完成一篇见面爬取的线程。通过不同的命令标识符来表示不同的字体、颜色、位置等版......
随着网络在世界范围内的飞速发展,互联网作为最具潜力与活力的新兴媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,成为反......
随着信息技术的发展,互联网在人们的生活工作中扮演的角色越来越重要,越来越多的人开始使用互联网,各种新的互联网应用如雨后春笋般涌......
网页木马(drive-by download)已经成为互联网用户面临的最严重的安全威胁之一,基于Internet网页爬取的主动方式的网页木马监测服务......
摘 要: 作为世界上最大的信息库,是全球范围内传播信息的重要渠道。但网上资源的分布相当分散且无统一的管理。普通用户对信息的检索......