深度搜索中下一页链接获取策略的研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户：jishume

【摘要】

：

高质量、结构化的数据对很多应用来说其价值是无穷的。然而这些数据往往都隐藏在查询表单背后的深度Web数据库中。深度Web数据库中的内容不能够直接被爬虫通过超链接直接获取

【作者】

：

李哲陈鹏李涛

【机构】

：

北京航空航天大学计算机学院

【出处】

：

微计算机信息

【发表日期】

：

2007年33期

【关键词】

：

下一页深度搜索 next page deep web hidden web invisible web

【基金项目】

：

国家科技基础条件平台科技部（2003DKA5G015）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高质量、结构化的数据对很多应用来说其价值是无穷的。然而这些数据往往都隐藏在查询表单背后的深度Web数据库中。深度Web数据库中的内容不能够直接被爬虫通过超链接直接获取,只有通过主动对查询表单提交查询才能有效地获取这些数据。最近的研究主要针对以下两个方面：一是如何有效的理解和获取网络上的查询表单,二是如何不断的对查询表单进行查询并下载表单背后的资源。一个必要的但还没很好的解决的一个问题是：如何将一次查询所获得的所有结果页全部有效的获得？这个问题从本质上看就是如何获取结果页面中＂下一页＂超链接的问题。本文针对

其他文献

2007西门子自动化创新之族特别报道

创新之旅已在沈阳、大连、北京、青岛开展培训和推广活动，向客户展示了持续提高竞争力的创新产品；并且带给客户涵盖汽车，烟草，食品等各个领域的PROFINET通讯解决方案。九月，创新之

期刊

创新产品西门子公司自动化PROFINET专题报道竞争力零距离客户

网络教学的利与弊刍议

“互联网+”时代背景下在线教育的兴起,改变了传统教学模式。网络化、信息化教学正在助力“教”与“学”,逐渐打破时空界限,为教育教学的发展带来更广阔的空间。网络教学有利

期刊

网络教学停课不停学特殊时期教学实效

IPv6在无线传感网络应用中的关键技术

无线传感器网络已经成为当今的热门研究领域之一,在国防安全、工农业领域各种控制、城市管理、生物医疗、环境监测、抢险救灾、防恐反恐、危险区域远程控制等许多领域都有重要的科研价值和实用价值,具有十分广阔的应用前景。分析了无线传感器网络与IPv6的之间关系,提出了IPv6协议在无线传感网络应用中需要解决的关键技术.

期刊

IPV6无线传感网络应用关键技术IPv6 wireless sensor networks applicationkey techniques

2010 IBIS 全球车身修复领域的专业论坛

IBIS主办方团队正在从会议框架及内容方面致力于打造一个全新IBIS论坛。作为唯一而真正的全球性论坛，IBIS聚集了全球碰撞修复领域各方智慧，在增进行业交流、创新性讨论、引发行

期刊

IBIS论坛修复车身行业交流

基于DNI的变压器铁芯制造系统综合健康管理

对称三角形圆截面卷铁芯三相配电变压器铁芯的生产制造系统,是一个自动化程度极高的复杂动态系统,个别部件故障常常会引起链式反应,导致整个系统不能正常运行。本文提出复杂

期刊

复杂系统综合健康管理(CSIHM)分布式网络智能(DNI)分布式专家系统(DES)Complex System Integrated Health Man

马自达3遥控门锁无反应故障

一辆长安马自达生产的马自达3轿车，发动机排量2．0L，装备4速手自一体变速器，行驶里程3000km。用户反映该车前一天遥控器使用很好，第二天早晨使用遥控器开锁突然无反应。锁车也无反