论文部分内容阅读
互联网上存在许多有价值的信息,搜索引擎只能索引静态页面,无法索引DeepWeb数据,而DeepWeb通常以表单形式存在,只有提交表单查询才能获得其数据,如何发现和识别DeepWeb查询接口成为人们关注的问题。在分析表单表现形式与功能内在的联系的基础上.提出一个表单的抽象模型,依此过滤非DeepWeb查询接口的表单。通过对返回结果页面分析方法,实现DeepWeb查询接口的识别,实验结果证明了该方法的有效性。