论文部分内容阅读
由于在Web数据库中存在着海量的信息,而这些信息隐藏在具有特定查询能力的查询接口后,从而为了解Web数据库的分布、更新等内容特征带来的困难,最终阻碍了Deep Web数据集成。文章基于这一问题提出了一种新的数据采样方法,这种方法可以以增量的方式通过查询接口从Web数据库中获取近似随机样本,同时利用已经保存在本地的样本记录生成下次查询。