论文部分内容阅读
随着网络规模的日益扩大,海量的信息被“深藏”于各类在线数据库中,用户只能通过查询接口才能获取其中的数据,这部分内容称之为DeepWeb;因此对同一领域的DeepWeb数据进行集成是非常必要的。查询接口的集成是其中一个非常关键的子问题。查询接口的集成分为模式匹配和模式集成两个步骤;重点研究集成查询接口中属性布局的确定。DeepWeb中查询接口数量巨大,以及动态性与异构性的特点给该问题带来了巨大的挑战。将查询接口的结构建模成一棵树,然后通过挖掘频繁的模式子树来构建集成的查询接口树,使其最大化地满足属性间的结构