Deep Web环境下查询松驰技术的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:pc84119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,Web上的信息量呈爆炸性增长。按照所蕴含信息深度的不同,可以将Web划分为Surface Web和Deep Web两大类。其中,Deep Web是指那些存储在Web数据库里、不能通过超链接访问而需要采用动态网页技术访问的资源集合。Deep Web中的信息量远远大于Surface Web中的信息量,有效地利用这些信息,能够更加充分地发挥Internet的作用。然而,在查询信息的过程中难免会产生失败查询,即没有结果返回的查询。对失败查询进行处理,使其返回与用户意愿比较相近的结果,比告知用户没有结果更具协作性,更有意义。   本文基于对Deep Web环境的观察和分析,提出了一种Deep Web环境下查询松弛的解决方案。首先,利用查询探测获得未知数据源的样本信息,并根据样本信息计算各个属性的近似函数依赖关系,得到属性重要度:然后,通过变换数据源关系全图得到针对于查询请求的数据源关系图;最后,利用这个数据源关系图,就可以按照特定的规则进行查询松弛和执行过程。   由于查询松弛的存在,从各数据源得到的结果数量可能很大,部分结果与用户查询请求的相似度较低,因此从各数据源得到结果后,先通过skyline方法对结果进行筛选,然后根据各个结果实例与用户查询的相似度进行排序,将最接近用户要求的结果集返回给用户。   以此查询松弛和结果过滤方法为基础,实现了Deep Web搜索引擎DWSearch中的查询处理子系统。出于处理并发访问的考虑,该系统采用了分布式设计。以DWSearch系统为平台,通过实验验证了本文提出的查询松弛和结果过滤办法的有效性。
其他文献
在IPv6网络中,移动性支持从原来的可选项变为必选项,组播通信的作用也日益受到重视。IPv6中取消了广播通信模式,其功能由组播替代实现。虽然移动环境下的组播通信具有带宽利
随着传感器节点软硬件技术的不断进步,传感器网络的应用范围也越来越广,新的节点设计和相关通信协议层出不穷。为了使研究人员能够高效、方便地对其研究成果进行验证和分析、
伴随着我国经济的高速发展,城市交通拥堵、出租车拒载和私家车空载问题逐渐成为了社会关心的焦点。针对这些城市交通问题,专家学者们不谋而合的提出了一种最为有效的解决方法
随着计算机应用的深入和软件工程的发展,软件系统已成为现代社会最重要的资产之一。越来越多的公司和社会机构依赖于其内部的软件系统来提高竞争力和减少成本。软件系统与其他
油气自然蕴藏的分布决定了油气田企业在地域上的分布性。随着企业信息化的不断深入,企业下属的采油厂纷纷建立了各自的管理信息系统(MIS),并积累了大量的历史生产数据。但是现
物联网服务是物联网技术与Web服务技术相结合的产物,其作为信息化时代的重要组成部分,在云计算分布式环境下的各种应用中得到广泛应用。物联网中数据和操作种类繁多,而物联网
上世纪50年代中期创立仿生学以来,人们不断地从生物进化的机理中得到启发,提出了许多用于解决复杂组合优化问题的新方法,比如蚁群算法和粒子群算法等等,它们都是适于大规模并行且
车辆牌照识别是智能交通系统(ITS)的一个重要组成部分,尤其是复杂背景下的车牌识别,有着广泛的应用领域和美好的应用前景,其发展必将大大加速ITS进程。本文针对目前车牌识别
电动机是所有自动设备的动力之源,磁瓦是电动机中的一个主要组成部件,其性能关系到电动系统的可靠性、稳定性和安全性。对于功能面的缺陷,必须在检测时予以剔除,以免装入电动机后
物联网技术、云计算、大规模高效能计算的蓬勃发展催生了以“制造即服务”为理念的云制造模式。随着这种模式的深入推广,越来越多的资源接入到云制造虚拟资源池中,资源提供商、