Deep Web接口集成及查询结果排序方法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:Tiger7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着World Wide Web的快速发展,Web信息越来越多的出现在互联网中,而网络动态语言以及Web数据库技术的发展,使得Web上信息呈现出动态性和深层性的特点。对于传统搜索引擎而言,Web中深层次的信息并不能被有效索引,这些深层次信息被称为Deep Web。Deep Web信息价值高,且在快速增长中,吸引了越来越多的人对其进行深入研究。本文对Deep Web信息检索相关技术进行研究和探讨,对一些关键技术进行了深入研究,提出了相应的处理方法,并在最后描述了一种面向Deep Web的垂直元搜索引擎原型系统的设计框架。本文的主要研究内容包括:(1)分析了Deep Web数据源发现方面的研究背景和相关知识,给出了基于搜索引擎的聚焦爬虫设计方法,同时描述了一种查询接口判定方法,用于完成数据源发现工作。(2)在查询接口模式抽取的基础上,将查询接口集成中的模式匹配问题转换为查询单项之间的相关度计算,据此提出了基于关联规则的查询接口模式匹配方法,用于完成查询接口集成工作。(3)在查询结果排序上,从数据源质量、用户查询响应以及查询相关度三个方面,综合计算出查询结果的排序分值,用于查询结果排序。(4)分析了搜索引擎的发展现状和工作原理,在此基础上,描述了面向Deep Web的垂直元搜索引擎系统的设计框架,并对关键模块进行了详细分析。本文对提出的方法和技术进行了相关的实验,结果表明本文提出的方法和技术是可行和有效的。
其他文献
本文是苏州某管理部门开发的“虚拟太湖流域”项目中的一个子课题,主要内容是在PC (Personal Computer)平台上模拟出视角在湖面下观察到的水下视觉效果。水下场景以其复杂性
随着计算机和网络的广泛普及,它已经应用到了社会的各个行业中,计算机的软件系统也在日新月异地改革。尤其是隶属软件工程中软件维护阶段的软件再工程就更为重要,原因是以前
入侵检测是近10余年发展起来的一种动态的监控、预防或低于系统入侵行为的安全机制。主要通过监控系统、网络的行为、状态以及系统的使用状况,来检测用户是否越权使用以及系
目前,我国有大量的蒙古文古籍以图像的形式保存在图书馆中。这些古籍文档内容涉及宗教、历史、文化、艺术、天文、地理、民族、医学等诸多方面,是人类文化的宝贵遗产。但图像
随着信息技术的迅猛发展和网络的不断普及,像图像、视频、音频等这类多媒体信息已经成为人们信息沟通中不可或缺的方式。人们在网络上可以轻松方便地下载、传播各种数字产品,
随着人工智能的浪潮兴起,智能聊天机器人成了人们研究的热门,人们希望机器像人一样思考,与人类对话,并成为人类的帮手。在聊天机器人中,一类重要的机器人是私人助理机器人,或
微电子技术的迅速发展促进了片上系统( SoC)的出现,集成电路的发展随之进入了一个新的发展时期。SoC的设计技术是从“集成电路”级设计到“集成系统”级设计转变的结果,其设计是
互联网中P2P应用的流行,网络蠕虫和僵尸网络的泛滥,严重威胁互联网的正常运转。使用流量分类方法标识出互联网中各种应用的具体分布,可以帮助运营商按需配置优化网络,限制P2P
随着信息产业的发展,人们获取数据和知识的手段已趋向于多样化。人类拥有的数据量越来越庞大,在这些数据量的背后可能隐藏着大量我们感兴趣的信息,如何有效的挖掘这些信息成
伴随着嵌入式技术的迅速发展,移动终端设备得到普及。终端设备的广泛应用,使其数据管理问题逐渐得到重视和研究,嵌入式数据库的概念也应运而生。当前,带有嵌入式数据库的移动