Ontology驱动的异构数据源上的关键字搜索

来源 :复旦大学 | 被引量 : 0次 | 上传用户:suan11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,网络上存在着大量的异构数据源,其中包含有海量的文本数据(FlatText),关系数据,以及XML等半格式化数据.这些数据源往往表达着相似甚至相同的语义,但彼此之间却是异构的.它们常常存在于各个自治系统之上,而这些自治系统则提供着各种各样的查询接口(SQL,XQuery等)。面对每一个这样的自治系统,用户必须掌握复杂的查询语法,并且预先了解到详细的数据模式(Schema),才能组织起一定的查询语句,从而访问数据源获得相关数据。关键字搜索是一个用户友好的信息发现技术,可一个架于各种异构数据源之上的关键字搜索系统:SOAK.SOAK为各种异构数据源提供一个共通的关键字搜索接口,并使用标准OWL[18]定义的Ontology来描述数据源中的数据。通过将各个数据源的数据模式集成为一个全局的Ontology,SOAK从全局上掌握各个异构数据源内部以及相互之间的语义。由于Ontology是一个共享概念集的显示定义,因此SOAK可以从各数据源中挖掘出丰富的语义,并将之返回给用户。与先前的系统相比,我们的系统主要有三个方面的优势:(1)SOAK可以从用户提供的关键字中提取出语义信息;(2)通过Ontology集成,数据中的隐含语义可以被挖掘出来;(3)返回结果使用Ontology展示,从而用户可以方便,直观地从结果中获得有用信息。
其他文献
元搜索引擎是基于搜索引擎基础之上的搜索引擎,它可以同时检索多个成员搜索引擎,对成员搜索引擎返回的结果信息进行融合、再加工后二次陈列给用户,解决了用户跨搜索引擎检索的问
互联网近年来的飞速发展,造就了一批以社交为主的网站,其中国外的Facebook,Twitter,Google+,国内的QQ空间,豆瓣,人人等最为流行。这些社交网站每天都会有大量的用户使用,并且
随着信息技术的快速发展,网络安全、隐私保护等问题越来越受到人们的重视。传统的解决这些问题的方式是设计复杂的密码学协议强化安全性,但传统的解决方式都是基于中心化的系
信息粒度广泛存在于现实世界中,是对现实的抽象。粒度计算即信息的粒化处理,是信息处理的一种新的概念,覆盖了所有有关粒度的理论、方法和技术的研究,是模糊集理论、词计算理论、
知识管理有利于提高企业产品开发、制造、销售及服务的质量和效率。知识管理通常包括知识获取、知识评价、知识重用、知识修改及更新等流程或者活动。知识管理系统是辅助企业
随着互联网技术的发展,在线中文网页的数量迅速增加,互联网上的信息量越来越大。搜索引擎能够有效地组织和分析海量的信息资源,帮助用户迅速地获取所需要的知识和信息。然而
在供应链管理模式下,单个企业之间的竞争变成了企业所在供应链之间的竞争。供应链的构建中最重要的一个环节就是评价选择供应商。从长期发展来看,核心企业应选择能保持较高的
虚拟植物生长可视化在现代农林生态研究中具有重要意义,而植物的形态发生模型和生理生态模型及其结合方式是本研究中的核心问题。论文首先在改进Open L系统的基础上,提出了植
根据移动自组网的特点,在无线通信带宽极其受限的情况下,采用组播技术实现多方通信可以节省带宽、减少网络开销,设计有效的组播路由协议是移动自组织网研究领域的重要内容之一。
随着网络技术和应用的快速发展,网络中所产生的数据也急剧增长,相应的数据存储技术和应用技术也得到快速发展,特别是云计算相关技术和数据挖掘技术的发展。云计算技术的应用