跨库集成检索系统中数据源连接器的半自动生成

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:devil521zhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无论是DeepWeb数据集成系统,还是数字图书馆的跨库集成检索系统,都面临的一个巨大挑战就是如何更加高效地集成各种分布的、异构的Web数据源。这个问题具体又可以分为两个子问题。一是Web数据源查询接口的理解。Web数据源在底层数据模型和查询接口设计等方面各不相同,如何让机器从语义上理解Web数据源的查询接口,是集成系统要解决的首要问题。二是查询转换。集成接口和Web数据源的接口模式存在很大差异,如何在两种模式间进行查询转换,特别是在对复杂查询提问进行查询转换时,如何最大程度地减少转换中丢失的信息,是一个关系集成系统的使用效果和用户体验的关键问题。 本文以数字图书馆的跨库集成检索系统作为平台,针对目前Web数据源连接器的手动生成方式日益成为Web环境下大规模数据集成的瓶颈这一现实,以解决查询接口理解和查询转换为重点,设计了一个连接器生成系统,并对原型系统中采用的关键技术进行了剖析和详细阐述。 为验证原型系统所进行的查询接口模式抽取及模式映射的效果,本文选取若干Web数据源,在连接器生成系统所创建的连接器上进行了查询转换实验,并对实验结果作了深入分析。实验结果表明,对于各种不同类型、不同特点的Web数据源查询接口,连接器生成系统都能够进行有效的模式抽取和模式映射等处理,创建数据源连接器,从而将Web数据源集成到跨库集成检索系统,并保证所生成的连接器能对集成接口上的查询提问进行正确而高效的查询转换。 连接器生成系统的实现,将为跨库集成检索系统大规模地集成Web数据源提供极大的支持。非程序员的普通用户可以方便地创建连接器,并在Web数据源的连接机制、查询接口等发生变化时,快速地对其连接器进行更新,从而确保跨库集成检索系统整体的健壮性和适用性。
其他文献
金港~?榄香烯注射液为我国学者自主研发,具有独立知识产权的抗肿瘤植物化学药,系从传统中药莪术(温郁金)中采用先进工艺提取制备而得,有效成分明确。榄香烯注射液获得国家食
图书馆是一个信息服务机构,它发展的最终目的就是最大限度地向用户提供优质高效的信息服务,满足社会对信息和情报资源的特定需求。信息领域每一次理念和技术的变革都会引起图
正确判断哪些信息应该予以关注或忽略的能力,以及对重要的信息进行组织与传播的能力,已逐渐成为了企业核心竞争力的重要组成部分。为了对企业所需信息进行合理的搜集、筛选、
学位
本文在前人研究的基础上,以辩证唯物主义和历史唯物主义为指导,充分运用档案学、民族学等学科理论和方法,对云南少数民族历史档案的开发利用研究进行了系统的探索,以期对云南少数
摘 要:在企业和项目两个维度,从制度建设、考核体系、公路施工项目成本要素等方面,提出降本增效的建议。  关键词:制度;考核;管理;降本增效  中图分类号:F275 文献标识码:A 文章编号:1004-7344(2018)23-0275-02  现阶段国内公路市场趋于饱和,工程预算公开透明,营改增实施,安全环保等管控加强,大力推行EPC、PPP项目代替传统项目,公路施工企业传统管理模式面临前所未有的
由网络所带来的话语权力的回归以及公民参政议政的实践无疑是有着极其重大的积极意义的,网络舆论所带来的自由与民主对于中国社会的进步起到了不可小觑的推动作用,但竞相出现
学位
Jacobs在1991年首次报道腹腔镜结肠切除术,其后多项研究证实腹腔镜结肠癌根治术与传统开放手术可获得同样肿瘤学效果~([1])。2009年,Hohenberger等~([2])提出完全结肠系膜切
党中央提出,企业要成为技术创新的主体,在支持鼓励企业成为技术创新主体的过程中,除了经费保障、人员保障、制度和法律保障之外,信息保障也极其重要。   论文采用问卷调查、实
自存储是实现公共资助科研成果长期保存与开放存取的一种重要且易行的途径,涉及科研人员与出版商之间的关系,以及科研人员内部(作为科研成果生产者与使用者)之间的关系。公共资
本文从电子商务网站的实际应用出发,运用理论研究、调查研究和案例研究的方法,通过调查和用户实际操作反馈,发现电子商务网站设计中的不足,针对问题进行分析和研究。运用信息构建