跨库集成检索系统中数据源的半自动注册机制及其实现

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:ustczhy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提升跨库集成检索系统的实用性,使之能够提高检索效率和检全率,跨库集成检索系统需要更为高效、便捷的异构数据源集成方案。基于虚拟化整合的集成检索系统在模拟数据源检索时,主要涉及查询请求提交和结果处理两个方面,因此本文在优化数据源集成过程的研究中,将数据源半自动化注册视为两个关键问题:查询转换问题,即如何将跨库集成检索系统的全局查询模式正确映射为各个数据源的本地查询模式;数据抽取问题,即如何从异构的检索结果页面中,抽取对本次检索有意义的数据项。   本文借鉴国家科学图书馆Cross Search系统现行的查询转换和数据抽取方式,提出异构数据源半自动注册的解决方案,针对查询转换和数据抽取两个主要问题,设计了数据源半自动注册系统,并对系统的实现方法、关键模块设计及工作原理进行了梳理和分析。同时,利用不同类型数据源对系统的注册效果进行检测,验证系统的可用性。实践证明,数据源半自动注册系统在保证跨库集成检索系统能够正确实现检索功能的基础上,可以提高数据源注册效率,并有效减轻管理人员负担。
其他文献
课堂提问是小学数学教学中进行启发式教学的一种主要形式,是"有效教学"的核心。古语云:学想于思,思源于疑。美国著名心理学家哈尔莫斯说过:问题是数学的心脏。有了问题,思维才有方向
有评论家认为海明威只擅长描写那些具有“重压之下的优雅风度”的男性角色,事实上,海明威成功描绘了具有不同的、个性鲜明的女性人物,真实地记录了每个时代背景下女性的生存
小学数学应用题是基本题型之一,也是综合的题型。多数学生对数学敬畏有加,更不用说应用题了,工程类、行程类等最是学生害怕的,怎么让学生学会解应用题是不得回避的问题。笔者通过
随着外部因素的影响和信息系统本身的发展,商务智能系统对于企业生存发展的战略意义和重要性与日剧增,商务智能系统的绩效对企业绩效的影响力也随之逐渐增强。如何正确认识与评
随着国际互联网的飞速发展,网络对社会、经济、政治、文化的影响日益广泛且深刻。人类社会已经由信息的匮乏时代进入到信息极度饱和的时代。本文在分析国内外信息生态理论研究
约翰 ?多恩爱情诗中的意象充满了矛盾性:既书写一种纯粹的精神之爱意象,又出现追求放纵的肉体之爱意象;有时又强调灵魂之爱与肉体之爱的统一.
国家科研项目是落实科技发展规划、引导科技活动走向、配置科技资源的重要方式和手段。国家科研项目运行中形成和积累的知识是重要的国家战略资源。在国家科研项目管理中引入
近年来,随着社会信息化的发展,人们对信息的知情权也在日益觉醒,因此人们对档案信息的需求正在逐渐从传统的简单的查阅到更为便捷的、利用信息技术的方式查阅的转变。所以,如何使
非物质文化遗产被誉为“民族记忆的背影”。无形的、活态的非物质文化遗产因为传承和保护的特殊性大多数正面临着生存的挑战,这在受到外来经济文化冲击的少数民族地区尤为明显
作为现象和实践的全球教育治理由来已久,但对全球教育治理的基本理论研究尚处于起步阶段.通过对国内外相关文献的分析,可对全球教育治理的概念、主体和机制做出如下的界定与