基于元数据的跨库文献检索方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:haisangpiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络资源的爆炸式增长,特别是图书情报领域,数据库资源的种类和数量越来越多。由于各个数据库都有其独特的界面、网站结构、认证方式,用户在使用时往往需要从头开始熟悉数据库的使用方法。而且不同数据库的内容往往呈互补的关系,因此用户查找资料时经常会从一个数据库到另一个数据库逐个查找。为解决这些问题,跨库检索系统应运而生。跨库检索系统往往采用B/S模式运行,向用户提供一个统一的检索接口。用户在这个检索入口内输入检索要求,系统会同时从各个数据库内检索数据,将命中检索结果分组、排序后呈现给用户。目前成熟的跨库检索系统主要基于元搜索引擎、数据整合、中间件技术等三种技术方式实现。这些系统有的运行效率低;有的不开放数据共享接口;有的配置复杂,难以维护;有的数据描述不规范,难以交换数据。   本文提出了基于元数据仓储的跨库检索系统模型。元数据是“关于数据的数据”,是描述一个具体的资源对象,并能对这个对象进行定位、管理,且有助于它的发现与获取的数据。DC核心元数据集,从产生开始就引起了各个领域广泛的研究兴趣。经过多年的研究发展,DC核心元数据集已被多个国家的多个组织,作为其领域描述资源对象的基本元数据集。中国数字图书馆标准规范建设项目也将DC作为数字资源对象的基本元数据集,并针对不同的文献类型的特点加以扩展。跨库检索系统中的资源类型很多,有期刊论文、会议论文、学位论文、电子图书、报纸等。因此,要充分考虑到各类型资源的共同点和不同点,又要考虑到跨库检索系统的主要功能不是保存数据、共享数据,最重要的是检索数据,统一检索分布、异构的庞大复杂数据。为此,我们将使用的元数据分成核心元素、资源类型核心元素、检索辅助元素三个层次。元数据应用纲要模型思想的重要内容,就是设计资源元数据结构时,尽量从通用元数据规范中找到需要描述和管理的元素的对应实体,利用这些实体来构建自己的元数据规范框架。在设计跨库检索系统元数据框架时,本课题充分借鉴了中国数字图书馆标准规范建设项目关于各类文献的元数据规范定义,对常用的期刊论文、学位论文、电子图书这三类文献,具体分析了他们的特点,并给出了详细的元数据规范定义。最后讨论了基于元数据仓储的跨库检索系统的框架结构,并着重讨论了数据库设计和搜索引擎两个核心问题,并进行了测试。
其他文献
Web服务是一种新型的软件泛型,它具备松耦合、高动态性和可重配置等特点。Web服务组合通过为成员服务制定工作流程来实现具备复杂业务处理能力的组合服务,同时满足了用户不断变
随着通信技术的不断发展,移动通信越来越重要,人们对移动通信的要求也越来越强,随之而来的就是移动通信技术的飞速发展,Ad hoc网络就是在这种情下况应运而生的。Ad hoc网络是
随着数字音视频技术的日益发展,能够在同一硬件平台上实现不同的音视频功能成为其发展的一大方向。本文从可重构的角度研究数字音视频技术能够运行在同一硬件平台上从而实现不
学位
计算机视觉的研究仅通过短短数十年的发展已经成为了当今计算机科学,尤其是人工智能领域一个格外引人瞩目的方向,呈现一派欣欣向荣之态。其中,既包括图像处理在实际生产、生
在现代软件开发和维护过程中,软件项目的需求往往处于持续的演化过程中。传统的瀑布模型所要求的固化的需求通常不能适应激烈的软件行业竞争和软件开发现状。因此,面对软件开
随着P2P网络和多媒体技术的日趋成熟,流媒体技术的应用和研究也取得了长足的进步。由于流媒体数据量大,对网络带宽要求高,传统的组播方式难以满足需要。应用层组播能够在终端
随着数字多媒体技术和因特网的快速飞跃发展,信息尤其是多媒体数字信息的传播交流达到了一个空前的强度和广度。数字多媒体信息便利传播处理的同时,也给数字媒体作品的版权带
随着信息技术的快速发展,工业无线网络技术成为继现场总线之后自动化领域新的研究热点。工业无线网络技术以其灵活性强、扩展性强、成本低和能耗低等特点,能有效降低工业测控
工作流技术是实现业务过程建模、分析、优化、集成与管理,并最终实现业务过程自动化的核心技术。随着信息技术的迅速发展,将业务流程用计算机实现的工作流系统的应用越来越广