论文部分内容阅读
在科学技术飞速发展的今天,大量的信息向我们涌来,海量的信息激起人们去探索和发现知识的欲望,以最小的精力成本去获得更多的知识是人们内心的所向往的。获取知识的方式和途径有很多种,通过档案资源来学习知识是未来知识学习的发展方向之一,尤其是档案馆藏资源,不仅包含了大量的事实信息,还将社会历史变迁内含其中,是以史鉴今的最好模式。依据国家的档案公开条例,我国绝大多数档案馆都对非涉密档案进行了公开,公众通过查询调档的方式,间接或直接获得档案资源。多数档案馆已经为用户开通了在线查档的功能,但用户通常只能获取到档案的档号、责任者等外部信息,通过将查询到的档号提交给档案馆工作人员,之后通过邮件方式浏览反馈回来的档案。这种方式虽然查准率高,但是效率低下,并且用户如果不明确查找目标,或对需求的描述有偏差,则会引起大量的时间与精力的浪费。为更好的向社会公众提供知识服务,本文将本体理论引入进来,利用本体技术对档案主题进行合理分类和语义关联,降低用户查询知识的门槛,通过语义分析和扩展,让用户利用趋于自然语言的检索式准确定位目标需求。本文利用《中国档案分类法》、《中国档案主题词表》建立馆藏档案本体类目及其间关系,分析类的属性和约束,将馆藏档案的知识结构建立起来,为知识库的合理构建奠定了基础。继而根据档案资源的特性构建知识库表结构,通过protégé、Mysql等软件,将构建的本体和数据库实例化。在捋顺档案馆藏知识库的构建流程即技术需要后,选取吉林省档案馆中吉林省劳动厅这一全宗为源数据集,将其中涵盖的概念体系和知识属性带入构建好的档案知识本体模型,对全宗内知识进行形式化表达。在将知识本体导入Mysql关系数据库后,使档案馆藏资源与本体概念一一映射,形成可供检索和调用的知识数据库。并以档案“责任者”字段为例,通过本文所构建的档案知识本体对数据集进行检索,通过得出的检索结果对比验证本文所提出的基于本体构建的档案馆藏资源知识库。本文利用本体对档案馆藏资源进行了语义知识库构建,讨论了语义分析对知识发现的积极作用。本文旨在馆藏档案本体和语义知识库领域研究都较少的情况下,构建一种以知识服务为根本目标的档案馆藏资源语义知识库模型,为未来的档案馆藏资源开发与利用提供一种思路和研究方向。