论文部分内容阅读
信息资源的开发和应用经过了多年的努力取得了巨大的成果。信息资源管理系统的发展经历从单机到小规模部门,从小规模部门向更大区域的应用的前进轨迹。信息资源彼此的关联性质也决定了只有在更大领域上的广泛共享,才能发挥信息资源最大的作用和能力的特性。信息资源的共享需要技术手段实现,同样也需要不同群体对概念的含义能够有共同的理解。通过计算机进行资源管理的更进一步的内容是:我们需要计算机能够在通用的领域内成为智能化工具来协助我们处理一些工作,智能化的含义是计算机能够在无需人工的交互,动态的、准确的和完整的将需要办理的复杂工作的方方面面处理好。这种智能化的实现需要很多知识,并且要求计算机也应该能够理解信息资源的含义。TimBerners-Lee于2000年正式提出SemanticWeb概念和体系结构。将一直停留在语法层面的信息资源管理通过SemanticWeb体系展现语义,扩展成为语义层面的信息资源管理。
为促进政务信息资源的广泛的共享与利用,国家规划了用以实现此任务的信息资源目录体系与交换体系。当前目录体系架构中存在两个技术问题尚待解决。这两个问题分别是,目录信息如何采集和如何搜索。这两个问题可以是数据格式转换和信息检索(IR)领域的问题,它们成功解决都取决于目录信息(知识)表现形式。将目录信息的表现形式定义在语义网的RDF和本体之上,通过相对成熟的信息检索技术和数据格式转换技术与语义网概念和技术相结合,试图寻求目录体系的技术问题的解决办法是本文要阐述的主要内容。
本文首先对语义网的概念、数据模型、基于本体和描述逻辑的知识推理的方法及其应用进行研究,给出信息资源的语义检索方案。然后介绍了非结构信息管理系统体系结构之中的概念和框架,给出目录信息采集的方案。之后展现语义网架构下的信息资源管理的目录体系的整体机构,力图将语义扩展的目录体系框架进行完整的描述。最后将基于语义扩展的目录体系框架的软件系统的构建过程和使用方法通过一个原型系统赋予实践。在原型系统的实现过程中采用辅助的软件工具和设计模式,力图表现这些开源开发工具和软件开发模式为软件系统的建设所带来的方便性。