论文部分内容阅读
人类信息基础环境已经由传统文献型被网络信息环境所取代,因特网的普及促使网络信息资源急速增长。相应的,网络信息组织与服务的模式也是多种形式并存。当前网络信息服务存在综合信息过剩个性化信息服务不足,信息利用率低以及资源共享性差等不足之处。其根源在于网络信息资源组织方法,信息描述的内容缺乏限制,造成为用户提供个性化和专业化信息存在困难。为了满足用户个性化和专业化信息需求利用新一代网络信息资源组织方法:可扩展标记语言(XML)与资源描述框架(RDF)、概念体系(Ontology)等为所描述的资源提供语义,探讨面向语义的网络信息资源组织方法。 第二章首先回顾传统的情报检索语言中对语义信息的组织方法,借鉴其中对叙词语义关系的处理方法,展开网络环境下语义信息组织方法研究。 宏观上,信息构建(IA)理论指导网站信息组织,IA理论充分考虑了用户与信息环境以及用户与信息内容之间的两个交互过程,强调“化复杂为明细”和“使信息可理解”,从用户角度组织网站信息。IA基本组件之一,“元数据、控制词表和词库”是控制语义信息、将其它组件(组织系统、导航系统、标引系统、检索系统)围绕用户需求无缝结合的关键因素,是整个网站的“灵魂”。信息构建理论体现了面向语义的网络信息资源组织理念。 微观上,分别探讨了可扩展标记语言(XML)、元数据(Metadata)以及概念体系(Ontology)等网络信息资源组织的新技术。相比HTML而言,XML具有链接性好、扩展性好、交互性好、结构性强、语义性强等诸多优点。这使得它非常适合于Web上的数据交换与信息发布,当前XML已经在知识的表示、信息保存和交换等方面得到广泛的应用。不同的信息使用环境需要不同的元数据对网络信息资源进行描述和组织,现在应用较为广泛的是都柏林核心集。元数据具有传统目录的“著录”功能,它能够使网络信息资源的管理维护者及使用者可通过元数据了解并辨别这些信息资源,进而利用和管理资源,是由形式管理转向内容管理的必要前提。元数据在网络信息资源组织和信息检索等方面应用广泛。资源描述框架(RDF)可以帮助网络信息解析器在阅读XML的同时,获得XML所要表达的主题和对象,并可以根据它们的关系进行推理,从而做出基于语义的判断。XML的使用可以提高Web数据基于关键词检索的精度,而RDF与XML的结合则可以将Web数据基于关键词的检索更容易地推进到基于对象的检索。概念体系(Ontology)作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,在知识的表示,信息的组织等方面对语义Web的研究意义重大。它与XML和RDF一起解决语义层次上的网络信息共享和交换。