论文部分内容阅读
随着信息技术的蓬勃发展,WEB上的信息资源也呈指数级的飞速膨胀。然而在目前的万维网中,绝大部分有效的信息都只能由人工来理解,用户越来越难从海量的数据中查找自己需要的资源。万维网联盟(W3C)组织倡导的基于本体(Ontology)的语义网(SemanticWeb)是一种能理解人类语言的智能网络,可以使人与计算机之间的交流变得像人与人之间交流一样轻松。所以在不远的将来,语义网能够在互联网中扮演越来越重要的角色。
本文首先简要地介绍了可扩展标记语言XML(eXtensibleMarkupLanguage)、语义网及WEB再工程(Reengineering)相关的知识背景,分别针对XML与WEB本体描述语言OWL(webOntologyLanguage)在WEB信息的表示层面进行研究;然后,在结合了一系列相关技术的基础上,提出了一种能够将WEB信息从当前普遍存在的数据密集型(data-intensive)网站中迁移至本体语义网的技术方案,并将该技术方案与其他研究者提出的方案做了比较,分析了它们各自的优缺点及适用性;最后,设计并实现了适用于本文提出方案的配套工具HTML20WL。