论文部分内容阅读
随着网络技术日新月异的发展,网络上的数据量呈指数级激增,大多数信息已不再局限于传统的结构化形式,而是以诸如电子邮件、图像、网页、工作流等非结构化形式存在。如何采用统一的方法表示和访问这些非结构化信息,并从中归纳及获取知识是各组织机构实施信息化建设的核心,也是目前一个新兴的研究方向。 XML作为数据表示和数据交换的新标准,具有统一的非结构化信息描述机制,但其在语义表达能力上存在不足,限制了语义异构环境下信息的表示、交换和共享。Ontology技术通过建立领域知识的概念模型,解决了XML语义差异问题,减少或消除概念及术语上的混乱,使得获取那些隐含或不明确的信息成为现实。利用Ontology可以给XML所表示的非结构化信息增加丰富的语义知识背景。 本文提出了一套通用的基于Ontology的访问策略和实现方案作为对非结构化信息访问机制研究特别是语义层次访问的探索和尝试,主要包括下列理论及技术: 1.结合Frame-Logic和SQL语言特点,提出一种新型类SQL数据操作语言Fl-Plus,支持各种数据访问操作; 2.初步设计和实现推理引擎,用以完成推理规则和语义词典的解析映射工作,实现了语义级别信息访问的核心技术,推理引擎的引入帮助计算机识别文档信息的语义,完成智能访问; 3.基于Schema生成的模式约束信息,约束各类信息访问操作,以最大程度保证底层数据的有效性和完整性; 4.针对处理XML应用的瓶颈问题,结合路径优化、Ontology集合访问和JDOM缓冲三大技术,在一定程度上提高了系统处理性能; 5.借鉴JDBC技术,设计了JXSC服务接口,为三层模式的信息访问方式提供支持。 最后,笔者在参与湖北省教育厅科研资助项目——“基于XML的WEB存储系统研究”的研究开发过程中,以上述理论为指导,结合JAVA及XML技术,初步实现了本文所提出的OBSA-AM(Ontology-based Storage Architecture—Access Mechanism)访问系统模型。