论文部分内容阅读
随着数字化技术的发展,通过各种途径获得、地理上分布存储的各类异质异构领域数字化信息正以几何级数飞速增长,而如何有效地发现并利用存在于这些数据资源中显式和隐含的知识,实现资源协同共享,是一个重要的研究课题。目前,知识网格的研究得到了较快的发展,与之紧密相关的本体则以其对概念模型的明确的规范说明而作为一种知识重用、共享和建模的重要工具,并成为其重要研究内容之一。虽然已建立了一系列构建本体的方法,涌现了众多理论、技术、表示语言和工具,但是,这些构建本体的理论和方法耗时、费力,而且容易出现倾向性错误,及时动态更新也很困难。因此研究如何从现有信息源,包括文本、词典、遗留知识库等,获取领域知识、以半自动/自动方式构建并扩充本体,是开发本体的理想和有效途径,而KDD技术为本体的规模化和应用指明了方向。该论文首先总体阐述本文采用的领域本体构建思想,从本体框架设计到丰富完备本体,每一次本体的丰富、扩充都是在本体指导下循序渐进地进行,以减少人工参与的程度。同时在建立领域概念体系的基础上提出了关于领域本体的框架建设策略,并通过对领域信息的提取、建模以及利用概念分层理论进行领域本体的自动框架建设。其次,该论文利用KDD中聚类、分类技术提出了对领域本体概念体系进行拓展的方法。该方法先对传统聚类算法进行改进,在本体的基础上,结合领域特定问题,提出了一种在粗糙概念聚类的基础上对领域概念进一步精确聚类方法。然后通过拓展文本聚类中的索引词获取领域内的概念并结合改进的可变相似性度量近邻传播聚类(AP-SVM)进行粗糙概念聚类;最后在领域本体指导下进一步精确概念间的层次关系,实现领域本体概念体系的完善。再次,该论文提出了采用多维关联规则技术扩展本体规则方法,通过对本体规则提取,在本体指导下的一致性处理,规则映射的建立,以及对概念本体的重新识别和更新等技术和方法充实和扩展概念本体。实验结果表明本文提出的方法易于实现且具有较高的可行性和有效性。最后论文从知识表示层面提出了一种基于知识等价映射的知识重用方法解决对已有异构知识的重用问题,该方法通过语义等价提取以及语义映射解决本体构建过程中对已有知识的自动重用问题。实验表明该方法具有较高的可行性和有效性。该项研究内容对于领域本体构建具有重要的理论指导意义,其研究成果具有较大的实用价值。