论文部分内容阅读
当今是知识爆炸的年代,知识和技术密集型产业将取代劳动密集型产业。在后工业化社会中,社会的主要功能从生产和制造货物转向了知识经济。自1977年美国斯坦福大学计算机科学家费根鲍姆教授(B.A.Feigenbaum)在第五届国际人工智能会议上提出知识工程的概念以来,作为对知识社会和知识经济的应答,知识工程在管理科学和信息科学领域都取得了长足的发展。知识工程以知识工程师为主体,针对依赖专家知识或者领域专门知识才能求解的应用难题,经过面向专家或者可靠知识源的知识获取,实现科学的知识表示、知识推理和知识管理,最后通过知识的有效利用以解决实际的知识依赖型问题。知识管理是将知识资源作为一个可“管理”的资产的管理科学,它是一种对机构信息资源和知识资源进行系统化管理的科学,通过有效的知识组织和处理,创造新的知识资源,提高知识用户生产活动的效率。可见知识工程和知识管理具有密不可分的关系,它们在技术上是统一的,包括知识收集与分类技术、知识存储与标记技术、知识搜索技术和辅助的知识传播和使用技术。现有的知识工程和知识管理技术大多是基于数据的语法级知识表示形式,导致了知识推理困难,也使得知识的应用受到极大的限制。究其根本,知识的表示缺乏语义支持且形式化程度低,因而无法实现自动推理,使得知识使用的效率指数级下降。近几年,语义Web技术的兴起推进了基于语义的知识表示技术的发展,语义Web主要基于XML、RDF/RDFS和OWL等语言,并在此基础上构建本体和逻辑推理规则,以实现基于语义的知识表示和推理,使得计算机能理解和处理Web信息,本体描述方法及工具的出现使得领域知识的形式化和可共享的语义表示成为可能。针对知识工程和知识管理研究领域的实际应用需求、研究现状和存在的问题,本文主要围绕知识获取、知识管理和知识运用三大重要环节,提出一个基于本体的知识获取、管理和应用架构OKAMA,该架构以本体为核心,以面向Web文本和工具书文本的知识半自动获取、基于本体的知识管理和基于语义的查询及知识挖掘为主要实现技术,着重研究并实现了面向Web的半自动知识获取算法、文本自动结构化处理算法、领域本体的概念体系、属性体系和公理体系创建、概念语义相关度和贴近度计算和知识挖掘方法等关键问题。最后,给出了一个OKAMA系统的实现原型,构造了心血管疾病领域的知识库和专家系统。论文的主要工作如下:提出一种基于本体的知识获取、管理和应用架构OKAMA,并详细阐述了各个功能模块的组成。该架构的最大特征是全部采用本体进行语义支撑。针对工具书和Web页面文本分别阐述了知识获取过程。根据Web文本的特征,给出了一个面向Web页面文本的上下位概念获取方法,实验结果(支持度和可信度)分析表明该方法的有效性,并采用RDF/RDFS构造子作为本体的形式化表示方式。给出了面向工具书文本的知识获取方法,并着重设计了文本结构化算法和基于消解反演的知识一致性检查方法。给出了心血管疾病本体的概念和属性体系结构,并详细阐述了本体中公理的构造方式;然后分别提出了面向心血管本体的语义相关度和相似度计算问题。对于不完全信息,灰关系分析能够用于度量这些样本间的相似性,故本文应用灰关系分析诱导的相似性度量于模糊聚类中,从而提出了基于灰关系分析的模糊聚类方法。分析了灰关系和核机理论之间相似性后,本文又由灰色理论中的灰关系衍生出一种新型核——灰关系核,同时,也由核机理论中的核诱导出一种新的灰关系度量,从而构建了两者间的一条双向通道。从实现角度看,本文研究了基于语义的知识库查询的方法和实现,提出了一种本体统计相关性与语义相关性相结合的关联规则挖掘方法。该方法以关联规则挖掘为目标,首先建立领域本体,并集成一个更为通用的本体系统辅助关联规则的挖掘,然后综合考虑本体的统计相关性和语义相关性定量计算规则相关度。最后,应用客观兴趣度和主观兴趣度约束无趣规则的产生。通过本文的研究,获得了一整套的多领域通用的基于本体的知识获取、知识管理和知识运用方法,该方法最大进步意义在于在知识管理和知识工程的全过程提供了语义支撑,这一整套方法体系可以规范化推广应用于其它领域。