论文部分内容阅读
信息技术高速发展,信息化建设对于医学领域知识的交流促进作用日益显著。医药卫生信息化建设的质量,取决于医学信息资源组织的科学性、有效性,而医学领域是一个庞大的学科门类,其中的知识很多涉及到与其他学科之间的交叉,使得领域知识比较繁杂。当前,医学信息资源的应用呈现出网络化的发展趋势,已经构成了海量信息资源,逐渐形成了无法语义识别的信息孤岛,传统的信息组织方式逐渐难以满足现有医学信息传播的需要。语义网技术为解决医学信息资源的共享问题提供了新的方案,它作为面向下一代网络信息资源语义应用的支撑技术,可以使数据以机器理解的形式进行处理和查找,通过一系列的语言、工具和技术,实现计算机之间的数据解释交流。在这些技术中,本体作为语义网的核心能够较好的表达出领域知识的语义层次,语义标注则利用本体将普通的信息资源序化为具有知识层次的形式化信息,使庞大的信息资源以语义关联的规范化形式存在。但是,由于领域本体之间的语义异构情况逐渐突出,使得语义标注的语义富集度受到限制,而顶级本体正是揭示领域知识的高层语义关系的通用知识体系。本文通过本体的创新构建、本体映射及整合、语义标注等工作,探讨具有医学领域顶级本体语义关系结构的本体语义标注工作机制,尝试建立基于顶级本体整合的医学领域本体语义标注系统模型,实证语义标注新思路,探索本体整合对于语义标注效果的促进作用,力求做到从实际出发,研究并解决现实中存在的本体语义应用障碍,进而提高医学信息资源的语义标注水平,推动面向网络医学信息资源的语义应用,促进医学信息资源的共享和知识发现。本文的内容主要围绕以下几个章节展开:第一章介绍了本研究选题的时代背景与技术背景,说明了与本研究有关的理论和技术的发展现状,指出研究的理论及现实意义,并提出研究的目标、内容、方法,并针对研究思路进行规划和布局。第二章对本体整合及语义标注的基本理论和原理进行系统描述,论述利用顶级本体进行整合及语义标注所涉及的主要技术,主要包括本体理论及有关的本体构建、本体映射和集成等有关技术,语义标注理论及相关技术方法等。第三章详细阐述了本体整合及语义标注领域中主流的应用工具、平台,以及近年来出现的新方法、新系统,对其使用的方法、技术进行详细研究,并选取具有代表性的系统进行比较,总结其技术特点与应用方向,为基于顶级本体整合的语义标注系统建设提供依据。第四章针对医学领域信息资源特点,深入研究医学领域中信息资源的结构形式,从语义模型的建立和标注方式选取的角度,分析基于顶级本体整合的语义标注模式。第五章以前文分析为依据,详细设计医学信息资源的领域本体建设、领域本体映射、本体整合及语义标注模型,系统讨论基于顶级本体整合的医学领域信息资源语义标注模型要素。第六章设计并实现了基于顶级本体整合的医学领域信息资源语义标注系统,并引入医学领域顶级本体进行针对医学信息资源的知识本体建设、本体整合、语义标注全过程测试,实证了语义标注方案的可行性,检验了语义标注系统的可用性,并综合探讨了语义标注过程中出现的问题及系统的特性。第七章总结全文所做的工作并得出结论,展望基于顶级本体整合相关的语义标注研究在未来的发展前景。本文实现了对医学信息资源进行基于顶级本体整合的语义标注,实证了医学顶级本体用于领域本体整合及语义标注的可行性。研究结果表明,基于顶级本体整合的语义标注系统是可靠的,采用顶级本体属性结构作为领域本体语义关系基础是具有后处理优势的,基于顶级本体的语义映射与本体整合是可行的,采用整合本体进行医学领域信息资源的语义标注是有效的。从实践层面实现了优化了医学领域本体构建过程,为医学领域本体的互操作提供了新的方案,同时拓展了医学信息资源的语义标注思路,为医学信息资源的高级语义应用打下良好基础。研究所采用的语义标注方法不同于传统以单一本体为模型的标注系统,并区别于当前的多本体整合模式,采用基于医学领域顶级本体语义结构形式的整合本体标注策略,提出了以顶级本体为整合要素的整合本体语义标注模式,并以此为依据建立了医学领域语义标注原型系统,从而探索基于医学本体的语义标注模式新思路,为本体实现高级语义应用提供参考。研究的具体创新点体现为:第一,顶级本体属性结构应用于领域本体构建。采取顶级本体属性扩展的方式表达领域本体的知识关系,以此方式构建的领域本体具有相对统一的语义表达框架,同时能够与顶级本体之间保持良好的交流,促进本体互操作。研究过程中出现的知识术语来源可靠;内容表达采用可自由转换的中英文双语;所构建本体具有顶级本体属性结构特征。第二,顶级本体语义关系参与本体整合。以顶级本体属性框架为基础进行属性合并,在本体概念映射的基础上实现领域本体整合,形成合并本体,以此方式构建的合并本体具有清晰的语义框架,由于语义关系表达的一致性,对于后续的本体整合也具有指导意义。第三,基于顶级本体整合本体的语义标注。相对于传统的单本体语义标注,整合本体具有知识体系更丰富的特性;相对于领域本体间无关联的多本体语义标注,整合本体具有知识关联更密切的特性;相对于单纯映射的多本体语义标注,基于顶级本体整合的语义标注具有知识表达更完整的特性。