论文部分内容阅读
近年来,随着全球信息与互联网技术的迅速发展,医学信息化得到了快速的进步,医学信息科学已成为当今信息研究领域的重要分支。医学领域经过多年的发展,已经形成了完备的知识体系,但随着全球信息化的深入及知识发现等概念的提出,传统医学在发展过程中缺乏规范化的问题也逐渐显现出来,医学资源缺少知识层面的统一描述给未来的医学领域的信息共享和研究带来了极大困难,所以建立医学领域的语义层次的知识体系及系统就显得尤其重要。本文分析了国内外对于本体及信息检索领域的研究现状,简要阐述了本体的理论和相关技术,建立了高血压领域本体且定义了推理诊断规则。结合HowNet中义原的语义距离、密度、深度,提出了一种多因素混合的相似度计算方法SCMMM:结合概念距离、深度、信息容量,又提出了一种多因素混合的相关度计算方法RCMMM。接着,在上面的基础上,本文构建了一种基于高血压本体的语义检索模型,该模型的基本思想是通过相似度计算将概念或关系规范化来扩充检索的范围;通过相关度计算发现检索内容与推理结果之间的隐性关系,再按照相关度对结果排序并反馈给用户。通过实验证明,SCMMM更合理的使用了义原树的特征,克服了现有的方法中义原位置不能对相似度产生影响的缺点,结果表明本文提出的SCMMM比现有的方法更为合理。RCMMM七单因素的相关度计算方法的结果更为合理,克服了两对概念的边数相同时概念距离相关度计算结果没有区分度的缺点;还克服了信息量相关度计算缺少对本体结构信息利用的缺点。语义检索模型的实验表明相似度阈值与查全率成反比,相关度阈值与查准率成正比。本文的主要内容和成果如下:①分析了本体相关理论,建立了高血压本体并分析和定义了高血压诊断规则。②结合相关文献提出了多因素混合的相似度、相关度计算方法,并通过实验验证了其有效性。③提出了基于领域本体的语义检索模型,并应用语义检索模型实现了高血压临床决策辅助诊断原型系统。