论文部分内容阅读
在传统资源管理方式下,由于信息资源缺少统一的语义描述,用户难以查找到与需求相关的资源,难以实现相关资源的语义融合。如何使被管理信息资源具有应用程序可理解的含义,方便用户查找到与需求相关的信息资源,并根据信息资源所具有的领域知识,实现信息资源的语义融合,这些都是信息资源管理所面临的问题。
本体(Ontology)作为共享概念模型的明确形式化规范说明,能够以一种明确的、形式化的方式表示领域知识,提高异构系统之间的互操作性,促进知识共享。资源描述框架(RDF)是基于模型理论的具备BNF形式语法的系统,是一个完备的、可靠的、完整的形式化系统。这些保证了RDF描述语义推理的形式正确性,保证了应用程序对RDF描述的特定领域本体正确的语义理解。
基于RDF技术构建的特定领域本体,通过建立概念和概念之间的继承、实例以及多种约束关系,可以表达高度共享和重用的特定领域知识。通过RDF技术可以将特定领域本体应用于XML数据文件、HTML页面或者WebService的语义描述中。把描述信息结合RDF语义规则进行正向推理,将描述的隐含语义显式化,得到描述资源的语义闭包,为机器提供对所描述资源可理解的语义,达到对资源语义正确理解的目的。
本文的主要工作正是在RDF的基础上,开展本体知识的表达和本体管理器的研究,并且设计和实现了本体管理器。
本文的主要创新点如下:(1)针对法轮功领域,利用符合W3C组织标准的RDF技术构建了特定领域本体,将本体以程序可读、可理解的形式化方式表示出来,达到领域资源共享和应用的目的。
(2)对法轮功领域中所选取的词汇进行分析时,利用情感倾向度计算方法,将计算词汇在语义上所表达的情感倾向度应用到本体抽取词汇的褒贬性的判断中,更加准确的判定特定领域词汇的褒贬性。
(3)利用HP公司的语义万维网应用开发框架——Jena,开发了基于资源描述框架RDF的可支持中文字符的可视化本体管理器。该管理器除了具有对本体进行修改、更新、查询等功能外,还可对导入的本体文件进行解析推理以导出本体应用所需要的知识,达到高度共享和重用这些特定领域知识的目的,并应用于实际的邮件过滤器中。