论文部分内容阅读
本体(Ontology)的概念起源于哲学领域,20世纪90年代以来,人们将本体的概念引入人工智能、知识工程和检索领域,从而使本体概念的内涵也随之发生了变化,在这些领域中,本体研究是关于知识概念表示和知识组织体系方面的研究。本体通常是指一套有关某一学科或某一领域的术语词表,以及术语之间关系的规范和说明。近年来,关于本体的研究与应用呈现出加速度发展的趋势,基础理论更为完善,应用领域更为广泛,技术产品更为成熟.与国外涌现的研究项目和研究成果相比,国内关于本体的研究尚存在较大差距,国内关于本体应用的研究尚处于起步阶段,尚未见到有关国内构建具有推理功能的学科或领域本体系统的报导。本课题以公安执法领域中描述案情的中文文本为研究对象,探讨采用自然语言理解中的文本分类方法,实现根据文本的内容来判别文本类别,给出相应的法律建议。首先在对语义检索部分,我们提出了最短匹配算法,针对检索的结果采用了一种基于本体的语义信息检索模型,避免了传统向量空问模型在语义处理方面的缺陷。根据不同关键字之间的组合利用本体的推理机制,采用Jena开发包作为起推理工具。利用不同关键字之间的语义关联等方面来充分考虑,得到与每个涉案人员相关一些的相关法律条款。并初步构建了一个公安法律文本自动分类系统。