论文部分内容阅读
本体是语义Web的核心,其学习算法逐渐成为语义Web的一个研究热点。已有的本体学习工作集中在术语、同义词、概念、分类体系和关系层,而公理层的研究很少。OWL DLP是能够转换为一阶Horn逻辑的OWL DL子集,也是RDFS的超集。Horrocks等人的研究表明,OWL DLP覆盖了大部分语义Web本体。本文选取OWL DLP的部分常用公理,构造了本体学习的测试基准,并提出了一个基于关系的OWL DLP本体学习算法。
研究OWL DLP本体学习算法需要一个合适的测试基准,但现有的数据集都不太适合用于OWL DLP本体学习的评价,因此构造学习OWL DLP本体的测试基准是一个全新的工作。它不仅可以满足本文的需要,还可以为其他研究人员提供一个学习OWL DLP本体算法的公共测试平台。本文构造测试基准的方法是在现有的本体上,通过分离本体的概念层和实例层,得到本体学习所必需的训练样例和评价学习结果所必需的黄金标准本体。当本体实例不能满足学习要求的时候,使用定义生成规则的方式自动生成实例,从而得到比较完备的测试基准。本文构造出了4个测试基准,其中2个的训练样例个数超过10万。
为了验证这4个测试基准是否可以为本体学习提供必需的训练样例,本文提出了一个基于关系的OWL DLP本体学习算法。该算法首先基于关系学习从断言集合学习一阶Horn子句集,再将一阶Horn子句集转换为OWL DLP本体公理。在学习规则集时,本文改进了经验式ILP算法——FOIL算法,使其在没有反例的情况下也能进行学习。然后通过手工的方式,将所得到的规则集映射到OWL DLP公理。实验结果表明,此算法在本文所构造的测试基准上具有较好的精度和召回率,验证了本文构造出的测试基准可以满足学习算法的需要。