描述逻辑公理的统计关系学习方法

来源 :东南大学 | 被引量 : 0次 | 上传用户:xzhtqx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义Web的发展,已经有大量语义Web数据存在。然而许多数据缺少结构和丰富的知识表示,本体的不完备性比较严重。本体学习能够降低本体的不完备性,是语义Web能否成功的关键之一。现有本体学习研究的不足在于:(1)已有的本体学习方法主要采用归纳逻辑程序设计,很少采用统计关系学习方法;(2)已有的本体学习的数据源以自由文本居多,很少从语义Web数据中进行学习;(3)常用的来自于信息抽取领域的本体学习评价标准对黄金标准本体过于敏感。  针对这些问题,本文主要进行以下研究:  1)首次结合描述逻辑ALC与贝叶斯网络,提出一种统计关系模型BelNet+(An Extension ofBayesian description logic Network)。针对使用贝叶斯网络表示BelNet+对网络结构为有向无环的限制,提出了一种链接方向赋值算法。同时实现了利用极大似然法对BelNet+进行参数估计的方法,并且对查询贝叶斯包含/不交公理(对应于描述逻辑中的包含/不交公理)进行了深入探究,提出并验证了查询贝叶斯包含/不交公理成立概率的方法。  2)提出基于BelNet+进行本体学习的方法。由于本体的模式层的公理可能不完备,其对应的BelNet+所定义的贝叶斯网络有可能无法支持有效的推理,由此提出对贝叶斯网络进行结构学习,利用学习得到的贝叶斯网络上进行大量的贝叶斯包含/不交公理的概率查询,从而能够实现公理学习的目的。  3)针对现在本体学习评价方法的不足,提出原有混淆矩阵的扩展,并相应地提出度量函数。同时在多种数据集上通过实验比对所提出的本体学习方法与已有本体学习方法,给出了详尽的相关分析,并且通过使用较大规模的语义Web数据集,充分验证了所提出的噪音探测方法的性能的优越性。  4)提出了一个新颖的利用不交公理学习探测语义Web数据中噪音的方法。由不交公理的语义,通过利用数据集隐藏的不相交概念得到相互冲突的个体类型声明,使得可以再进一步通过分类算法对冲突的个体类型声明进行分类,从而得到数据中的噪音。
其他文献
信息系统工程建设具有投资大、周期长、风险高、技术含量高、涉及领域广的特点,在信息系统工程建设中,很多业主单位(包括政府部门)在实施信息化建设的过程中,因了解和熟悉信
网格是构建在互联网上的一种新兴技术,网格的研究是目前新的研究热点。随着网格技术的发展,Web服务概念的提出,网格技术已渗透到社会各行业。网格的目标是把互联网整合成一台
Job-Shop调度问题是许多实际车间调度问题的简化模型,是一个典型的NP-Hard问题,已被证明在多项式时间内得不到最优值。蚁群算法是近年来兴起的一种优化算法,特别在解决组合优
随着网络技术的迅猛发展和网络应用服务的不断深入,针对网络的攻击破坏,非法入侵等安全事件也在持续增长,而且大有愈演愈烈之势。而传统的基于入侵检测和防火墙的防御方式已
实时系统已广泛应用于国防、航空航天、通信、自动控制等领域。随着实时系统的规模和复杂性的增加,为了更好地理解所开发的系统,从而开发出高质量的实时软件,需要对系统进行
骨髓是人体的主要造血组织,对骨髓细胞形态和数量的分析有助于造血系统疾病及其他某些疾病的诊断和鉴别。传统的诊断方式是由人眼完成的,而这种方法存在很多的弊端。基于图像
射频识别(Radio Frequency Identification,RFID)是一种快速、实时、准确采集与处理信息的技术,在零售、物流、交通、医疗、国防等多个领域有着广阔的应用前景。其中,RFID中
服装CAD系统自二维向三维转变,是三维计算机技术成熟与服装个性化定制的一个必然趋势与结果。在整个服装CAD系统中,三维服装设计是最核心的部分。所以服装的褶皱的设计对提高
水平基因转移(Horizontal gene transfer,HGT),又称横向基因转移(Lateral gene transfer,LGT),是指在不同的生物个体之间遗传物质的交流,即从亲代以外的个体中获得遗传物质的
本文在分析国内外分布式信任模型以及P2P中存在的安全问题的基础上,结合现实世界中的社会关系网络,提出了一种新型的信任模型BGTR以及在此基础上设计了激励机制SOIM。该模型