【摘 要】
:
近年来,大数据和人工智能得到了快速发展。当面对海量数据以及高表达性的本体时,推理效率受到巨大的挑战。通过物化方式将推理问题转换为查询问题是当前查询问答推理的主流方
论文部分内容阅读
近年来,大数据和人工智能得到了快速发展。当面对海量数据以及高表达性的本体时,推理效率受到巨大的挑战。通过物化方式将推理问题转换为查询问题是当前查询问答推理的主流方法之一,但是物化方法在结果的可靠性和有穷性上存在限制。本文主要研究了基于本体的合取查询问答(Ontology-mediated Querying,OMQ)问题。与包含有限实例的普通数据库的查询应答相比,OMQ中的关键挑战是处理本体所带来的可能无限大的后果集。本文采用基于纯物化的方法,不需要对查询进行重写,通过合取查询的深度来解决本体导致的物化数据库无限增长的问题。该方法可以在DL-LiteNhorn下保证结果的可靠完备性。当表达性提高时,近似处理可以在保证结果的可靠性的同时尽可能靠近完备性。而且通过线下物化的方式有效降低了查询问答的时间代价。本文开发了有效生成和管理数据库物化模型的技术,并在gOWL原型系统中实现。从系统工程的角度来看,物化方法允许设计模块化架构来集成现成的高效SPARQL查询引擎。实验中通过集成RDF-3X和TriAD来分别实现了单机版和分布式版推理机。通过在真实数据集DBpedia以及人工数据集LUBM和UOBM下与当前先进的推理机进行对比,初步的实验表明,gOWL优于PAGOdA,Ontop和Pellet(加速可达三个数量级)。综上所述,本文针对查询问答推理能力弱以及效率差的问题提出了多步型物化本体模型的方法以及对应框架,有效的提升了推理效率和结果的可靠完备性,将会为本体推理应用于大数据提供新思路。
其他文献
二维sp2碳材料石墨烯具有特殊的结构和电子性质,有望应用到下一代的电子器件、能源存储设备、自旋电子学器件等方面而得到了广泛的关注。而在石墨烯的表面上吸附原子,比如氢原子,可能会完全改变石墨烯的电子性质。氢原子会破坏了石墨烯费米能级处的线性色散关系并打开带隙。氢化提供了一种崭新的方法用于调控石墨烯性质,具有广泛的使用前景。从石墨烯到部分氢化石墨烯和到全氢化的石墨烯,石墨烯由原本的非磁导体演变为铁磁半
伴随着经济的快速发展,人类对能源的需求越来越大,加快开发和利用新型能源的步伐、提高已开发和投入使用的能源的利用效率,已成为当代研究的重要课题。在我国,建筑能耗是所有能耗类型中最大的一项,而采暖能耗在建筑能耗中占据极大的比例。因此,合理利用建筑储热材料、提高储热材料的性能,是降低建筑能耗、实现节能减排的重要方式。熔盐是一种易得且高效的传热储热材料,目前已在商业化太阳能热发电等方面广泛应用。同时,以相
铁电金属材料是一种同时具备金属导电性和铁电性的材料。众所周知,根据库仑定律,晶体内部的静电场会被能自由移动的巡游电子所屏蔽,所以具备金属导电性的材料不可能同时具备铁电性。然而安德森和布伦特在1965年的一篇文章里提出:根据朗道相变理论,铁电相变是可以在金属性材料里出现的。在之后的半个世纪里,尽管有几种材料被认为可能具有铁电金属的特性,比如V3Si、Nb3Sn还有Cd2Re207,但最终它们都被实验
土地的合理利用直接关系到社会的可持续发展,土地数据的快速获取与精准测量是土地管理、土地规划编制及土地整治的重要前提。针对传统土地调查技术需要大量外业操作费时费力的问题,本文致力于研究一种基于无序图像的三维重建技术。主要研究内容如下:(1)提出了一种基于自适应邻域测试的图像误匹配点剔除算法。针对以往特征点匹配比率测试算法获得的匹配点不能兼顾匹配正确率与匹配数量的问题,设计迭代高阈值比率测试方法初步过
保险公司作为大型企业,通过卖出保单和投资金融市场获得盈利。同时,它们也面临着各种风险,比如赔付风险和市场风险。风险过大时还会导致破产。如何控制风险成为保险公司资产
随着移动互联网和移动设备的普及,图像已经成为人们日常生活中最主要的信息交互方式之一。在国防军事、工业医疗和城市建设等领域也充满了各种各样的图像数据,高质量的图像更
微型真核生物指单细胞真核生物,其种类繁多,大小、形态、功能各异。微型真核生物在生态系统中作为初级生产者、消费者、分解者,同时作为连接微食物环与传统食物链的重要组成
在生物数学领域中,Lotka-Volterra模型是一个经典的数学模型。它有近百年的历史,至今仍有很大的活力,引起众多学者对其关注、研究。经典的Lotka-Volterra模型学者们己经研究得比较透彻。但是带有收获项的Lotka-Volterra模型,在现有的文献中研究的并不多,一般仅研究带有常数收获项的情形。研究带有扩散项的Lotka-Volterra模型更是寥寥无几。本文主要通过微分方程定性理
软件缺陷预测技术通过对软件历史数据进行分析,利用分类、排序等模型,识别潜在有缺陷的软件模块。软件缺陷预测模型构建过程中,有缺陷样本数远小于无缺陷样本数,且分布不均匀,存在严重的类间不平衡和类内不平衡问题,这两种情况都会对构建预测模型产生负面影响。为了减少数据不平衡对预测模型的影响,在软件缺陷预测模型构建的四个阶段都存在相应的方法对数据不平衡进行修正,包括数据采样、特征提取、分类器优化以及评价标准。
角蛋白是一种可再生、可生物降解、价格低廉,而且容易获得的非食物性蛋白质。废弃的羽毛、羊毛、头发、指甲及动物角蹄中均富含角蛋白,但大多被焚烧或掩埋等方法处理,这不仅