SMap:基于语义的关系数据库模式与OWL本体间映射方法

来源 :第29届中国数据库学术会议 | 被引量 : 0次 | 上传用户:li359990774
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  伴随语义网的发展,语义网本体数量激增。然而万维网上绝大多数的数据仍存储在关系数据库中。建立关系数据库模式与语义网本体间的映射是一种实现两者之间互操作性的有效途径。因此,提出了一种基于语义的关系数据库模式与OWL本体间的映射方法SMap,包含简单映射发现和复杂映射学习两个阶段。在简单映射发现阶段,首先通过逆向工程规则将关系数据库模式和本体中的元素对应地分为不同类别,再为每个元素构建虚拟文档并计算它们之间的相似度,其中针对不同类别的元素设计了不同的虚拟文档抽取方案。在复杂映射学习阶段,基于已发现的简单映射以及重叠的数据库记录和本体实例,自动化地生成训练事实数据,然后运用归纳逻辑编程算法学习出多种类型的基于Horn规则的复杂映射。真实数据集上的实验结果表明,SMap在简单映射发现和复杂映射学习上均明显优于现有的关系数据库模式与本体间映射方法。
其他文献
随着定位技术在很多领域的应用,越来越多的应用系统服务器中开始存储大量的定位数据,而如何对这些定位数据进行聚类分析日益成为一个研究热点。针对以轨迹片段表示轨迹局部特征存在的问题,引入了以轨迹点表示轨迹局部特征的思想,并在局部位置无关概念的基础上,提出了一种有效的轨迹片段聚类算法。该算法利用R-Tree和局部位置无关的角度快速找出代表性轨迹点,并进一步获得轨迹片段聚类。实验结果也表明该算法比现有流行算
通过机器学习等方法发现数据库系统用户的合法行为模式,并据此对用户提交的数据库请求实时进行检测是一种主动的深度防御机制。依据结构化查询语言(SQL)的语法结构和语义特性,设计了适用于组合攻击检测的SQL语句模型,并依据SQL操作对象的层次性,引入SQL操作泛化,给出了一种通用的基于SQL操作序列的用户行为模型。分析了引入SQL泛化后,BIDE算法位置拓展检验和BackScan剪枝判定的合理性,提出了
提出了一个有效的基因差异共表达模式挖掘算法:DiPattern,从两个真实的基因表达数据中挖掘出具有差异共表达特征的行常量基因。该算法使用样本范围支持度来衡量具有关联性的基因组,同时提出了3种在真实数据环境下基因之间共表达关系,并根据差异表达支持度来衡量基因模式的共表达差异度。为了提高挖掘效率,DiPattern使用了有效的剪枝策略,使得算法可以不产生候选集挖掘出所有最大行常量基因差异共表达模式。
变异测试是一种基于缺陷的软件测试技术,在近四十年得到国内外学者的广泛关注,并取得了一些研究成果。对已有的研究工作进行总结,将其分为变异测试原理、优化和应用三个模块。其中在变异测试原理模块中,给出变异测试的基本假设,对变异测试分析流程进行介绍,并对其中的重要概念依次给出定义,从静态检测和动态检测两个角度对等价变异体检测技术进行总结。在变异测试优化模块中,从变异体选择优化和变异体执行优化两个角度对已有
非手部手势是手语表达中不可缺少的一部分,头部运动的实现并与手势进行协同表达是其重要研究内容。对真人手语表演数据中的手势与头部动作之间的关系进行了深入研究,提取二者的动作特征,利用核典型相关分析方法(KCCA)建立起手势与头部动作之间的预测关系模型。动画合成结果以及评价实验表明,KCCA方法能更好地刻画手势与头部动作的协调性,实现虚拟人行为动作合成的逼真性。
世系记录了数据产生和演化的过程,基于世系信息计算不确定性数据查询结果的不确定性,可提高处理的效率.贝叶斯网是不确定性知识表示和推理的基本框架,以有效支持基于世系的概率推理和查询处理为目标,本文利用布尔公式、逻辑蕴含和图模型的性质及等价转换机制,将不确定性数据的世系表达式等价地转换为BN,并基于BN的概率推理回答查询,设计并实现了LBNS这一基于BN的不确定性数据世系表示和查询处理系统.首先介绍了L
综合利用了SURF算法和RANSAC算法各自的优势,提出了一种SURF算法和RANSAC算法相结合的遥感图像匹配方法。首先利用SURF算法提取特征点并进行预匹配,然后用RANSAC算法剔除误匹配点对,解决了SURF算法中存在的误差匹配和错误匹配问题。通过实验验证了所提算法的有效性,并且该算法在实际应用中也取得了良好的效果。
空间近似关键字查询包含一个空间条件和一组关键字相似性条件,这种查询在空间数据库中返回同时满足以下条件的对象:1)对象的位置信息满足查询中的空间条件;2)对于查询中的任何一个关键字,对象中至少包含一个关键字与其相似度大于给定阈值.随着当前数据的爆炸性增长,空间数据库无法完整地存放在内存中,因此空间数据库需要支持空间近似关键字查询的外存索引.目前,还没有在外存中支持精确的空间近似关键字查询的索引结构.
现有轨迹相似性度量缺乏对时空语义和时间随机性的考虑,不能有效地区分移动对象的社会角色。为解决这一问题,做了如下工作:1)提出了时空关联语义(spatial-temporal associated semantics, STAS)的概念,解释了轨迹的语义相似性规律,即两条轨迹的语义相似性与其在某时段内经过同类型区域的概率正相关;2)提出了时态熵(temporal entropy)的概念,度量了轨迹经
对于社交网络影响力最大化问题,Kemple和Kleinberg提出了有较好影响范围的贪心算法,但是KK算法的复杂度非常高,并不实用。利用线性阈值模型提出了一种基于节点激活阈值的启发式算法。它综合考虑了节点之间的影响力和节点的激活阈值,根据每个节点在激活过程中动态变化的阈值来计算PIN值,启发过程中,每一次都选取PIN最大的节点作为种子节点进行激活,贪心阶段中再贪心地挑选那些具有最大影响范围增量的节