大规模语义数据的分析存储方案研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:sjuser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语义Web和Linked Data运动的发展,语义数据规模变得越来越庞大、涉及的领域也越来越宽广,并且有的数据集已经出现多个版本的演变,这就使得大规模语义数据的分析和存储面临着巨大的挑战。一方面,本体的规模增长和版本的更新需要一种简单有效的分析方法,帮助人们认识本体内部的变化情况,简化维护和管理本体的过程。另一方面,语义数据海量的增长使得传统的基于HDD的存储策略的读写速度难以满足人们的需求,需要更加有效的存储策略提升原有数据存储系统的读写速度,进而满足RDF数据的快速存放和高效查询。本文首先提出一种基于本体指标的本体版本演变分析方法。该方法使用一种图结构转化规则,将本体的描述与公理转化为一张有向图,利用这张图的结构描述已有的Ontology层和Class层指标,并设计Property层上的4个指标。而后抽象出分析本体版本演变规律的过程,提出一个本体版本演变分析算法,选用版本更新较为完整的OpenGALEN和OpenCyc本体作为数据集,对多个版本下的本体指标进行度量。同时,针对大规模RDF数据的存储提出了一种基于SSD和HDD的动态混合存储方案。在本方案中,首先分析系统中数据模型的生成和操作方式,将原有数据模型按照加载顺序分置在SSD和HDD之上,以支持数据的快速读写,而后采用改进的最近最少使用策略,结合数据模型原有的分片技术,周期性地扫描并将使用最少的数据模型置换出SSD,进而优化原有系统的I/O性能,最大限度的利用SSD和HDD的特性。通过分析和讨论实验结果,证明利用本体指标分析本体内部结构变化,能够发现本体指标变化所表现出的本体版本演变的规律,简化了人工观察分析本体的过程。同时,在同等硬件和数据集的情况下,本文提出的混合存储策略具有良好的数据加载和查询性能,相比传统的单独存放于HDD的数据存储策略性能提高约20%到25%。
其他文献
云物流是一种基于物联网和云计算技术的物流服务新模式,它为资源整合与优化配置提供了一种新的思路。为达到上述目标,本论文提出了一种基于云物流资源虚拟化与服务组合的两阶段
随着我国国际影响力的迅速增强,越来越多的外国友人开始学习汉语。虽然孔子学院和各种汉语培训机构在世界各地迅速崛起,但无论是学校数量还是面对面的传统教学方式,都远远不能满
下一代网络中的业务执行环境主要负责为各种增值业务逻辑的执行提供运行环境,并为业务的管理提供支持。随着下一代网络业务种类数量的丰富,根据业务用户的个性化需求,运维人
路径规划是移动机器人研究领域的一个重要问题,它控制机器人在环境中按照预定的路径运动到目标点。本文以AS-R移动机器人为背景,对移动机器人的路径规划问题进行了研究。本文
随着机器人技术的不断发展,服务机器人的应用领域越来越广泛,除了工业、农业等传统领域外,其在医疗、文娱、家居等诸多环境中得到了广泛应用;同时人们对生活质量的要求不断提
随着互联网的普及和宽带技术的发展,以P2P对等网络技术为核心的软件产品正在为越来越多的网民所接受和喜爱。自2000年开始,国内外多家P2P软件产品产品纷纷问世,其中以国外Nap
数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,它引起了科学界和产业界的广泛关注。数据挖掘的主要目的是从数据集合中发现隐含的、事先未知的、对决策有潜在
蚁群算法是一种最新发展的模拟昆虫王国中蚂蚁群体觅食行为的仿生优化算法,该算法采用了正反馈并行自催化机制,具有较强的鲁棒性、优良的分布式计算机制、易于与其它方法结合
随着社会信息化的不断深入,对网络带宽的要求与日俱增,而目前广泛使用的接入网技术如数字用户线路(xDSL,Digital Subscriber Line)、电缆调制解调器(CM,Cable Mode)的带宽已无法
人脸是人类最具表达能力的部分,其复杂的特征组成造成人脸建模一直是计算机图形学领域中一个极具挑战性的课题。基于颅骨的三维人脸建模技术是三维人脸建模技术的分支,主要应