时态RDF(S)的自动化构建与存储方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:yhmlivefor49
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息技术领域内,时间作为描述数据变化过程的基本维度,是诸多应用程序的重要组成部分。Web是现代信息共享与交互的基本平台,由于用户可以在任意时刻对数据进行编辑与发布,因此网络数据通常具有较高的动态性和时效性。长久以来,时态信息的表示和存储管理都是各项科学研究的重点,其中XML(Extensible Markup Language)作为主要的数据传输和存储语言,相关的时态扩展已经获得较广泛的研究。然而随着人工智能时代的来临,用户对网络的要求已经不仅仅局限于数据共享,人们对网络提供智能数据分析与处理的要求愈加强烈。但是目前使用的网络标准Web 2.0缺乏数据语义的描述,数据的内涵信息必须人工解读,提供智能化服务更是举步维艰。语义Web的出现与发展为此带来了解决方案,其采用的资源描述框架RDF(Resource Description Framework)及模式RDF Schema(统称为RDF(S))能够强有力地表示数据间的语义,从而加强机器对数据的理解,促进人与机器的协同合作。与此同时,语义Web领域内的时态数据处理研究也从未间断过。二十世纪初学者就提出了RDF(S)的时态扩展方案,并给出了具体的蕴含规则及语义推理方法。为促进Web信息语义化进程,本文关注于基于时态XML的时态RDF(S)自动构建,并在观察到时态RDF(S)数据呈指数增长的情况下,研究了基于分布式数据库HBase的时态RDF(S)存储,具体研究内容如下:(1)分析时间维度,提出时间域的表达方式与计算方法。依据选取的时间维度,提出时态RDF(S)、时态XML与XML约束规范XML Schema模型的形式化定义,并且给出时态XML与时态XML Schema的应用方式。(2)在时态模型定义的基础上,分别提出基于时态XML Schema和时态XML文档提取时态RDF Schema和时态RDF实例的映射规则及映射算法,并且设计实现相应的构建原型系统,验证映射方法的有效性与可行性。(3)分析HBase的数据模型与物理结构,提出HBase内置时间模型中存在的问题。并根据时态RDF(S)的数据特性,提出基于HBase的时态RDF(S)存储模型。该模型不仅能够有效存储具有时态特征的RDF数据,并且能够快速响应所有TriplePattern以及层次信息的查询。此外,本文针对该存储模型提出了相应的时态RDF(S)查询方法,并利用LUBM(Lehigh University Benchmark)数据集进行查询实验与结果分析。
其他文献
恒安集团适时对产品进行升级换代,“安乐”卫生巾已由普通直条型扩展为普通、保健、护翼三大系列,拥有标准型、超薄型、旅游型等3O多个不同规格品种系列。 为了能与国际水平
南通市有着"体育之乡"的美称。随着南通市崇川区人口老龄化的速度不断加快,越来越多老年人的心理、生理和生活质量得到社会更多的关注。如何让老年人健康快乐的安度晚年,是我
近些年山东省城市商业银行盈利能力逐年提升,转型发展有序推进。但仍存在竞争力不足、经营绩效较低、业务单一以及内部治理不完善等问题。建议政府加强对城商行发展的扶持,城
目前,资本市场上的并购案例不断增加。文章以科尔尼产业演进理论为基础,以并购动机作为评价并购绩效的标准,选取传媒业作为研究对象,对传媒业的产业演进阶段进行划分,并以属
本文根据著名肝病专家李昌源教授治疗急慢性肝炎的学术观点和医疗经验,结合现代医学对肝病的认识,运用辨证分型的原则,将急性无黄疸型肝炎分为肝郁热,肝郁脾虚两型;急性黄疸
由于我国体育经济发展的起步较晚,人们对于体育消费的文化还未形成,使得我国体育经济的发展还相对较弱。在社会发展转型的关键时期,对中国体育经济发展进行研究对于促进我国
针对红透山矿选矿厂生产实际情况,对影响磨矿效率的磨矿结构、磨矿介质、磨矿浓度、装球率和分级效率等因素分析,在理论上提出一系列提高磨矿效率的办法降低球磨机的介质尺寸
女书是一种自然状态下的文化存在,其表现方式主要是写、读、唱。女书的字形、字音与汉字、汉语方言土话有着复杂的多层面的关系,女书的使用多与精神寄托或宣泄活动有关,形成
学界普遍认为明代妇女的社会地位很低,明代中晚期的商妇作为妇女中的一个特殊的群体,她们的地位并没有一般学者认为的那样低。对传统贞节观念的挑战,通过参与商业活动提高经
羽衣甘蓝属十字花科芸薹属甘蓝种的一个变种。原产欧洲地中海沿岸的希腊等国,在欧洲和北美一些国家栽培历史悠久。近年来,我国从美国、荷兰、德国等国家引进在北京、上海等城市