语义Web中RDF数据关联规则挖掘方法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:R845451732
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去几年中,随着人们对语义网和数据挖掘两个研究领域的兴趣已经日益增加,基于RDF数据的关联规则的挖掘方法引起了人们的极大关注,从基本介绍到理论研究,由理论探讨到试验与应用,逐层递进,不断深入。然而,很少有人做挖掘语义网数据本身的工作,也就是语义网数据挖掘的工作。RDF数据挖掘技术也已经应用到了许多领域,我们坚信该研究会给许多特定领域的研究活动带来很大的益处,例如临床和牛物医学领域,除此之外还能应用于许多其他涉及复杂的、异构的数据的一些领域。  本文主要通过了解语义网数据挖掘技术的相关知识,然后进行统计数据整理,分析语义网数据挖掘技术在临床和生物医学中的具体应用,以及在实际应用中存在的问题和解决方法,包括以下几个方面的内容:  首先是理论基础,主要包括RDF数据模型,模式定义语言RDFS,本体描述语言OWL,以及SPARQL查询语言的介绍。然后是数据挖掘的过程,用户要根据扩展的语法来指定挖掘的模式后根据用户已经指定的挖掘模型来产生事务,并将得到的事务集使用传统的关联规则算法来进行处理。接下来是生物医学领域的关联规则挖掘,本章将要通过实验来证明我们的方法能够将语义网中的数据变成基于语义的事务,最终这些事务集将会产生高质量的关联规则。最后是关联规则挖掘扩展,由于本文关注的是如何将现实世界的信息以三元组的形式表示出来,因此前面章节主要用传统的关联规则算法,在本章中将要扩展几种其他的关联规则算法。
其他文献
我办报和当新闻记者,再加编刊物,前后共十四年。我从事文学活动主要是在报刊编辑工作之余挤时间写的。因此要我在《作家寄语》栏里,给从事记者、编辑工作的青年朋友们,讲一
棉花F_2群体具有广泛的遗传变异,是杂交育种进行单株选择的最好世代。但是,棉花主要经济性状大都属多基因控制的数量性状,由于基因的连锁和多效性,使不同性状间存在不同程度
数据挖掘是一种能够从海量数据中提取有价值信息的技术。它可用于发现隐藏在数据中的聚类模式、关联模式、分类模式等,以辅助人们决策。其中,分类是数据挖掘的一项重要任务,而决
农业部部长助理左叶同志对新闻记者吼了一声“你重要还是我重要?滾出去!”“你重要还是我重要?”新闻記者应当怎样回答这个问题呢? Assistant Foreign Minister Left Yeh s
掖县西由公社王贾大队位于胶东半岛掖县的西北部,地势平坦,土质肥沃,水利条件很好,无霜期为190天,年降水量700公厘左右,盛产小麦玉米,一年两作两收,是掖县的水利精种高产区
今年我们宋郭大队的小麦生产不如去年,1,330亩小麦平均亩产450斤,比去年亩产530斤减产15%%。小麦的减产,有经验也有教训。本来今年小麦从播种到管理,每个关键每道工序,一般过
摄影报道和文字报道一样,记者要反映现实生活,首先得认识现实生活。只有在我们的主观认识上符合客观现实的时候,才有可能反映实际生活的本来面目。而要做到这一点,基本的办
近年来,随着经济全球化进程的不断加快,国民生活水平的不断提高,在新常态下,我国高等教育发展正处于大众化教育阶段,逐渐走向成熟.教育大众化的出现会带来一定的问题,高校辅
对于经济增长和能源消费因果关系是自上世纪70年代能源危机的爆发以来能源经济学界普遍关注的问题。对这一问题的不同研究结果将会影响各国的能源政策,但是这一研究由于研究方
跳绳运动在我国有悠久的历史,起源于我国古时南宋时期,它是集健身性、趣味性、竞技性等多种性质于一体的一项运动.因此,深受人民群众喜爱.本文采用文献资料法、实地考察法、