数据空间中数据资源之间关联关系发现与语义查询研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:sunzhiqiang7310
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库技术经过多年的不断发展已经成为当今IT领域最成功的技术之一,它推动了全球范围内的商业、政务、金融等方面数据管理的发展。当代数据的三个典型特点使得传统关系数据库捉襟见肘、疲于应付。首先是数据信息海量化,其次是信息共享化,最后是数据类型多样化。针对这些特点,传统数据库已经不能满足当前信息化发展日益增长的需要。数据空间(dataspace)是一个抽象的数据管理概念,旨在克服当前遇到的挑战。其目的是减少需要设置通过利用现有的匹配和映射生成技术依托数据集成系统的方法,因为它是使用以改善系统随收随付即付(Pay as you go)方式进行管理的。本文基于现有数据空间研究成果的基础上,对数据空间的组织形式,数据空间中关联关系规则的挖掘以及知识发现,数据空间的查询处理以及结果排序进行了研究。首先,本文在分析以往数据空间管理系统体系结构的基础上,将数据空间分为对象模型层、基础层、资源层、分析层以及管理层五层体系结构。其次,通过定义SPORD模型来表示资源层数据组织形式,随后针对数据空间资源层资源节点之间关联关系,提出了一个基于FP-tree的改进模型,实现多维关联关系规则发现。再次,将数据空间查询处理分为内容查询、结构化查询以及语义查询,重点介绍通过MS-SteinierTree算法对语义查询处理,以及结果top-k排序。最后,以C#、VS2008为实验平台,通过实验对MDFP-tree模型以及MS-SteinierTree算法进行性能以及可行性验证。实验结果证明MDFP-tree算法和MS-SteinierTree算法的具有优越性和可行性。
其他文献
随着军队信息化建设日益发展,军队内部各单位的网络系统也深入到各项事务中,网络规模越来越大,终端数量越来越多,使用和管理也日益复杂,特别是众多的非常正常工作应用软件、
维数约减已经成为当前机器学习领域的受人关注的研究热点。维数约减是将数据由高维约减到低维的过程而用来揭示数据的本质低维结构。它作为克服“维数灾难”的途径在这些相关
高层体系结构是目前分布式仿真的通用技术标准。论文对高层体系结构相关技术进行了论述,重点研究了高层体系结构的数据传输模型。针对数据传输模型中的关键部件运行支撑框架,论
目前,光纤通信技术迅猛发展。这种技术具有频带宽、损耗低、抗干扰能力强等优点,而且建网的成本在逐步降低,因此,很多企业都已经或正在组建自己的光纤通信网。同步数字系列(SDH)在
网格技术是继Web与Internet技术后的第三大技术。网格把大量的、分布式的各种软件和硬件资源组合起来,为科研人员和工程技术人员提供了统一的计算环境,来解决数据和集中计算
随着互联网技术的日益普及,Web上的信息量呈爆炸性增长。由于互连网上信息资源的极大丰富,信息服务的个性化越来越引起人们的重视。人们对信息获取的目的逐渐从查全转变为查
随着第三代测序技术的普及,生物数据呈指数增长。各种生物数据库如NCBI、EBI、DDBJ等被建立和不断丰富,标志着生物数据也迈入了“大数据”时代。大量的生物数据对人们处理和
互联网已是我们生活中密不可分的重要工具。为了满足用户对网上信息资源的获取,各种搜索引擎应运而生,如Google和百度等。但是随着信息急剧膨胀以及信息多元化的发展,传统搜索引
随着互联网技术和电子政务的飞速发展,各行各业对门户内容管理系统的依赖性越来越强。而传统信息系统的建设存在着多种弊端:角色分工不明、资源组织不合理、安全性低、扩展性不
Delaunay三角网是数字高程模型(DEM)构建的基础。Delaunay三角网具有适用性强、分布灵活的特点,对于非规则离散分布的散乱数据的动态网格化的计算机造型、复杂构图研究、图像