数据空间数据源管理子系统

来源 :华侨大学 | 被引量 : 0次 | 上传用户:wang3398218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据空间(Data Space)是作为解决当前数据管理所面临的挑战而提出的一种新的数据管理技术。随着信息技术的不断发展,数据源多源和多样化特点使的传统以关系数据结构为基础的数据库管理系统面临重大挑战,人们急需一种能淡化数据形式,支持各种不同数据形式的数据管理方法,它不仅要支持不同形式的数据,还要实现各种数据之间语义关联,保证数据的更新演化,具有Pay-As-You-Go特性。   本文研究数据空间的数据源管理子系统的实现技术。在借鉴诸多描述数据的数据模型基础上,将刻面的概念引入到数据空间,建立了一个基于刻面属性集合的数据模型,通过四元组的形式来描述各种异质异构数据源,并在此基础上实现了一个针对常用类型数据源的属性自动抽取模块。数据空间创建初期,系统自动为常用数据源建立基本刻面和内容刻面,并对数据空间的数据源分别实现它们的属性自动抽取。本文设计了数据空间的数据源更新策略,通过定时地对数据源的访问接口进行监控,再根据用户使用数据源的规律,设置数据源改变频度和用户使用频度,以此为依据设置数据源的更新频度值。本文对实现的数据源管理子系统进行测试,测试各种不同的数据源、抽取数据源属性,建立多刻面数据模型的各项功能。测试的数据源包括本地文件系统内的OFFICE文件,主要以DOC文档和PPT文档为主,还有网络上的网页文件,主要以新闻网页为主。对本地和网上的各种数据源的大量实验结果证明了系统的有效性。
其他文献
动态交通网络的控制一直是城市交通问题的一个重点和难点,当城市中的车辆数目成爆炸式增长时,给城市的交通问题和环境问题带来了巨大影响,并且汽车尾气的排放也加剧了全球温室效
旅行商问题(Traveling Salesman Problem),缩写为TSP,TSP问题是一个难于解决的著名数学难题之一。这个问题的特点就是易于描述但是随着样本点数目的增加,计算复杂度呈指数增加。
麦克风阵列技术是当前语音信号处理领域的研究热门,在噪声抑制和声源定位等场合有着广泛的应用,被认为是最有前景的语音增强技术。但实际应用的麦克风阵列和假设的理想阵列模
学位
自动协商的研究具有重要价值,它将传统活动中的协商经验应用于智能化的自动协商中,研究传统活动中协商经验的方法,采用人工智能技术对协商的决策函数、协商提议、协商策略等进行
学位
科学技术的飞速发展极大地改变了人们的生活,但由科学技术推动着的企业生产设施等具有重大安全隐患的危险源,却时刻威胁着人们的生命和财产安全。因此,加强重大危险源的实时
学位
随着生命科学的快速发展,在分子生物学中的一个主要挑战是揭示基因表达的调控机制,也就是说要知道基因表达的激活和抑制怎样实现的。面对这个挑战的一个主要步骤就是识别调控
随着网络的普及及发展,推荐系统越来越多地被应用在实际的商业应用中,越来越多的企业看到了推荐系统的价值。但是推荐系统在应用过程中,存在着数据稀疏性、可扩展性、用户兴
公开密钥加密体制(Public-key Encryption Scheme)也叫非对称加密体制,它的提出使密码学发生了一场根本性的变革,在此体制中使用两个密钥,即加密密钥和解密密钥,在与多个用户
随着Web 2.0的到来,网上信息量急剧增长,用户可利用的数据也越来越丰富。然而,用户不得不耗费大量的时间来获取有价值的信息。特别是大数据时代的到来,信息过载问题已然成为
人脸表情识别(Facial Expression Recognition,简称FER)是人工智能中一个非常重要且十分复杂的课题。人脸表情识别是指利用计算机对人脸图像进行分析,然后对其为哪种表情进行
学位