基于RDBMS的大规模非关系型数据存储技术研究

被引量 : 0次 | 上传用户:scx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化技术的迅猛发展,各种非关系型数据不断出现。这些数据对数据库有了新需求,一方面是传统的关系模式已经不能完全胜任。另外一方面则是新型数据库参差不齐、尚待发展,替换原来使用的数据库有很大的阻力,而传统关系数据库成熟、并且有着广泛的用户群。因此企业需要找到一种存储非关系型数据的合理方式。通过分析非关系型KEY/VALUE型数据的数据特点,并结合列式数据库的存储原理以及传统关系数据库的行式存储原理,提出了一种将非关系型数据存入关系数据库的方案。通过抽取KEY/VALUE数据的信息,将VALUE数据进行属性拆分,以列式数据库的思想为每一个单独的属性创造一个表,这个两列表由KEY与某一列属性组成。在逻辑上,依然可以将众多小表看成为一个完整的表,因此需要对SQL语句信息进行提取和拆解,然后将SQL语句的操作分发到下面的各个小表中去,并行处理。考虑到VALUE这类字符串类型的属性比较多,可以将其中的字符串替换成整型ID存入数据库中,一方面可以对重复的字符串进行去重处理,压缩数据空间,另一方面也可以加快对数据库对字符串属性列的处理速度。因此在拆分SQL语句的时候就要对字符串属性直接进行替换,并将替换的数据存入外部文件,通过建立字典和索引,可以快速处理替换部分。通过将不同的数据集导入到存储系统中进行功能测试和性能测试,测试结果表明系统能正确的对输入信息进行替换处理;经过处理的数据的查询速度要比原始数据更快。
其他文献
试带法测尿糖假阳性和假阴性原因分析及消除方法山东省文登市中心医院(264400)迟玉丽,李振明,林爱玲试带法尿糖试验的原理是:葡萄糖氧化酶将葡萄糖氧化成葡萄糖醛酸和过氧化氢,后者再由过
中国的企业在国家"走出去"战略的号召下,逐步开展对外直接投资,近年来,企业的国际化水平得到了好大的提高。对于企业来说,对外直接投资首先面临的就是区位选择问题。因此,找
从电影艺术的角度讲,一切影片本就是框架的艺术。而导演王家卫是个框中构图的诗人,他善用一切物体和人,在取景框里再次建立"框架"。《花样年华》g是王家卫电影中,利用框式构
<正>川劳社发〔2009〕20号各服务外包企业:成都市已被国务院批准为全国20个服务外包示范城市之一,为推动该市服务外包企业积极承接国际业务,促进服务外包产业发展,按照人
<正>现将《四川省中长期人才发展规划纲要(2010-2020年)》(以下简称《规划纲要》)印发给你们,请结合实际认真贯彻执行。《规划纲要》是今后一个时期我省人才工作的指导性文件
晚期喉癌的综合治疗,包括放疗、化疗、手术、靶向药物治疗及它们之间的联合应用,在治疗方案的选择上,必须综合考虑两方面的因素:最大可能提高喉癌的局部控制效果;在保证局部
目的:奥施康定(盐酸羟考酮控释片)作为治疗中重度癌痛的首选阿片类药物之一,临床应用上,其疗效在不同个体间存在差异,这与其受体,转运体和代谢酶的数量及功能有关,而其基因的多态性可
<正>什么时候买入?什么时候卖出?如何确立安全的买入时机?如何卖在股价将要回落的高点附近?学会看盘的最终目的也不过如此。长期以来通用的判断方法是以K线形态上的大阳与大
针对1,4—二羟基蒽醌生产过程中大量废水排放的状况,通过使用无机凝聚剂,设计和制定了相应的工艺。经1年运转表明,处理后的废水达到国家环保排放标准,且成本低廉。
<正>侵袭性纤维瘤病(aggressive fibromatosis,AF),又称韧带样纤维瘤或硬纤维瘤、纤维组织瘤样增生或肌肉腱膜纤维瘤病。其发病率占所有肿瘤的0.03%,占所有软组织肿瘤的3%[1]