【摘 要】
:
随着计算机技术的发展,数据量呈现爆炸式的增长,数据压缩作为减小存储数据所需空间的技术,能够有效缓和存储和传输的压力,在各类系统中得到了广泛的应用。与此同时,海量数据上的有效信息的挖掘是目前的研究热点,而数据挖掘和分析通常需要基于对数据的随机存取以及查询等操作。现有的传统数据压缩算法通常只是为了消除数据的冗余而设计,不支持压缩数据上的随机存取和其他检索操作,而高效的索引结构也通常只是面向原始数据设计
论文部分内容阅读
随着计算机技术的发展,数据量呈现爆炸式的增长,数据压缩作为减小存储数据所需空间的技术,能够有效缓和存储和传输的压力,在各类系统中得到了广泛的应用。与此同时,海量数据上的有效信息的挖掘是目前的研究热点,而数据挖掘和分析通常需要基于对数据的随机存取以及查询等操作。现有的传统数据压缩算法通常只是为了消除数据的冗余而设计,不支持压缩数据上的随机存取和其他检索操作,而高效的索引结构也通常只是面向原始数据设计,无法被应用于压缩后的数据上。为此,本文提出了一种支持查询的自适应无损压缩框架:对数据按照预设的分隔符进行分割,并用上下文模型估算数据的概率分布,通过算术编码进行压缩,最后将编码结果分块存储。其中,自适应的上下文模型通过在冷数据上进行训练,并定期更新模型,为编码提供准确的概率分布。在存储策略上,本文基于算术编码的特性,对编码后数据分块存储,以支持随机存取和不解压的顺序查询,查询类型包括精确查询、前缀查询和范围查询。同时,为了更高效的查询,本文算法提供了便捷的接口,以支持主流索引结构的集成,并以b+树为例进行了查询效果验证。实验结果表明,本文算法的压缩效果达到主流压缩算法的水平,顺序查询速度是对照算法中最快的LZO算法的24.8倍。同时,本文实现了b+树的索引的集成,在压缩后数据上,索引查询速度为顺序查询的172.5倍。
其他文献
近年来,以天然活性物质为先导化合物研发高效、环保型农药已成为新农药创制的重要途径之一。厚朴酚是一种具有联苯二酚结构的新木脂素类化合物,具有抗癌、抗病毒、抗氧化、抑
量子点(quantum dots,QDs)的优异光学特性已被学界认可。因此,作为新型的荧光标记物,量子点正逐渐取代传统的有机荧光染料,在细胞标记、多色成像和肿瘤靶向等方面都有着非常广
去中心化分布式应用(DApps)被誉为互联网的未来。但由于它的底层技术——区块链公开透明的特点,造成了隐私保护上的问题。本文构建了一种更安全、抵抗双花攻击的轻量级环签名(LwRS),并将其与改进的双密钥隐形地址协议(DkSAP-IoT)相结合,并集成了数据可用性和安全性的理念。通过构建新的强化承诺方案来实现安全的LwRS,该方案利用签名人的整个私钥,然后使用加密哈希函数来计算更强的密钥镜像,而Dk
在所有植物次生代谢产物中,紫杉醇是一种高效的抗癌药物,临床上对多种癌症都具有良好的治疗效果。当前它仍主要从生长十分缓慢的珍稀濒危物种红豆杉属的树皮中提取,因此探索
葆灵女中在其五十载的办学历程中,教育实践不断发生改革,尤以1925年以后所发生的多方面变化和改革最为显著。本文旨在通过对葆灵女中的教育实践变迁进行系统的回顾和梳理,进而探究引起其变迁的诸多因素。本文采用史料实证研究方法,跨学科综合研究方法以及个案分析方法,在充分挖掘葆灵女中一手资料的基础上,一方面对史料加以甄别和分析,另一方面结合历史、宗教以及社会文化的研究。此外,本文将葆灵女中作为教会学校的个案
薄板冲压成形技术以其大批量、高效率、低成本等优点引起了国内外学者的关注并得到迅速发展,其成形方法包括刚模成形和软模成形。随着科技的发展,对成形零件的形状和质量提出
民族器乐音乐是中国最具特色的传统音乐,它拥有千年的历史文化,在这历史长河中它不断的繁衍生息,被赋予着一代又一代民族器乐研究者的智慧和传承精神。民族器乐音乐在地方戏
死亡仪式是将死亡的个体归入社会另一范畴——死者世界——的重要手段,它更多地表现为社会性的仪式。在本次田野调查中,笔者以白露坑村的死亡仪式为主要研究对象,通过对不同类型的葬礼过程、做墓与二次葬、祖先的巫术力量和年节祭祀等内容的描述,试图对当地如何通过仪式和观念赋予祖先完满的道德人格这一问题进行分析。在白露坑村,死者可通过葬礼和二次葬等仪式归入祖先的范畴。二次葬是死者进入坟墓的重要仪式,它也是令社会中
帕木竹巴第悉执掌西藏地方政权时,四海平定,富裕之民,依法治官,以律治贤,职官取其人文之精华,贤者探讨十明之文化,出现其繁荣之根源与帕木竹巴第悉时期的行政组织相关联的,故本文首先应用文献研究和实地调查相结合对帕竹的宗谿、万户和部落等基层行政单位的数量与其地理位置作了考证与梳理,并探析了基层行政单位的组织形式与作用其次帕竹第悉时期的第悉、宗本,囊钦、都元帅、岱本等行政职官作了梳理,帕竹首都职官构架作了
本文为一篇汉译英翻译实践报告,选取了《大羌故事》的第四和第五章节作为报告的翻译材料。译者受导师委托,参加了《大羌故事》翻译项目。该项目目的在于向世界传播中华文化。在提倡加强国内文化宣传和倡导文化“走出去”的当今社会,翻译介绍少数民族文化的材料有着重要的意义。原文材料涵盖多篇羌族文化故事以供读者了解中国少数民族文化。本文作者将理论与翻译实践进行有机统一,在理论的指导下圆满完成了此次项目。译者采用目的