基于数据温度的冷热数据识别机制研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:roadog212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
追求存储成本和系统性能的平衡一直是数据库管理系统设计的核心目标之一。现代数据库多采用混合存储架构,每一层存储介质都对应不同的存取速度和存储成本。而在数据库中存放的数据通常有冷热之分,如何准确地识别数据的冷热,根据数据的冷热程度将数据存储在不同的存储介质上,在保证系统性能的前提下最大程度的降低存储成本,这一直是数据库领域的研究热点。目前,识别冷热数据大多依赖于LRU等特定的数据结构,利用数据的相对位置来判定数据的冷热,无法全面反映数据的冷热程度,而且这种识别方式不可量化且不具有可持久性。所以,本文希望研究出一种科学的冷热数据识别方法,提高识别准确率并实现数据冷热程度的量化。本文的创新成果有以下几个方面:1.提出一种基于牛顿冷却定律的温度模型来衡量数据的冷热程度,能够实现数据冷热程度的量化和可视化,同时温度可作为数据的持久属性。2.在温度模型的基础上,提出基于温度模型的缓存替换策略TCR(Temperature Cache Replacement),与传统LRU算法相比,具有更高的缓存命中率。同时,为了克服单纯温度模型算法开销大的缺陷,提出将温度模型和LRU算法相结合的T-LRU(Temperature Least Recently Used)缓存替换策略,其命中率相比LRU算法可提升30%~150%,在缓存容量较小时提升尤为明显;在系统层面,T-LRU的访问延迟要低于LRU算法,系统性能更好。3.在电商业务的应用场景下,为了降低线上数据库和历史数据库的存储成本,分别提出基于温度模型和基于机器学习(GBDT)的冷热数据识别和迁移模型。在冷热数据的识别上,基于温度模型的识别准确率比LRU算法略好,同时模型开销较小;而基于机器学习模型的识别准确率可以达到90%以上,能够在保证系统的性能的前提下,尽早的将冷数据识别并迁移,降低存储成本。
其他文献
组织学是基础医学生的必修课程,随着互联网及数字化的技术发展,全景切片的诞生在形态学的教学中起到了重要的作用。但由于与传统教学模式的差别,网络数字化一直作为辅助教学
<正> 青黴素和鏈黴素是臨床上比較常用的兩种抗生素,現将其毒性反應及處理辦法分別述之如下: 青黴素所引起的各种反應中,只有少數是嚴重的,肌肉和皮下注射時可能引起疼痛,但
斑纹虎皮鹦鹉呜叫声虽不悦耳,但羽毛华丽,体形优美,深受人们喜爱,是国际、国内市场上的热门货。其羽毛有浅黄、天蓝、深蓝、黄、绿、白等色,均隐约呈现黑色斑纹。
藏书志是清代中后期发展起来的一种版本目录体式。本文试图通过对清代到民国年间藏书志的考察,结合以往目录学家的研究成果,从编纂对象、操作模式和内容形制三方面入手,探讨藏书
<正>本文介绍我们已开展的利用单片CMOS技术实现多功能程控心脏起搏器电路系统的研究工作.包括:(1)利用CMOS预放级或电压比较器实现心电波双向灵敏感知放大;(2)采用CMOS倍压
1建立汽车维修资料数据库系统的必要性随着国内汽车保有量的迅速增加,车辆的维修量也随之增加。汽车维修企业在维修汽车的过程中,需要汽车制造厂商提供的维修资料作为依据,而
我国中医文化有着数千年的历史文化,当然因为喜欢和好奇心开始我的研究和学习。在历史的发展中,我们中医文化的发展被不断完善,其文化博大精深。学习让我充满热情,在我国数千
<正>11月14日,戴姆勒宣布计划投资总计超过11亿元人民币,建立中国研发技术中心,这标志着戴姆勒在其全球最大市场本土化的进一步深化。继2014年梅赛德斯-奔驰乘用车中国研发中
目的:采用高效液相色谱法建立同时适用于西洋参、人参和三七药材鉴别的特征图谱,并与其不同栽培年限的样品特征图谱鉴别比对,为同属药材的鉴定及质量评价提供科学依据。方法:
“寤言不寐,愿言则嚏”为《诗经》“邶风“终风”中的诗句,“嚏”这一生理现象早在古老的周代,即被当作一种前兆迷信,为人们所信仰,并渐成民俗,表示思人之意。自《终风》之后