社交网站如何“冷”处理海量图片

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:qqq1981115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  目前互联网上最火的应用应该算是社交网站了,随着用户数的激增,一些顶级的社交网站每天要分享近20亿张照片,而且需求还在不断增加。那么这些社交网站是怎么实现这种海量照片的存储和分享的?其幕后功臣之一就是Cold Storage系统。
  知识扫盲——认识Cold Storage
  Cold Storage直译过来就是“冷存储”,意思就是存储历史数据的存储系统。大家知道每天都有数以千万计的用户在社交网站上发布自己的社交日记,很多日记都包含图片。因为社交信息的传播具有及时性的特点,常常发布几天后图片就基本没什么人访问。因此社交网站历史图片数量非常多,为了保存这些历史图片,他们通过购买数量庞大的低端商品化硬盘来保存这些图片,数量之大,可以存放数百PB的数据(图1)。
  不只是简单的存储——Cold Storage工作原理解密
  如上所述,社交网站每天都要保存海量的图片,但是Cold Storage并非只是简单保存这些数据。因为每天有很多用户在分享其中的图片,这样网站不仅要保证历史图片的显示,而且要方便用户从服务器数据库中引用。这样Cold Storage系统就要和开放机架、网络、数据中心等其他组成部分配合,同时还要保证数据的安全。Cold Storage主要是通过下面的技术手段实现的。


  1. Open Vault Storage解决方案
  Open Vault Storage是一套专门针对Open Rack(开放计算的机架标准)打造的简单高效的存储解决方案。它采用了模块化的I/O拓扑,每个2U机框可容纳30块硬盘,这样就可以在尽可能少的空间里摆放最多的硬盘,达到最高的存储/空间比。Open Vault Storage另一个重要特性就是交互性强,它几乎可以与任何服务器实现交互操作。这样社交网站服务器系统就能够实现和Cold Storage的数据交换(类似本地硬盘连接到Windows系统中),方便用户在网站上可以任意实现图片的下载、引用和分享(图2)。
  2. 数据安全保护神——Reed Solomon Coding纠删码技术
  对于每个企业来说,保障数据安全始终是重中之重的事情。特别是对于大型的网站企业,由于它们的数据量极其庞大,因此Cold Storage除了解决简单存储功能外还要保证数据安全。目前Cold Storage系统使用的是“Reed Solomon Coding纠删码技术”。


  这种技术使用的是存储领域常用的数据冗余技术,它的原理是将一份原始数据分成n块,然后根据这些分好的数据块再生成m个校验块。这样当原始数据发生损坏的时候,我们利用特定的算法,从n个原始数据块和m个校验块中任取x块组合就能解码出原始数据(图3)。
  通过冗余技术,Cold Storage可以通过较小的成本实现数据的存储和冗余保护。从技术角度讲,校验块越多,安全性保障就越高,但同时需要存储校验块的容量开销就越大,从而提高存储成本。为了实现最佳的平衡,一些大型的社交网站目前的配置是10:4(即每10块硬盘配4块校验盘)。这样只要使用1.4GB存储空间就可以保障1GB数据的安全(图4)。


  3. 规模越大性能越好
  社交网站上保存的数据非常多,而且每天24小时都要面对数以千万计的用户的访问。对于常规的系统规模变大后性能就会降低,但是Cold Storage系统却可以实现规模越大性能越好。因为这个系统在每次增加容量时软件都要对现有数据进行再平衡,即将原有数据分配到新的硬件上,并释放之前用过的空间。这样增加容量后对系统的性能就不会有影响,同时借助网站强大的服务器硬件和云计算、并行计算能力,Cold Storage可以实现规模越大性能越好,随时随刻都能够给用户良好的交互体验。
其他文献
DirectX 12能为我们带来什么  微软的DX12最重要的变化就是带来了底层硬件优化(D3D 12 Low Level API),这一优化除了可极大地提高开发者的潜力外,对消费者来说,主要可带来下面两大方面性能的提升。在DX11下,AMD FX-8350并没有因为核心数的提升大幅提高效能,而在DX12下,FX-8350的多核性能得以大幅度提升  一是真正支持多线程。尽管从P4时代已经有多线程技
期刊
从名字上看,既然《见招》,那么接下来就是“拆招”了,找工作不仅是个人的问题,也是受聘单位的需求显现。在“拆招”之前,自然要填写一下个人的基本资料,花1分钟时间注册然后填满所有的选项就可以开始了。至于自我推荐、自我介绍这些长篇大论的东西完全不需要,可见这里就是一个实实在在的招聘市场,不搞任何虚的东西。  该应用的界面设计很简单,在“我想要”大区里,你可以定制自己想找的工作类型,比如工作地点、职位、实
期刊
索尼将VAIO PC业务出售的决定令人扼腕,很多玩家都担心日后再也看不到时尚精致的日系PC了。好消息是,原本打算固守日本本土市场的Vaio Corp(收购索尼VAIO PC业务的子公司)迫于市场份额的需求,再次启动了全球化市场战略,而其首款主打型号就是类似微软Surface的VAIO Z Canva。该产品采用12.3英寸触控屏,搭载i7-4770HQ处理器(注意不是低功耗CPU哦),内置16GB
期刊
传统酷冷至尊的机箱优点是用料出色,但在结构和功能上相对弱一些,但是这个弱点已经一去不复返了。全新的MasterCase 5系列采用模块式设计,整个机箱基本你能想到的地方都可以自由拆装并且更换零件,用料一如既往的豪华,是近几年酷冷至尊少见的精品机箱。    点评:一直以来酷冷至尊的机箱被爱好者们戏称为“洞洞流”,对比其他厂商的高阶产品总是落于下风。本次的MasterCase 5系列机箱可谓诚意之作,
期刊
R9 Nano显卡与Fury X同样使用完整版Fiji核心,4096个流处理器单元、256个纹理单元、64个ROP单元,显存也是4GB,HBM技术下位宽高达4096bit,带宽也有夸张的512GB/s。如此高的性能却只有15cm身材,并且只需要单8pin供电和风冷散热器即可,十分不可思议。    点评:近几年由于ITX平台火爆,出现了大批ITX身材的高性能显卡,深受打造“性能小钢炮”爱好者的喜爱。
期刊
苹果去年发售的iPhone 6/Plus让三星固有的大屏优势荡然无存,为了迎接苹果下代iPhone 6S的挑战,三星抢先一步推出了Galaxy Note 5/S6 Edge+两款年度大屏旗舰。两款新品都采用了5.7英寸2K屏幕(S6 Edge+为曲面屏幕),搭载Exynos 7420八核处理器,内置4GB内存和32GB起步的存储空间,配备500万/1600万像素前后摄像头,以及3000mAh的不可
期刊
大名鼎鼎的西数黑盘终于有新品了,此前的最高容量4TB,这次新推出了5TB及6TB两种大容量产品。采用SATA 6Gbps接口,缓存容量已经提升到128MB,其中5TB版速度可达190MB/s左右,6TB版速度为210MB/s以上,这已经是7200rpm转速HDD的最强性能了。    点评:西数近几年大力发展绿盘、红盘和紫盘,传统DIY领域的蓝盘和高性能黑盘相对有些沉寂。本次6TB版本的黑盘问世,不
期刊
病毒危害:  随着杀毒软件的防范能力增强,很多木马病毒已很难传播了,不过还有一些病毒继续负隅顽抗。最近就出现了一款全新的病毒木马,如果用户不小心运行了它的话,病毒就会通过内核接口向系统内核读写数据,从而修改安全软件重要的监控函数,这样安全软件的实时监控就会失去效果。接下来病毒木马将会下载其他的恶意程序,将恶意代码插入到资源管理器的进程中。当这些操作完成以后,病毒木马将连接到远程服务器,再通过它和黑
期刊
挑战题描述  进入好友空间如何只看他的原创说说?我的一个朋友在空间总用说说写一些文章,但他也总转发一些说说来积累素材。我却只想看他的原创说说,几万条说说一个一个翻太麻烦,有时候想看他早期的原创说说找起来更是麻烦。有没有什么好方法可以过滤掉他的转发而只看他原创说说的好方法?(题号:20151103)  解题思路  因为目前腾讯说说其实就是一些简单的网页内容,因此如果要在几万条说说中查找具体内容,我们
期刊
挑战题描述  女朋友最近迷上了4399上的网页在线小游戏,可是这些小游戏无法在线保存数据,这样有时玩到正尽兴的时候,如果有事要外出,关掉浏览器后又要重新开始。有没有保存网页游戏进度的方法呢?(题号:20150303)  解题思路  之前本刊上介绍过的通过虚拟机的方法保存Flash游戏进度,有点复杂。其实我们通过手动备份Flash的临时文件,或者通过一款小软件FlashCookies View,可以
期刊