探讨重复数据删除技术在中央电台媒资备份存储系统中应用

来源 :传播与制作 | 被引量 : 0次 | 上传用户:long_teng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  一.引言
  2012年初,中央电台媒资备份存储系统正式投入使用。经过一年的运行,大量的节目内容,丰富的历史资料迅速将中央电台媒资备份存储系统填满,严重掣肘了节目归档、素材入库等媒资管理工作。近期中央电台完成了媒资备份存储系统在线扩容工作。备份存储的磁盘容量由之前的20TB,增加30TB,总计达到50TB。短短一年时间,磁盘空间需求已经翻番,可以预见,中央电台媒资备份存储系统还将面临磁盘空间短缺的问题。面对日益爆炸的数据增长和由此不断上升产生的存储压力难题,如何控制和有效降低海量数据显得尤为重要。重复数据删除技术无疑是“瘦身”的一项不错选择。
  二.数据冗余
  三.重复数据删除概念
  通过相关研究和对实际系统的分析发现,在海量数字存储系统中,存在大量的重复数据和相似数据。通过重复数据删除技术可以有效去除这些重复数据,对相同数据只存储一份和只存储相似数据的不同部分,可以有效利用存储空间,从而有效降低存储系统成本。
  重复数据删除是一种数据缩减技术,旨在最小化文件之间的冗余和重复的无损压缩,并对存储容量进行有效优化。它通过删除数据集中重复的数据,只保留其中一份,从而达到消除冗余数据目的。
  目前,绝大多数的重复数据删除算法都工作在二进制数据层次上,通常使用一些数据切分算法,如以整个文件为切分粒度,固定大小的数据切分,或者某些HASH函数(如Rabin Fingerprinting算法),将每一个带归档的文件切分成若干相互不重叠的数据片段,并把这些数据片段作为逻辑单位进行后续处理和存储操作。在这些数据片段中,只有不重复的数据片段才真正存储到存储设备中,而其他的重复数据片段只需记录其ID和相应的依赖文件的对应关系即可。
  2. 文件切分
  重复数据删除对于S48音频文件切分算法的实现基于以下的观察和思考:许多不同的文件有着相同的音频内容和不同的TAG描述信息,即相同的歌曲由同一个歌手演唱,但发布在不同专辑,或者相同的内容由不同编辑制作,这样就有了不同的TAG。因此,一般把每个S48文件划分成三个部分:帧头、音频帧、TAG,其中帧头和音频帧被解析和存在元数据服务器数据库的某张表中,音频帧作为一个逻辑数据片段存储,以便进一步被打包成物理对象实际存储在磁盘设备上。
  具有相同音频的数据内容被切成一个数据片段,只需保存其中一份即可。由于某些HASH函数(如Rabin Fingerprinting算法)可以捕获到二进制层次上的重复,所以若两个数据对象具有相同的内容,则可进一步进行重复数据删除,只存不重复的数据对象。图3展示了上述过程,并说明在存储系统中数据组织的层次关系。
  3. 方案实施
  重复数据删除主要是针对大规模存储系统设计,其进程可以部署在不同的应用服务器上,且可作为核心进程运行。因此,其方案需要有较好的可扩展性,易于进行数据容灾的部署。
  因此在媒资备份存储系统内部署重复删除技术至少需要包括应用服务器,文件归档服务器,元数据服务器和智能存储节点等四部分组件实现重复数据删除和数据存储。图4展示存储系统体系结构。
  应用服务器为各种应用的宿主服务器,如WEB服务器,流媒体服务器等部署应用服务端软件。文件归档服务器主要是将文件归档到存储节点,同时部署重复数据删除软件的地方。元数据服务器主要对元数据管理、与应用服务器交互、安全机制的部署等服务。智能存储节点是完全由通用组件,即操作系统、阵列柜、磁带库、文件系统等组成。
  对于每个存储文件首先根据其相应的元数据信息,被文件归档服务器切分成若干不重叠的数据片段。每一个数据片段将对内容通过某些Hash函数计算得到的签名作为其标识符,用以判断当前是否有重复的数据片段存在。不重复的数据片段将被封装成定长的数据对象,由元数据服务器决定将它们存储到对应的智能存储节点中。最后当数据的存储位置信息将会返回到文件归档服务器。文件归档服务器可以与智能存储节点直接进行数据传输。这样应用服务器产生、调用的节目素材等内容就通过入库、切割、计算、存储等步骤进行了“瘦身”,最大限度的精减系统内冗余、重复数据的产生,从而实现了重复数据删除。
  六.总结
  随着中央电台编播系统数字化的发展,节目内容、节目素材将呈现爆炸式增长趋势,数据总量将急剧膨胀。我们将面临诸多挑战,如媒资备份存储空间不足、成本高昂等问题。本文通过对重复数据删除技术的探讨,采用标准、科学、先进和可靠的技术,阐述了全新的媒资备份存储系统,为今后的媒资备份存储系统发展规划,提供了有效的支持,并确保系统在今后相当长一段时间留有扩充余地。希望能为广播电视的媒资备份存储系统建设提供一种新思路。B&P
  参考文献
  [1] 袁玉宇 刘川意 郭松柳 . 云计算时代的数据中心. 电子工业出版社 .2010
  [2] 李栋 数字声音广播 北京广播学院出版社 2001
  [3] Dave Reinesl. Our Expanding Digital World:Can we contain it? Can we manage it? Intelligent Storage Workshop(ISW2008),UMN,MN,2008
  [4] 张为民 唐剑锋 罗治国 钱岭 . 云计算:深刻改变未来 . 01版 . 北京 . 科学出版社 . 2009
  [5] 朱近之 张振伦 金海龙 蒋建华 王春海未来,在云端 微型计算机 2011(2)
其他文献
4K、8K超高清、OLED、第二屏应用、电视无处不在  从今年的CES 2013展会可以看到未来电视一共呈现出4大趋势:4K、8K超高清、OLED、第二屏应用、电视无处不在。  4K、 OLED从容绽放  在CES展上,索尼、夏普、海信等电视大厂纷纷推出自己的4K超高清电视,夏普还展出了8K超高清电视。对4K超高清最为热衷的是日本厂商,索尼展示了整套的4K系统流程,从拍摄所需要的摄像机,到处理过程
期刊
【关键词】 高清 同播 AFD  一.源起  为发展先进文化满足人民群众精神文化需求,促进民族电子工业发展和“保增长、保民生、保稳定”的客观需求,2009年8月6日,广电总局下发了《关于促进高清电视发展的通知》。《通知》中明确要求:“发展高清电视,主要采取现有频道高、标清同播过渡的方式,积极稳妥推进。高、标清同播,是指同一频道内容,同时采取高清和标清方式播出”。9月28日全国包括上海东方卫视在内的
期刊
【摘要】 本文以贵州广播电视台电视播控中心“编、制、存、播”一体化新型播出系统中节目素材由缩编网子系统向播出网子系统提交的传输流程为例,阐述了ESB、EMB互联子系统在电视播出系统中的应用。  【关键词】 缩编网 播出网 ESB EMB  一.概述  随着电视播出数字化技术的不断发展,近年来多家电视台都选择了“编、制、存、播”一体化的这样一种新型的电视播出系统。一方面是因为这种新型的播出系统将节目
期刊
【前言】 随着演播厅技术不断革命,以及社会娱乐不断发展,广大人民群众对于娱乐不断追求,电视台娱乐节目随之不断推陈出新,这使得节目部门对舞台舞美要求越来越高。作为地级台,扬州台的娱乐节目不断增加,就城市频道来说,每晚就有1个小时左右的幸福久点档自办娱乐节目,节目支出成本压力增加。作为我台主要的节目演播厅,800大厅承担了大部分的节目录制任务。大面积使用LED大屏,减轻了舞美成本压力,通过减少舞美的布
期刊
高度声道增强环绕声  在熟悉的5.1或7.1环绕声阵列上增加扬声器通道可以再现一个栩栩如生的氛围声场,并且实现像直升飞机这样的空中目标的更准确定位。尽管通过向传统的扬声器水平配置增加一个“高度”成分,过去10年里环绕声取得了进展,但近来3D视频的发展,使得各种3D声音方案应运而生。  SRS实验室2012年1月推出其多维音频平台(MDA)。通过MDA,不依赖使用任何形式扬声器配置得到的有限和传统的
期刊
2013年,规则正在改变,宽带中国提速启动,移动互联网迅猛发展,新智能终端和业务异彩纷呈??面对新规则,广电的产业格局正经历着有史以来最大的洗礼,战略转型期成为2013年的“主打歌”,广电新技术需要适应新的规则,变革图强,向宽带化、移动化、融合化方向加速发展。  笔者认为全社会对多屏、个性化视音频需求的持续增长正改变着广电目前的技术结构,广电产业市场蕴藏着巨大发展潜力,新拐点的到来也将为广电带来新
期刊
OTT  OTT是指基于开放互联网的视频服务,终端可以是电视机、电脑、机顶盒、PAD、智能手机等等。意指在网络之上提供服务,强调服务与物理网络的无关性。通过互联网传输的视频节目,如PPS、UUSEE等平台的内容传输到显示屏幕(包括电视)上。  OTT传输的基础网络是IP网络,在具有基础设施的网络里开展OTT业务没有太多的限制,在通过广电的有线网上去开展OTT服务不需要建专网,节省了网络建设费用。同
期刊
【摘要】 为适应广播电视网络向NGB(下一代广播电视网络)以及多业务融合的网络演进,满足语音、数据、视频业务以及差异化服务的要求,采用IP技术组建业务承载网络,构建一张具备高性能、高可靠、可运营、可管理、可平滑升级、适合多业务承载的IP网络。此网络实现数字电视、高清电视、视频点播等广播电视业务及综合信息、数据等IP业务承载平台功能,满足多功能业务开展,承载未来多种新型增值业务。  一.青海广电网网
期刊
当前,在三网融合的背景下,电视和电信业都在面临着全行业的升级转型,特别是要积极应对OTT时代的到来。行业要得到持续快速发展,就必须创新业务,寻找适合自己和本地发展的业务模式。  市场研究公司英富曼电信和媒体公司的年度行业调查表明,创新是全球电信和媒体业者高管在2013年优先考虑的问题。  受访的电信和电视运营商高管将业务创新排在第一位,随后为合作和商业模式创新、客户服务创新和网络创新。  英富曼认
期刊
【提要】 各种专业的气象包装制作播出系统应运而生,如何在3D地图模型之上制作海洋预报?大洋DAURIC图文在线包装系统解决了海洋预报的电视包装处理问题,达到海洋预报绚丽的包装效果、丰富的表现形式及高效的信息处理能力。  本文将简要介绍利用大洋DAURIC图文包装系统对于海洋预报产品的电视包装,探讨DAURIC-Weather天气预报包装系统增加了海洋要素的改进方法。  【关键词】 电视包装 海洋预
期刊