面向大规模流量的音视频资源在线溯源关键技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:liuqinggang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络作为一个开放式的平台,有一系列的让用户可以分享资源给他人的服务,网盘、资源共享网站等一键下载资源服务由于其操作简单、下载速度快等特点成为音视频资源最主要的分享途径,同时这类服务称为CLS服务。如何从骨干网节点海量的网络流量中获取下载CLS音视频资源HTTP会话的分享链接对于骨干网流量的网络审查、网络取证、网络流量监控、视频版权保护、复杂网路环境信息内容唯一标识、海量流量中的数据链接汇聚和关联,提取网络流对象等具有重要意义。为此,本文研究了一种基于追踪下载资源用户cookie的在线溯源方法。该方法首先从骨干网节点的海量流量中识别出传输音视频资源的HTTP会话并针对依次到达的资源数据包碎片使用累积哈希的方法计算资源的标识ID;然后,根据HTTP话单的cookie相似度分析,利用倒排索引的方法攫取下载资源对应的URL跳转链;最后通过提取同一资源对应的多个URL跳转链的唯一公共节点实现最终的溯源。进一步,本文实际开发了一个针对骨干网节点流量的CLS音视频资源溯源系统—cookieTracking。该系统采用了分布式流量处理架构,前端基于流量捕获平台获取TCP流量,解析所需HTTP话单,识别下载资源HTTP会话计算其资源ID,并通过socket以及Google Protocol Buffer发送至后端的流量处理服务器;后端负责下载资源HTTP话单的溯源:首先,采用了Reactor模式的事件处理设计,主线程将前端发送的消息放入HTTP话单队列,多个工作线程通过哈希表建立cookie项及location与HTTP会话的关联;其次,溯源线程根据倒排索引的方法追踪关键cookie进而获取URL跳转链,入口页面追溯线程通过合并同一资源对应的多个URL跳转链的唯一公共节点实现溯源。最后,通过爬虫程序访问该分享链接,比较前后下载资源的ID值验证系统溯源的正确性。此外,cookieTracking采用了前端数据包接受及发送的零拷贝技术、工作线程数目动态调整机制、线程池机制优化系统的性能。实验结果显示在平均带宽为2Gpbs的测试流量中持续运行5*24h,系统的平均查准率、查全率、获取时间分别为:85%、70%、5000ms,表明该方法具有很好的性能和可扩展性。
其他文献
目的:   NK细胞在肿瘤免疫监视过程中具有重要作用,NK细胞介导的抗肿瘤作用是由活化信号和抑制信号共同整合决定的,活化信号主要是由NKG2D受体与配体的相互识别完成。NKG2D
车牌检测与识别系统(License Plate Recognition,简称LPR)是数字图像处理与模式识别技术在智能交通(Intelligent Ttransportation System,简称ITS)领域中的重要研究课题之一,
目的:研究β肾上腺素能受体与多巴胺受体在大鼠结肠粘膜的分布,以及去甲肾上腺素和多巴胺对大鼠结肠粘膜黏液分泌的调节。   方法:采用AB/PAS方法(alcianblue/periodic ac
随着信息传输、可靠性和有效性的要求不断的提高,纠错码在众多领域也得到了迅速的发展和广泛的使用。在移动通信中,纠错码被广泛用于模拟体制的信令传输及数字体制的整个传输,以
目前在很多物种尤其是动植物中已经发现了多种smallRNA,并对其生成途径和功能机制进行了细致的研究。但对低等真核生物而言,只有粗糙脉孢霉(Neurosporacrassa)和稻瘟病菌(Magnapor
本文通过对荣华二采区10
期刊
移动互联网技术在最近几年迅猛发展,其导致微处理器与片上系统对静态随机存取存储器(Static Random Access Memory,简称SRAM)的要求变得越来越高。然而,由于等比例缩小技术的
期刊
快速傅立叶变换(FFT)作为数字信号处理领域的核心算法之一,在现代数字信号处理的各个领域有着极为广泛的应用。随着宽带OFDM系统,ADSL调制器,数字电视,雷达及声纳信号处理系统的
随着科学技术的进步,普通2D视频已经满足不了人们日益膨胀的视觉享受要求,因此,3D视频产品应运而生,如3D电视、3D显示器、3D显示屏等。由于3D视频源在制作上非常复杂,制作成本昂贵