网络监控系统中音视频实时流同步技术的研究与设计

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:lcgbeyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着安防事业的蓬勃发展,监控行业已经遍布教育、公安、银行等领域并发挥着重大作用。与此同时,音视频压缩技术也日益成熟,高性能的音视频压缩算法使网络监控的出现成为可能。由于网络监控拥有组网灵活、维护方便、使用便捷等优势,正引领着未来监控市场的发展趋势。在网络监控系统中,音视频同步是一个关键的问题。受网络延时,拥塞等影响在客户端接收的音视频信息往往会出现“唇音不同步现象”,这将大大降低用户的体验度。当前,音视频同步算法多样,复杂且效率低,很难应用于资源有限的网络监控系统中。由于在数据传输中使用了RTP协议,如果能有效使用RTP包中的时间信息,音视频同步问题将会大大简化。本文正是根据网络监控系统这个平台在应用中遇到的音视频同步问题,提出了解决方案。整个网络监控系统包括媒体服务器,数据管理转发服务器以及客户端软件。本文根据音视频流的传输过程将其分采集、压缩、发送、接收、同步、解压、播放等模块,针对这些模块进行优化和缓存设计,并充分利用RTP协议中的时间戳,提出参考时间及音视频同步算法。本文首先介绍了音视频同步技术的研究背景和意义,并讲述了音视频流媒体的广泛应用及在网络监控系统中的价值。然后,重点研究了本文所涉及到的相关技术,包括音视频压缩编码技术,流媒体技术,实时传输协议RTP,以及几种音视频同步技术。并分析各技术的优缺点,为该系统从理论上确定了切实可行的方案。接着介绍了本文网络监控系统的软硬件环境,其软件特点基于Linux操作系统开发的,其硬件特点是基于arm+dsp结构的主芯片控制的。并针对硬件平台及当前已有的技术,通过理论验证和仿真等方法找到音视频数据发送的最佳MTU值,通过缓存的设计消除了音视频的乱序和抖动现象,最后,在direcshow的框架基础上完成音视频在PC客户端的同步播放。
其他文献
随着智能手持设备的广泛普及与人工智能高速发展,图像和视频成为主要的媒体信息传递方式。图像和媒体信息中包含了大量的自然场景,其中的文字信息具有重要的应用价值。场景字
隐密术(Steganography)是利用人类感知系统的不敏感特性及多媒体文件的冗余特性,在不引起人类感知系统怀疑的基础上,通过在多媒体文件中嵌入秘密信息实现秘密通信的一种技术
波达方向(Direction of Arrival, DOA)估计侧重研究空间中多个传感器阵列构成的处理系统对空间信号参数的估计能力。它的基本目的是确认同时处在空间某一区域内的多个感兴趣
OFDM系统要求子载波间具有严格的正交性,且其符号周期较长,因此对本振相位噪声较为敏感。相位噪声是频率源非理想因素引入的一种随机相位干扰,会严重破坏OFDM系统的整体性能。对
在新兴的通信技术和移动互联应用的需求不断提升的情况下,无线通信的需求在近几年大幅增加,无线电频谱资源可谓是越来越稀缺。在这样的条件下,扩展可用的频谱资源和充分利用
本文主要研究了电子侦察中雷达信号调制方式的实时识别问题,以FPGA硬件可实现为前提,给出了五种常见雷达信号调制方式的实时识别方法和硬件设计方法。  首先从总体上介绍了雷
语音中典型的瞬态噪声是一段突发的、脉冲式的信号和一段短时衰减振荡过程构成。瞬态噪声的存在严重干扰语音质量。由于其占有较宽的频带,与语音信号在时频域有较多重叠,因此
Capon波束形成算法,作为一种经典的自适应波束形成算法,其基于最大化信干噪比准则,可以有效地保持期望信号并同时抑制干扰和噪声。理论上,其假设导向矢量精确已知,并且快拍数
航空机载总线用于连接飞机中的各个子系统,是现代航空电子系统的中枢,机载总线性能的优劣对飞机整体性能的影响至关重要,随着航空电子系统日趋复杂,传统的机载总线逐渐难以满
生物特征识别技术在信息化高度发展的当今社会中为身份识别提供了有效的途径,受到越来越多研究者的关注。基于多生物特征融合的身份识别方法相比单特征识别具有以下特点:1)更强