多媒体会议系统音频处理与视频码率控制技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:yyfdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体通讯系统中,高效的语音激活检测可以减少背景噪声的传输,确保在声音完美的基础上,大大提高带宽利用率;码率控制技术可以使得视频在具有较高峰值信噪比同时获得稳定的码流,对于H.264,这点特别重要。与MPEG—4不同的是,在H.264协议中没有定义基于对象的编码,没有利用视频画面由不同对象组成这一基本特性,那是否可以通过基于对象的编码提高PSNR呢?从目前了解的文献来看,未见这方面的研究,所以该问题在H.264的码率控制策略中也显得格外重要。 本文研究了静音检测、语音混合算法。提出基于变分辨率频谱MFCC参数及两个感觉参数的语音特征的静音检测方法,使用多门限过零率检测首先对纯静音进行预判,然后用支持向量机对语音特征进行分类。相比于G.729B中的静音检测技术和基于MFCC+SVM静音检测技术,在噪声比较大的情况下仍能达到比较高的语音识别率。 作为视频通讯系统混音器的重要组成部分,本文采用SAW混音算法对各路解压音频进行混音,听觉测试比较优秀,并且通过对算法结构进行优化,获得了比较低的混音延时,即使是对20路音频混音,其运算延时仍很低,可以满足实时传输的要求。将新的静音检测技术与SAW混音技术使用在视频会议系统后,MCU的混音计算量大大小于采用G.729B静音检测技术的视频会议系统MCU,同样设备条件允许更多的客户端连接服务器参加语音讨论。 文中全面的分析了码率控制模型,首先对图像DCT变换系数的统计特征进行探讨,证明交流系数具有拉普拉斯分布,并介绍了推导过程。其次,基于DCT变换的视频编码器中,实现比特分配的一般手段是调整各个宏块的量化步长。本文从理论上讨论了基于宏块的率失真模型和二次率失真模型,得出量化步长与码率之间的关系。 本文对基于图片、视频的文字提取算法进行了总结,重点分析了一些代表性算法:颜色分割以及纹理分割等。并提出了一种基于多分辨率的视频文字提取算法,在多分辨率情况下依据梯度信息提取文字候选块,并使用SVM进行最后候选块的鉴别。另外基线的引入更加准确的定位了文字,提高了判别的准确度。而使用了连续帧检测,则降低了误判的概率。结果表明对于复杂背景下的文字也能得到了很好的分割的效果,并且有效的抑制了复杂纹理导致的误判,对中英文文字均有较好的效果。 通过对率失真模型和文字提取算法的研究,本文提出H.264中多个核心算法:十字MAD预测模型、帧码率分配、基于文字对象的宏块码率分配等,并将基于宏块的率失真模型应用在H.264的宏块层控制中,实验表明,相比于MAD线性预测模型,十字MAD预测方法具有运算简单、误差低的优点;我们比较了基于宏块的率失真模型与基于二次模型的H.264码率控制算法,前者具有更好的PSNR,缓冲能保持在一个较平稳状态,缓冲占用率不高;在对具有文字字幕的序列进行测试时,我们使用了自适应的宏块码率分配方法,当字幕区域获得相对较少比特时,视频的PSNR有所提高,PSNR与帧实际比特数均无明显波动。
其他文献
随着实验技术的进展,近几十年来,人们又开始关注凝聚态系统的零温量子相变的研究.本文主要是从数值和解析两个方面研究了二维Wen-plaqutte模型加入横向外场 (哈密顿量形式为)后
整数和分数量子霍尔效应的发现是近来凝聚态物理学的一项辉煌的成就,并吸引了大量的物理学家转到这一领域中来.随着对这一理论研究的深入,出现了很多的新的物理内涵,象电荷密度波
近二十年来,随着纳米技术的发展,人们对介观系统的研究取得了长足的进展。本文使用非平衡格林函数理论对量子点中的圆极化场引起的动力学0-π相变进行了研究。本文由三章构成:
本文分为两部分:第一部分是对目前复杂网络研究现状的简单综述,第二部分是作者关于加权网络和无标度电信博弈网络的两个研究工作的详细总结。 在文章的第一部分中,作者介绍了
“形而上的奋斗”,语出J.M.库切的《内心活动:文学评论集》之《布鲁诺·舒尔茨》篇:“雅各布周围是些愚笨的人,他们对他的形而上奋斗毫不理解,尤其是他的宿敌——女仆阿德拉。”  库切是2003年诺贝尔文学奖得主。他笔下的舒尔茨,是波兰犹太籍作家,1942年被盖世太保枪杀于故乡街头。舒尔茨仅存于世的只有两个短篇小说集《肉桂色铺子》和《沙漏做招牌的疗养院》。  当我第一次读到“形而上的奋斗”这个词时,就
期刊
低维材料(纳米点和纳米线)的量子效应,使得它的力学、热力学、电磁学及光学性能发生改变并具有奇特的物理和化学性质,它在微电子、纳电子、量子信息存储、量子光电器件等方面具
奇异夸克物质(SQM)作为预言中存在的一种十分稳定的强作用束缚体系,单个强子口袋中包含了几乎等量的u、d、s夸克,其存在与否关系到人们对强相互作用的深入理解。 质量较小的
手征夸克模型被广泛的应用于研究核子的自旋味道结构。在手征夸克模型中,夸克放出赝标Goldstone玻色子,因此我们可以将通常夸克模型中的组份夸克看成是由夸克及被其放出并围绕
“学案导学”,是指以学案为载体,以导学为方法,教师的指导为主导,学生的自主学习为主体,师生共同合作完成教学任务的一种教学模式。这种教学模式一改过去老师单纯的讲,学生被动的听的“满堂灌”的教学模式。这种教学模式重要的任务是培养学生的自学能力、自学习惯,教会他们怎样学习、怎样思考,提高学生分析问题、解决问题的能力。充分体现了教师的主导作用和学生的主体作用,而主导作用和主体作用和谐统一,才能发挥最大效益
最美好的回忆往往是在最苦最累的时候留下的.rn神气的军装,穿在身上,美丽的橄榄绿,展示着它的威严.永远铭记,烈日下一遍遍的齐步走;永远铭记,三伏天下漫长的徒步行军;永远铭