一种改进的H.264/AVC模式选择快速算法

来源 :2010年通信理论与信号处理学术年会 | 被引量 : 0次 | 上传用户:kaigg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对H.264/AVC视频编码标准中预测模式选择计算复杂度大的问题,本文提出了一种改进的模式选择快速算法.对于帧内模式选择,利用图像的复杂度、帧内4×4块和相邻块最优预测模式之间的高相关性、绝对变换误差和(SATD)与率失真(RD)性能之间的强相关性等,有效的跳过一些预测模式;对于帧间模式选择,利用隶属度函数判断宏块的细节特征,从而缩小预测模式的选择范围.两者结合,大幅度降低了计算复杂度.实验结果表明,本文的改进算法在保证编码性能下降很小的前提下,编码时间平均减少了约85.47%,大大提高了编码效率.
其他文献
The electronic devices installed on vehicle become more and more powerful, which form a complicated electromagnetic field in the car.The problems of Electromagnetic Compatibility (EMC) are so serious
采样周期是相控阵雷达资源调度的关键参数之一.本文针对交互式多模型(IMM),提出了一种改进的自适应周期算法,该算法利用IMM上一次模型更新概率对各模型预先设定的采样周期进行混合估计,产生下一次的采样周期.在保证跟踪精度的要求下,有效地减少了跟踪采样的次数,节省了雷达系统资源.仿真中把提出的算法与固定采样周期算法和传统的公式法进行了比较,结果表明了文中提出算法的有效性.
对于机动目标,由于速度的变化,其Chirp信号雷达回波脉冲间同一采样位置的相位变化呈非线性.而传统的FFT相参积累方法只对相位线性变化的信号有效.本文提出了运用匹配傅里叶变换(MFT)的方法实现对具有二次相位项的信号的相参积累.仿真结果表明,该方法能够对机动目标回波信号实现有效相参积累.
由于ITU-T的G.722.2编码标准帧间激励的依赖性,导致其对丢失浊音端点十分敏感,会造成严重的错误传播.为改善其性能,设计了与G.722.2结合的宽带独立编码算法,它是由iLBC (internet Low Bit-rate Codec)改造的.提出了改进的算法,先用离散Teager能量算子对输入语音进行浊音端点检测,再对浊音端点附近进行独立编码以加强保护.实验结果表明,改进算法的平均码率在多
本文提出一种基于多级延时和嵌套全通滤波的联合混响模型.该模型根据混响的特点,把整个混响过程分为前期混响和后期混响,利用多级延时算法实现前期有限长度的离散反射,利用多级嵌套的全通滤波器模拟后期混响,同时利用低通滤波器模拟空气对声音高频成分的吸收.该方案避免了染色现象,可以产生高密度的反射声.实验结果表明,该方案可以有效地模拟现实混响.
当语音从采用AMR-WB协议标准的编解码终端传输至采用AMR标准的终端时,需要进行语音编码协议的转换,将AMR-WB码流转换成AMR码流.本文仅对AMR-WB到AMR转码过程中的LPC部分进行讨论.传统上,采用tandem方法进行码流转换,即先将AMR-WB的码流通过AMR-WB解码器,得到合成的语音,再将合成语音通过AMR编码器,从而得到AMR码流,这种转码方法的运算复杂度较大.现根据宽窄带合成
研究了汉语和英语清、浊音的LSF参数帧内相关性.针对相关性统计结果,分别对汉语和英语清、浊音的LSF参数进行了多种分组方案的SVQ实验.结果表明,清音的量化效果优于浊音,且英语清音在减少量化比特数的情况下依旧可获得较好的量化效果;把10阶LSF参数分成(4,6)两个矢量或(4,4,2)三个矢量会得到较优的量化效果.介绍了差分LSF参数的概念,实验表明其帧内冗余度比LSF参数低,且标量量化性能较LS
本文给出一种利用Benford定律对音频信号重量化进行检测的方法,该方法统计WAV格式音频信号各帧DCT系数首位数字的概率分布,并将其与Benford定律对比.对于未经重量化的音频信号,二者具有理想的拟合度,而被重量化的音频信号则不具有这一特点.由这一原理可实现音频信号重量化的检测.实验结果表明,利用Benford定律可以有效地检测出对音频信号的重量化;对于持续一定时间长度的局部重量化,也可以定位
本文将主动感知理论中的注意机制用于说话人跟踪问题,提出一种基于主动感知的音视频联合说话人跟踪方法.该方法将自底向上与自顶向下两种控制策略相结合,首先从麦克风阵列的多路语音信号中提取出听觉全局特征图,根据全局显著性度量进行注意焦点转移,实现摄像机的指向控制;然后利用说话人的视频信息,采用粒子滤波在感受野的中央区域进行注意焦点跟踪,进而确定说话人的空间位置.实验结果验证了本文方法的有效性.
该设计首次采用H.264编码的技术设计出一种高速高保真(HSHF: High-Speed &High-Fidelity)视频压缩编码器.并通过对H.264中只I片技术的解析、组合X264框架和提出HSHF帧内改进算法等手段,详细介绍HSHF视频压缩编码器的设计过程.研究结果表明:HSHF具有速度增益7倍以上、保真度41dB以上、压缩比8:1以上,并且对大图像、内容单一、运动剧烈的序列有着明显的优势