论文部分内容阅读
随着多媒体通信的发展,甚低码率的视频编码已成为数字图象压缩技术的发展前沿。在基于内容编码的思想指导下,作者协助博士生汪孔桥,针对可视电话、视频会议和人机交互等各类业务中大量的头肩序列图象,提出并发展了一种甚低码率、面向对象的灰度图象编码方法——视频头肩序列图象编码算法。这一编码方法包括人脸检测、人脸跟踪以及小波分层图象编码算法。 但是,这一算法的性能距实际应用还有较大的差距,特别是在算法的实时性与鲁棒性等方面。为此作者进一步独立开展了视频头肩序列图象编码算法的实用化研究。主要成果有: 1.通过重新设计降低分辨率的方法,用“平滑——亚采样”方法取代了传统的mosaic方法,并通过调整算法结构去除算法中的冗余,和优化编程等措施,大大提高了人脸检测算法的运算速度。在一定程度上解决了人脸检测的实时性问题。 2.通过调整算法的寻优顺序,用“旋转角度——平移量”的搜索顺序取代“平移量——旋转角度”的搜索顺序,大大提高了人脸跟踪算法的速度,很好地解决了人脸跟踪的实时性问题。同时,通过加入噪声去除和引入对图象中人脸剧烈运动的分析,基本解决了人脸跟踪的鲁棒性问题。 3.通过选用分块DCT变换编码结合整体运动补偿的方法,在保证了甚低码率的前提下,初步解决了编码的实时性问题。 4,在LAN和PSTN上建立了实时的测试系统,对实用化的算法进行了系统集成和测试。 在完成以上实用化工作的同时,通过引入彩色分割,将原来基于灰度图象的人脸检测算法推广至彩色图象,并以此工作向国际MPEG组织提出了一项新的MPEG-7提案。