面向手语新闻播报系统的压缩技术研究

来源 :北京工业大学 | 被引量 : 4次 | 上传用户:elements17
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聋人在获取信息,尤其是实时性极强的新闻类信息时,存在着很大障碍。如何使用计算机技术帮助聋人提高他们对信息的接收能力成为一个既有极高科研价值,又有极强实际意义的课题。本文完成了一种面向聋人的信息传媒方式,即通过计算机动画技术使用虚拟人打手语来进行新闻播报,进而通过使用大量压缩算法来提用系统的服务吞吐量与可用性。首先,通过设计与实现手语表达系统与基于网络的手语新闻播报系统从宏观上解决了聋人看新闻的需求,然后着重分析如何对系统中的三维网格数据、手语动作驱动数据、纹理数据、二维手语视频数据进行有效压缩来提高系统的服务吞吐量,以提高系统的服务能力。对于三维网格数据,本文提出基于几何序列的多分辨率网格压缩方法,通过将多分辨率网格相应的几何图组合为几何序列,并使用视频压缩算法来进行压缩,在主观与客观质量上都取得了极大的提升,而且大大提升了码流数据的可用性与鲁棒性;对手语动作驱动数据,本文引入了基于差异补偿的Lempel-Ziv马尔科夫链算法来降低动作角本文件中的能量,以提升压缩性能;对纹理数据,本文采用JPEG2000进行压缩来支持多分辨率特性,进而使用基于自适应位平面的压缩算法,加强了纹理数据压缩的适应性,提高了压缩性能;对于二维手语视频,本文采用H.264/AVC标准进行压缩,并着重分析了帧内预测算法,并提出了两个加强帧内预测性能的算法,其一为基于块匹配的帧内预测算法,通过挖掘空间冗余来从主观和客观上提高预测的准确度,其二为基于模式适应度的快速帧内预测模式选择算法,通过考虑预测方向的能量分布来定义适应度概念,并降低候选预测模式的数量,加速了预测速度。在文章的最后,对工作进行了总结,并对未来工作提出了展望。
其他文献
2000年,Ahlswede等人基于网络信息流的概念提出了网络编码的思想。通过允许网络节点进行编码,可以获得网络组播速率的最大流限,即网络资源利用的理论上限,而通过传统的路由和复制
液晶显示器LCD(Liquid Crystal Display)现在已经广泛应用于手机、 PDA(Personal Digital Assistant)等便携式电子产品中。LCD控制器则是系统和LCD之间的接口部件,是系统显示
平台化是管理软件的发展趋势。传统的管理系统是在低层的技术平台上直接构建的,采用面向技术、业务无关的“原始”编程工具进行开发,这直接导致了所开发的管理系统具有两个重大
随着计算机和通信技术的不断发展,嵌入式系统的应用日益广泛,但传统的开发方法限制了软件开发人员,因为软件的调试,需要在真实的目标系统上完成。为了解决这个软件开发的瓶颈,全系
自然语言理解是人工智能领域的经典难题,目前国内外有大量的研究。在汉语信息处理领域,相应的研究应该包括有字处理、词处理、句处理、篇章处理。然而到目前为止,关于汉语理解的
新的网络存储技术——SAN(Storage Area Network)以其自身多方面的优势,为日益增长的信息存储和管理提供了良好的解决方案,成为网络存储理想的管理和应用模式。但目前,SAN的管理
在过去十年里,随着众多领域并行计算需求的迅速增长而硬件又受到摩尔定律的严重制约,多核CPU现在被越来越多的应用于并行计算机中,于是基于多核处理器的并行程序设计技术也就成
随着“信息爆炸时代”的来临,如何更快、更准、更方便的搜寻到数据已经成为了当代社会关注的焦点。在这种需求的刺激下,搜索引擎技术成为了计算机科学的研究热点。顺应这股潮流
近几十年来,数据库技术和海量存储器等硬件的快速发展使得人们收集数据的能力得到进一步的提高。面对信息时代海量数据的出现,如何有效地利用巨量的原始数据分析现状以预测未
本文对MDA中PIM到PSM/SQL模型转换进行了研究。文章探讨了MDA中PIM到基于SQL的PSM的模型转换技术。定义了UML类到SQL表的模型转换关系,给出了UML类源元模型、SQL目标元模型以