形状部分的视觉显著度与形状编码

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:a67273271
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代多媒体信息处理要求计算机能够模拟人脑的功能实现对海量图像和视频数据的检索、分类、识别、编辑、交互和存储。而形状作为物体识别的关键特征,对于上述应用起着不可或缺的作用。因此,如何准确而高效地实现形状的计算和存储,成为本文研究的重点。现实物体姿态和视角的变化,使得形状的外观千变万化。人眼对形状的区域选择性和多尺度特性,极易导致实际形状度量与视觉感知之间的差异。更不用说由形状获取导致的量化和分割噪声。这些都给形状的计算和存储带来了极大的挑战。为迎接上述挑战,本文深入研究了基于部分和轮廓的形状表示理论及应用。提出了形状部分的视觉显著度,改进了可操作率失真轮廓编码框架的失真度量和编码结构,并通过双重失真规则化优化了原有的框架。上述成果应用于形状解析、指尖检测和手势识别,均取得了良好的效果。下面给出具体的研究成果。1、提出了形状部分的视觉显著度。首先,将形状部分的视觉显著度简化成三角形的视觉显著度。然后,将三角形的视觉显著度建模成三角形的两邻边长度和、长度比和转角的函数。再利用这三个因素之间的完备性、独立性和直观性,推导出三角形的视觉显著度。实验结果表明,该度量优于现有度量,能显著提升形状解析和手势识别的准确度。2、提出了基于解析法的精确失真度量。首先,将该度量定义为原始轮廓点到参数曲线的最短距离。接着,利用最短距离线段与参数曲线段垂直这一几何关系,给出对应的参数方程。然后,通过解析法求解参数空间,获得最终的距离。为减少执行时间,提出了混合允许失真检验算法。实验结果表明,该度量能精确度量实际失真,且计算复杂度与现有度量的最低计算复杂度持平。3、提出了两种任意方向边编码结构。首先,将数字平面分成八个或者十六个扇区,然后用扇区序号、短分量和长分量表示近似边。实验结果表明,该编码结构能有效地节省近似多边形的顶点数目,在提高编码效率的同时,使得形状描述更加简洁。4、提出了基于失真双重规则化的可操作率失真形状编码方法。将基于2-范数的失真规则项引入原有的目标函数,以期在边码率与边失真之间寻求更好的平衡。为避免噪声干扰,给出了规则化参数的取值范围。并将该组合优化问题转化为带权重的有向无环图中的最短路径问题求解。实验结果表明,该方法不仅能够在保持编码效率不变的情况下减少近似边失真,同时对噪声也具有很好的鲁棒性,因而非常适用指尖检测和手势识别等应用。本文的贡献主要有两点:第一,形状部分的视觉显著度使得物体形状部分之间的视觉显著性比较成为可能,第二,基于解析法的精确失真度量、任意方向编码结构,以及双重失真规则化策略使得可操作率失真轮廓编码结果更准确、简洁而高效。这些都为基于形状的物体识别奠定了良好的基础。
其他文献
救死扶伤的最佳效果来源于正确的诊断和治疗。对于伤病,无论是或难或易的诊断,还是或简或繁的处置,都是一个集理论与实践、经验与技术于一体的调查研究、分析判断、不间断地进行
莫言的“高密东北乡”王国中有大量物质、社会、精神、语言等方面的民俗文化。但莫言并没有停留于社会生活层面的诸种民俗事象活化石般地记录和复现,而是经过审美取舍和艺术
心脏骤停是指病人过去有或无心脏病史,意外地发生心脏射血功能的突然停止,导致脑血流的中断,随之出现意识丧失、呼吸停止、瞳孔散大,即可发生临床死亡,因此心脏骤停为心脏急
<正>三台县坚持"抓党建促脱贫、以脱贫强党建",紧扣脱贫攻坚大局精准发力,注重在脱贫攻坚第一线选干部、配班子、建堡垒、育人才、强治理,有效助推了绵阳市丘区农村扶贫攻坚
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
“没有正确的诊断,便没有正确的治疗”是每位临床医师都熟悉的格言。诊断包括临床诊断和病理诊断,病理诊断当然是最准确的,但有时亦需结合临床加以考虑。何况大多数病例并不可能
共面波导(CPW)作为一种重要的平面传输线,已应用于微波、毫米波、亚毫米波、光学和高温超导集成电路等领域,并已在一些电路中取代微带线,在微波集成电路中占据着越来越重要的
我国城市高层建筑的发展和地铁建设的日益兴起,地下空间的布局日趋复杂,于是,深基坑的施工、支护施工监测也越来越受到人们的重视。因此,为了保证工程安全顺利的进行,在深基