融入勒让德多项式的活动轮廓模型及其在数字图像分割中的应用研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:ws162282330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分割是按照不同特征将图像划分成互不重叠、具有独特性质的各个区域,从而提取感兴趣目标的位置或者边界的过程.这一技术是进一步图像分析、理解的基础和关键,被广泛应用于多个领域,特别是在图像处理领域占据着重要的地位.迄今为止,上千种分割方法已被提出,通常都是针对特定问题的图像分割方法,具有一定的针对性和局限性,无法形成一个适合所有类型图像通用的分割算法.基于变分水平集方法和基于区域的活动轮廓分割方法在图像分割中得到成功的应用,但还有一些问题有待解决,例如参数选择、初始轮廓的影响、噪声敏感等问题.本学位论文针对数字图像常存在噪声大、弱边缘、对比度低区域、非同质等分割难题,开展了如下工作:1.提出一种新符号压力函数驱动的活动轮廓分割模型.在低维空间中,用一组勒让德多项式近似地拟合图像灰度变化,融入勒让德多项式的SPF能精确逼近感兴趣区域.新模型利用新的SPF特性以及气球力作为局部信息,能灵活控制曲线收缩膨胀运动,降低对初始轮廓的敏感性.同时,新模型还引入正则项作为全局项来限制曲线演化长度,能有效地实现非同质、低对比度图像的分割.实验结果表明,新模型与已有的勒让德水平集模型、传统分割模型相比,分割的结果更加精确,计算复杂度低,分割速度快.2.提出一种改进的自适应全局项分割ACM.针对新模型的全局项是常数,导致分割结果无法得到正确边界,提出一个改进的自适应全局项.利用演化曲线的背景与前景的勒让德系数向量差值的均值、最大值、最小值函数构造了自适应全局项,从而形成一个能实时更新演化曲线的能量函数.实验结果显示改进的模型能更好的处理图像细节,加快了演化速度.3.提出一种融入勒让德多项式的活动轮廓分割新模型.为了避免LIF模型窗口尺寸的选择,构建了融入勒让德多项式的新的局部拟合图像,产生了新的差值能量函数作为局部项.新LIF模型选取Chan-Vese模型中能量拟合函数作为全局信息,用权重系数来根据图像类型调整局部信息以及全局信息的比例.实验结果显示,新LIF模型能更好的避免LIF模型对初始轮廓以及噪声敏感等问题,相比于传统的模型能更好地解决非同质图像分割问题.
其他文献
空间RDF数据上的Top k最相关语义地点检索查询结合了基于关键词检索和基于地点检索的两种思想。这种查询会返回一组语义地点,每个语义地点都是以一个以带有关联位置信息的地点实体节点为根节点的子图。该查询通过计算一个评分函数来获取语义地点和关键词之间的相关度。这个分数由每个关键词在结果树上出现的节点和地点节点(根节点)的距离组合可得。但我们观察到由kSP(Top k Sematic Place)算法查
对话系统是自然语言处理领域一个重要的研究课题。越来越多的服务商使用智能对话系统来帮助他们减少人工开销。同时,也有越来越多的用户愿意使用智能对话助理来帮助他们完成日常的各项工作。特别是近年来,随着深度学习等技术的发展,面向开放域的对话系统逐渐成为了研究热点。为了设计更好的对话系统,对系统生成的应答进行质量评估,是研究过程中不可或缺的一步。一个好的评估方法,将有助于缩小机器对话与人类之间的差距。然而,
随着万物互联时代的来临,不同于云计算时代,大量数据在网络边缘产生,有限的网络接入带宽和应用对实时性的要求使得远端的云计算中心不能对海量数据进行高效处理。多址边缘计算(Multi-access Edge Computing,MEC)技术作为云计算模式在边缘网络中的扩展,能够在边缘网络中支持资源密集、延迟敏感型应用,并为用户提供有地理位置感知的实时服务。但与此同时,新型信息服务和面向业务类应用的快速增
在现实生活中,人们常常需要对自己拍摄的照片进行各种操作,以实现期望的视觉效果。例如给照片中的人物化妆,改变图像中的呈现的时间或季节,按照某种特定艺术风格对图像进行渲染等等。这通常需要借助相应的图像编辑工具,例如Photo Shop等,并花费大量的时间和精力才能实现上述效果。图像风格转换技术可自动地实现上述图像编辑任务,降低图像编辑的操作难度,提升易用性。给定一张内容图像作为输入和一张图像作为风格参
深度学习是机器学习领域中的一个研究方向,是一种以复杂神经网络为基础架构,学习数据的内在规律和表示特征的算法。深度学习使计算机具有像人一样的分析学习能力——能够识别文字图像声音和挖掘数据内部特征,因此,深度学习已被广泛应用于搜索技术,数据挖掘,自然语言处理,图像识别,机器人导航,推荐系统和个性化技术中,同时也在其他相关领域中取得了许多成果。然而,现有的深度学习模型在计算上昂贵且占用大量内存,从而阻碍
近年来,随着现代信息技术的飞速发展,人类进入信息社会,越来越多现实应用领域涉及到多标签学习问题,如文本分类、生物信息学、图像识别等等。传统的单标签学习中,学习对象只隶属于单一类别,而多标签学习中,学习对象可同时隶属于多个类别,并且类别(标签)之间存在着复杂的关联性。多标签学习的目的是准确预测未知样本具有的标签子集,由于标签数量可能巨大且互相之间存在着复杂的关联性,因此,比传统的单标签学习具有更高的
随着计算机科学的发展,数字图像和视频成为人类获取外界信息的主要来源,而在现实世界的夜晚或者其他低光条件下,我们获得的图像和视频质量会降低,这包括亮度低、对比度低、噪声大等特点.这些图像和视频质量的降低将会直接影响到监控安防、夜间行车和生物医学等领域的发展.因此,随着计算机视觉等研究领域的不断深入,图像处理技术备受重视,其中低光图像增强就是计算机视觉的一项重要课题.对于一些经典的低光图像增强算法,参
数字图像处理近年来得到了极大的重视和长足的发展,并在科学研究、医疗卫生、通信方面得到了广泛的应用.在实际图像形成、传输的过程中,由于各种干扰因素的存在图片会受到噪声的污染.这严重影响了人们对数字图像的认识,所以图像复原在图像处理中十分重要.本文主要针对脉冲噪声(特别是椒盐噪声和随机值脉冲噪声),提出基于鲁棒分形图像编码的原始对偶算法和低秩加权核范数算法,数值实验也说明了这两种算法的有效性.具体研究
大数据时代,聚类分析是探索性数据分析不可或缺的工具.与分类相异,聚类是在无监督环境下进行的.在聚类分析中,人们通常认为彼此接近的点往往属于同一个类别,这就是所谓的聚类假设.通常情况下,同一类中的模式比不同类中的模式相似性更大.当我们把研究对象数字化为多维空间当中的点时,模式之间的相似性可转化为对应数据点之间的邻近度(或相似系数).根据聚类的这些特点,本学位论文提出了一种基于类内邻近度的聚类算法框架
在真实场景中,由于被拍摄物体快速运动、拍摄者手抖等各种原因,使得运动模糊成为最常见的模糊类型之一,运动模糊图像复原技术成为了一大研究热点。近几年,随着计算机处理速度和存储能力的提升,在运动模糊图像复原这一任务中,利用深度学习对模糊图像进行复原的方法发展迅速,该类方法使用卷积神经网络自动估计模糊核,显著提高了复原效果。主流的运动模糊图像复原算法均需要使用成对的数据集进行训练,而获取成对的数据集往往比