【摘 要】
:
视觉感知是生物智能的关键内容,人们通过对图像或视频的理解,将客观世界的信息映射成为脑海中的感知内容,而目标轮廓检测是实现上述功能的重要基础。由于生物视觉系统表现出突出的性能,通过深入研究其内在工作机理,将有助于视觉计算模型的构建和应用。本文模拟视觉信息流的感知和表达过程,以视通路中视觉信息流的解析和传递方式为基础,提出了一种基于尺度可变感受野的视通路轮廓检测模型;考虑到层级神经元细胞响应的差异性及
论文部分内容阅读
视觉感知是生物智能的关键内容,人们通过对图像或视频的理解,将客观世界的信息映射成为脑海中的感知内容,而目标轮廓检测是实现上述功能的重要基础。由于生物视觉系统表现出突出的性能,通过深入研究其内在工作机理,将有助于视觉计算模型的构建和应用。本文模拟视觉信息流的感知和表达过程,以视通路中视觉信息流的解析和传递方式为基础,提出了一种基于尺度可变感受野的视通路轮廓检测模型;考虑到层级神经元细胞响应的差异性及关联性,提出了一种X-Y双通道多抑制联合作用的轮廓检测模型。在X-Y双通道多抑制联合作用的轮廓检测基础上,提出了一种多支路特征联合决策的半监督分类方法。本文的主要研究内容和成果如下:(1)提出了一种基于尺度可变感受野的视通路轮廓检测模型。由于传统轮廓检测未考虑视觉特征与感受野尺度之间的联系,忽视了生物视觉系统中不同视通道间视觉信息存在差异及关联,导致轮廓检测细节信息模糊不清,纹理抑制不充分,轮廓检测结果不理想。本文主要利用感受野尺度动态调节机制构建尺度可变的感受野响应模型;基于视觉系统中存在的稀疏表达、去冗余度等机制,结合稀疏编码和各向滤波器模拟神经节至外膝体的视觉信息处理;考虑到不同视通道中视觉信息的差异性及关联性,提出多路径协同作用的视通路视觉响应模型,通过V1区复杂细胞完成视觉信息的重组,根据不同视通路间视觉信息的差异性抑制背景纹理。最后,以Ru G40库的图像为实验对象进行算法模型的有效性验证。(2)提出了一种X-Y双通道多抑制联合作用的轮廓检测模型。考虑到神经元细胞以及水平细胞之间的分类和视觉信息传递通道独立并行特性,提出了一种X-Y双通道信息传递数学模型;为适应对比度差异性分布下的视觉检测任务,提出了一种对比度动态调节的感受野响应模型;模拟视觉处理机制中存在的多种纹理抑制方式,引入环形抑制和稀疏编码分别实现X和Y通道的纹理抑制;模拟生物视觉系统自动补全轮廓功能,在最优方位基础上细分方位,利用二维高斯导捕获精细方位的神经元响应,从而保证轮廓结构的完整性。最后,以Ru G40为本文实验库,将实验结果的二值轮廓图与基准图进行比较,同时与主流轮廓检测方法进行对比分析,结果表明本文方法在综合性能上优于对比方法。(3)在前述双通道多抑制联合作用的目标轮廓检测模型基础上,提出了一种多支路特征联合决策的半监督分类方法,并应用于图片分类任务中。首先将获取的目标轮廓输入到分类网络中,从而有效改善了分类效率和复杂度;另外考虑到传统分类网络对有标签数据的海量需求,并且存在网络特征表征能力差、特征利用率低等情况,本文通过多样且互补的多支路特征提高对原始轮廓数据的表征能力;设计多支路特征的联合决策并建立共识驱动图,以降低伪标签数据错误标注的风险;最后根据伪标签数据和有标签数据联合训练多支路特征网络,进一步提高网络的特征提取能力。本文选用Market-1501数据集进行实验,得到了56.8%的平均正确率(m AP)和80.3%的Rank-1正确率,取得了较好的性能。
其他文献
脑-机接口(BCI)是一种通过分析大脑思考时的脑信号,从而实现直接控制外部设备的系统。BCI技术的发展为许多领域带来了研究的新方向,同时对研究者提出了更高的要求,目前已成为众多领域的热门研究课题之一。脑电图(EEG)是BCI系统中重要的研究信号,可以体现出大脑思维活动的变化。但EEG信号存在非平稳性,非线性等特点,这增加了信号的分析难度。本文以EEG信号的多模态特征为研究对象,对多模态在BCI系统
城市供水管网的漏损监测对于节约水资源,保障城市居民正常用水具有重要的现实意义。实际供水生产中存在着很多扰动因素,导致实时监测数据波动较大,很难判断管网是否存在异常。围绕这一实际问题,本文在现有的研究基础上,开展了以下研究工作:1.提出了一种基于用水模式的三级DMA短期需水量预测方法,旨在解决气候、社会因素导致需水量预测不准确的问题。采用孤立森林、相关性分析、因子分析等方法对影响日用水量变化的主要因
本文主要针对发动机零部件喷油器阀座的缺陷检测算法进行研究,目前这类细小零部件的瑕疵检测主要依靠人工视测或传统的机器视觉检测。人工视检检测效率低,无法保证检测的速度和准确率。传统的机器视觉检测方法虽然高效,但是应用环境苛刻,容易受光照、相机位置、背景等其他因素的影响,鲁棒性差,对特征信息的提取能力十分有限。针对上述问题本文开展了基于深度学习的喷油器阀座表面瑕疵检测算法的研究。针对原有喷油器阀座检测速
随着开关电源的应用日趋常态化,对开关电源的高品质要求也逐渐提升,高转换效率以及高功率密度的开关电源亦成为当前研究的焦点。本文以功率因数校正(PFC)变换电路为研究对象,旨在解决PFC变换器的共模干扰问题,同时保证电路的高功率因数和高效率运行。本文首先针对常用的无桥PFC拓扑就共模噪声的解决方式、开关元器件的数量和电感利用率等方面进行了对比分析。通过对比各种拓扑的优缺点,本文提出了一种新型共地式无桥
随着控制科学的不断发展,工业水平不断提高,控制系统逐渐从单一系统向复杂多维的互联大系统转变。传统的集中式控制方式只能用来控制结构相对简单的互联系统,而对于结构比较复杂的高维的非线性互联系统的控制效果就没那么理想了,因此分散式控制方式应运而生,将互联系统分割成多个子系统,为每个子系统设计独立的控制器。由于互联系统规模庞大,子系统间信息相互交流,在加上外部扰动等不可抗因素,互联系统很容易发生故障,因此
随着社会的进步和科技的不断发展,人们对于高效率便携式电源的需求越来越大,如何更有效的解决能源损耗问题,受到了广大国内外学者的关注。传统的反激变换器经常被应用在小功率场合中,但是不能完全回收漏感能量,且效率较低无法满足人们对于高效率的标准。不对称半桥反激在成本上继承了反激变换器的优势,同时与不对称半桥变换器一样可以实现软开关,很好地解决了回收变压器漏感能量的问题,得到了电力电子学界的关注。因此,本文
置信规则库(Belief Rule Base,BRB)推理方法结合了专家系统、模糊集理论和Dempster-Shafer(D-S)证据理论,是一种综合性的非线性系统建模方法。其在IF-THEN规则的后项中加入了分布式的置信结构,具有对模糊不确定、概率不确定甚至不完整信息的建模能力。但是在规则前置属性(外部变量)较多的情况下,置信规则库会出现“组合爆炸”问题,影响该方法的建模精度和适用性。为解决此问
模糊控制可以有效处理复杂非线性系统,而网络控制系统可以看作是一个复杂的非线性系统,因此模糊控制是用来分析网络控制系统的强有力的工具。T-S模型是由非线性模糊权重将一组线性子模型光滑连接而成的全局模型,在任意紧集内其可以以任意精度逼近任意光滑非线性函数。但在高度不确定环境下,一型模糊模型往往不能获得较好的效果,此时就需要使用二型模糊模型。区间二型模糊集合不仅保留了二型模糊集合处理隶属函数不确定性的优
因为锂离子电池越来越难以满足人们对于能量方面的需求,锂硫电池因高比容量和高的能量密度得到持续的关注,而成为重要的研究方向之一,为新能源系统的发展提供一种可能。但是正极硫的不导电性、硫的体积膨胀以及中间产物多硫化物溶解,这些都是锂硫电池未能商业化的主要技术障碍。本论文从锂硫电池的正极材料组成和结构出发,系统的探究了S@Ni O、S@GO/Ni O、S@C/Ni/Ni O等不同复合材料对锂硫电池的电化