基于背景建模的快速特征匹配方法及应用研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:aigeng87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在项目“虚拟手术仿真中多模态耦合视触觉反馈关键问题研究”中,项目组研制了基于虚拟现实、计算机视觉和电磁学等技术的视触觉交互平台。该平台通过立体视觉技术获取操作器械的空间位置信息,并将其传递给虚拟场景;虚拟场景利用该信息同步虚拟操作器械以及计算它和虚拟模型的位置关系,依此进行触觉渲染并传递给电磁力反馈装置;力反馈装置根据“力”的大小来调控电流,进而引起操作器械周围磁场的变化,实现力反馈的目的。在定位过程中,为了避免环境干扰而采用白色遮罩将操作空间覆盖住,使得该平台的操作空间及应用场景受限;传统的特征匹配方法存在较多的误匹配,且计算量较大,导致虚拟场景中的操作器械存在抖动现象和达不到实时性要求;以及网络摄像头的使用使得整个平台的自主性和集成度都很低,这些问题的存在都不利于该平台的进一步推广应用。
  为了解决上述问题,本文开展了基于背景建模的快速特征匹配方法来实现快速定位的研究,该工作包括的主要内容有:去除非目标区域的背景建模方法研究、提升背景模型中训练数据质量的优化方法研究、计算空间位置过程中快速精确的特征匹配方法研究以及嵌入式环境下快速视觉定位方法的硬件架构设计与实现。主要的研究工作如下:
  提出了一种新的基于核密度估计(kernel density estimation,KDE)的背景模型框架。首先我们为每一个像素设计了一个新的数据结构,称之为米诺向量(Mino vector, MV);为场景中的像素定义了动态性这一概念,并依据动态性对像素进行分级,以便得到量化的结果,称之为动态级。然后引入并实现了可变核密度估计方法,该方法可以有效地提高估计精度。其次,在阈值选择上,不同于传统的全局阈值,每个像素依据其自身的动态级自适应地获取阈值。最后,受著名的电子游戏 – 俄罗斯方块(Tetris)的启发,我们提出一种称之为Tetris更新策略(Tetris update scheme,TUS)的方法,当更新条件满足时,将背景模型最底层的一行删除,从而使得噪声得到抑制。通过在著名的视频数据集CDnet2012上验证本文方法,实验结果表明,和当前最好的方法相比,我们的框架实现了具有竞争力的结果。
  提出了用于提高背景模型的训练数据质量的优化方法。训练数据的质量问题涉及两个子问题,分别是多少样本算是合适的,以及这些样本里面哪些是可靠的。为了解决第一个子问题,本文首先提出一种称之为双重方差的收敛方法,用来决定在训练数据序列中的一个合适的终止点。这样的话,可以使用从第一帧到该终止点间的数据进行训练,而不是使用全部的训练数据。至于第二个子问题,我们通过为每一个像素构建一个像素直方图,然后从这些灰度值数量不为零的数量上减一,该方法可以有效地去除外点的干扰。进一步地,本文方法属于即插即用型,可以方便地应用于基于训练样本的背景模型。实验中,通过将本文方法集成到多种当前最优的方法中,实验结果表明,这些方法在使用本文方法前后的三项性能指标(recall,precision和F-Measure)都有所提升,分别为从4.95%到16.47%,从5.39%到26.54%和从12.46%到20.46%。
  提出了用于立体图像对( stereo pairwise image , SPI )匹配的方向大约一致(approximately consistent in orientation,ACIO)约束关系,其描述了SPI的匹配特征向量间的空间位置关系,有效地避免了误匹配的发生,提高了匹配的精度;通过对标准K-d树(standard K-d tree,SKD-tree)结构的分析,提出了层次结构K-d树(hierarchical K-d tree,HKD-tree),将SPI特征集根据ACIO约束关系划分成层次结构并建立映射,该方法缩小了搜索空间,从而达到加速匹配的目的。在ACIO和HKD-tree的基础上,提出了高效、快速的匹配算法。实验结果表明,所提方法比 SKD-tree 方法和最新的级联哈希方法( cascade hash , CasHash )在精度上略占优势,但在匹配速度上比SKD-tree快一个数量级以上,同时也数倍于CasHash。
  为了提高和完善该平台的整体性与自主知识产权,提出了基于Arm Cortex-M系列高性能微处理器的双层硬件架构设计,并优化背景模型和特征匹配算法。前端芯片用于信号采集和运行优化的背景模型进行目标过滤,后端芯片用于发送同步采集控制信号和对过滤的目标对象进行特征匹配,并计算目标的空间位置。实验结果表明,双层硬件架构设计和优化的背景模型与特征匹配算法,可以在保证位置计算的准确性的前提下提高运行速度,为该平台后续向高集成度方向的发展和进一步的推广应用奠定基础。
其他文献
随着人们对环保性问题的日益重视以及对电网供电质量要求的不断提高,以往仅仅考虑经济性的单目标优化已经跟不上新时代对现代电力系统运行控制的要求。当代的电力系统需要同时综合考虑发电成本经济性,发电环保性,电网安全性、可靠性和稳定性以及减少电网有功线损这些问题。因此,研究电力系统多目标优化对如今电网的运行有着实际的指导意义。不仅如此,随着大规模微网、分布式能源的开发与利用均通过以电网为骨干网的能源系统将能
全球变暖与大气污染是威胁人类生存的两大环境问题。火电厂在发电过程中会产生大量的温室气体及大气污染物,前者主要以CO2为代表,后者则以PM2.5、SO2、NO2的影响最为严重。作为碳排放和空气污染物排放的最重要主体之一,电力工业在低碳、低大气污染发展中担任着重要的角色。近年来,电力系统最优环境经济调度技术因其无需增加多余建设成本、收效较快而引起学者的广泛关注。  大气中温室气体的含量直接决定着大气对
学位
风力发电技术的发展使大规模风能资源得到了开发和利用,然而我国源-荷逆向分布制约风电的消纳,远距离输电是解决风电消纳问题的重要手段,固定串补能显著能提高线路的输送能力,增加系统的稳定裕度,在远距离输电中广泛应用并带来次同步振荡问题;但风电场规模庞大,单机容量小,建模复杂,是研究次同步振荡等风电并网动态问题的重要瓶颈,为此需要对双馈风电场进行等值建模,借助于等值技术,可有效地研究次同步振荡问题。因此,
该论文介绍了MgB的重要超导特性和提供了研制MgB超导薄膜的有价值的新方法.该论文创建了一种新的制作MgB超导薄膜实用技术,化学气相沉积两步法异位退火法合成MgB超导薄膜,采用这种新方法制备MgB超导薄膜的基本过程为:先以BH为B源在衬底上化学气相沉积先驱B薄膜;然后先驱B薄膜在Mg蒸气中高温退火形成MgB超导薄膜.这种新方法成功地在AlO多晶和单晶衬底上制备了MgB超导薄膜.在多晶AlO衬底上制
学位
该文的主要工作有以下几点:(1)根据专利01250270.7提出的横向流动和电激励相结合的方法来提高TEA CO激光器的重复率的新思想,建立了TEA CO激光器的理论模型.(2)根据双曲函数保角变换的基本原理,分析了放电电极的特点,讨论了电极面形变化对电极之间电场分布的影响,对几种不同的电极面形结构进行了对比和研究.(3)给出了风机、导风板、球隙、腔镜结构等主要部件的结构形式和设计计算方法,为新结
学位
该文首先阐述了质子交换LiNbO波层结构特性、质子浓度分布、折射率分布基本理论,论述了折射率测量方法迭代法.并用三维FD-BPM法对的质子交换LiNbO波导传输模式进行了研究,确定符合器件设计要求的单模波导的尺寸和工艺参数.该文对质子交换LiNbO单Y相位调制器的重要部件Y分支进行了深入的研究,比较了不同S弯曲形式的Y分支过滤长度与损耗的关系,并计算出间距250μm时的最小弯曲长度.对于调制器的电
学位
该文研究了脉冲预电离的扩散冷却CO激光器的运转机理,提出采用脉冲预电离技术改善纵向脉冲放电的稳定性、降低工作电压和提高电光转换效率.提出了两种新的预电离技术.采用螺旋结构横向脉冲预电离技术首次研究了非自持纵向放电CO激光器,非自持激光器的主放电和输出功率由外加的预电离脉冲控制,激光器的可控性非常好.该文还发展了一种采用Pspice软件对脉冲预电离放电进行瞬态模拟的理论分析方法,有利于激光器放电电路
深度学习方法在自然图像、自然语言、人脸等众多机器学习领域获得了较好的性能,且引起了学术界与工业界的广泛关注。深度学习研究的是一大类拥有多层非线性变换的模式识别系统,这些系统将数据从低往高逐层抽象,相比于浅层方法更适合于对真实世界中的高度非线性问题进行建模。  人脸表情识别是一个典型的高度非线性问题,本文围绕人脸表情识别问题,研究探索了二值神经网络、二值自编码器、二维卷积神经网络、带有视觉注意力的卷
量子密码是近三十年发展起来的一种新型密码技术,它是经典密码与量子力学相结合的产物。与传统基于计算安全的经典密码体制不同,量子密码的安全性不依赖于计算的复杂度,而是基于量子力学基本原理。量子力学基本原理使量子密码具有经典密码无法比拟的优势——无条件安全性和对窃听的可检测性。自1984年量子密码诞生至今,已有大量的量子密码协议被提出,这些协议丰富了量子密码的研究内容,也推动了量子密码的发展。然而现有的
学位
随着无线传感网(IEEE 802.15.4)标准化的进程以及IETF(The Internet of Engineering Task Force)成立6LoWPAN(IPv6 over Low-Power Wireless Personal Area Network)工作组,进一步加快了IPv6网与802.15.4传感网的融合。本文围绕用于这两种异构网络融合的 6LoWPAN 技术展开研究,通过