基于强化学习的大视场摄像机标定技术研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:lvsby2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
立体视觉测量技术因其具有非接触、易于安装、不干扰风洞流场、不破坏桨叶气动外形和精度高等优势,已成为在风洞试验中测量旋翼桨叶位姿与形变的重要手段。摄像机标定是立体视觉测量技术的核心步骤,系统的标定精度将直接决定测量精度。然而风洞试验环境复杂,旋翼桨叶尺寸大,测量范围广,使得传统大视场摄像机标定方法存在靶标的摆放位置姿态依赖人工经验、精度不高、稳定性及可操作性差等问题。本文针对在大场景下进行基于立体视觉的直升机旋翼桨叶运动参数测量时,大视场摄像机标定靶标的摆放位置姿态优化问题,开展了基于强化学习的大视场摄像机标定技术研究。主要工作内容和研究成果如下:(1)构建了大视场摄像机标定问题的环境模型。首先,探清了在有限标定图像数量的条件下,图像样本分布对大视场摄像机标定误差影响大的机理;然后,通过分析标定图像样本采集过程的马尔可夫性,并将其抽象成序贯决策问题,建立了标定图像采集的马尔可夫决策过程(Markov Decision Process,MDP)模型,包括:标定智能体状态空间、标定智能体动作空间、状态转移概率以及奖励函数,为开展本文方法研究提供环境基础;最后,在以摄像机成像系统作为MDP模型模拟环境下,以靶标作为智能体,对标定靶标进行设计,并通过理论分析与实验验证相结合,设计了模拟环境中的噪声模型。(2)提出了基于Q-Learning的大视场摄像机标定方法。首先,采用固定稀疏特征表示方法构建Q表,并通过预探索的方法对Q表中所有的标定状态-动作值进行初始化;然后,以标定反投影误差容限作为收敛条件,在靶标与模拟环境迭代交互的过程中单步更新动作对应的值函数,通过Q-Learning算法对标定智能体进行迭代训练,学习和优化靶标的摆放位置姿态策略;最后,对带噪声图像进行了模拟实验以及对比实验。结果表明,该方法能够为操作人员在标定图像采集过程中靶标的摆放位置姿态提供有效的指导,使得无任何经验的操作人员都可以完成摄像机标定,具有不依赖人工经验等优点,提高了大视场摄像机标定的稳定性以及可操作性。(3)针对Q-Learning方法因高维标定状态空间而存在Q表占用内存大、大视场边界区域位置精度较低等问题,提出了基于深度Q网络(Deep Q Network,DQN)的大视场摄像机标定方法。首先,采用最小堆的形式构建了用于存储标定交互数据的经验池,设计标定交互数据预收集方法并采用即时奖励优先原则设计经验的更新方式;然后,通过多层感知器(Multilayer Perceptron,MLP)构建DQN双网络结构拟合标定状态-动作值函数,并进行训练优化靶标的摆放位置姿态策略;最后,开展模拟实验和真实实验,并分析部分因素对标定精度的影响。模拟实验结果表明该方法有效地减小了算法的内存占用、提高了大视场边界区域位置的精度。按照该方法获得的靶标位置姿态摆放策略,进行多次真实大视场摄像机标定实验,结果表明,无任何经验的操作人员即可完成摄像机标定,且标定精度优于具有丰富经验工程师的操作结果;在5m测量距离,4.6m×2.3m的测量范围内,基于靶标位置姿态摆放策略的立体视觉平均测量误差为0.832mm、相对误差均小于3‰,表明通过该方法指导获得的立体视觉标定精度及稳定性能满足大视场条件下的精度要求;且在相同误差限2‰条件下,立体视觉工程师标定成功率约60%,而基于该方法的标定成功率达到100%,有效地提高了大视场摄像机标定的成功率。综上,本文创新方法有效地解决了大视场摄像机标定过程中靶标摆放导致标定依赖人工经验、精度不高、稳定性差的问题。
其他文献
肝脏超声造影是一种针对肝癌早期筛查的医学影像技术,然而在超声造影检查过程中,由于患者存在呼吸运动,影响了造影量化诊断参数获取的准确性,从而导致诊断结果可能出现偏差。因此,开展肝脏超声造影序列图像呼吸运动校正技术研究,探究有效的呼吸运动校正技术,对提高超声造影量化诊断参数获取的准确性,促进超声造影量化诊断技术的发展具有重要意义。本文针对肝脏超声造影检查过程中受呼吸运动影响,致使造影量化诊断参数获取准
学位
现代工业中排放的染料废水和含铬废水具有毒性、致畸性和致癌性等严重危害,对生态平衡和人类健康构成严重威胁。因此,寻找能够快速有效并且廉价的吸附去除废水中污染物的吸附剂是人类社会可持续发展的关键。壳聚糖是一种广泛存在且廉价易得的生物大分子,且含有大量的氨基和羟基,能有效对污染物进行吸附。采用合适的制备技术、交联方式和修饰方法能有效提高壳聚糖材料的机械强度、可回收性能、吸附容量和选择性吸附性能。在本研究
学位
作为上世纪发展起来的新型飞行器,直升机被广泛应用于军事、救灾、旅游等各个领域。随着直升机在各领域应用更加广泛,直升机的安全性也变得愈发重要。桨毂作为直升机旋翼系统的核心部件之一,在直升机长时间飞行状态下,桨毂会由于长期受力而产生疲劳裂纹,若没有及时发现裂纹,将直接影响旋翼系统的正常工作进而影响直升机飞行安全。近些年来,利用声发射检测技术对直升机部件产生的疲劳裂纹进行检测并进行裂纹状态识别,能在很大
学位
红外传感器可以根据物体的热辐射效应得到红外图像,并且红外传感器工作在全天候,不受外界环境的干扰,但不能细腻地显示目标的轮廓和背景信息;相比之下,可见光传感器在纹理细节方面具有较高的空间识别度,符合人类视觉系统的感知,但无法显著性地突出目标。因此,整合多源图像的优势信息到单幅图像以便更细致地描述同一场景中每个物体的特征信息已经成为一个研究热点。在此背景下,由于红外与可见光图像融合研究不断深入,该项技
学位
机载视景系统是飞行控制系统的重要组成部分,具有直观、生动的信息传递方式,能够有效的降低飞行员的驾驶负担。同时凭借其实时视景画面,能够在退化视觉环境(Degraded Visual Environment,DVE)下具有同可视条件下相同的操作效率,从而为机组的飞行安全提供额外的保障。因此,机载视景系统具有非常重要的研究意义。本文对基于OpenGL es的机载视景系统进行研究,设计了基于IMX6Q与V
学位
立体视觉标定是获得三维空间点与成像像素点之间对应关系的过程。如今,立体视觉测量系统正广泛应用于大视场环境下大型工件的测量(例如:直升机旋翼桨叶运动参数测量中,桨叶直径长达4.2m)。立体视觉标定作为立体视觉测量的核心步骤,其精度直接影响测量系统的性能。汇聚型双目立体视觉系统具有公共视场大、摄像机摆放灵活等特点,更容易满足大视场环境下高精度测量的需求。因此,大视场环境下的汇聚型双目立体视觉标定技术具
学位
经直肠超声(Trans Rectal Ultra Sound,TRUS)穿刺手术是检测前列腺是否癌变的重要技术,该技术通过手术中实时2D TRUS图像与术前3D TRUS图像的空间位置关系,来快速定位前列腺中疑似癌变的组织或细胞。但是对患者进行穿刺手术时,由于采用局部麻醉,存在患者无法缓解不适而发生的身体运动,以及TRUS探头对前列腺造成挤压等情况,这些情况将导致前列腺运动,致使原本建立的术中实时
学位
本文基于导师团队中标的某航天企业废水处理工程项目,旨在通过实验研究为工程项目提供技术支持,确保顺利验收。介绍了企业的生产工艺和废水来源,以其排放的含磷废水为研究对象,进行现场水质分析,掌握水质特性。对比分析吸附、生物、离子交换、化学除磷、混凝除磷等含磷废水处理方法,针对企业含磷废水特点,结合实际生产需要,选择化学除磷+混凝除磷的方法。采用单因素实验法,从pH和投加量两个角度,通过对比三种化学除磷剂
学位
图像去雾是常见的像素级视觉任务,也是典型的不适定问题。其目的是去除给定有雾图像中的雾气,恢复出清晰无雾图像。基于深度学习的图像去雾依据是否参照大气散射模型,分为间接算法和直接算法。直接算法常利用编解码网络直接学习有雾到无雾图像的映射模型。本文针对现有数据集样本量小,包含场景复杂度低,以及编解码网络信息丢失和网络模型表达能力弱的问题,从迁移特征的学习、多层次特征的融合、网络结构及损失函数的设计进行研
学位
人体行为识别是医疗监护、安防监控、人机交互等诸多领域的研究热点。由于红外成像系统具备可持续工作、保护隐私等优点,因此基于红外成像的行为识别方法具有重要的研究意义和广阔的应用前景。考虑到跌倒常对人,尤其是老年人造成较为严重的伤害。于是,本文选择跌倒和易与跌倒相混淆的站到坐、坐到躺行为,以及站、坐、躺、走等常见行为作为研究对象。对包含这7类行为的红外信息进行连续帧拼接操作,构建了红外图像数据集。实际应
学位