基于卷积神经网络的图像快速调焦技术研究

来源 :中国科学院大学(中国科学院光电技术研究所) | 被引量 : 0次 | 上传用户:xubin761
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学测量系统作为一种有效监测目标的手段,一直受到大家的重视。由于传统的靶场光测设备使用的调焦技术一般需要依赖额外辅助的设备指导调焦操作,不符合光测设备集成化的发展要求。而基于图像的自动调焦系统,只需依靠图像信息即可完成调焦,且硬件结构集成度高、运算速度快,逐渐成为自动调焦领域的主要研究方向。但是基于图像处理的自动调焦方法是一个逐渐寻找调焦最优值的方法,在实时调焦系统中,调焦速度慢是该方法有待解决的首要问题。另一方面,近些年在无参考图像质量评价领域中卷积神经网络成果突出,通过网络模型即可对图像的清晰度作出直观评价,具有计算速度快(无迭代过程)、准确性高(无局部最优问题)等优点,有望解决调焦速度慢的问题。本文针对上述背景,开展了基于卷积神经网络的图像快速调焦系统的相关研究工作。首先,针对SMD函数在精细调焦过程中精度不足的问题,提出了基于像素差异的改进SMD评价函数。该函数在原SMD函数基础上补充了水平方向和垂直方向额外两个像素的对比,另外又增加了目标像素45°和135°斜对角的像素的对比差异,通过Matlab仿真和自动调焦实验,实验结果表明该评价函数的灵敏度和抗噪性得到了提升,有利于提高调焦系统的成像精度。其次,针对图像评价值无法直接反应图像是否清晰,提出了一种图像评价网络。通过改进VGG卷积神经网络,实现对图像模糊程度识别任务,并与常用的图像识别网络方法进行对比。结果显示:改进后的VGG网络对数据集包含4类、7类、10类和15类不同模糊程度的识别精度分别为97.45%、95.28%、93.65%和83.54%,证明了该图像评价网络能够很好地识别图像的模糊程度。然后,针对传统爬山搜索算法大步长调焦容易导致电机反转,影响调焦精度;小步长调焦增加调焦次数,影响调焦效率的问题,提出了一种以图像评价网络为主,评价函数为辅的改进爬山搜索算法。首先,图像经过图像评价网络识别模糊程度,然后根据图像模糊程度制定精确的搜索步长,图像评价函数用来控制调焦搜索方向是否正确。在系统离焦程度较低的位置采取曲线拟合搜索算法,充分利用各个算法的优点,提升调焦的搜索效率,并且有效避免在调焦过程中陷入局部极值。最后,将本文所提出相关算法应用在基于监控相机的自动调焦系统上。实验结果表明,本文的搜索算法的搜索速度是传统爬山法的2-3倍,调焦效率得到明显提升,电机驱动次数稳定在5-8次,且不受系统初始状态影响。证明了该自动调焦方案的可行性,为以后自动调焦系统中应用卷积神经网络提供了参考。
其他文献
本文的研究重点聚焦在数字媒体艺术中的未来主题,首先是在艺术学科内对数字媒体艺术中的未来主题进行探讨,同时借鉴奇点艺术的分类和研究方法,从生物、物理和数字虚拟三个方面入手,对相关的数字媒体艺术进行归类并通过案例分析的方式,进一步深入地剖析未来主题背后的艺术理念和人文内涵。在从艺术学科角度对“未来主题”进行解读后,转向一个更为宏观的角度,即结合“未来学”这一与未来主题息息相关的学科。由于在未来学领域,
学位
土壤重金属污染威胁人类健康,然而传统的土壤重金属污染探测手段成本高、效率低,且收集的土壤重金属样本元素数据缺失问题较为严重,生态环境领域的缺失值补充方法精度低且局限性高。为解决以上问题,本文将机器学习算法引入到土壤重金属污染预测中,构建区域土壤重金属污染预测模型。以我国华北平原的某区域为研究区,收集该研究区2020年度的8类土壤重金属数据,利用这8类土壤重金属数据对研究区进行系统的评估。主要的研究
学位
永磁同步电动机由于具备体积较小,工作效率高等优势而广为应用,直接转矩控制是电机使用的主要控制方式,传统直接转矩控制一般使用开关表和滞环比较器来实现,然而滞环比较器不
随着我国劳务人口数量的减少以及生态文明建设的推进,传统的现浇结构建筑已慢慢的被装配式结构建筑所取代。从中央到地方,各级人民政府和建设行政主管部门出台了一系列的激励政策,优秀的设计单位和施工、监理单位也顺应时代发展的组织单位人员进行装配式结构的学习和探索,整个建筑行业进入了装配式结构建筑的新领域。为了使装配式结构建筑更加智能化、信息化,越来越多先进的科学技术被引入装配式结构建筑,建筑信息模型(BIM
近年来,无线光通信(Optical Wireless Communication,OWC)因其超宽频谱、保密性好等特点受到学术界和产业界的广泛关注。无线光通信的室外应用场景主要指自由空间光通信(Free
在天文学研究的热点问题驱动下,天文望远镜正向着更强集光能力、更高分辨力、更全波段等方向发展,增大望远镜口径是解决上述问题的重要技术途径。围绕大口径望远镜研制需求,科学家们提出拼接主镜方案:拼接主镜由数个子镜面拼接而成。应用拼接主镜的最大优点是极大的减轻了主镜的自重,各个子镜口径较小,子镜面的支撑系统相比于大口径单镜面而言大大简化,并且其加工制造运输难度也大大降低。但是拼接主镜各个子镜间的相对位置难
随着计算机和传感器等机器人相关技术的快速发展,移动机器人的使用也越来越多。考虑到医院环境的特殊性,医护人员工作压力较大,因此,在医院中使用机器人代替护士的一些简单工
学位
《点石斋画报》创办于1884年,其出版发行的十五年正好是晚清中国风云变幻的时期。作为新闻画报,它始终在记录晚清一代的社会生活与历史变迁。尤其是画报对民风民俗的记叙很有
在本文中,基于全局优化的烟花算法(FWA),将现代计算启发式范式应用于非线性有源噪声控制系统(ANC)。参考麦克风用于采集噪声信号,误差麦克风用于采集残差噪声信号,该信号同时