【摘 要】
:
计算机视觉是指用摄像设备和计算机模拟人类视觉对目标进行识别、跟踪、测量的机器视觉,通过对图像的识别分析对其中的图形进行进一步处理,使其成为更适于仪器分析和人眼观察的图像。计算机视觉能够在客观世界感知三维场景、识别和理解,能够实现视觉感知、图像识别、人脸识别、目标定位等。在现代社会中计算机视觉及相关的算法具有很总要的研究价值。卷积神经网络在局部感知、信息捕捉的优势,使其在计算机视觉的研究方面发挥了重
论文部分内容阅读
计算机视觉是指用摄像设备和计算机模拟人类视觉对目标进行识别、跟踪、测量的机器视觉,通过对图像的识别分析对其中的图形进行进一步处理,使其成为更适于仪器分析和人眼观察的图像。计算机视觉能够在客观世界感知三维场景、识别和理解,能够实现视觉感知、图像识别、人脸识别、目标定位等。在现代社会中计算机视觉及相关的算法具有很总要的研究价值。卷积神经网络在局部感知、信息捕捉的优势,使其在计算机视觉的研究方面发挥了重要的作用。卷积神经网络利用多个卷积层的运算,能够在不同的尺度上抽象出图像局部特征,具有强大的网络表达能力、数学映射特性。深层次的神经网络更能够解决数据量小或特征点过多带来的过拟合问题。然后随着对于卷积神经网络在图像研究方面的深入,目标识别有了更多的改进,但是网络层次加深引入了更多的特征导致对数据的依赖和计算资源加大的问题亟待解决,同时如何将已训练好的网络特征迁移到未知的领域也是值得应用的。因此卷积神经网络的特征迁移研究和网络调整还有着重要的意义。目前,主流卷积网络还存在对大规模训练数据的依赖的问题。论文在充分研究卷积神经网络在目标识别算法的基础上,从性能改进的角度,提出了四个方面的改进:1.针对神经网络的上层的特征参数过多,导致数据冗余,计算复杂度较大等问题,针对池化层使用最大化池化替代均值池化,增强了图像的识别度,针对多层全连接层进行网络调整,减少参数的方法。2.利用迁移学习算法,对水平视角下的已训练好的目标识别器,对特征参数使用kmeans算法进行聚类迁移,完成迁移学习工作。3.针对Softmax分类器的高斯损失类内间距离大的问题,引入Center Loss,调整类内间距离。4.利用Tensor Flow框架完成了GPU并行化计算设计。论文在VOC、MIT数据集上进行了实验,实验结果表明改进的迁移算法在这些数据集上都取得了非常有竞争力的结果,提高了算法对于目标识别的准确率。
其他文献
口腔癌等口腔疾病由于普遍在较晚时期才被发现,导致治疗不及时,甚至引起死亡,因此研发有效的成像工具对于口腔疾病的早期诊断至关重要。光学相干层析术(Optical Coherence Tomography,OCT)作为一种新的生物医学光学成像技术,具有非侵入、高分辨率、成像速度快、灵敏度高等优势,在口腔疾病的早期诊断上具有重要的应用前景。本文针对手持式口腔OCT成像系统研制中的一些关键问题进行了研究。
阐述一种电力系统继电保护二次回路故障状态实时监测方法,利用电流极限圆和电压极限特征检测方法进行故障特征提取,通过实时频谱检测对故障状态参数进行定位识别,构建定位监测模型。
由于非致冷红外焦平面阵列系统具有重量轻、无需致冷、成本低等优点,有广泛的军用和民用市场,因而这项技术是一个行之有效的发展新方向。本课题即针对非致冷红外焦平面探测器开展研究工作。 课题的重点放在非致冷微测辐射热计焦平面阵列,这种非致冷红外产品的设计研制工作包括:设计和模拟工具的研究、材料选择和器件制作工艺的研究、探测器和读出电路的设计研究、真空封装和性能表征的研究等。作者主要进行了探测器模型仿
光束经过烟雾、生物组织、毛玻璃、混浊水体或其他散射介质时会发生强烈的散射现象。光束在这些介质内部发生多重散射后,在探测面上表现为无序的光学散斑,传统的光学系统无法有效的探测被散射介质遮掩的物体。因此,研究透过散射介质的成像技术是现在光学成像领域的热点问题之一。本文针对这一热点问题,用两种手段实现了透过散射介质成像,并基于成像手段实现了透过散射介质对运动物体进行跟踪。本文详细研究了光学散射现象中散斑
雾计算是一种新兴的计算技术,它将云计算服务扩展到网络边缘,例如网络、存储和计算。它具备了各种特性和功能,如降低服务延迟、大规模地理分布、异构性、实时性和移动性。而随着新的计算模式,雾计算面临了新的挑战,其中由于雾环境中分布式的设备框架,安全性和隐私性成为了最大的关注点之一。在本文中,我们主要关注与雾有关的各种安全和隐私问题。从各种安全问题出发,以雾计算的角度,选择了两个不同的问题,提出不同的唯一解
数字化学习因其便捷,便于共享,学习形式新颖等特点,已经广泛应用于国内外教育领域的教学过程中。面向中学STEM学科,虚拟实验作为一项典型的数字化学习模式,有助于解决传统学习模式下学生实验能力薄弱的问题。目前,虚拟实验缺乏与学科知识的紧密结合,而结合了人工智能领域的相关研究成果的知识图谱,可以辅助教师与学生更好地通过虚拟实验完成学科知识的教学与学习,且在学生自主式实验学习过程中发挥着重要作用。本文的主
自1999年扩招以来,我国高等教育无论是在教学规模,还是在治学水平方面均发生了翻天覆地的变化[1]。当前,我国接受高等教育的学生数量已经位居世界前列。面对如此庞大的学生规模,实现校园统一的信息化、数字化管理已经成为我国高校管理发展的主要趋势。鉴于此,本课题研究的学生培养过程数据管理系统旨在为高校二级学院学生教学管理工作提供一个全面、合理、可靠的信息管理平台。该平台囊括了目前学生培养管理工作所需的所
随着智能设备的升级和网络技术的迅速发展,人们接触到的图像越来越丰富和多样化。如何让机器更好地理解图像的语义信息并为人们的生活提供便利已成为图像研究的热点之一,尤其近几年在深度学习和跨模态领域(计算机视觉和自然语言处理)的巨大突破,图像问答任务已成为人工智能的重要研究方向。根据不同任务情形,研究者们提出了很多解决方法,基本思想通常都是提取图像特征与文本特征融合再对答案进行预测,或是在像素级别使用注意
近年来,随着计算机视觉的快速发展,移动机器人的应用场景也越来越广泛,同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是实现智能机器人自主导航的核心技术。考虑到人们大多数的活动都处于室内,传统的基于GPS与惯导的定位技术在室内场景存在信号容易丢失等弊端,因此本文主要研究基于RGB-D相机的室内定位算法。本文主要的研究工作有:(1)本文提出了一
近年来,大数据分析技术在医疗领域逐渐得到了广泛的应用。其中,聚类方法通过计算数据间的相似度得到类簇从而帮助我们发现样本间隐藏的联系。而将聚类技术应用于医疗领域能够挖掘医学数据中的潜在信息,为医学研究人员提供决策支持。本文对聚类技术在疾病危险因素上的提取算法模型做了研究,具体工作如下:本文构建了基于改进Canopy的K均值算法模型以提取危险因素。首先基于特征选择双标准策略对数据进行特征筛选,利用改进