论文部分内容阅读
现今,计算机视觉和人工智能与人类的生活息息相关,比如人脸识别与检测、道路违章监控、车牌识别、手机拍照美颜、无人驾驶技术、围棋人机大战等方方面面。任何高科技产品和应用的诞生与实现都离不开背后科研工作者努力的付出和探索,而在当前这波人工智能发展的浪潮中,除了计算机硬件技术的发展外,比如GPU,深度学习技术绝对了起到了重要的理论和算法推动作用。深度学习,基于深度神经网络的发展和完善,不断在计算机视觉领域的研究中取得了出色的成果。例如,Image Net图像检测和分类比赛(ILSVRC)中众多使用深度神经网络框架的算法取得了远低于人类肉眼所能区分图像的误差;Alpha Go围棋机器人先后成功地击败了当前围棋领域的顶尖世界冠军李世石和柯洁,而其背后的理论基础依然离不开深度神经网络的辅助。可见,深度学习已经在计算机视觉领域中崭露头角,然而,由于深度神经网络模型的复杂设计以及标签化训练数据的不足等众多问题,使得深度学习在计算机视觉领域进一步推广和研究仍然面临巨大挑战。近来,深度学习的发展不仅突破了很多难以解决的视觉难题,提升了对于图像认知的水平,加速了计算机视觉领域和人工智能相关技术的进步,更重要的贡献在于改变了我们处理视觉问题的传统思想。本文工作总结了这些年来对于深度学习框架的研究,以及将深度学习逐渐引入到相关的计算机视觉领域中遇到的挑战和技术难点。在计算机视觉领域的研究中,除了常提到的人脸识别、单目标跟踪和多目标跟踪外,像生物医学图像的检索和分类这种新颖的交叉学科视觉处理问题,也是非常值得进一步去探索和提升的。为此,本文围绕这些计算机视觉领域研究中存在的技术瓶颈和难点,提出了新的研究思路和系统模型。通过对深度学习在计算机视觉领域的若干关键技术问题的研究和探索,提出了深度学习在人脸识别中的算法模型,开辟了深度学习与偏好学习在单目标跟踪中的技术新方向,分析了深度神经网络在多目标跟踪研究中的算法设计,探讨了深度偏好学习技术在生物医学图像检索中的技术可行性,深入研究了卷积神经网络模型对于生物医学图像分类任务实现的技术手段等方面的关键技术研究。通过与大量流行的对比算法在广泛应用的数据库上进行测试和对比,实验结果表明本文提出的这些算法和模型均能获得不错的效果,相信可以推动计算机视觉领域相关问题的研究,并为后来科研工作者提供新的研究思路和方向。