深度学习在计算机视觉领域的若干关键技术研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:beyond870402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今,计算机视觉和人工智能与人类的生活息息相关,比如人脸识别与检测、道路违章监控、车牌识别、手机拍照美颜、无人驾驶技术、围棋人机大战等方方面面。任何高科技产品和应用的诞生与实现都离不开背后科研工作者努力的付出和探索,而在当前这波人工智能发展的浪潮中,除了计算机硬件技术的发展外,比如GPU,深度学习技术绝对了起到了重要的理论和算法推动作用。深度学习,基于深度神经网络的发展和完善,不断在计算机视觉领域的研究中取得了出色的成果。例如,Image Net图像检测和分类比赛(ILSVRC)中众多使用深度神经网络框架的算法取得了远低于人类肉眼所能区分图像的误差;Alpha Go围棋机器人先后成功地击败了当前围棋领域的顶尖世界冠军李世石和柯洁,而其背后的理论基础依然离不开深度神经网络的辅助。可见,深度学习已经在计算机视觉领域中崭露头角,然而,由于深度神经网络模型的复杂设计以及标签化训练数据的不足等众多问题,使得深度学习在计算机视觉领域进一步推广和研究仍然面临巨大挑战。近来,深度学习的发展不仅突破了很多难以解决的视觉难题,提升了对于图像认知的水平,加速了计算机视觉领域和人工智能相关技术的进步,更重要的贡献在于改变了我们处理视觉问题的传统思想。本文工作总结了这些年来对于深度学习框架的研究,以及将深度学习逐渐引入到相关的计算机视觉领域中遇到的挑战和技术难点。在计算机视觉领域的研究中,除了常提到的人脸识别、单目标跟踪和多目标跟踪外,像生物医学图像的检索和分类这种新颖的交叉学科视觉处理问题,也是非常值得进一步去探索和提升的。为此,本文围绕这些计算机视觉领域研究中存在的技术瓶颈和难点,提出了新的研究思路和系统模型。通过对深度学习在计算机视觉领域的若干关键技术问题的研究和探索,提出了深度学习在人脸识别中的算法模型,开辟了深度学习与偏好学习在单目标跟踪中的技术新方向,分析了深度神经网络在多目标跟踪研究中的算法设计,探讨了深度偏好学习技术在生物医学图像检索中的技术可行性,深入研究了卷积神经网络模型对于生物医学图像分类任务实现的技术手段等方面的关键技术研究。通过与大量流行的对比算法在广泛应用的数据库上进行测试和对比,实验结果表明本文提出的这些算法和模型均能获得不错的效果,相信可以推动计算机视觉领域相关问题的研究,并为后来科研工作者提供新的研究思路和方向。
其他文献
近年来非物质文化遗产的保护受到了社会各界的广泛关注,德格八邦噶玛噶孜画派的唐卡艺术已列为我国第一批口头与非物质文化遗产,让我们看到了他的价值和重要性。同时,也向我们提
高坝的工作性态与施工及运行过程密切相关,受到自基础开挖、大坝浇筑、蓄水运行过程中的温度场、渗流场、应力场的不断变化和耦合作用影响。本文介绍了混凝土坝三场耦合作用
桑树扦插生根是一个由外界因素和内源物质共同调控的复杂过程。采用桑品种育711号1年生硬枝为插穗,分别以传统愈伤组织生根技术和新的可诱导皮部生根的技术进行处理,以清水处
两会如新闻报道大战,各家媒体纷纷"兵出奇招",以"两会喊你加入群聊"为首的H5设计在众多两会新闻报道中脱颖而出,让时政新闻的传播变得更加亲民、更接地气。本文主要以"两会喊
回顾一下会计发展的历史,让大家对财务会计有个更深刻的认识,通过雷曼兄弟破产这一个案例来对财务会计风险的成因做个分析,针对企业财务会计风险我们给怎么样进行防范。
国内文献中通常将汉语的定语分为限制性的和描写性的两种;国外文献中关于汉语定语的讨论,则常常借用限制性和非限制性这一对概念。从句法语义功能的角度来分析,汉语的各种定
为了研究TB6钛合金自然萌生小裂纹的扩展行为,针对单边缺口拉伸试样开展室温下不同应力比(R=0.1,0.5)的小裂纹扩展实验,采用复型法观测了小裂纹的萌生与扩展情况。结果表明:
<正>在人们的悲伤与哀悼中,他们或许只会留下一个微笑或一句最简短的道别。正像科恩最后一张专辑中的一首歌《Traveling Light》中写下的":我将轻装上路,道一声再见。"刚刚跨
研究目的本论文主要包含两大部分内容:其一、葛根黄芩黄连汤方证的文献综述、理论研究、现代临床应用与实验室研究。其二、葛根黄芩黄连汤的循证医学与系统研究。全面检索、
为解决目前我国小型冷库用风冷机组在高温季节运行时存在耗能大、制冷效率低、开机时间过长、压缩机排气压力超高造成故障停机等问题,设计研制出一种集风冷、水冷和蒸发冷却