一种基于深度学习和概率图模型的本征分解方法的研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:w5423112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机视觉在图像理解方面取得了卓越的进展,尤其是在图像识别、物体识别和定位等方面。而现在还缺乏有效的方法理解图像的形状、材质和环境的光照分布等更复杂的图像信息。其中,图像中物体的形状、材质和所处的光照分离形成的图像属于人类视觉感知的一部分,通常被称为本征图像。理解并分离图像中代表的物体的外观材质的反射率图和代表物体形状与所处的环境光照的相互作用的阴影图是计算机视觉中的一个由来已久并极具挑战的问题一一本征分解问题。本征分解问题是将一张原始图像分解为一张反射率图和一张阴影图,在没有其他约束的情况下,这是一个约束不足的病态问题。因此本征分解是计算机视觉领域中一个富有挑战性的问题,精确地分解出反射率图和阴影图是是一件非常困难的事情。由于单张图像缺乏足够的信息,当图像包含复杂场景的时候,分解结果常常因为约束不足而在反射率图和阴影图上出现严重的二义性,最终产生非常不理想的结果。为了解决这些问题,本文提出了一种基于深度学习和概率图模型的本征分解方法,在不对材质、形状和环境光照类型做特定假设的情况下对单张彩色图像进行本征分解。本文首先通过训练一个深层卷积神经网络初步分解反射率图像和阴影图像。然后利用条件随机场进行优化反射率图像和阴影图像。本文设计的卷积神经网络通过多尺度架构、深层监督、逐级细化合成图像以及多阶段训练方式获取初步的结果相较以往算法已经有了显著提高。接着通过条件随机场将本质图和对应的梯度图像进行进一步优化,能得到细节更加丰富边界更加清晰的本征图像。此外,本文的基于深度卷积神经网络模型和条件随机场的算法具有一定的通用性,有应用于其他图像预测的经典视觉问题的潜力。
其他文献
今年是周恩来诞辰110周年,征得已故雷英夫将军家属的同意,特选发雷将军生前口述《风雨曾家岩》一文,以飨读者。1939年8月,毛泽东向周恩来推荐雷英夫,赴重庆八路军办事处任参
随着大数据时代的到来,云计算技术也得到了迅猛的发展。而且云平台中的资源可以像水电、煤气一样按需使用、按量计费、弹性扩展、极其廉价。越来越多的中小企业选择购买云服务
系统崩溃现场处理(core dump)是指在系统崩溃时将系统状态保存在永久性存储器(persistent storage)中的过程。被保存下来的系统崩溃现场可用于调试和分析,以寻找系统崩溃的原
随着计算机技术的飞速发展,迫切要求改善人与计算机之间的交互方式,由于手势在语义表达方面所具有的友好性与直观性,使得手势在人机交互中得到广泛应用和研究。为了提高人机
舆情,是指在一定的社会空间内,围绕舆情因变事项的发生、发展和变化,作为主体的民众对作为客体的执政者及其所持有的政治取向产生和持有的社会政治态度。舆情信息是对舆情的
红塔烟草(集团)有限责任公司云南支部生活杂志社今年初以来,昭通市镇雄县发生大面积冰雪灾害,灾害持续时间久、范围广,人民群众生产生活设施损失严重。据不完全统计,已造成直
随着嵌入式技术研究的逐步深入以及互联网技术与信息家电、工业控制等技术结合的日益紧密,以Internet为标志的嵌入式系统正处于个迅速发展的阶段。嵌入式网络视频服务器是一
This paper presents a novel energy-aware algorithm for service composition based on sharing routes in Wireless Sensor Networks (WSNs). The method integrates the
[摘 要] 财经应用文写作课程目前存在的问题:一是课程设置过于靠前,二是教材体例缺少内部结构的联系性,三是讲授过程中缺少学生参与环节,四是一些文种数据运用被忽略,五是财经应用文写作没有明确的指向。解决问题对策建议是:课程在大三下学期开设与按照国民经济发展计划及项目时段、项目推进的次序与实际财经应用应该出现的时间顺序来安排文种体例,创新教学流程,导入学生参与,利用多媒体教学,围绕“5w”促进理论与实
本文试从当前高职高专英语听说教学特点出发,分析听力理解和交际会话的内涵及影响英语听说能力提高的几个因素,并提出在教学实践中提高学生英语听说能力的若干教学策略。 Ba