【摘 要】
:
立体图像的质量不仅影响着人们对立体图像的感知,而且反映了立体图像的传输、压缩等处理技术的好坏。所以有必要设计一种可靠、高效的方法来评估立体图像质量的优劣。为了使所提方法能够模拟人脑对立体图像的感知机制,论文设计了一种左右视点的融合方法,并依据融合图像提出了两种无参考立体图像的质量评价客观方法。第一,首先根据视觉特性得到融合图像,利用立体匹配算法得到视差图,将视差图和融合图像结合形成强化图像;其次,
论文部分内容阅读
立体图像的质量不仅影响着人们对立体图像的感知,而且反映了立体图像的传输、压缩等处理技术的好坏。所以有必要设计一种可靠、高效的方法来评估立体图像质量的优劣。为了使所提方法能够模拟人脑对立体图像的感知机制,论文设计了一种左右视点的融合方法,并依据融合图像提出了两种无参考立体图像的质量评价客观方法。第一,首先根据视觉特性得到融合图像,利用立体匹配算法得到视差图,将视差图和融合图像结合形成强化图像;其次,考虑到图像在不同尺度下呈现不同的特性,通过两种高斯模型对视差梯度加权后的融合图像和强化图像在两种尺度下提取自然场景统计特征;然后,对视差图使用简单、高效的方法提取统计特征;最终将特征进行融合,并送入支持向量回归,以主观得分作为标签得到立体图像的客观质量分数。第二,根据卷积神经网络提取特征的优异能力,设计了一种双通道的卷积神经网络来实现无参考立体图像质量评价。首先,建立一个以密集连接网络为主体的卷积神经网络结构;其次,将融合图像作为卷积神经网络一个通道的输入,另一个通道的输入为视差图,视差图可以起到特征补偿的作用;然后,考虑到视差信息在感知立体图像过程中的重要作用,通过改进挤压激励模块来实现视差图对融合图像的加权指导,这种加权策略加强了融合图像的重要信息的比重,减轻了非重要信息的比重;最后,在卷积神经网络的末端,将视差图的特征和加权校正过的融合图像的特征进行融合得到总体特征,将总体特征与主观得分进行回归分析,得到待测立体图像的质量分数。实验在公开数据集上进行测试,结果表明,所提出的无参考立体图像质量评价方法能够有效地应对对称和非对称失真类型的立体图像,并与主观评分保持很好的相关性。
其他文献
复杂多变的光照给计算机视觉领域的研究带来了许多挑战,特别是对于实时单目视觉定位与建图算法(SLAM)。近年来,SLAM系统在普通光照环境下已经可以完成精准的定位建图任务,但在弱光照环境或者阴影环境下,前沿的SLAM系统也往往因为其视觉前端光照鲁棒性不足而导致跟踪出现问题。对于弱光照环境下的SLAM视觉前端鲁棒性问题,本文首先通过改进现有的成熟SLAM系统的视觉前端,提出了一种基于双特征算法的图像特
随着物联网、大数据和人工智能等技术的发展,视觉目标跟踪依然是计算机视觉领域热点研究方向,具有广泛的应用价值,如无人驾驶、智能监控、医疗诊断及行为分析等方面。视觉目标跟踪任务是在给定初始帧的目标位置信息的情况下,准确可靠地预测后续视频序列中目标的位置和大小。视觉目标跟踪过程中通常会面临许多挑战,如目标间遮挡、目标外观模糊、旋转及光照变化等,这些复杂的因素都对视觉目标跟踪算法的判别能力提出了更强的挑战
语言模型,尤其是神经网络语言模型,在自然语言处理和信息检索任务中至关重要。最近人们提出了量子语言模型(QLM),它使用相同的概率空间来统一单个单词和词组的表示,而不必像以前的研究那样人为地扩展词空间。神经网络类量子语言模型(NNQLM)将QLM扩展到端到端体系中,通过自下而上的方法来构建密度矩阵,替代了QLM复杂的迭代估计算法。众所周知位置信息对语言模型尤为重要,但无论是QLM还是NNQLM都仅是
近年来,随着网络发展的多元化,信息过载问题日益严重。分类目录和搜索引擎是早期出现的解决信息过载问题的两类主流方案。但是随着互联网规模的不断扩大,分类目录网站只能覆盖有限的热门网站,而搜索引擎则需要用户主动提供关键词来寻找信息,在用户不清楚自己需求的情况下具有很大的局限性。这时,个性化推荐技术应运而生。个性化推荐技术可以分析和挖掘用户潜在偏好,是解决大数据时代信息冗余问题、提高人们信息获取的效率和质
近年来,随着移动通信技术的迅速发展和计算机技术的普及,大多数智能设备都有安装全球定位系统GPS,所以在户外环境中(例如百度地图、谷歌地图、高德地图等)获取位置信息的服务需求与日俱增。然而,GPS对于建筑物、停车场以及靠近墙壁的地方等室内环境表现不佳,因为来自GPS的信号太弱,无法通过大多数建筑,从而使GPS难以进行室内定位。由于GPS定位技术受限于室内只能在室外提供精确定位信息,所以室内定位技术引
在如今的大数据时代,文本信息错综复杂,如何在浩瀚的文本信息库中快速且准确的查询到所需要的文本为信息检索带来了挑战性难题。在选取准确的关键词和筛选限制条件问题上的困难,使得在大量文本信息中精准查找所需文本信息的任务变得枯燥乏味且费时费力。近年来,研究人员开始借助机器学习算法对文本信息进行分类从而帮助解决文本信息检索任务,但是运用机器学习算法为文本信息检索任务带来了新的挑战。首先,某个文本领域的专家可
数字图像分割技术已经在各个领域得到了广泛的应用,但是对于碑帖图像文字分割的相关研究相对较少。本文以碑帖图像作为研究对象,结合图像处理、数学形态学和深度学习技术,提出了两种可行的碑帖图像文字切割方法。第一种是基于形态学的切割方法,第二种是基于目标检测的切割方法。基于形态学的切割方法运用数字图像处理技术和数学形态学运算方法,对图像做二值化投影,根据投影图像的坐标,将图像按列切割,再采用同样的方式,对每
在海量数据的互联网时代,如何对庞大的数据进行快速、有效地分类和检索成为近年来研究的热点。传统的图像分类技术通常为了识别某个类别,首先需要获得对应类别大量带标注的训练样本,并从中抽取出部分样本构成训练集来得到相应的分类器,最后通过该分类器实现对测试样本的分类。但现实生活中,传统的图像分类技术具有一定的局限性,对于标注数据的获取需要耗费昂贵的人力和物力的代价,针对每一类的图像均收集其对应的标注也不太符
随着计算机等网络设备的广泛应用,数据量的激增,大数据量的分析已经成为了数据分析中的重要一环。而高维数据分析是大数据分析的重要组成部分。大部分的高维数据分析系统都是基于一些系统做一些数据筛选和降维等操作,他们的视图展示一般都是以量的形式来展示信息,比如散点图矩阵、平行坐标轴等。这些方法对用户的认知负担仍旧比较大。针对高维系统分析,本文提出来了散点图模式的方法进行维度的分析,结合数据筛选进行高维数据分
本文设计了一个在特定情况下需要将目标软件与授权硬件绑定的加解密方案,主要分为加密系统和解密加载系统,并在Linux和Windows平台下对该方案进行了验证。主要工作如下:(1)介绍了在Linux下主要可执行文件类型——ELF可执行文件及其加载流程;介绍了Windows下主要可执行文件类型——PE可执行文件及其加载流程。(2)在加密系统中设计了信息存储结构体,用来存储绑定的硬件信息和后续校验。针对不