多特征融合和自适应聚合的立体匹配算法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zyf115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对局部立体匹配在光照失真和弱纹理区域匹配精度低的问题,提出了一种多特征融合的代价计算和自适应十字窗口聚合的立体匹配算法.引入HSV颜色空间分量,结合改进后的Census变换和梯度信息作为匹配代价计算方法,排除了视差边界异常值的影响,增强了算法对光照失真的稳健性;提出了基于梯度信息和可变颜色阈值的自适应窗口代价聚合方法,提高了在弱纹理区域的匹配精度;通过视差计算和多步骤的视差精细得到了最终的视差结果.实验结果表明,所提算法较AD-Census算法在无光照失真条件下误匹配减少了3.24%,能有效解决视差边界和弱纹理区域错误匹配的问题,对光照失真稳健性好且能有效抑制噪声干扰.
其他文献
如今,制造业数字化转型中采用消息队列遥测传输(MQTT)协议已成为趋势,而工业场景中往往存在大量的传感器等设备.考虑到实际部署的复杂性,在工业场景中实际部署MQTT前,进行必要的模拟以获取网络性能等数据是不可或缺的,这将更有利于工业场景中的链路设计和网络规划.而NS-3作为当前最流行的网络仿真器之一,提供了丰富的网络模型,非常适合像工业场景这种大型复杂网络的仿真,但目前利用其模拟部署MQTT仍是一项困难的工作.针对该问题,提出了一个适用于NS-3的扩展仿真框架ns3-mqtt,该框架由多个MQTT组件构成
推荐技术已经成为信息过载时代提供个性化服务的关键技术.由于推荐结果的多样性可以提升推荐效果,多样性推荐方法开始备受关注.针对现有基于朋友好奇心的多样性推荐方法中,诸如朋友、信任关系等难以获取及比较稀疏的问题,提出了基于相似用户好奇心的多样性推荐方法(SUC).分析用户的真实评分,计算相似用户集;采用协同过滤方法,计算用户的预测评分;分析用户的真实评分和预测评分,计算用户的好奇心评分;融合预测评分和好奇心评分,计算用户的项目推荐列表.SUC方法不需要额外的用户关系信息,更具普适性.在五个真实数据集上的实验表
针对海洋传感网(Ocean Sensor Networks,OSNs)中采用非协同算法单一循环地对多个水面目标节点依次定位导致的定位效率低、定位精度差等问题,提出一种基于有效集的再优化协同定位(Active Set Method based Re-Estimation Cooperative Localization,ASM-RECL)算法.研究将原定位的非凸非线性问题转化为基于交替非负约束最小二乘(Alternative Nonnegative Constrained Least Squares,ANC
Android恶意软件的几何式增长驱动了Android恶意软件自动检测领域的发展.一些工作从可解释性的角度来分析Android恶意软件,通过分析模型获取最大影响的特征,为深度学习模型提供了一定的可解释性.这些方法基于特征相互独立的强假设,仅仅考虑特征各自对模型的影响,而在实际中特征之间总是存在着耦合,仅考虑单个特征对模型的影响,难以反映耦合作用,不能刻画不同类型软件中敏感API的组合模式.为解决该问题,将An-droid软件刻画成图,并结合图的结构信息和图节点内部的信息提出了一种基于图嵌入的方法来检测An
作为广受用户青睐的即时通信系统,微信在给人们生活带来极大便利的同时,也给不法分子提供了违法犯罪的新手段、新工具.微信聊天记录作为我国法律中明确列出的电子证据类型,其有效性引起广泛关注,使得微信聊天记录的恢复成为相关领域的研究热点.针对现有的聊天记录恢复研究多集中于删除消息的恢复,撤回消息的恢复尚未取得有效进展,通过研究PC版微信运行过程中的动态内存管理机制,分析撤回消息在动态内存中的特征字符及字段结构,对比文本、表情、图片等不同类型的消息在内存中的存储原理,提出一种基于动态内存分析的微信撤回消息恢复方法.
情感识别依靠分析生理信号、行为特征等分析情感类别,是人工智能重要研究领域之一.为提高情感识别的准确性和实时性,提出基于语音与视频图像的多模态情感识别方法.视频图像模态基于局部二值直方图法(LBPH)+稀疏自动编码器(SAE)+改进卷积神经网络(CNN)实现;语音模态基于改进深度受限波尔兹曼机(DBM)和改进长短时间记忆网络(LSTM)实现;使用SAE获得更多图像的细节特征,用DBM获得声音特征的深层表达;使用反向传播算法(BP)优化DBM和LSTM的非线性映射能力,使用全局均值池化(GAP)提升CNN和L
针对传统的卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long Short-TermMemory,LSTM)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于CNN和LSTM的多通道注意力机制文本分类模型.使用CNN和LSTM提取文本局部信息和上下文特征;用多通道注意力机制(Attention)提取CNN和LSTM输出信息的注意力分值;将多通道注意力机制的输出信息进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上.在三个公
针对传统的玉米叶片病害图像识别方法正确率不高、速度慢等问题,提出一种基于改进深度残差网络模型的玉米叶片图像识别算法.提出的改进策略有:将传统的ResNet-50模型第一层卷积层中7×7卷积核替换为3个3×3的卷积核;使用LeakyReLU激活函数替代ReLU激活函数;改变残差块中批标准化层、激活函数与卷积层的排列顺序.进行数据预处理,将训练集与测试集的比例划分为4:1,采用数据增强的方式对训练集进行扩充,将改进的ResNet-50模型经过迁移学习得到在ImageNet上预训练好的权重参数.实验结果表明,改
知识图谱问答是自然语言处理领域的研究热点之一,近年来受到广泛的关注.知识图谱问答面临需要结合多条三元组进行推理的多跳问题以及知识图谱不完整等挑战,为解决这些问题,提出了一种融合知识表示学习的双向注意力模型(Bidirectional Attention model combining Knowledge Representation,KR-BAT).引入知识表示学习以提高模型全局建模能力,应对知识图谱不完整的情况;使用双向注意力模型捕捉候选答案和问题间丰富的交互信息,经过分析推理给出答案.在MetaQA数
现代目标检测算法仍然存在由现有目标检测架构引起的正负样本不平衡和训练数据引起的难易样本不平衡.现有方法一般采用基于类别频率的重采样或基于类别预测概率的重新加权,虽然减轻了类别的不平衡问题,但是引入了新的超参数,为每个训练任务需要进行大量的手动调整超参数.为此在现有Focal Loss损失函数基础上提出了一个新的损失函数自适应聚焦损失(Adaptive Focal Loss),使模型聚焦于对训练过程贡献更大的困难样本,并且可自适应地调整超参数.根据训练过程中每批图像标签中的正负样本数量计算出自适应的加权因子