基于余弦相似的视觉语言导航算法

来源 :激光与光电子学进展 | 被引量 : 0次 | 上传用户:qq978458283
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决视觉语言导航任务中存在的导航准确率低与泛化能力弱的问题,在Regretful模型的基础上,提出了一种基于余弦相似的视觉语言导航算法。通过增加余弦相似损失函数来指导神经网络,学习预测导航方向,减小了特征空间中类内特征的差异,增大了类间特征的分布范围,提升了无搜索策略模型的导航准确率。同时提出了一种全景视图特征平滑方法来进行数据增强,提升了模型的泛化性能。实验结果表明,该算法改善了模型在R2R(Room-to-room)数据集上的导航准确率等多项指标,效果优于Regretful模型,验证了所提方
其他文献
为解决传统方法中由注意力曲线等长分段导致的精确率偏低的问题,提出了基于图像质量曲线提取关键视频段的方法,从各段内选取注意力值最高的帧作为关键帧。针对本地数据库进行视频关键帧提取,精确率为52.94%,F值为62.77%,分别比Muhammad的方法提高了5.23%和2.65%。
期刊
研究了采用5 kW CO2连续激光器和200 W YAG脉冲激光器在CU基材上进行熔敷PdCuSi合金非晶态涂层,讨论了两种激光器辐照条件下该合金的非晶形成能力和Ni-P非晶预镀层的作用。
Considering fluctuant dark count rate in practical quantum key distribution (QKD) system, a new decoy-state method with one vacuum state and one weak decoy state is presented based on a heralded single photon source (HSPS). The method assumes that the dar
期刊
中红外激光在激光医疗、激光光谱学和红外对抗等领域有着广泛的应用前景.为了获得结构紧凑、便携性好的中红外激光源,采用975 nm半导体激光器泵浦高掺铒氟化物双包层光纤实现了2.8 μm的中红外光纤激光输出.将光纤耦合输出的中心波长为975 nm的半导体激光,经过消像差非球面透镜系统耦合进双包层光纤,激光谐振腔由高反镜和具有4%菲涅耳反射率的光纤端面组成,当注入到增益光纤的泵浦功率高于0.37 W时,获得了中红外激光输出.实验结果表明:中红外光纤激光器中心波长为2.785 μm,谱宽0.9 nm;工作阈值为0
为提高设计效率提出了一种空间光学遥感器柔性支撑参数化设计方法。分析了温度变化、装配误差两种工况下对柔性支撑形变的需求。并根据折衷规划理论设置柔性支撑的优化函数,以某空间光学遥感器主镜所用柔性支撑为例给出柔性支撑参数化设计的详细设计过程。经过参数化设计,主镜柔性支撑基频达到88.8 Hz,温度变化4 ℃,镜面的均方根(RMS)达到5.3 nm, 0.1 mm装配误差下的镜面RMS达到12.9 nm,光轴水平1 g重力镜面RMS达到5.0 nm。柔性支撑的性能显著提高并且所有设计满足指标。同时设计过程实现了计
期刊
利用边缘光抑制技术,设计并研制了一套双光束激光三维直写光刻系统。该系统含有高速扫描振镜和三维纳米压电平台两组扫描机构,可以根据不同加工需求完成多种扫描模式下的微纳结构制造。分析了光刻光束中激发光与抑制光的能量变化对加工精度的影响,通过对光刻光束能量的精确控制,实现了基板表面最小线宽为64 nm的均匀线条和线宽为30 nm的悬浮线的稳定加工,加工结构的线宽变化符合理论预期。该系统在进行实用器件加工时,最高加工产率可达到0.6 mm2/min。使用该系统加工制造了多种微纳结构,证实了其具
耶路撒冷的希、伯来大学的S. Yatsiv和A. Gabai与幻Almor激光有限公司合作发展了一种特别紧凑的CO2激光器。通过采用一种新的电极结构能节省费钱的大型泵浦和冷却回路。将活性激光气体与两个冷却的、平面金属电极连接,并用高频激励。釆用这种结构可以从90 cm长和30 kg重的结构中产生大约500 W功率。
期刊
给出了利用红外透射光谱计算金刚石薄膜中SP2/SP3键价比,从而判断金刚石薄膜质量的判断技术。这种方法给出了薄膜质量的定量判断,甚至当由于灵敏度限制拉曼光谱无法给出判断结果时这种方法仍可使用。文中给出了两个金刚石薄膜样品的计算结果并和非晶碳膜进行了比较。