视觉语言导航相关论文
视觉语言导航(Vision-and-Language Navigation,VLN)作为一种与人交互环境中的自然导航任务,需要智能体理解自然语言指令、分析视觉......
视觉语言导航是一项集计算机视觉和自然语言处理于一体的跨模态任务。该任务要求模型能够对图像和自然语言两种不同格式的信息进行......
为了解决视觉语言导航任务中存在的导航准确率低与泛化能力弱的问题,在Regretful模型的基础上,提出了一种基于余弦相似的视觉语言......
通过语言给予智能体指示使其完成通用性的任务是人工智能领域的愿景之一。近年来有越多越多的学者试图通过融合计算机视觉与自然语......