多模态注意力机制相关论文
复杂场景下多模态信息推理算法研究是人工智能领域研究热点之一,其结合了计算机视觉和自然语言处理两大研究方向,已成为学术界以及......
最近,计算机视觉和自然语言处理相结合的新领域受到了广泛的关注,例如视频描述生成,视频问答等。其中,视频问答作为一个非常新的研......