搜索筛选:
搜索耗时2.6606秒,为你在为你在102,285,761篇论文里面共找到 3 篇相符的论文内容
发布年度:
[学位论文] 作者:袁韶祖,
来源:中国石油大学(华东) 年份:2023
图像描述是一项计算机对给定图像自动生成相关文字描述的技术。不同于一般的图像识别模型,图像描述不但包括对物体、人物、场景的识别,也涉及对于文本理解和生成,是多模态领域一个极富挑战性和应用前景的领域。图像描述首先要解决多模态信息的融合问题,因为图像......
[期刊论文] 作者:袁韶祖,王雷全,吴春雷,,
来源:计算机系统应用 年份:2020
视频场景识别是机器学习和计算机视觉一个重要的研究领域.但是当前对于视频场景识别的探索工作还远远不够,而且目前提出的模型大都使用视频级的特征信息,忽略了多粒度的视频特征关联.本文提出了一种基于多粒度的视频特征的注意力机制的模型架构,可以动态高效的......
[期刊论文] 作者:王雷全,候文艳,袁韶祖,赵欣,林瑶,吴春雷,,
来源:计算机科学 年份:2021
视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获得高质量的答案。文中提出......
相关搜索: