基于预训练的跨模态统一模型研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:wudajiang1213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
世界是多模态的——信息往往同时存在于语言、声音、图像等多个模态当中。当前人工智能发展迅速,在自然语言处理(NLP)、自动语音识别(ASR)和计算机视觉(CV)各自领域都有重大突破,但这种单一领域的突破仍然与真实世界有着明显不同。为构建真正理解人类世界的人工智能,它需要有对多模态数据识别和响应的能力。近年来自然语言处理和计算机视觉两大领域不断碰撞和融合,衍生出很多跨模态研究课题,如图片检索和图片问答等,但是由于这两个领域中的基础模型大都针对纯NLP或CV任务单独设计和训练(例如NLP中针对语言模型设计的BERT和CV中针对图片分类设计的ResNet),这些模型无法很好地刻画语言和视觉内容之间的关联。从下游任务对应的标注数据中学习这类关联是解决方案之一,但由于标注开销大,数据量较少,该方案依然缺点明显。本文中提及的跨模态仅设计图像和文本两种模态之间的交互任务。本文设计一种新的结构——Unicoder-VL,基于自注意力机制学习语言与图像信息间的协同表示。在此基础上,利用大规模的图像文本匹配对数据,设计基于文本的掩码语言模型(MLM)、基于图像区域的掩码类别预测(MOC)、图像文本匹配(VLM)和图像特征生成(MRFG)等多种预训练任务,借助通用领域跨模态预训练-微调技术,该模型能够学习到图像和文本间的内在关联,并用于生成图像和文本的联合向量统一表示,同时从预训练好的模型参数开始微调可以加快训练速度、提高训练效果,减少对下游任务数据量的要求。预训练的Unicoder-VL考虑了跨模态信息的联合向量表示能够很好地迁移到下游任务中,并在图文检索、图像问答等多个任务上都取得很好的效果。本文在此基础上继续进行对比实验,探究各超参数对预训练质量的影响。本文发现,在目前允许的范围内,预训练数据集越大、数据质量越高、模型越大、合适的训练策略,可以使得预训练的模型在后续下游任务的表现越好。本文不涉及单模态的输入,未来旨在扩展模型支持单模态输入,允许图像字幕生成、场景图生成等等任务。本文提出的跨模态预训练思想不仅限于图像-文本领域,理论上可以迁移到其他跨模态领域,如视频-文本、语音-文本等等。而预训练技术本身还有很大的探索空间,这些都使得本文的工作具有很强的扩展性和探索价值,这是相关跨模态工作不具备的。
其他文献
辛弃疾作为南宋词坛大家,研究者层出不穷。然而,以往研究者多着重于其词所抒发的爱国情怀、忧患意识等,对其词的叙事研究还存在不足。事实上,以抒情为主的稼轩词,在叙事性上也十分突出。本文在前人的基础上,立足于文本,从我国传统理论出发,结合西方叙事学理论的经验,系统探讨稼轩词中的叙事性。在绪论部分,本文对目前学界关于稼轩词的叙事研究现状进行了细致的梳理,发现现有的稼轩词叙事研究成果呈现零散化的特点。基于此
雪,听起来轻盈、琐碎,像害羞的邻桌小女孩:又像风吹过远处田野的声音,悠扬、深远。下雪时,鹅毛般的雪花从空中落下来,纷纷扬扬,飘飘洒洒,弥漫天空,悄悄落在树上、冬青上和地上,仿佛仙女
文章界定了学生学习效能感的含义 :一是学生对自已学习能力和学习成绩的预期和主观判断 ;二是学生对教师与教育功能的看法与判断 ,指出在大力提倡学生作为学习主人的情况下 ,
2004年1月4日信息产业部在无锡召开由中电科技集团公司第五十八研究所研制的2003年度新品成果鉴定会。到会的有上级领导、专家和各系统、各单位的用户代表,共17个单位,40余名代
随着微风的抚摸,鸟儿的一声“早安”,我懒洋洋地睁开了睡梦中的眼睛,抖了抖雪白的连衣裙,观望着世界。我,就是毛茸茸的蒲公英。
从1951年法国,联邦德国与荷兰,比利时,卢森堡,意大利一起组成欧洲煤钢共同,意味着欧洲这个大陆由自由分散走向联合统一。1968年欧洲关税同盟的设立实现了进一步的一体化。即
铁路车站作为铁路系统的“站、车、线”三大基本要素之一,对列车运行、指挥调度、旅客乘车安全等方面起到支撑和保障作用,其在铁路三大要素中处于基础且核心的地位。与以往研究多以铁路整体为研究对象的情况不同,本文以济南站为研究对象,从车站层面着手构建治安防控体系,更为深入和细致,以点带面,以此更好地为铁路整体治安防控以及区域治安防控提供保障。济南站既具有独特的区位功能、辖区范围、周边元素等自身特点,又具备既
<正>"砍头不要紧,只要主义真。杀了夏明翰,还有后来人。"这首人们耳熟能详的就义诗,字字带血、笔笔惊心。以诗观人,犹如见作者之凛凛威风、浩然正气。以诗传情,感受到的是作
美丽乡村是建设美丽中国的重要组成部分,是实施乡村振兴战略的重要一环,是实现农民增收、农业增效、农村发展的重要途径。为贯彻党中央建设美丽乡村的精神和工作要求,近年来各地方根据具体情况探索适宜的美丽乡村建设模式,并取得了显著的成就。邹城市作为山东省美丽乡村示范村建设试点县,自2013年开始,积极引导优化产业体系,发展休闲观光农业和乡村旅游等环境友好型产业,同时整治环境和保护农村资源,打造优美的村庄环境