这些令人不安的照片,AI正在学习根据文字生成图片

来源 :海外星云 | 被引量 : 0次 | 上传用户:wjlovewz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
女子曲棍球比赛

  在全球所有 AI 模型中,OpenAI 的 GPT-3 最能引发公众的遐想。虽然它可以僅凭很少的文本来输出诗歌、短篇小说和歌曲,并且成功地让人们相信这是人类的创作。但是,它在同人类对话时还是显得非常“幼稚”。可尽管如此,技术人员依然认为,创造了 GPT-3 的技术可能是通往更高级 AI 的必经之路。

  GPT-3 使用大量文本数据进行了训练,那么,假如同时使用文本和图像数据进行训练,会发生什么呢?艾伦人工智能研究所(AI2)在这个问题上取得了进展,技术人员开发了一种新的视觉语言模型,可以根据给定的文本生成对应图像。
  不同于 GAN 所生成的超现实主义作品,AI2 生成的这些图像看起来非常怪异,但它的确可能是一个实现通用人工智能的新路径。

AI“做题家”


  GPT-3 在分类上属于“Transformer”模型,随着 Google BERT 的成功,该模型开始流行。而在 BERT 之前,语言模型可用性不佳。它们虽然具备一定的预测能力,但并不足以生成符合语法和常识的长句子。BERT 通过引入一种称为 “masking(遮罩)” 的新技术,使模型这方面的能力得到了大幅加强。
  模型会被要求完成类似下面的填空题:
  这位女士去___锻炼。
  他们买了一个___面包做三明治。
  这个想法初衷是,如果强迫模型进行数百万次的这类练习,它是否可能学会如何将单词组合成句子以及如何将句子组合成段落。测试结果表明,模型确实获得了更好地生成和解释文本的能力(Google 正在使用 BERT 帮助在其搜索引擎中提供更多相关的搜索结果)。
  在证明遮罩行之有效之后,技术人员试图通过将文本中的单词隐藏,将其应用于视觉语言模型,例如:一只站立在树木旁的___。
是鸟?是飞机?不,这只是AI 产生的“神作”
AI2 模型根据文本生成的图像示例

  通过数百万次的训练,它不仅可以发现单词之间的组合模式,还可以发现单词与图像中元素之间的关联。这样的结果就是模型拥有了将文字描述与视觉图像相关联的能力,就像人类的婴儿可以在他们所学的单词同所见事物之间建立联系一样。举个例子,当模型读取到女子打曲棍球的图片(题图),便可以给出一个较为贴切标题,如 “打曲棍球的女人”。或者它们可以回答诸如“球是什么颜色?” 之类的问题,因为模型可以将单词 “球” 与图像中的圆形物体关联。

一图胜千言


  技术人员想知道这些模型是否真的像婴儿一样 “学会” 了认识这个世界。孩子不仅可以在看到图像时联想到单词,还可以在看到单词时在头脑中浮现出对应的图像,哪怕这个图像是真实和想象的混合体。
  技术人员尝试让模型做同样的事情:根据文本生成图像。然后模型吐出了无意义的像素图案。得到这样的结果是有原因的,将文本转换为图像的任务相比其他要困难得多。AI2
其他文献
背包一旦背负时间过长,肩膀就会出现酸痛,背部发热等不舒适的情况,想必大家小时候背书包上学都有这样的感受吧。如今笔记本电脑背包也越来越注重背负的舒适感,在背包上加入了诸多人体工程学设计,肯辛通Contour笔记本电脑背包便是这样一款注重人体工学设计的背包。 本
(美)谢林·布里萨克,卡尔·梅耶 著 张建新,张紫微 译/  中信出版社/9787508664309/2016-10/51.00  《谁在收藏中国:美国猎获亚洲艺术珍宝百年记》是《华盛顿邮报》年度非虚构作品,《纽约时报》《经济学人》《赫芬顿邮报》等多家媒体联合推荐。首开先河地对从鸦片战争开始到1949年这段期间内,西方尤其是美国收藏家们是如何从中国发掘大批珍贵文物,并运送出国的行为,做了系统梳理。
我一直没搞懂为什么会有人花上万元购买蓝光影碟机在试用了OPPO BDP-83之后,我现在终于理解他们的想法了。 本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
6月28日,欧盟28国领导在比利时首都布鲁塞尔举行峰会。据了解,难民危机将成为该次峰会的重要议题。尤其是意大利新政府拒绝移民船靠岸事件发生之后,欧洲各国对于难民危机的分歧正在不断加剧。  6月中旬,一艘载有630个难民的民间救援船“水瓶座号”被意大利和马耳他拒收,救援船抵达西班牙东部的瓦伦西亚港口,最终西班牙没办法,只好伸出援手收留这批难民。这一拒绝载有难民的救援船的事件背后,是欧洲各国持续加深的
1  去伦敦出差的飞机上看完了人类学博士Wednesday Martin写的畅销书Primates of Park Avenue,讲的是纽约上东区精英妈妈们的生活。作者的笔触幽默恢谐,所以我一路都在笑。等到略沉重的最后一章看完后,合上书,我不禁想:天呐,全世界的妈妈真的都是在焦虑同样的事,纽约和上海有什么分别!作母亲这一点上,和爱情似的,都人人平等。    作者描写了自己六年时间里如何从一个曼哈顿
近日,德国航空初创公司Lilium与佛罗里达州奥兰多市签署了协议,将在该市的Lake Nona建立交通枢纽。这是该公司在美国的第一个总部,也是继德国慕尼黑之后的第二个总部。  Lilium与当地房地产开发商Tavistock Development合作,计划在Lake Nona建造一座名为Vertiport未来主义智能城市。这个城市毗邻奥兰多国际机场,人数规模在6.5万人左右,建造资金为2500万
就2011年中国的外部压力来看,首先是美国经济复苏的疲软,以及欧洲主权债务危机。  目前,美国仍在制定宽松的货币政策,这么做的目的显而易见,就是想让奥巴马能在2012年连任。因此他们必须让新兴经济体继续通胀,维持美国的出口。要实现这个目标,美国就会发很多的钱,结果就是加速热钱向新兴资本市场流入,让大宗商品价格疯狂上涨。2010年12月,国际原油价格超过了90美元/桶,在2008年,石油价格曾飙升至
过去2年的百城巡展是以推广智能高清家庭影院新概念,引领整个影音行业与时俱进为目标,联手数十个知名家庭影院品牌厂商共同打造的全民盛事。2013年,顺应行业趋势变化与网庭影音机构产品结构调整,百城巡展的升级模式——2013“影·响·力”网庭影音机构百城大练兵,将携手合作伙伴:EPSON家用投影机、Vivitek丽讯家用投影机、LUTRON智能照明控制系统,CP家庭影院外延产品,共同拓展市场,增加终端市
摘要:2020年新冠疫情以来,许多出版单位积极策划了内容丰富、形式多样的出版内容,助力全国的疫情防控工作。笔者通过梳理分析成果、特点及存在问题,提出应对之策,抛砖引玉,以期加快出版行业的数字化和融合发展进程。  关键词:疫情;出版融合;发展策略  2020年新冠疫情以来,全国出版单位认真贯彻落实习近平总书记的重要指示精神和党中央、国务院决策部署,按照中宣部要求,积极应对,加快转型步伐,出版了一批疫
最近,我走进肯尼亚首都内罗毕的一家小餐馆,想歇歇脚喝点水,然后再回办公室。看到客人必须遵守的一大串规矩,我“大惊失色”。  每张餐桌都贴着一张大幅告示,上面列出的条目包括:  严禁闲坐  不许分吃  喝食品饮料最多只能呆20分钟  这张告示让我联想起非洲的大众传播——特别是公众场所的标志、警示以及它所反映的社会现象。  我相信,文字也是灵魂的窗户。我们与人交流的方式和内容,也反映着我们是怎样的人、