论文部分内容阅读
“AI换脸”这项技术从实验室走向大众后,它的下一步发展,会把我们引向充满“丢脸”风险的美丽新世界吗?如果连脸都不再能证明你是你了,该如何面对?
“世上最值得玩味的表面乃是人的脸。”《脸的历史》一书在开头引用了这句话,因为脸是每个人独一无二的身体特征,而且难以捉摸。
然而,人工智能的发展,让每一个人只需通过一部手机、一个APP,花上几分钟,就能实现“换脸”。“AI换脸”能让你既能和明星同框飙戏,又能改变性别,既能穿越回民国时代身穿旗袍、中山装,又能飞跃到未来,预测你年老后的样子。它甚至还能告诉你,如果你是一只猫、狗或长颈鹿,又会是一副怎样的模样。
这并不是关于未来的遥远遐想,而是我们当下生活的现实。打开手机应用市场,各式各样的换脸APP应接不暇。
8月30日晚,一款名为“ZAO”的视频换脸APP在上线几小时后,就刷屏了各大社交平台。打着“仅需一张照片,出演天下好戏”的旗号,“ZAO”通过人工智能技术把影视片段中明星的脸换成用户上传照片中的脸。“这个月花700万租的服务器,今晚已经消耗三分之一了。”这天,“ZAO”官方助手在微博上写道。上线两天后,“ZAO”在苹果应用商店APP Store的免费APP下载排名中跃居第一。
和其他换脸APP一样,“ZAO”的效果并不能称作以假乱真。但它的出现,让人们不得不重新审视“AI换脸”这项技术:从实验室走向大众后,它的下一步发展,会把我们引向充满“丢脸”风险的美丽新世界吗?如果连脸都不再能证明你是你了,该如何面对?
“给我一个软件,我也可以当影后”
8月30日深夜,马宇飞一直沉迷于试戏中。她不是演员,也没有真的在片场——她试戏的平台是“ZAO”。
这天睡前,她和往常一样刷着微信朋友圈,一段视频吸引了她的注意。这是摘自《神雕侠侣》的一个片段,画面中,小龙女与杨过正深情对视。仔细一看,小龙女的面孔不再是演员刘亦菲,而是自己的好友弦子。
她立刻好奇地询问弦子如何做到“换脸”,后者推荐了“ZAO”。马宇飞下载安装后,上传了自己的照片,一连在自已的朋友圈转发了三段经典影视剧片段:《大话西游》中“紫霞仙子”朱茵眨眼、《笑傲江湖》里“东方不败”林青霞抓起酒瓶豪饮,以及章子怡和张震在《卧虎藏龙》里的一段过招。无一例外,女主角的脸,都变成了马宇飞的了。
“太魔性了”,在“ZAO”上换脸飙戏是马宇飞从未有过的全新体验,而且效果也不错。她发布的一条“换脸”视频,得到一百多个赞。马宇飞玩得十分投入,在朋友圈写道:“给我一个软件,我也可以当上影后。”
“ZAO”并不是国内流行过的首款换脸软件。更早前,“前世青年照”“我的军装照”“当你老了”等换脸游戏,都曾在社交平台掀起过病毒式传播潮。人们不仅乐在其中还愿意把自己“换脸”后的图片在朋友圈、微博上分享。
除此之外,这几年还流行过多款捏脸APP,通过辨识用户上传的真人照片“捏”出用户个人的立体卡通形象,创作出用户专属的虚拟形象。
社交媒体时代引发了一场无限制的脸部生产,没有人再过着“无图像、无脸”的生活。《脸的历史》称:“脸性社会”已经来临。“一种对脸的私人消费正在互联网上蔓延开来,人们纷纷将自己的脸放到网上供人观赏,仿佛在参加一场永不结束的虚拟狂欢。”
随着技术发展,“换脸”不仅能生成静态图片,还能运用到动态视频里。“颜技”是一款与“ZAO”功能相似的APP,在今年4月份上线,官方微博的认证为“首款全民AI换脸APP”。尽管未能像“ZAO”一样一夜爆红,“颜技”还是吸引了一大批用户。为了保证服务器不超负荷运行,“颜技”设置了每个时间段新用户注册量的限制。
和“颜技”一样,“ZAO”大大降低了AI换脸的门槛,换脸视频的制作者只需一部手机、一个APP、一张照片就能轻松上手。曾有“颜技”用户抱怨换脸处理时间太长,有时几个小时也无法生成完毕。而“ZAO”上的原始视频多为十几秒,处理时间也只需几秒钟。
“全民换脸时代”已至?
长久以来,AI换脸技术的开发局限在顶尖学府的实验室里,因为公认的高成本和硬件要求,未能得到广泛应用。
2013年11月,电影《速度与激情7》主演保罗·沃克突然因车祸去世,但影片尚未拍摄完成,该如何收尾呢?
那一年,“换脸”的方法并不被看好,不論从技术突破还是制作成本而言,都是难以想象的。在此之前,电影《角斗士》曾运用过“换头技术”,仅仅两分钟的镜头,花费却高达320万美元。
最终,《速度与激情7》剧组还是采用了“换脸”的做法,以5000万美元的高昂花费,通过“真人拍摄加CG技术”将保罗·沃克的脸部再现到银幕上——这是影视行业中最接近AI换脸的一次尝试。
但Deepfake深度造假改写了这个局面。2017年12月,一名ID为“deepfakes”的用户开始在论坛Reddit上分享自己制作的换脸视频。视频的内容并不友好:斯嘉丽·约翰逊、爱玛·沃森、盖尔·加朵等好莱坞知名女星纷纷中招——“deepfakes”把她们变成了情色电影里的女主角。
Deepfake使用的深度学习技术是“生成对抗网络”(GAN)。《换脸APP背后的恐慌》一文如此解释GAN:“要伪造视频,首先需要两个神经网络来参与。网络A会生成一个假的视频片段,然后问网络B这个视频是否为真,网络B的反馈能够加强网络A所生成图像的可信度。前者被称作生成网络,后者则为判别网络。就这样,两个神经网络在不断对抗中学习,直至Deepfake生成以假乱真的视频。” 在接到大量受害者投诉后,Reddit关闭了“deepfakes”的账号及创建的相关讨论板块,但这个做法却促使“deepfakes”直接开源了其AI换脸项目的代码。多位非内部识别领域的程序员在看过代码后表示,代码并不复杂,可以直接在电脑上运行。
“deepfakes”的开源代码使得AI换脸技术不再高不可攀,许多爱好者开始了自己的尝试,这项技术也随之风靡全球。短暂消失后,“deepfakes”也重新回到网络中,继续更新分享AI换脸技术。
“ZAO”在一夜爆红后,跌入舆论漩涡。先是有法律从业者指出,“ZAO”最初的用户协议是“霸王条款”。在第六条中,“ZAO”指出,用户在上传及发布内容之前,“同意或者确保实际权利人同意授予ZAO及其关联公司以及ZAO用户全球范围内完全免费、不可撤销、永久可转授权和可再许可的权利”,同时,进行换脸时,用户需“同意或确保肖像权利人同意授予ZAO及其关联公司全球范围内完全免费、不可撤销、永久可转授权和可再许可的权利”。这意味着,用户在勾选同意后,“ZAO”有权将其肖像和资料授权给自己想授权的第三方,并且可修改;而明星肖像权的问题,也落到了用户身上。第七条更是直接写明,若产生侵权纠纷,用户,而非平台应承担责任。
数据安全问题与AI换脸技术结合,引发了巨大担忧。知微数据CEO于霄在朋友圈提醒道:“有手机号,有面部图像,通过技术合成,犯罪分子可以替你和你的家人通话……色情视频换脸、视频欺诈,很快会成为最流行的犯罪玩法,对骗术识别能力差的老人有极高的杀伤力。保护自己的声纹和面部图像,尽量不要给任何APP做此类精细化采集。”
甚至有人担心,在人脸支付如此普及的今天,AI换脸有没有可能破解防线,导致用户的支付软件被“刷脸”?
这些疑问一个接一个抛出来,许多使用过“ZAO”的用户慌了,要求删除账号和个人信息的人不计其数。
9月4日,工信部官方发布消息称,针对媒体公开报道和用户曝光的“ZAO”APP用户隐私协议不规范,存在数据泄露风险等网络数据安全问题,工信部对北京陌陌科技有限公司相关负责人进行了问询约谈,要求开展自查整改。
但人们对于AI换脸的担忧与恐惧并未随着“ZAO”的整顿而平息。这项技术的发展和普及,真的如许多质疑者所言,是一个已经打开的潘多拉魔盒吗?
“每个人都是潜在受害者”
在美国,“换脸色情片”的受害者难以通过法律进行自我保护。制作“换脸视频”过程中使用的成百上千张用来训练机器的照片,往往是受害人在社交平台或媒体公开发布的照片,此外,美国法律专家指出,“换脸视频”是一个不同于原视频的新创作,因此可能会被视作言论自由,受到美国宪法第一修正案的保护。
国内的“换脸色情片”黑产也存在已久。在闲鱼、淘宝或是QQ上输入关键词,就能轻易找到卖家。
交易通过百度网盘或提供专门APP的下载包完成。娱乐圈的知名女星,几乎都没能逃过“换脸色情片”的侵扰——尽管换脸的效果并不理想,甚至十分拙劣、粗糙。至于定制视频,对方则开价一分钟50元。而零基础学AI换脸,通常是 FakeAPP的使用教程,价格从300元到800元不等。
尽管看似门槛不高,AI换脸技术仍旧算不上一项普及度高或是便捷廉价的技术。河南大学人工智能教授张重生说,AI换脸技术昂贵,是因为训练模型的成本昂贵,“训练过程首先是硬件设备,就是要有非常好的GPU和CPU”。GPU尤其重要,有时要用到11块——以较好的GPU型号RTS2080为例,每块价格在九千元左右。
除此之外,训练过程中要输入大量的真实数据——可能是几百万甚至上千万张图像。张重生继续解释:“你几千万张图像进行迭代的训练,比如说原来有1000万张图像,你再乘以50次,那就相当于有5亿次计算,且每一次计算可能都需要一定的时间。这个训练过程要花费大量时间。”
关于“定制视频50元一分钟”的说法,一位视频制作者换脸哥也表示质疑。“制作指定的视频,造价过万,这还是粗制滥造。”他说,在目前的技术下,如果想要把换脸视频做得更精细、足以骗过视觉判断,“至少要上十万,这成本太高了。”
“换脸哥”坦承,自己做的换脸视频也并非无懈可击,脸型和光线都很难突破”。即便如此,这也是一项有些“烧钱”的爱好。通常而言,他做一个换脸视频需要一周时间。以“杨幂换脸黄蓉”视频为例,他用到的CPU官方售價15999元,GV100显卡的价格也因品牌不同在4万到6万不等,“极少数人群有这样的硬件”。除此之外,还需要收集几千张杨幂4K分辨率以上的照片。
此外, Deepfake软件的研发过程其实很枯燥,效果也因人而异,想要做到自然并不简单。不过,“换脸哥”还是乐此不疲。
清华大学电子系博士、人工智能从业者李治说:“AI换脸,第一个难点是要识别出图像和视频里的脸,第二个难点就是要做得自然。图像周围的纹理,包括视频的连贯性等都要解决好。”
讨论度极高的“ZAO”,在专业人土眼中,“有意思、好玩”,但还不足以对用户构成威胁。
一位匿名技术人员指出,“ZAO”换的并非全脸,而是半脸——主要是眉、眼、鼻为主的面中部分,“连打卡机的人脸识别都过不去,更别提破解支付宝”。
攻防战:AI VS AI
《脸的历史》中记录,19世纪摄影术发明后,“西方刑侦技术鼻祖”、法国犯罪学家阿方斯·贝蒂隆曾试图建立相片档案来识别罪犯。他在巴黎警署成立了一个部门,拍摄人的正面像和侧面像,并配有标准化描述身体特征的文字来建立档案。 十年间,贝蒂隆搜集了大约十万张照片。然而,事实证明,被录入档案的脸仍旧不是一种可靠的数据载体。在罪犯改头换面的情况下,脸并不能泄露他的真实身份。
但进入21世纪,随着人脸识别技术的发展,脸被抽象和量化,成了一种数据载体,重新成为身份识别的依据。如今在大洋彼岸,AI换脸技术已经影响了人们的政治和社会生活。
今年3月,美国佛罗里达州议员、2016年美国大选共和党总统候选人马克·卢比奥在华盛顿一场集会上,称Deepfake技术有着“核武器一般的杀伤力”。“如果你想对美国的国家安全造成威胁,需要10艘航空母舰、核武器和远程导弹。但今天你所需要的,就是制作一个逼真的假视频。”
他对台下的观众说道,“(AI换脸技术)可能会破坏我们的选举(2020年美国大选),使我们的国家陷入巨大危机。”
卢比奥的言论看似夸张,但并非空穴来风。针对政治人物炮制出的“假新闻”,在美国、欧洲引起过多次争议。
去年4月,一段“奥巴马痛骂特朗普是猪”的视频在YouTube上获得百万次浏览量。在片尾,迷题揭开——原来,这是美国新闻聚合网站Buzzfeed用AI换脸技术将演员乔丹·比尔的声音及嘴型,换到美国前总统奥巴马脸上。这个视频在提醒大众,在科技高速发展的当下,眼见也未必为实,对于假新闻,要提高防备意识。
Deepfake之所以令人忧虑,因为它不仅能伪造人脸,还能伪造声音。李治的主要研究方向是声音。在他看来,与换脸技术相比,由于娱乐性较差,声音相关技术的成熟和潜在的危险往往被人们忽视。
百度推出的Deep Voice算法,只需一段时长3.7秒的音频,就能生成足以以假乱真的假语音。据《华尔街日报》报道,今年3月,一个黑客组织利用AI语音克隆技术致电一家英国能源公司,假冒该公司位于德国的母公司的董事长,骗取了22万欧元。
当一个人最具独特性的生物信息聲音、人脸都能被造假、克隆,真假之间的边界越来越模糊,人们应该如何判断?
加州大学伯克利分校的计算机科学教授Hany Farid感到担忧,他警告说,在极端情况下,一个Deepfake视频或图像可能会引发军事冲突或其他现实生活中的动荡。
假视频的传播平台,往往是各类社交媒体。“社交平台已被武器化。”Hany Farid表示。然而,尽管AI假视频层出不穷,但社交媒体迟迟未迈出干预那一步。
今年6月,美国众议院情报委员会举行了一次听证会,提出如何应对Deepfake的问题。委员会主席提出,社交媒体应该立即制定政策保护用户不被假信息诱骗。
“Deepfake与传统的假消息不同,就像垃圾邮件不同于传统的假信息,应该区别对待。”扎克伯格表示Facebook正在制定相应的应对政策。
9月5日,Facebook终于正式向Deepfake“宣战”。这家公司表示,将开发出更好的开源工具来检测Deepfake,并计划联合微软、麻省理工大学等业界和学界的伙伴共同举办“Deepfake检测挑战赛”。5天后,这个计划下又多了一个项目——Facebook正在雇用演员建一个Deepfake视频,用于开发新的检测工具。
在此之前,针对Deepfake技术的攻防战已经打响,《华尔街日报》7月报道,美国学术界、国防部和一些初创企业已经推出各式各样的技术来对抗AI换脸视频、图片带来的威胁。
这注定是一场苦战。一方面,AI换脸本就是一项兴起时间不长的技术,针对其的检测技术还在起步阶段。去年12月,纽约州立大学奥尔巴尼分校计算机科学系的研究人员发现,利用Deepfake技术制作的视频中,人物往往缺乏“自发的、无意识的生理活动,例如呼吸、脉搏、眼球运动”——在此之前的换脸视频中,人物是不会眨眼的。
依据这个漏洞,研究团队开发出一款识别成功率近99%的检测软件。然而,仅仅两周后,一封署名为Deepfake创作者的信寄到了研究人员手上,“感谢指正,漏洞已修复”,信上写道。自此之后的视频里,人物更加逼真了,“换脸哥”制作的“杨幂换脸黄蓉”视频中,杨幂的眼睛就会随着表情变化而眨动。
除了AI,人们也可以利用自己的肉眼进行识别——目前的Deepfake技术远未达到完美相似,仍存在一些肉眼可辩的细微瑕疵。Buzzfeed总结了一些辨别视频真假的方法,如,不要妄下结论,查看内容来源,检查人物的嘴部动作,放慢视频,仔细观察人物的神情、动作等。
李治把这场攻防战比作造矛与造盾之间的“竞争”,“防守的一方肯定不如进攻的一方显眼”。“技术本身可以往好的方向发展,但它被用歪了的话,应该怎么解决?”他认为,要么从源头控制技术的发展利用,要么普及技术本身让人们更好地预防,而后者是一个慢慢渐进的过程。