论文部分内容阅读
最近,一款以“蚂蚁呀嘿”为背景音乐的换脸摇头特效视频,在抖音、微博等平台被火热刷屏。名为Avatarify的、制作这款特效的App,在几天之内就冲上了国内苹果应用商店的榜首,但在不到一周后的3月2日凌晨,这款应用被悄然下架了。
面对这如暴风雨般来去的热潮,我们心中大概已不再泛起太大的波澜,因为,早在三年前,我们就见识过一款名为“ZAO”的换脸视频应用在一周内的现象级快速兴起与下架。如今很难想象当时的我们有多么天真,当我在微信一屏屏刷到朋友们的脸在几秒之内无缝般移花接木到演员的脸上,同时还能毫无破绽地出演剧情时,内心确实受到了不小的震撼。我们可能普遍会对一张照片是否修过产生警觉,但却仍然本能地对视频和声音抱有信任,因为那个时候,“深度造假”远未像现在这样被认知。
“深度造假”这个词诞生于2017年,当时一位名为“deepfakes”的用户,在社交新闻论坛网站Reddit上发布了一些经过Al换脸的色情视频,视频将色情演员的脸替换成了盖尔·加朵、泰勒·斯威夫特、斯嘉丽·约翰逊等好莱坞女星。这一事件的轰动效应迅速引发了全球的关注,在那之后,deepfake就成了AI(人工智能)换脸技术的代名词。
维基百科对Deepfa ke的定义是:英文“deeplearning”(深度学习)和“fake”(造假)的混成词,专指基于人工智能的人体图像合成技术的应用。虽说技术是中性的,但如何把握好度则是对人性及随时跟进的法律的考验。斯嘉丽·约翰逊就曾在接受华盛顿邮报的采访中说过:“让任何一个人成为这项技术的攻击目标只是时间问题。”事情将远不会止于色情报复等行为,如果脸部和声音的生物特征数据被泄漏,我们的门禁和银行账户等都将不再安全。如果不对深度造假技术的使用加以监管,无论是个人生活还是公共政治等层面,我们都将会无所适从。
我无意在伦理和社会公共议题上过多地讨论深度造假,更多想讨论的是,在这之后我们和影像的关系发生了怎样的变化?我们都有过这样的经验,如果了解过魔术的技巧,就不会再产生第一次观看表演时的强烈冲击了,正如我们多数人经历假照片后的感受。而现在,我们来到了升级后的深度造假的世界,这将会是一个口说和耳听都不再为凭的世界,是一个你可能会在自己毫不知情的情况下说出你没有说过的话的世界。此刻,我们要刷新我们的认知和心理来面对。
暗房时代说起来稍微有点遥远了,大多数从Adobe Photoshop时代走来的我们,曾经为了将一张照片中的人像移入另一张照片,或者为了将照片中的人修得更完美等,先要学会使用这个软件,而修好一张图还要花费很长时间,然则结果还不一定完美。在“无图无真相”口号还流行的时代,即便我们已經对杂志上被修得过分完美的模特产生了共识,但对于一般照片的信任还是基本存在的。但深度造假技术则击溃了我们过往的认知,与PS不一样的是,它的一个重要特点在于:其图片和视频是由人工智能算法制作而成。
只要稍稍回想一下,就会发现我们已在不知不觉中进入了算法的世界。三不五时,朋友圈就会出现一些刷屏的小程序,要么是为你生成不同风格的怀旧照片,要么是生成你老年时的照片,或者是让你看到男性或女性版本的自己,等等。在我们惊讶于一键换头的便捷的同时,各种美图软件已成了我们生活的必需品,我们对自己在照片中的完美形象比任何时候的期望都要高。
现实越走越远,似乎无法回头,一旦知道那些几乎毫无破绽的照片或视频是伪造的,我们的认知就会发生变化。因此,当近期一款用AI技术将怀旧老照片中的人的头部动起来的程序开始进入大众视野的时候,我已经感觉到了自己体内的“免疫抗体”。
虽然如此,当我点进网站“This Person Does Not Exist”(这个人不存在)后,不得不说,刚看到那些肖像照时,我简直无法说服自己他们都是人工智能合成的,从他们的面部表情和眼神中,我甚至能想象到他们的呼吸、喜好、经历等等。这些人脸肖像是用StyleGAN2技术生成的,这是深度造假的基本技术之一:算法让一个网络去生成内容,让另一个网络将其与人脸进行比较,迫使其不断改进,直到合成图像与真实人脸之间无法区分。那么问题来了,一旦所有人都变得怀疑一切,我们将如何让自己判断眼前所见?
我们或许会变得更为偏狭,只相信自己信任的信息源。而识别深度造假的方法,还得依靠人工智能。目前,通过神经网络算法来判断是主要方法之一,但其准确率只落在84%—99%之间。而且,一旦我们用新的技术去识别深度造假,它就会对这项技术进行深度学习,从而进行规避。因此,任何一种反深度造假的技术,都会让其越来越强大。但另一种方法将会更为可靠:通过区块链技术的证据溯源来进行判断。
我们不得不调试好自己,学会与深度造假共存,这将影响到我们创作、沟通以及诠释世界的方式。影像作为当前最强而有力的沟通媒介已被推入了真与假的战场,而它是否能守住防线不至溃败,则成为我们的担忧。
或许,我们将进入一个很难确定什么是真实的世界,在这里,真相不仅是奢侈品,而且正被重新塑形。而更大的隐忧在于:许多人甚至根本不在乎真相。奥威尔在《1984》里说过,“谁控制了过去,就控制了未来;谁控制了现在,就控制了过去”,在人工智能时代,这句话或许应该改为:“谁控制了数据,就控制了过去和未来”。
面对这如暴风雨般来去的热潮,我们心中大概已不再泛起太大的波澜,因为,早在三年前,我们就见识过一款名为“ZAO”的换脸视频应用在一周内的现象级快速兴起与下架。如今很难想象当时的我们有多么天真,当我在微信一屏屏刷到朋友们的脸在几秒之内无缝般移花接木到演员的脸上,同时还能毫无破绽地出演剧情时,内心确实受到了不小的震撼。我们可能普遍会对一张照片是否修过产生警觉,但却仍然本能地对视频和声音抱有信任,因为那个时候,“深度造假”远未像现在这样被认知。
“深度造假”这个词诞生于2017年,当时一位名为“deepfakes”的用户,在社交新闻论坛网站Reddit上发布了一些经过Al换脸的色情视频,视频将色情演员的脸替换成了盖尔·加朵、泰勒·斯威夫特、斯嘉丽·约翰逊等好莱坞女星。这一事件的轰动效应迅速引发了全球的关注,在那之后,deepfake就成了AI(人工智能)换脸技术的代名词。
维基百科对Deepfa ke的定义是:英文“deeplearning”(深度学习)和“fake”(造假)的混成词,专指基于人工智能的人体图像合成技术的应用。虽说技术是中性的,但如何把握好度则是对人性及随时跟进的法律的考验。斯嘉丽·约翰逊就曾在接受华盛顿邮报的采访中说过:“让任何一个人成为这项技术的攻击目标只是时间问题。”事情将远不会止于色情报复等行为,如果脸部和声音的生物特征数据被泄漏,我们的门禁和银行账户等都将不再安全。如果不对深度造假技术的使用加以监管,无论是个人生活还是公共政治等层面,我们都将会无所适从。
我无意在伦理和社会公共议题上过多地讨论深度造假,更多想讨论的是,在这之后我们和影像的关系发生了怎样的变化?我们都有过这样的经验,如果了解过魔术的技巧,就不会再产生第一次观看表演时的强烈冲击了,正如我们多数人经历假照片后的感受。而现在,我们来到了升级后的深度造假的世界,这将会是一个口说和耳听都不再为凭的世界,是一个你可能会在自己毫不知情的情况下说出你没有说过的话的世界。此刻,我们要刷新我们的认知和心理来面对。
暗房时代说起来稍微有点遥远了,大多数从Adobe Photoshop时代走来的我们,曾经为了将一张照片中的人像移入另一张照片,或者为了将照片中的人修得更完美等,先要学会使用这个软件,而修好一张图还要花费很长时间,然则结果还不一定完美。在“无图无真相”口号还流行的时代,即便我们已經对杂志上被修得过分完美的模特产生了共识,但对于一般照片的信任还是基本存在的。但深度造假技术则击溃了我们过往的认知,与PS不一样的是,它的一个重要特点在于:其图片和视频是由人工智能算法制作而成。
只要稍稍回想一下,就会发现我们已在不知不觉中进入了算法的世界。三不五时,朋友圈就会出现一些刷屏的小程序,要么是为你生成不同风格的怀旧照片,要么是生成你老年时的照片,或者是让你看到男性或女性版本的自己,等等。在我们惊讶于一键换头的便捷的同时,各种美图软件已成了我们生活的必需品,我们对自己在照片中的完美形象比任何时候的期望都要高。
现实越走越远,似乎无法回头,一旦知道那些几乎毫无破绽的照片或视频是伪造的,我们的认知就会发生变化。因此,当近期一款用AI技术将怀旧老照片中的人的头部动起来的程序开始进入大众视野的时候,我已经感觉到了自己体内的“免疫抗体”。
虽然如此,当我点进网站“This Person Does Not Exist”(这个人不存在)后,不得不说,刚看到那些肖像照时,我简直无法说服自己他们都是人工智能合成的,从他们的面部表情和眼神中,我甚至能想象到他们的呼吸、喜好、经历等等。这些人脸肖像是用StyleGAN2技术生成的,这是深度造假的基本技术之一:算法让一个网络去生成内容,让另一个网络将其与人脸进行比较,迫使其不断改进,直到合成图像与真实人脸之间无法区分。那么问题来了,一旦所有人都变得怀疑一切,我们将如何让自己判断眼前所见?
我们或许会变得更为偏狭,只相信自己信任的信息源。而识别深度造假的方法,还得依靠人工智能。目前,通过神经网络算法来判断是主要方法之一,但其准确率只落在84%—99%之间。而且,一旦我们用新的技术去识别深度造假,它就会对这项技术进行深度学习,从而进行规避。因此,任何一种反深度造假的技术,都会让其越来越强大。但另一种方法将会更为可靠:通过区块链技术的证据溯源来进行判断。
我们不得不调试好自己,学会与深度造假共存,这将影响到我们创作、沟通以及诠释世界的方式。影像作为当前最强而有力的沟通媒介已被推入了真与假的战场,而它是否能守住防线不至溃败,则成为我们的担忧。
或许,我们将进入一个很难确定什么是真实的世界,在这里,真相不仅是奢侈品,而且正被重新塑形。而更大的隐忧在于:许多人甚至根本不在乎真相。奥威尔在《1984》里说过,“谁控制了过去,就控制了未来;谁控制了现在,就控制了过去”,在人工智能时代,这句话或许应该改为:“谁控制了数据,就控制了过去和未来”。