论文部分内容阅读
摘要:人脸识别技术是基于人的脸部特征,对输入的人脸图像或者视频流.首先判断其是否存在人脸,如果存在人脸,则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息。并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份,这种技术正走在全世界广泛的蔓延。
关键词:脸部识别;人脸图像
前言
北京参观Megvii的总部,就像拜访大哥的机房一样。公司大厅的摄像机眨眼间识别访客。其他这样的设备被部署在办公室周围。在“终结者”电影中的人造智能(AI)系统之后,他们捕获的一些图像显示在名为“Skynet”的视频墙上。一个视频墙显示了一群在电梯前面等候的员工,每个脸上都有一个白色的框架,旁边的每个人的名字。创业公司的首席执行官尹琪对奥威尔的设想进行了测试,只是说“这有助于抓坏人”。即使尹先生想考虑技术的含义,他也不会有时间。Megvii正在忙于建立他所描述的视觉计算的“大脑”。
该公司自2011年成立以来已经走了很长的一段路(其名称代表“超级视野”)。全球超过30万家公司和个人使用其面部识别技术,称为Face++,使其成为最大的这类服务之一。在十二月,Megvii筹集了1亿美元,估值近20亿美元,并将其转变为世界第一个十亿美元的创业公司,可能被称为“面对工业综合体”。
脸部识别技术的广泛应用:
该领域的供应商销售硬件和软件工具来识别面孔,然后将这些面孔连接到其他有用的数据。虽然市场规模相当小,最乐观的估计就是数十亿美元,但是技术已经开始渗透到更广泛的业务领域。主要原因是面部识别的准确性正在迅速提高,将其放在与语音识别相同的轨迹上,当精确度提高最终几个百分点时,语音识别真正起飞,几乎达到100%。AI大部分研究员Andrew Ng说:“大多数人都低估了95%到99%的准确度之间的差异,99%是一个改变游戏规则的人。
更重要的是,智能手机将为人脸识别,智能扬声器,如亚马逊回声,已经做了语音识别:使消费者可以接受。数以百万计的中国人已经在智能手机上“滑动”他们的脸,以授权付款。9月12日,苹果公司预计将推出新版iPhone,其技术可以可靠地识别所有者的脸部,甚至在黑暗中解锁设备。在三星公司推出了一款类似但不太复杂的Galaxy Note之后,几周之后,将面部识别技术分为两类:底层功能和使用它的应用程序是有意义的。Megvii的Face++属于第一类,与SenseTime,另一家中国创业公司NTechLab,俄罗斯公司以及亚马逊,IBM和微软的类似产品也同样如此。所有这些都提供面部识别作为云计算服务。Megvii的客户可以上传一批照片和名称,并使用它们来训练算法,然后可以识别那些特定的人。公司还可以将识别服务集成到自己的产品中,例如控制对在线帐户的访问。Megvii和SenseTime的服务主要建立在良好的数据上。他们可以访问中国政府的图像数据库,这个700万公民的圖像数据库,每个人都有16岁的照片。中国政府机构也是有价值的客户,越来越多的国家的数以万计的监控摄像机将很快认出面孔。在深圳人脸识别是用来识别客户与人物;名称和图片在屏幕中上升。在北京,市政府已经开始利用这种技术在公共厕所捕捉卫生纸的窃贼(其制度也阻止人们在九分钟内取得超过六十厘米的纸张)。
通常由云计算服务之一提供的商业应用程序的传播速度更快。9月1日,阿里巴巴的子公司Ant Financial在实体店首次部署了“微笑付款”系统,杭州的KFC餐厅名为KPRO的更健康版本的客户可以通过查看在屏幕上(见图)。一家连锁便利店小米表示,当人们进入商店时,会使用面部扫描来研究他们的行为。几家中国银行现在让用户在自动取款机上识别自己的脸。
脸部识别技术的未来:
西方国家进一步落后,一些行业早已采取了基本的面部认同,包括赌场想要转移臭名昭著的赌徒。但主要是大型网络公司(谨慎)使用该技术。Facebook的成员将照片上的朋友标记为Facebook,因此该公司的算法可以识别其他照片。Google采用这项技术,将用户上传的照片分组到其照片服务。亚马逊的新家庭主播者Echo Look也有一台相机,这可能是为了识别面孔。其他公司正在测试水域。JetBlue和其他美国航空公司已采取初步步骤,将乘客面孔与护照照片相匹配,旨在消除登机牌。劳埃德银行不是唯一的西方银行计划复制中国银行,并允许客户使用他们的面孔登录帐户。Uber,一个骑行的公司,有一个系统要求在印度的司机在开始换班之前采取自行车。这应该减少未注册的司机假冒注册的司机。芯片制造商Nvidia计划在新加利福尼亚总部进行面部识别。例如,摄像机可以识别值得特殊待遇的忠实客户和VIP。他们可以察觉到顾客面部的不满,派出工作人员进行干预。世界上最大的零售商沃尔玛据说正在致力于面部识别系统,以改善客户服务。然而,这种“对抗性攻击”在语言上不可能保持面孔识别被广泛使用。Megvii的尹先生期望技术成为一种商品。这就是为什么他已经把他的目光提高了一些。他正在将公司的计算机视觉大脑引向更复杂的任务,如解释人类行为和识别对象。
结语
不出意料的是,这些服务的传播也许已经促成了挫败的努力。以色列创始人D-ID代表“去身份验证”,开发出轻微改变照片的软件,使算法无法识别。这样可以让人们分享他们脸部的照片,而不必担心会被用来识别他们的脸部。其他人也提出了针对复杂监控系统的低科技防御措施,例如在规格框架上具有致幻图案的眼镜,或仅仅戴口罩或化妆品。尹先生希望他的公司能够发展成为一个“算法工厂”,为计算机视觉服务提供各种构建模块,其他公司将能够结合和重组,以便提供更为先进的产品。Megvii是否符合这个愿望,它所传播的技术只会传播。
(作者单位:江西科技师范大学)
关键词:脸部识别;人脸图像
前言
北京参观Megvii的总部,就像拜访大哥的机房一样。公司大厅的摄像机眨眼间识别访客。其他这样的设备被部署在办公室周围。在“终结者”电影中的人造智能(AI)系统之后,他们捕获的一些图像显示在名为“Skynet”的视频墙上。一个视频墙显示了一群在电梯前面等候的员工,每个脸上都有一个白色的框架,旁边的每个人的名字。创业公司的首席执行官尹琪对奥威尔的设想进行了测试,只是说“这有助于抓坏人”。即使尹先生想考虑技术的含义,他也不会有时间。Megvii正在忙于建立他所描述的视觉计算的“大脑”。
该公司自2011年成立以来已经走了很长的一段路(其名称代表“超级视野”)。全球超过30万家公司和个人使用其面部识别技术,称为Face++,使其成为最大的这类服务之一。在十二月,Megvii筹集了1亿美元,估值近20亿美元,并将其转变为世界第一个十亿美元的创业公司,可能被称为“面对工业综合体”。
脸部识别技术的广泛应用:
该领域的供应商销售硬件和软件工具来识别面孔,然后将这些面孔连接到其他有用的数据。虽然市场规模相当小,最乐观的估计就是数十亿美元,但是技术已经开始渗透到更广泛的业务领域。主要原因是面部识别的准确性正在迅速提高,将其放在与语音识别相同的轨迹上,当精确度提高最终几个百分点时,语音识别真正起飞,几乎达到100%。AI大部分研究员Andrew Ng说:“大多数人都低估了95%到99%的准确度之间的差异,99%是一个改变游戏规则的人。
更重要的是,智能手机将为人脸识别,智能扬声器,如亚马逊回声,已经做了语音识别:使消费者可以接受。数以百万计的中国人已经在智能手机上“滑动”他们的脸,以授权付款。9月12日,苹果公司预计将推出新版iPhone,其技术可以可靠地识别所有者的脸部,甚至在黑暗中解锁设备。在三星公司推出了一款类似但不太复杂的Galaxy Note之后,几周之后,将面部识别技术分为两类:底层功能和使用它的应用程序是有意义的。Megvii的Face++属于第一类,与SenseTime,另一家中国创业公司NTechLab,俄罗斯公司以及亚马逊,IBM和微软的类似产品也同样如此。所有这些都提供面部识别作为云计算服务。Megvii的客户可以上传一批照片和名称,并使用它们来训练算法,然后可以识别那些特定的人。公司还可以将识别服务集成到自己的产品中,例如控制对在线帐户的访问。Megvii和SenseTime的服务主要建立在良好的数据上。他们可以访问中国政府的图像数据库,这个700万公民的圖像数据库,每个人都有16岁的照片。中国政府机构也是有价值的客户,越来越多的国家的数以万计的监控摄像机将很快认出面孔。在深圳人脸识别是用来识别客户与人物;名称和图片在屏幕中上升。在北京,市政府已经开始利用这种技术在公共厕所捕捉卫生纸的窃贼(其制度也阻止人们在九分钟内取得超过六十厘米的纸张)。
通常由云计算服务之一提供的商业应用程序的传播速度更快。9月1日,阿里巴巴的子公司Ant Financial在实体店首次部署了“微笑付款”系统,杭州的KFC餐厅名为KPRO的更健康版本的客户可以通过查看在屏幕上(见图)。一家连锁便利店小米表示,当人们进入商店时,会使用面部扫描来研究他们的行为。几家中国银行现在让用户在自动取款机上识别自己的脸。
脸部识别技术的未来:
西方国家进一步落后,一些行业早已采取了基本的面部认同,包括赌场想要转移臭名昭著的赌徒。但主要是大型网络公司(谨慎)使用该技术。Facebook的成员将照片上的朋友标记为Facebook,因此该公司的算法可以识别其他照片。Google采用这项技术,将用户上传的照片分组到其照片服务。亚马逊的新家庭主播者Echo Look也有一台相机,这可能是为了识别面孔。其他公司正在测试水域。JetBlue和其他美国航空公司已采取初步步骤,将乘客面孔与护照照片相匹配,旨在消除登机牌。劳埃德银行不是唯一的西方银行计划复制中国银行,并允许客户使用他们的面孔登录帐户。Uber,一个骑行的公司,有一个系统要求在印度的司机在开始换班之前采取自行车。这应该减少未注册的司机假冒注册的司机。芯片制造商Nvidia计划在新加利福尼亚总部进行面部识别。例如,摄像机可以识别值得特殊待遇的忠实客户和VIP。他们可以察觉到顾客面部的不满,派出工作人员进行干预。世界上最大的零售商沃尔玛据说正在致力于面部识别系统,以改善客户服务。然而,这种“对抗性攻击”在语言上不可能保持面孔识别被广泛使用。Megvii的尹先生期望技术成为一种商品。这就是为什么他已经把他的目光提高了一些。他正在将公司的计算机视觉大脑引向更复杂的任务,如解释人类行为和识别对象。
结语
不出意料的是,这些服务的传播也许已经促成了挫败的努力。以色列创始人D-ID代表“去身份验证”,开发出轻微改变照片的软件,使算法无法识别。这样可以让人们分享他们脸部的照片,而不必担心会被用来识别他们的脸部。其他人也提出了针对复杂监控系统的低科技防御措施,例如在规格框架上具有致幻图案的眼镜,或仅仅戴口罩或化妆品。尹先生希望他的公司能够发展成为一个“算法工厂”,为计算机视觉服务提供各种构建模块,其他公司将能够结合和重组,以便提供更为先进的产品。Megvii是否符合这个愿望,它所传播的技术只会传播。
(作者单位:江西科技师范大学)