图片智能分类谷歌AI新模型ACE解密

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:deng5384588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

图片智能分类并不是简单的事


  电脑中保存的图片多了以后,为了方便后续的查找和管理,我们经常需要对图片进行分类。如果只是简单地根据图片类型、尺寸或者Exif版本等数字化元素进行分类,那么借助资源管理器的“分组依据”就可以非常快速地完成(图1)。
  不过在实际的使用中,上述简单的分类并不能满足我们的需求,因为很多图片的分类是根据人类的感觉、掌握的知识,甚至情绪等进行划分的。比如下图中需要将跑车归为一类,因为我们知道跑车的底盘都较低、外观采用扁平设计、很多采用敞篷这些知识,通过人工是很容易区分的,但是机器并不掌握这些知识,这个简单归类就会让机器识别有难度(图2)。


看一眼就能挑出重点——ACE模型解读


  如上所述,如果AI需要实现对于某一类图片的精准识别, 它就需要像我们人类那样进行学习。
  首先AI需要设定模型,然后根据这个模型通过大量图片的深度学习来掌握人类的判断能力,这样才能通过识别照片上的某些属性进行分类。要让机器识别上述跑车图片,那么可以根据一定的模型先准备图片数据集,数据集中会标注每张图片的标签、特征值和分类,比如将底盘高度作为特征值,并将这个数据量化。假设跑车底盘高度被设定为5,那么以后AI只要在图片中发现汽车符合“5”的标准就将其归类到“跑车”组,从而实现对“跑车”图片的识别(图3)。
  不过这种传统机器模型有很大的局限性,它们大多是基于每个样本单特征进行学习(比如上述底盘高度),但是在实际应用中这种单特征的学习还是无法应对更为复杂的图片识别。因为在机器学习中如何系统性地总结和解释每个样本的特征重要性得分很有难度,比如在上述跑车判断中,就涉及到了外观扁平设计、底盘高度、敞篷等特征,到底哪个特征更重要?
  当然这样的问题如果交给人类判定就没有什么难度,因为这些特征都可以通过我们的直觉获得。在上述照片组中,人眼仅仅依靠汽车外观是否扁平化设计就可以轻松区别出是否为跑车。为此谷歌提出ACE模型来解决这个问题,通过ACE模型的训练后可以让AI拥有类似人的直觉功能,因此分辨类似上述照片就没有难度了。那么ACE是怎么训练机器,从而让AI拥有这样的功能?
  ACE首先是分割类别图像,为了方便对图片识别,它将图片按照多个分辨率进行分割。在谷歌的一个示例中,它将多张包含警车的图片按照车辆的轮胎、警车上的执法徽标、警车上的小车窗进行分割(图5)
  接着将相似的分割归为同一个概念,借助这些相似的分割图片训练出当前最优卷积神经网络,从而找出识别这些图片的最优策略,最后通过这些策略的训练,实现对这类图片的精准识别。在上述警车例子中,经过ACE模型训练后,对于警车的图像分类器来说,借助车辆上的执法徽标就可以很好地识别这类图片。这种能力就像是人类的直觉一样,只要AI“瞄一眼”这些图片,通过车上醒目的标记就可以知道这些是警车(图6)。
  当然在实际训练中,ACE会根据不同图像的性质选择最佳的识别属性。在另一个例子里,对于预测篮球图像的分类器,ACE是通过分割出来的篮球球员的球衣来进行分类(而不是通过篮球本身,因为篮球的颜色容易和背景颜色混淆,不利于识别)。这样借助这种更为科学的模型,ACE可以拥有类似人类的直觉能力,从而可以更高效地实现对图片的智能识别。

小知识


  什么是ACE模型
  ACE是Automated Concept-basedExplanation(基于概念的自动解释)的简称,它的核心是“自动解释”能力,这种能力是基于识别高级概念的方法获取。ACE在提取概念并确定每个概念的重要性之前,会将一个训练过的分类器和一个类别的一组图像作为输入,并将片段图像的类似片段作为相同概念进行分组。ACE就像是人类的直觉一样,可以快速实现对图片显著特征的识别(图4)。


让更智能的AI为我們服务


  如上所述,通过AC E模型训练,我们可以让AI拥有更加智能的能力。显然这些高智商的AI能够为我们的生活带来更多的乐趣,因为这样的AI就像拥有人类的眼睛和大脑一样,对于海量的照片,它只要看一下就可以立刻做出判断。



  ACE的这种识别能力可以在生活中得到大量的应用,比如很多朋友喜欢在朋友圈晒自己的照片,现在可以使用ACE将最值得发朋友圈的照片筛选出来(比如找到美颜效果最理想的,最容易突出自己身体特征的照片),这样就可以将自己最美好的一面展示给朋友。我们期待类似ACE模型越来越强大,让更智能的AI为我们提供更多的贴心服务。
其他文献
首先,在本地电脑的某个磁盘分区中建立名为“模板”的文件夾,然后在它里面再分门别类地创建几个文件夹,如建立名为“个人简历”、“计划书”的文件夹;打开“模板”文件夹这个层级,在窗口上面的地址栏点击,选中其中的地址路径(如“E:\模板”),进行复制;打开Word文档,点击“文件→选项”,在弹出窗口的左侧一栏中点击“保存”一项,在右侧窗格的“默认个人模板位置”处粘贴刚才复制的地址,点击“确定”(图1)。 
期刊
视频下载无水印——兔二工具  兔二(https://www.tool2.cn/)是一款免费在线工具集,它在线提供很多媒体工具,可以让我们直接下载抖音、快手、微博等短视频并自动去除水印。比如现在需要下载自己在快手上拍摄的视频,首先在手机上启动快手APP,然后在个人中心里找到自己拍摄的视频作品,打开后点击上方的“分享”按钮,在弹出的窗口中选择“复制链接”,接着将链接传输到电脑微信或QQ上(图1)。  
期刊
插入可编辑内置立方体——打造立体图表  在PowerPoint的系列版本中,我们都可以直接通过插入图表的方法制作立体柱状图,但是其中的柱状体是受表格数据限制的,调整起来十分不便(图1)。  而在Power Point 2010及以上的版本中,我们则可以直接通过“插入→形状→基本形状→立方体”获得立方体。这样插入的立方体更方便我们打造更为酷炫的立体图表。  首先启动PowerPoint 2019(本
期刊
有向四步流程图  这里我们所说的有向图,是指带有箭头指示方向的图形。我们首先看看本例的最终效果(图1),其主要难点是制作带有缺口的圆形,因为通过普通方法进行合并或拆分,最终虽然能得到一个“豁口”的圆形,但却是自动封闭的,所以制作过程中需要附加其他一些处理。  首先在PowerPoint中(本文以2016版为例),将圆形设置为无填充颜色,并加粗轮廓线。接下来绘制一个高度与圆形将要开的缺口大小相近的矩
期刊
首先,选中A1: C2数据区域,切换到“插入”选项卡,点击“饼图→圆环图”,插入一个环形图;选中整个图表区域,切换到“图表工具→格式”选项卡,在大小处高度设置为5厘米,宽度设置为4厘米;修改一下标题文字内容,然后将图表中的标题、图例字體可以设置一个好看点的字体,如“ 微软雅黑”。选中圆环图,点击“形状效果→阴影→ 外部→右下斜偏移”,给图表加上阴影效果;在图表区空白处右击,选择“设置图表区域格式”
期刊
在過去的很长一段时间,手机QQ的聊天记录只能通过“漫游”的形式保存,所以QQ用户非常羡慕微信用户特有的“聊天记录备份与迁移”功能。好消息是,如今最新版的手机QQ(8.1.8)终于引入了类似的功能,可以让我们再也不用担心聊天记录丢失的问题了。  依次进入手机QQ的“设置→通用→聊天记录备份与迁移”(图1),就能看到和微信相同的备份界面,我们可以选择将聊天记录备份到其他手机或者PC上(图2)。其中,“
期刊
简单获取Scribus  Scribus适用于多个操作系统,它一般有两种版本。一种是稳定版,当前为1.4.x系列,可从https://WWW.scrlbus。net/dOWFIloads/stabIe—branch处下载。另一种是开发版,当前为1.5.×系列,这一系列版本包括许多全新的功能,不过它的稳定性没有保障,有兴趣的朋友可以从https://www.scribus.net/downIoads
期刊
旗舰级SoC市场现状  虽然2020年旗舰级SoC市场将由麒麟990 5G、Exynos 990、天玑1000和骁龙865“四剑客”组成,但Exynos 990仅被韩国和欧洲市场销售的Galaxy S20系列手机所列装,国内用户基本无缘享用。同时,天玑1000暂时也仅是纸面上的存在,至本文截稿时只有OPPO Reno 3搭载了这颗SoC的缩水简化版天玑1000L,而天玑1000能否被更多OEM厂商
期刊
利用表格对齐合同的落款  在制作合同的时候,都需要在合同的落款处设置甲方、乙方、时间等相关内容,不过实际操作过程中,这些内容往往很难对齐。为了让合同看上去更加正规和美观,我们可以利用表格的方式来进行对齐设置。  我们首先在Word中输入相关的内容,并在每个内容之间用空格键进行分隔,比如“甲方 :_ _ _ _ _ _ _”这样。接着将这些内容选中,点击“插入”标签中的“表格”按钮,在弹出的菜单中选
期刊
选择需要的图表模板  打开Char ts Factor y云服务的主页(https://chartsfactory.com),该服务不需要注册,也不需要用户上传表格文件,立刻就能上手进行图表的制作。接下来点击网页中的“Make a Chart”按钮,在弹出的新页面中可以看到一个图表模板,点击模板右侧的“Edit Chart”选项,就可以在该模板的基础上进行制作了。  如果用户对弹出的模板类型不满意
期刊