论文部分内容阅读
我们不要希望能够在短时间内用上这一技术。不过这项技术确实可以给搜索服务增加新的垂直领域,而且也使得搜索的能力更加接近我们日常生活的需要。
有没有想过会有这样一天,当我们来到北欧某个不知名的小城,看到一座宏大的建筑,然后用手机拍摄下来,发送到Google搜索引擎之后,Google不但可以给我们返回关于这座建筑的名称和介绍,还能够提供周边的相关信息?
事实上,这个功能并不是遥不可及的,2009年在美国迈阿密举行的“计算机视觉与模式识别大会”上,Google的研究人员提交了一篇论文,初步展示了Google正在研发中的建筑物识别功能。Google表示,识别5万个地标性建筑的准确率高达80%。
模式识别技术
要了解对建筑物的识别技术,我们首先要对模式识别了解一二。模式识别(Pattern Recoqnition)其实是人类的一项基本能力,而随着人工智能的发展,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。
所谓模式识别,其实是指对事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认,分类和解释的过程。目前模式识别是信息科学和人工智能的重要组成部分。它包括两个形式的内容,抽象的模式识别包括意识,思想、议论等;而具体的模式识别则主要是对语音波形,地震波,心电图,脑电图、图片,照片,文字、符号、生物的传感器等对象进行测量的具体模式进行分类和辨识。
Google的这一技术就是采用了模式识别的方法,提取搜索特征并与数据库里的数据进行比对得出结果。所以这一技术的实现有两大要素,第一是特征的提取,第二则是数据库的建设。只有这两个关键要素的问题都得到解决,Google的建筑物识别才可能真正进入实用阶段。
Google帮你认建筑
Google的这一技术目前仅80%的准确率难以满足实际使用要求,更是远远达不到这类搜索所需要的精准要求。但这一技术的发展前景显然是值得期待的。
Google负责计算机视觉研究的专家表示,这一技术的第一步是利用GooglePicasa等所具备的4000多万张带有GPS标签的图片文件整理出一个全球地标清单。随后Google将会把目标建筑的图片和这数据库进行对比,找出每个建筑物合适的照片。利用高效的图像匹配算法修正图像并且通过更先进的技术缩小结果,并给出准确答案。同时Google还需要开发一个用于快速图像识别的索引系统。
不过客观来说,这一技术要真正投入使用恐怕还需要很长时间。一方面,很多不同的建筑物可能会有着类似的外观和特点。特别是某些有民族和国家特征的建筑,比如哥特式的教堂、伊斯兰清真寺等等;另外,建筑物上如果包含有旗帜或横幅也很容易导致错误的匹配。所以,我们不要希望能够在短时间内用上这一技术。不过这项技术确实可以给搜索服务增加新的垂直领域,而且也使得搜索的能力更加接近我们日常生活的需要。
有没有想过会有这样一天,当我们来到北欧某个不知名的小城,看到一座宏大的建筑,然后用手机拍摄下来,发送到Google搜索引擎之后,Google不但可以给我们返回关于这座建筑的名称和介绍,还能够提供周边的相关信息?
事实上,这个功能并不是遥不可及的,2009年在美国迈阿密举行的“计算机视觉与模式识别大会”上,Google的研究人员提交了一篇论文,初步展示了Google正在研发中的建筑物识别功能。Google表示,识别5万个地标性建筑的准确率高达80%。
模式识别技术
要了解对建筑物的识别技术,我们首先要对模式识别了解一二。模式识别(Pattern Recoqnition)其实是人类的一项基本能力,而随着人工智能的发展,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。
所谓模式识别,其实是指对事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认,分类和解释的过程。目前模式识别是信息科学和人工智能的重要组成部分。它包括两个形式的内容,抽象的模式识别包括意识,思想、议论等;而具体的模式识别则主要是对语音波形,地震波,心电图,脑电图、图片,照片,文字、符号、生物的传感器等对象进行测量的具体模式进行分类和辨识。
Google的这一技术就是采用了模式识别的方法,提取搜索特征并与数据库里的数据进行比对得出结果。所以这一技术的实现有两大要素,第一是特征的提取,第二则是数据库的建设。只有这两个关键要素的问题都得到解决,Google的建筑物识别才可能真正进入实用阶段。
Google帮你认建筑
Google的这一技术目前仅80%的准确率难以满足实际使用要求,更是远远达不到这类搜索所需要的精准要求。但这一技术的发展前景显然是值得期待的。
Google负责计算机视觉研究的专家表示,这一技术的第一步是利用GooglePicasa等所具备的4000多万张带有GPS标签的图片文件整理出一个全球地标清单。随后Google将会把目标建筑的图片和这数据库进行对比,找出每个建筑物合适的照片。利用高效的图像匹配算法修正图像并且通过更先进的技术缩小结果,并给出准确答案。同时Google还需要开发一个用于快速图像识别的索引系统。
不过客观来说,这一技术要真正投入使用恐怕还需要很长时间。一方面,很多不同的建筑物可能会有着类似的外观和特点。特别是某些有民族和国家特征的建筑,比如哥特式的教堂、伊斯兰清真寺等等;另外,建筑物上如果包含有旗帜或横幅也很容易导致错误的匹配。所以,我们不要希望能够在短时间内用上这一技术。不过这项技术确实可以给搜索服务增加新的垂直领域,而且也使得搜索的能力更加接近我们日常生活的需要。