奔跑吧,让AI做你的眼睛

来源 :中国科学探险 | 被引量 : 0次 | 上传用户:gzhp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  “我们应该激励更多为视障人士创新的技术成果,让其尽早转化成真正让视障人士受益的产品,这需要构建一个良好的创新生态。”
  日新月异的科技力量正为视障人士“重见光明”带来希望。
  2020年11月底,谷歌表示,其研发的一款人工智能系统,能够帮助视障人士独立参加跑步比赛。据悉,依靠该系统,视障人士不需要依靠人类向导或导盲犬自己便可以跑完全程。那么,这款人工智能系统如何让视障人士参加跑步比赛?近年来在帮助视障人士恢复视力等方面,人工智能有哪些阶段性成果?目前这些产品距离应用还有多远?
  用声音信号为盲人引路
  现在很多崇尚健身的人喜欢挑战马拉松,而盲人如何参与跑完“半马”或“全马”呢?一位公益组织人员介绍,盲人要参加此类比赛,需陪跑者的帮助。为了方便跑步,盲人和陪跑者之间有1条牵引绳,分别套在各自的手腕上,如同牵手跑步。为了确保盲人在跑步中万无一失,有时需要两位陪跑者。但是,盲人平时训练时,随时找个陪跑者似乎不太现实。
  最近,不少城市开始允许导盲犬进入地铁、公交车。然而,国内导盲犬的数量十分有限,据统计,截至2017年,导盲犬的数量仅为116只,比大熊猫还稀少,而需要导盲犬服务的视障人士却多达800万人左右。每训练一只导盲犬需要耗费12万~15万元,导盲犬的寿命约为十几年,视障人士即使有幸排到一只,但当它退役之后,视障人士又该如何外出,也是个值得思索的问题。
  谷歌开发的这套系统似乎让我们看到了希望。“这个系统,不需要让视障人士依靠人类向导或导盲犬即可自己跑完全程。”远望智库AI事业部部长、图灵机器人首席战略官谭茗洲说。
  据介绍,这个应用程序使用人工智能模型来识别道路上的一条画线,并推断出跑步者与这条线的关系。如果跑步者离线太远,该应用程序就会向他们佩戴的骨导耳机发送信号,播放令人不快的噪音。声音是哪只耳机发出的、音量有多大,都能让跑步者知道他们需要移动的方向及其离终点有多远。
  谭茗洲解释道,这有点像汽车上使用的接近警报,当汽车离可能发生碰撞的地方越近时,警报的声音就会越大,频率也会越快。使用谷歌的这个系统,跑步者需要把一部安卓手機与经设计的腰带绑在腰上。这款应用程序不需要连接互联网即可工作,而且还可考虑多种光照和天气条件。显然,若在一些社区,专门为视障人士建立带有指引标志的赛道,他们自己便可以安心愉快地奔跑健身。
  构建无障碍场景,所感如所见
  “视障人士只是眼睛看不见,声音是可以听到的,目前的AI科技让他们真正看见世界不太可能,但可以让他们体验到‘如同看见’的效果。”谭茗洲指出。
  如今,许多互联网公司都通过各种方式成功让视障人士与他们提供的服务实现互动,主要方法就是将文本转变成由屏幕阅读器发出的语音。4年前,脸谱公司(Facebook)发起“无障碍倡议”,尝试采用人工智能技术来丰富盲人、聋人和其他残疾人士的用户体验,重点工作之一是重新设计菜单和按钮结构,运用自动口译某些照片和视频的算法使其能为屏幕阅读器所用,为视障用户提供丰富的场景描述。
  作为美国一位专业徒步旅行者,视障人士特雷弗·托马斯时不时在脸谱上与粉丝分享其带着爱犬到一些山径和步道徒步旅行的照片和视频。他感慨道:“之前因看不见照片,我对是否使用脸谱无所谓,而现在我无法想象没有脸谱的日子了。”例如,对于旧金山湾落日的照片,含有人工智能技术的屏幕阅读器会如此描述:这张照片含有自然、户外、云朵、草地、地平线、植物或树木;一对夫妇带着孩子站在加州丹麦城著名风车前面的照片,屏幕阅读器诠释:这张照片包括了3个人,微笑,户外。
  “显然,这些解释不能对照片进行全面描述,但在没有人工帮助的前提下确实能填补某些空白,视障人士仅需点击阅读器来描述,而无须他人来做解释。”谭茗洲说。
  瑞士eyra公司专门为视障人士研发了一种助读设备。据介绍,这个装置由三部分组成:挂在耳朵上面的骨传导耳机及其上面的高清摄像头,还有AI处理器。AI处理器可以将文本转化成有声小说,当然也不用担心噪音干扰的问题,因为是骨传导,可以一定程度上减少噪音干扰,给视障人士的生活带来便利。
  今年在拉斯维加斯举办的世界最大消费类电子产品展会上,一款智能手机可以通过语音讲述周围的世界,赋予视障人士和弱视用户更丰富的视觉体验。该应用还可适配智能眼镜,可将用户的智能手机摄像头变成用户的眼睛。据介绍,其利用人工智能识别摄像头指向的视觉信息,包括食品包装、海报和显示屏,比如超市的商品信息、车站的显示投屏、街边的海报。此外,还可以识别记录亲朋好友的面孔,用户可以用其扫描和寻找周围的人和事。
  三方面发力,释放科技的人文关怀
  据美国劳工部和美国盲人联盟的统计资料表明,目前视障人士可以顺利就业的职业达147种。因此,有学者提出,要想改变视障人士的就业现状,教育是关键一步,特殊教育也需科技化。
  目前,很多专为视障人士设计的解决方案,正凸显着人工智能应用的多样化和人性化。那么,如何加速人工智能产品的突破性运用,让冰冷科技释放出人文关怀?
  谭茗洲指出,这需要三方面发力。首先要培育创新生态。“在2017年德勤全国创新精英挑战赛总决赛上,一支四川大学在校学生团队研发的一款视障人士Kindle阅读器获奖。”谭茗洲说,我们应该激励更多像这样为视障人士创新的技术成果,不让其沉睡,尽早转化成真正让视障人士受益的产品,这就需要构建一个良好的创新生态。
  此外,要解决算力和成本之间的矛盾。谭茗洲介绍,机器学习训练往往要消耗大量的算力,操作中会出现时间上的延迟与信息隐私的安全隐患,这就要将AI算法中的数据上传到云端完成。而要满足终端AI推理运算的实时、可用性需求,就要在本地处理大量的数据,但若在终端本身部署高性能的AI芯片,从成本控制上来看不大现实,在实体场景中部署足够多的边缘AI更具一定可行性。
  边缘计算可看作是5G+AI+云计算的绝佳辅助——“神经末梢”。比如AI导盲杖要实现实时交互与判断,看到红绿灯变绿,能够自动判断出“可通行”的状态。运用边缘计算就不必将路灯信息上传到云端,经云服务器层层判断才发出行走的提醒。这无疑大大减少延迟带来的行进风险,也降低云端计算的超负荷。
  最后,还需要等待产业环境的全面成熟:基础设施的完善,软硬件基本到位,这样可在终端设备上更好运行深度学习算法。“加强5G智能网络建设,保障云计算及边缘计算的每一个节点高效可靠利用。”谭茗洲指出。
其他文献
据国外媒体报道,核能十分神秘。虽然核反应仅用一丁点的“起始”材料就可以产生巨大的能量,从而使其成为一种奇妙且可靠的能源,随之还有一些棘手的难题。  与“核”相关的最大问题之一便是,如何处理核反应过程中必然产生的核废料。  核废料,更具体一些应叫做放射性废料。这种“发光垃圾”是不同的核技术(包括核电、核医学和核研究)产生的副产物。核废料极其危险,因其包含放射性物质。这些放射性物质,会对包括人类在内的
期刊
据国外媒体报道,物理学家如今正处于了解黑洞的黄金时代。自2015年以来,研究人员已经能够使用激光干涉引力波天文台(LIGO)获得黑洞并合产生的信号,而诸如事件视界望远镜(EHT)等望远镜曾拍摄到黑洞阴影的第一张照片。2020年也不例外,一系列令人兴奋且独特的发现加深了我们对黑洞的认识。  下面,让我们一起来回顾一番2020年的十大黑洞发现。  2020年诺贝尔物理学奖表彰黑洞发现  仿佛是为了证明
期刊
据国外媒体报道,说到互联全球的技术,半导体芯片居功至伟。但是这小小的芯片,究竟是如何走进我们生活每一处的呢?  从不夜城到偏远乡村,一项技术正在改变我们生活和工作的方式。从口袋里的智能手机到支持互联网运作的庞大数据中心,从电动踏板车到超音速飞机,从起搏器到预测天气的超级计算机,不管是看不见的还是鲜为人知的,所有这些设备或设施的内部,都包含一项使这一切成为可能的微小技术:半导体。  半导体是现代计算
期刊
Deepfake是一种换脸技术,可以将图片或视频中A的脸换到B的头上。其名字由深度机器学习(deep machine learning)和假照片(fake photo)组合而成。这项技术不需要操作者具备深厚的专业知识,只要收集到足够素材,AI就可以完成。Deepfake换脸效果逼真,让人难以分辨真假,这也引发了众多伦理和隐私问题。  史泰龙和施瓦辛格两位好莱坞顶级流量功夫巨星最近一次合体出现在大银
期刊
6000.08万吨!2020年12月27日上午10时,我国第一大油气田——中国石油长庆油田生产指挥中心,数字化显示屏上,油气生产曲线跨上年产6000万吨油气当量高点,其中生产原油2451.8万吨、生产天然气445.31亿立方米,超越大庆油田的巅峰产量,中国石油工业新的里程碑诞生。  面对“井井有油,井井不流”的世界级难题,6000万吨级特大型油气田的新突破背后,有着怎样的硬核科技支撑?  从“磨刀
期刊
随着对绿色汽车和动力源需求的增加,全球的研究人员正在努力发明新型电池,这些电池可以储存更多的能量,并允许车辆每次充电行驶更长时间。正在探索的新电池技术之一是锌空气电池(ZAB),ZAB的一大挑战是电池可能不稳定。  因为它的碱性电解质中会有寄生或副反应,如枝晶形成和空气電极失效,可能导致电池失效。目前研究人员已经解决了这一问题,他们开发了一种使用非碱性水电解质的新型电池化学成分,这种新的化学反应克
期刊
在我们所处的宇宙之外是什么?这似乎是一个无法回答的问题。然而,一些宇宙学家给出了回答:我们的宇宙是一个正在膨胀的泡泡;在它之外,存在着更多的“宇宙泡泡”,它们都沉浸在一个不断膨胀和充满能量的海洋中。这就是多重宇宙论(multiverse)。  这个概念正在两极分化。一些物理学家接受了多重宇宙论,认为这可以解释为什么我们的宇宙看起来如此特殊(只有特定的宇宙泡泡可以容纳生命),另一些物理学家则拒绝接受
期刊
据国外媒体报道,几十年以来,天文学家一直在争议银河系的神秘气泡是近而小,还是远而大,目前最新X射线全天观测数据表明,银河系中心存在两个高温气泡,其上下延伸大约5万光年,比之前发现的费米气泡更大。  德国马克斯·普朗克地外物理研究所天体物理学家彼特·普雷德尔首次看到宇宙最炽热天体地图时,立即意识到神秘气泡是银河系一场大灾难之后形成的,一团亮黄色云在银河系中心盘面升起,向上延伸大约2万多光年,同时,在
期刊
人工智能是引领全球新一轮科技革命和产业变革的重要驱动力,正在深刻改变人们的生产生活方式。各国纷纷出台相关政策举措,力促人工智能技术和应用与传统经济融合,助推人工智能产业加速发展。  当前,以人工智能(AI)为代表的新兴信息技术蓬勃发展,人工智能应用技术正加速普及,特别是在医疗健康、教育、金融、安全防务等专业服务领域都有广泛应用。咨询公司麦肯锡的一项最新研究发现,疫情防控以来,传统经济加快智能化转型
期刊
随着国家的发展越来越好,各领域的不断提高,人们应该适当加强各种技术的实际应用在地质研究中,因为现在的能源危机日益加剧的发展经济,这是一个伟大的能源供应和需求的矛盾。基于时代的不同,地质学研究也取得了不同程度的突破。然而,当前的经济发展过度依赖能源,对能源的需求逐年增加。因此,有必要选择合理有效的方法,在合理范围内应用先进技术,从而更全面地分析地质环境,满足技术需求。
期刊