论文部分内容阅读
在形形色色的人工智能设备中,也许最为引人关注的就是仿真人——其外观和能力均呈现出“无限接近人类”的趋势。
随着人工智能的发展,机器人的功能日渐强大,从送货无人机、外卖机器人到机器人护士,它们已经进入了我们生活的方方面面。在形形色色的机器人中,仿真人是最亮眼的,它们不仅外观与人类一般无二,而且在新技术的加持下,正变得越来越智能化,拥有了与人相似的皮肤、脂肪、神经网络乃至语言逻辑系统。
密集灵敏的传感器——皮肤
近日,日本昭和大学与机器人生产商Tmsuk合作研发出一款新型机器人,它与传统的机器人有所不同,完全仿照真人进行设计,其身高和体重都与真人相当。
据日本《大人之科学》杂志报道,参照真人设计制造的仿真人不算新鲜事物。昭和大学这款仿真人的特别之处在于,其皮肤由一种特殊的材料制成,并植入了先进的微型传感器,不仅与人类的皮肤非常相似,而且使仿真人具备了最基本的触觉——痛觉。它还可以用与人类一样的声音和表情,来表达自己对于痛感的反应,看上去有些不可思议。
目前在仿真人的设计研发领域,视觉和听觉都可以通过传感器很好地加以实现,具备嗅觉的仿真人也已经通过加装气体分子感应器而开发成功。但是对于人工智能的感知系统来说,触觉的实现仍是一大难题。
对于人类来说,触觉在感知和改变世界方面起着至关重要的作用。触觉与视觉相结合,才能做出有效的动作。对于仿真人,灵敏的触觉可以消除它们处理柔软、易碎和可变形物体时的误差。
在人工智能领域,仿真人实现触觉不仅需要精度极高的传感器来感知外力,还需要准确判定外力作用的位置、角度,并预判机器人与外力施加者之间的相互作用。据估算,机器人要实现与人类相近的触觉,需要在1平方厘米的智能皮肤上配置数百个甚至上千个触觉传感器。开发这样的智能皮肤是一项具有挑战性的工作。
全球人工智能领域的研究机构和企业都有科研人员致力于开发智能皮肤。美国麻省理工学院和哈佛大学的研究人员取得了重要成果,他们将超过550个微型传感器均匀分布在1平方厘米的智能皮肤上,可以识别触碰到的物体的硬度、温度等特征。这种微型传感器由微小的电极、电路和压阻膜构成,能够记录并识别其所接触的物体的各方面特征。
麻省理工和哈佛大学的这项技术成果可用于假肢和仿真人的开发设计。日本昭和大学成为该技术的第一批实践者,借助它令仿真人有了痛觉。有趣的是,昭和大学开发这款仿真人的主要用途是供牙科专业的实习生练习牙科手术技巧——实习生通过仿真人逼真的反应,可以发现并改进自己工作中的不足,从而避免在面对真人患者的时候动作生硬、精神紧张。
昭和大学的研究团队表示,他们将不断强化仿真人的触觉系统,以实现对更大范围的力度、温度乃至湿度的感知,从而“无限接近真人的触觉”。
分布式能量系统——脂肪
据美国《科学机器人》杂志报道,在机器人的工业设计中,如何容纳电池是需要考虑的一个重要方面。电池一般会占据机器人可用机载空间的20%左右,也占据其整体重量的20%。对于仿真人来说,由于其外观与人类相同,如何在其体内布置电池成为一大难题。
美国密歇根大学的工程师开发出一种新型电池,其设计灵感来自于人体内的脂肪——形状不规则,可以分布在体内的任何一个地方,从而大大提高了仿真人内部空间的利用率。
工程师们利用锌电池为仿真人提供动力。这种电池的化学反应剂被包在由水基聚合物凝胶和芳纶纳米纤维制成的薄膜中,形状可以改变,反应剂不会泄漏。其供电原理是:在锌电极和空气分子之间传递氢氧化物离子,形成电流。
工程师们首先将这种新型锌电池作为小型机器人的动力系统。电池被连接到机器人的马达上,结果证实它可以替代机器人普遍使用的锂电池,而且具备一定的优势。这种新型电池既可以作为仿真人的动力源,又可以将精密部件包裹起来,起到一定的保护作用。特殊的结构使它成为仿真人的首选能源。
就能量密度而言,锌电池很难与先进锂电池媲美。为此,研究人员不断改进锌电池的成分和结构,将其能量密度提高了100倍。但这还不是极限,研究人员指出,将现有的锌电池的能量密度再提高7倍,就可以取代锂电池,而它能任意改变形状的特性是锂电池望尘莫及的。
《科学机器人》指出,技术人员还需进行更多的实验来开发分布式能量系统——它就像人类体内储存的脂肪,在需要的时候可以分解释放能量,这是仿真人能量系统的发展方向。未来科学家也许能找到比锌电池更好的供电系统。
动作操控系统——神经网络
以仿真人的标准来衡量,目前的工业机器人是“笨拙”的。虽然它们可以在工业装配线上不厌其烦地重复同一个动作,还能保持超高的精度,但只要目标零件被移动一点点,或者将其换成不同的零件,那么工业机器人就会“崩溃”。一些仿真人虽与人类一般无二,但无法做出和人类一样的细巧动作,即使它们反复练习,仍会给人以机械、僵硬的感觉。
美国旧金山的OpenAI公司近日推出一种新型仿真人动作操控系统,成功操控仿真人用一只手灵活地翻转简易魔方。该系统利用新型软件,通过“深度机器学习”让仿真人在虚拟状态下学习抓取并转動魔方,然后再让它进行实际操作。操控系统指引仿真人进行随机尝试,并在不断达到一个个目标的过程中逐渐强化“深度机器学习”能力。
据美国《大众科学》杂志报道,虽然让仿真人做出像人类那样的灵活动作非常困难,但如果研究人员能很好地利用OpenAI公司的动作操控系统,那么仿真人就有望学会组装电子产品、将餐具放进洗碗机,以及将卧床的人扶起来。
OpenAI公司能够成功开发仿真人动作操控系统,主要得益于神经网络模型技术的发展。此前该技术发展的最大障碍是开发平台不统一。全世界的开发人员和科学家建立了多种开发平台,然后各自在特定的框架中升级并评估机器人神经网络模型。虽然他们都取得了一定的成果,但应用人员发现,很难将这些模型的优势集中到一个模型中,各个操控系统的工具包之间缺乏兼容性和互操作性。
为消除障碍,“脸书”(Facebook)与微软建立了一个开放式机器人操控系统开发平台,允许将各个平台的神经网络模型技术集成在一起使用。从2019年到2020年,该平台成为行业先进技术的集结地,OpenAI公司的操控系统正是在这个平台上开发的。随着更多基于该平台的仿真人操控技术问世,仿真人的行动能力有望“无限接近人类”。
词汇关联软件——语言逻辑系统
也许很多人已经习惯了应用人工智能语音助手——手机上的语音辅助系统、智能音箱的语音助手等,但它们都没有真正做到“智能化”。
亚马逊和谷歌的研发团队正在加速推进这方面的工作,其目标是让仿真人能够与人类连续对话,“就像两个人在聊天一样”。仿真人词汇关联软件的改进,加上更好的语音合成系统,可以让人们从简单地向人工智能助手下达指令,升级到与仿真人交谈。仿真人的词汇关联软件用于捕捉词语之间的语义关系,它相当于人类的语言逻辑系统,可以使仿真人更好地理解人类的语言,而不仅仅是服从简单的命令。在此基础上,仿真人可以执行基于对话的任务,包括处理大量烦琐的事务,例如做会议记录、预订餐厅、协调行李托运、查找信息以及在网络上购物等等。
《大众科学》指出,在仿真人的词汇关联软件中,数据量是呈几何数量级增长的,在这个过程中,“深度机器学习”显得尤为重要。它是自动驾驶技术、图像识别技术、动作操控技术以及词汇关联技术等几乎所有人工智能技术发展的基础。简单地说,“深度机器学习”是人工智能进行自主学习的能力,也是仿真人“无限接近人类”的基石。
编辑:姚志刚 winter-yao@163.com