摘要:
研究人员和制造商正在培训机器人如何利用人工智能来学习和处理复杂的任务,但是所能实现的功能还远远未达到人们期望机器人达到的目标。现在人工智能的定义比以前更广泛,这可能会造成一些混乱。
在人工智能 (AI) 领域工作了数十年的研究人员和企业家,正试图帮助人们更好地理解它不够明晰的内涵。他们正在努力减少围绕人工智能的一些混淆和误解,并展示它是如何被用于工业应用的机器人技术。
“ 最大的误解可能是, 它还有多远。”Rethink Robotics 董事长兼首席技术官Rodney Brooks 说,“ 自从1956 年AI 之父John McCarthy 创造了‘人工智能’一词以来,我们一直致力于人工智能的研究,到目前为止大约62 年了。但它远比物理学复杂得多,而物理学花了相当长的时间来完善。 我想我们还处于人工智能的初期阶段。”
很多与人工智能相关的炒作与最近媒体的大肆报道相关,例如展会上仿生和受动物启发的机器人展示,或者观赏体育的人工智能系统,例如可以与人类下棋、打乒乓球、高尔夫的机器人。一些误解源于将机器性能等同于能力。当看到人执行某项任务时,我们可以假定一些基本的能力——技能和天赋,人必须拥有这些技能才能完成该任务。但人工智能和这并不一样。
“虽然AI 系统在下棋方面的表现令人吃惊,但它甚至不知道它是在玩游戏。”Brooks说,“我们把机器的性能误认为是它们的能力。当看到程序像人一样学习新事物时,如果你认为程序也能像你一样对其有深刻的理解,那可能你就犯了一个错误。”
■ 图 1: Brooks 认为AI 仍处于起步阶段。机器智能和人类智力之间没有可预见的竞争,人类仍然更聪明。
人工智能到底是什么
人工智能已经成为营销的时髦词。就像在此之前的 “机器人”一样,现在似乎一切都是AI 驱动的。到底什么是AI,什么不是 AI,有时很难确定。即使是专家,在确切的定义什么是AI、什么不是 AI 时,也会犹豫。正如Brooks 所指出的,在1960 年代被认为是 AI 的事物,现在则出现在计算机编程的第一个课中。但它不叫 AI。
“在某个时候曾被叫做AI,” Brooks 说,“后来,它就变成了计算机科学。”机器学习以及它的所有变化,包括深入学习、强化学习和模仿学习,都是 AI 的子集。
“在某段时间内,AI 是一个非常狭窄的领域。有些人非常确定的认为它是一种搜索技术。”加州大学伯克利分校工业工程与运筹学研究教授兼主席Ken Goldberg 说,“而现在, AI 被广泛认为是机器人和机器学习的一个总括术语,因此现在它被看做一系列子集的集合。”
先进的计算机视觉是人工智能的一种形式。“如果你只是检查螺丝是否在合适的地方,那从60 年代开始就有了该项技术。如果想将其称之为AI,那就需要对其进行扩展。”Goldberg说,“但同时,如果一个计算机视觉系统能识别工人面孔,那我们一般认为这是人工智能。因为这是一个更复杂的挑战。”
缺乏语境
人的智力和机器智力之间的一个重要区别是语境。作为人类,我们对周围的世界有了更多、更深入的了解。但人工智能并没有。Brooks 说: “我在AI 语境领域已经工作了60 年,成果甚少。”这就是为什么即使我们拥有超级智能AI,我也并不担心。虽然我们在某些领域取得了成功,也就是现在所谓的革命,但非常有限。当然,言语理解与我们10年前的情况截然不同。过去,按照语音理解系统的设置,你可以按下或说‘2’来代表挫折感。但现在已经不是这样。”他援引亚马逊的Alexa 为例,还有谷歌助手和苹果的 Siri。
“你对 Alexa 说些什么,即使在音乐播放的时候,在房间里还有其它人在说话时,它也能很好的理解。”Brooks 说,这令人吃惊,主要受益于深度学习的发展。“充分利用这些新兴技术领域的发展,让我们可以做出更好的产品。”
“在刚开始创建Rethink Robotics 时,我们考察了所有的商业语言理解系统。那时,我们认为在工厂里,实现机器人语音识别是荒唐可笑的。我想现在情况已经发生了改变。”Brooks 说。
语音识别系统编译出正确的字串。准确的字串足以做很多事情,但它仍不能像人一样聪明。“这就是区别,”他说,“获取字串只是一种有限的能力。如果要扩展这种能力,还有很长的路要走。”
这些有限的能力,已经成为许多关于人工智能乐观预测的基础,但对未来人类所承担的角色,则可能显得过于悲观。
在现实世界中的AI 研究
相对于单一性,Goldberg 更强调多样性,注意到不同组合的人和机器合作解决问题和创新的重要性。如果AI 应用程序想要走出实验室,进入现实世界,这种协作尤其重要。
加州大学伯克利分校电气工程和计算机科学系的教授Pieter Abbeel,也是Embodied Intelligence 公司的总裁和首席科学家。他正致力于将AI 带入工业世界,同时强调人类和机器协同工作的重要性。
“ 这是挑战的一部分,” Abbeel说,“ 人类如何能够利用这项技术,利用它来使自己更聪明,而不是仅仅让这些机器与我们分开?当机器成为我们日常生活的一部分,可以用于提高效率的时候,那就是它真正令人兴奋的时刻。”
尽管Abbeel 对 AI 的前景感到兴奋,但他认为适当的谨慎是有必要的。“我认为最好记住,像语音识别、机器翻译和识别图像中最显著的进步其实只是所谓的监督学习的例子。”
重要的是要了解有不同类型的AI正在建立。在机器学习中,有三种主要的学习类型: 监督学习、无监督学习和强化学习。
“ 监督学习只是一种模式识别,”Abbeel 说。从语音到文本,或者从一种语言到另一种语言,这是一个很难的识别模式,但是 AI 没有任何目标或目的。给出英语,它会告诉你中文是什么。给它一个口头句子,它将转录成一系列的字母。这只是模式匹配。你给出数据——图像和标签,它学习如何从图像到标签的识别模式。
没有监督的学习是你只给它图像,没有标签。希望它能够从大量的图像开始,了解世界是什么,然后逐步建立这种理解,也许在将来它可以更快地学习到其它东西。没有监督的学习没有任务。只需给它提供大量的数据。
接下来是强化学习,这种学习非常不同,更有趣,也更难 ( 强化学习被归功于自动驾驶技术的进步)。 强化学习是给系统一个目标。目标可以是在视频游戏中获得高分,或在国际象棋游戏中获胜,或组装两个零件。这也是对AI 产生某些恐惧的理由。如果 AI 有错误的目标,会发生什么?目标应该如何设定?
重要的是人类和人工智能不会在真空隔绝的环境中进化的。Abbeel说:“当我们创造越来越智能的机器时,我们作为人类的能力也将会增强。现在,我们在Embodied Intelligence所做的工作最让我兴奋的是,人工智能的最新发展,已经使 AI 能够理解它们在图片中看到的内容。”
■ 图 2: Abbeel 正在将机器学习的突破性研究转变为实际的工业应用,机器人可以自主学习新技能。
机器人抓取的深度学习
加州大学伯克利分校的Autolab实验室, 专注AI 领域的研究超过10年,并已将其应用于云机器人、深入强化学习、从演示中学习、以及仓库物流强健的机器人抓取和操纵、家庭机器人、以及外科机器人等项目。
该实验室的Dexterity Network(Dex-Net) 项目表明, AI 可以帮助机器人学习抓取不同大小和形状的对象,通过提供数以百万计的3D 对象模型、图像,以及如何将它们抓取到深度学习的神经网络指标。
以前,机器人通过拿不同的对象反复练习来学习抓取和操作对象,这是一个耗时的过程。利用合成点云代替物理对象来训练神经网络、识别抓取,最新的Dex-Net 迭代效率更高,可以达到99% 的抓取精度。从长远来看,Goldberg 希望开发高可靠性的机器人,能够抓取各种刚性物体:如工具、家居用品、包装货物、和工业零件。
■ 图 3: 在研究人员培训神经网络如何识别来自数以百万计的3D 模型和图像中的对象以后,机器人可以操作之前从未遇到过的对象。
深度学习协作机器人
Rethink 公司的 Intera 5 软件,旨在使Baxter 和Sawyer 协作机器人更聪明。机器人的视觉和培训功能中,利用了很多人工智能。
“传统的工业机器人没有太多的智慧,这一情况正在改变。我们正在将深度学习应用到机器人。” Brooks说。未来可能90% 的制造,都是人与机器人在同一空间协同工作。
Baxter 和Sawyer 机器人有一个示范培训功能,可以使 AI 投入工作。Brooks 说: “当你通过演示训练它的时候,你可以通过移动它的手臂向其展示某些东西,它会推断出一个叫做行为树的程序。它会为自己编写一个程序来运行。你不必亲自去写这个程序。”
Intera 5 是一种图形化编程语言。Brooks 说,你可以查看它,修改它,或者你可以在行为树中编写一个程序,让它绕过程序的选项自动执行。
■ 图 4: 集成AI 的协作机器人,将计算机数控车床应用到定制注塑机上,可以促进工艺过程的自动化,提高产品质量和生产效率,并可以将运行人员从重复的任务中解放出来。
AI 改变机器人编程
人工智能正在改变机器人的编程方式。在Embodied Intelligence 公司,Abbeel 和他的团队利用 AI 的力量,以帮助工业机器人学习新的、复杂的技能。
他们的工作是从 Abbeel 在加州大学伯克利分校的研究中发展而来的,在使用模仿学习和深层强化学习来培训机器人操纵物体方面有了重大突破。开始采用感知和控制相结合的方式来远程操作机器人。操作员佩戴虚拟现实 (VR) 装置,通过摄像机来显示机器人的视图。
在控制方面,VR 设备配置了操作员手持的处理设备。当运行人员的手移动时,该运动就能被跟踪。跟踪所得的坐标和方向,被送入驱动机器人的计算机上。这样操作员可以直接控制机器人爪的运动,就像木偶一样。
Abbeel 说: “我们允许人类将自己嵌入机器人内部。”通过机器人的眼睛, 人可以看并且控制机器人的手臂。他说,人类是如此灵巧,以至于机器人爪和我们的手之间没有可比性。通过 VR 系统,操作员可以感受到机器人运动方面的限制。
“通过给机器人演示来传授技能的精髓。这并不意味,在刚开始时会像机器人一样快。它会以人类的速度进行,对于大多数机器人来说,这非常缓慢。”Abbeel 说。这是第一阶段( 模仿学习)。通过示范培训机器人。然后在第二阶段,机器人将运行强化学习,从它自己的尝试和错误中学习。这时,机器人已经学会了任务的精髓。现在,机器人只需要学会如何加速。这时它可以通过强化学习加快学习的进程。
他们的技术特别适合于挑战性的视觉和操作任务,而这对传统的软件编程技术来说太复杂了。Embodied公司可以让任何人通过自己的演示,使用该软件来重新为它们的机器人编程。这将允许任何公司,不管大小都可以快速重新部署机器人,完成不同的任务。
■ 图 5: 操作员戴着VR 头盔,手持运动跟踪装置,远程操作机器人,这样它就可以学习如何使用强化学习来独立完成新的技能。
未来的潜力
虽然AI 在云计算机器人、机器学习、计算机视觉、语音识别等各个方面都在进步,并在特定领域取得了显著的进步,然而,AI 对人类还是所知有限。
在 AI 和人类工程学的帮助下,即使有一天机器人能够接近人类的灵巧程度,但可能也永远不会真正掌握周围的世界。语境和独创性将仍是人类主导的领域。技术既不坏也不好,就看我们如何使用它。有了人工智能和机器人的帮助,人类就有了巨大的潜能来做更多有意义的事。
版权声明:本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。