在过去一年里,人形机器人领域的融资活动显著增加。这一趋势显示了市场对人形机器人技术的高度关注和期待。为了更深入地了解这一领域的现状和未来发展方向,我们选择了一期波士顿动力创始人的采访内容来供读者参考。
本次访谈由知名主持人莱克斯·弗里德曼(Lex Fridman) 主持,访谈对象是波士顿动力公司(Boston Dynamics)的创始人兼 CEO Marc Raibert。访谈围绕机器人技术的未来展开,讨论了波士顿动力在机器人研发方面的成就、技术挑战以及未来的发展方向。
自成立以来,波士顿动力公司开发出了一系列标志性项目,如大狗(Big Dog)、阿特拉斯(Atlas)、Spot 和 Handle 等机器人,这些机器人在全球范围内引起了广泛关注。现阶段,波士顿动力不仅专注于腿式机器人技术,还广泛涉足人工智能和自动化领域,致力于创造更先进的未来机器人。
在访谈中,Marc Raibert 首先澄清了他对机器人技术的定义,指出机器人不仅仅是机械装置,而是具备一定智能和自主性的系统。他提到,目前的机器人在某些具体任务上表现出色,但距离全面的智能化和实用化还有一定距离。通过不断的技术创新和优化,波士顿动力公司希望在未来实现机器人在更多实际应用场景中的广泛部署。
Marc Raibert 的核心观点包括:
- 机器人不需要追求完美,特别是在人与机器人互动中,缺陷可能是件好事,擅长笨拙地处理物体可能比完美地建模和移动更值得优化。
- 波士顿动力公司一直明确追求商业化,复杂的液压机器人对产品不友好,全电动商业类人机器人是未来的发展方向。
- 和索尼的合作是波士顿动力从一家仿真公司再次转变为一家机器人公司的真正转折点。
- 最明智的事情就是找到合适的人才,正是他们真正推动了事情的发展。
- 机器人操作的挑战在于实现动态操作,突破静态抓取的安全性,研究如何在复杂环境中移动和抓取物体。
- 3D 环境中的平衡与控制是通过估算高度、决定脚的位置和保持身体直立来实现的,这些技术挑战在当时并不难解决。
- 智能分为运动智能和认知智能,波士顿动力已经为运动智能设定了标准。AI 研究所的设计是将运动智能的物理性与认知智能结合起来。在认知智能上考虑竞争,但是在运动智能上没有感受到竞争的激烈。
- 钦佩埃隆·马斯克作为技术专家的成就,但不认为今天的 Optimus 能达到 Atlas 的水平。
以下是本期播客内容的完整翻译,我们作了不改变原意的删减。
无拘无束的机器人
莱克斯·弗里德曼(Lex Fridman):
以下是我与马克·雷伯特(Marc Raibert)的对话。他是一位传奇的机器人专家,波士顿动力公司(Boston Dynamics)的创始人和长期 CEO。最近,他成为新成立的波士顿动力 AI 研究所(Boston Dynamics AI Institute)的执行董事,该研究所专注于研究和开发远超现有技术的未来机器人。
他在卡内基梅隆大学(CMU)、麻省理工学院(MIT)以及著名的 MIT 腿实验室(MIT Leg Lab)和波士顿动力公司(Boston Dynamics)领导了超过 40 年的出色腿式机器人研发工作,创造了像 Big Dog、Atlas、Spot 和 Handle 这样的惊人机器人。请问你第一次爱上机器人是什么时候?
马克·雷伯特(Marc Raibert):
我从小就喜欢动手做东西。很幸运,我的父亲虽然未能实现梦想,他本想成为一名航空航天工程师。可惜的是,他那持有传统观念的母亲认为那样会像个修理工,所以不允许他追求这个梦想。于是,他成了一名会计。不过,我们的地下室总是堆满了工具、设备和电子产品。从小我就看着他组装各种套件,比如电子套件。我现在还保留着几件他组装的东西。
真正让我走上机器人学道路的是在研究生期间。我跟随 MIT 的 Berthold K.P。 Horn 教授从课堂回到实验室。当时我在上一个短期课程,叫做 IAP(独立活动期)。我跟着他回到实验室,看到桌子上有一个被拆解成上千个零件的 Viscarm 机器人手臂。从那天起,我就成了一名机器人学家。
莱克斯·弗里德曼(Lex Fridman):
你还记得 1974 年吗?当时只有一个机械臂和一些零件,你看着这些零件,想象着机械臂重新组装后的样子,以及它的各种可能性。
马克·雷伯特(Marc Raibert):
这在某种程度上激发了我的想象力。当时,我是脑与认知科学系的研究生,研究神经生理学。我本科在东北大学学的是电气工程,但我发现神经生理学并不适合我,它不够抽象。我无法通过观察单个神经元来理解控制系统或思维等复杂问题。而且,AI 实验室一直很有吸引力。这是在 20 世纪 70 年代 CSAIL(计算机科学与人工智能实验室)成立之前。所以,当我跟随他回到 AI 实验室并看到机械臂时,我就想这就是我要做的。
莱克斯·弗里德曼(Lex Fridman):
理解脑与认知科学(BCS)方法与机器人学方法之间的紧张关系是有趣的。
马克·雷伯特(Marc Raibert):
他们有一个专注于大脑、心智和机器的中心,试图弥合这一差距。即使在我在那里时,David Marr 也在 AI 实验室。David Marr 的一些大脑模型不仅吸引了生物学家,也吸引了计算机领域的人。他当时是 AI 实验室的访问学者,我猜他后来成为了全职人员。
这是第一次在这两个群体之间建立桥梁。后来这座桥梁消失了。然后在 80 年代,这种联系又出现了一次。最近,大约在过去的五年里,这种联系变得更紧密了。
编辑注:David Marr 是一位开创性的计算神经科学家,以其关于视觉处理的三层次模型和对人工智能领域的贡献而闻名。他出生于 1945 年 1 月 19 日,去世于 1980 年 11 月 17 日,英裔美国人,曾在麻省理工学院担任教授。
莱克斯·弗里德曼(Lex Fridman):
你曾说过你一直喜欢创造。你还记得有什么特别的作品吗?
马克·雷伯特(Marc Raibert):
我们年轻时只是做一些小发明。我不知道大家是否还记得,荧光灯里有一个小部件,一个小的铝制圆筒,我们会把它们拆开,里面装上火柴头和引线,制作成小火箭。
莱克斯·弗里德曼(Lex Fridman):
你认为功能性和创造酷炫东西之间的平衡是多少?
马克·雷伯特(Marc Raibert):
曾经有一段时间,大概是在我已经成为教授,或者可能是在莱顿大学研究生院的时候,我认为功能是最重要的。移动性、灵活性、感知和智能是机器人最关键的功能。这些才是重要的,其他都不重要。我甚至有一种柏拉图式的理念,认为如果你只是看着一个机器人,它什么都不做,它看起来就像一堆废铁。我的很多机器人在那些日子里确实是那样的。
但当它开始移动时,你会觉得它的动作有某种生命力或引起某种兴趣。我认为我们甚至故意在设计机器时不考虑结构本身的美感。但后来发现,事物本身的美感与机器人的仿生动作结合起来,确实有加成效果。但核心还是让它们做一些有趣的事情。
莱克斯·弗里德曼(Lex Fridman):
在你的许多工作中,有一个核心理念是你在过去 40 多年里所创造的机器人和系统都表现出一种无拘无束的特质。很多人所了解的机器人在移动时非常谨慎、小心,对环境充满了戒备。而你制造的许多机器人,尤其是在早期,表现得非常激进、欠驱动(underactuated)。它们跳跃、充满活力、快速移动。那么,这背后的哲学是什么呢?
马克·雷伯特(Marc Raibert):
让我告诉你我是如何开始研究腿部运动的。当我还是研究生时,我参加了一个关于生物运动学的会议。我记得是在费城。那次会议主要是生物力学方面的研究人员,他们研究肌肉和神经元之类的东西。他们更多关注生物力学,而不是计算方面。大约有 1000 人参加了会议。
我去听了一场报告,所有的报告都涉及动物或人的身体和呼吸等方面。但有一场报告是由一个机器人专家做的,他展示了一个六足机器人。这个机器人走得非常慢,总是至少有三只脚在地上,就像桌子或椅子一样,具有三脚架般的稳定性。它移动得非常慢。
我看着它,心想,这不对,这完全不像人类和动物的运动方式,因为我们会弹跳和飞跃。我们必须预测将会发生什么,以保持在跑步时的平衡。我们利用腿部的弹性、肌肉和肌腱等作为能量循环的一部分,我们不会每次都把能量浪费掉。我不确定当时是否完全理解了这一点,但我确实受到了启发,决定尝试相反的做法。
我当时完全不知道如何让一个跳跃机器人运作,尤其是在三维空间中保持平衡。实际上,当我开始时,我主要关注的是弹跳的能量。我打算在腿部装一个弹簧装置和一些执行器,以便能实现弹跳的能量循环。平衡的重要性是后来才意识到的。然后,我制造了一个类似于弹簧单脚跳的机器人。
现在我认为我们需要在机器人操作方面做类似的事情。如果你看看机器人操作,我们这个领域已经研究了 50 年,但还远未达到人类的操作水平。虽然我们取得了一些进展,但我认为一切都太过安全了。
我认为我们需要打破这种静态抓取的安全模式。很多研究都是关于部件的几何形状,然后你设计如何移动手部以便相对于部件进行定位,然后小心地抓取并移动它。这完全不像人类和动物的工作方式。我们会在手中抛接多个物体,并能对它们进行分类。
当然,更激进的做法意味着在一段时间内效果可能不会很好。所以这是一个长期的解决方案。这只是理论,目前还不确定是否会有回报。但这就是我目前的思考方式,并试图鼓励我们的团队去尝试。
莱克斯·弗里德曼(Lex Fridman):
嗯,是的,我的意思是,我们需要讨论实际要优化的是什么。对于机器人来说,有时候,尤其是在与人类互动时,存在一些缺陷反而可能是有益的。追求完美不一定是正确的目标。就像你说的,也许我们应该优化的是机器人在处理物体时的失误,而不是完美地建模物体和移动手臂去抓取那个物体。因为在现实世界中,完美可能并不存在。
马克·雷伯特(Marc Raibert):
我不知道你是否认识我的朋友 Matt Mason,他是卡内基梅隆大学机器人研究所的所长。我们在研究生院时就认识了。他曾分析过一段朱莉娅·查尔德做饭的视频。他发现朱莉娅在处理食材时用了大约 40 种不同的方法,但没有一种是抓握。她会用手推、滚动食材、用刀压平等,但从未使用抓握。
一切从 Leg Lab 开始
莱克斯·弗里德曼(Lex Fridman):
你创建并领导了麻省理工学院(MIT)著名的腿实验室(Leg Lab)。你能描述一下第一个跳跃机器人是什么样子的吗?
马克·雷伯特(Marc Raibert):
首先,Leg Lab 实际上起源于卡内基梅隆大学。我从 1980 年开始在那儿担任教授,一直到 1986 年左右。所以我们最早的跳跃机器人就是在那儿建造的,大概在 1982 年左右让第一个简化版的机器人工作起来。然后,我们在 1983 年建造了一个三维的机器人。我们在 Leg Lab 建造的四足机器人,第一版大约是在 1984 年、1985 年建造的,真正投入运行大概是在 1986 年左右,这花了多年的开发时间才实现。
莱克斯·弗里德曼(Lex Fridman):
我们回到第一个跳跃机器人,这些机器人非常了不起。你谈到了第一个非常重要的步骤,追求让机器人上下跳跃。然后你意识到,平衡是一个你应该关心的问题,而且实际上是一个可以解决的问题。所以你能不能讲一下如何创建那个机器人,涉及了什么。
马克·雷伯特(Marc Raibert):
好吧,我先不谈技术方面的内容,而是从动机和资金方面开始。
在加入卡内基梅隆大学之前,我实际上在喷气推进实验室(JPL)工作了三年。在那里,我结识了 Ivan Sutherland,他有时被认为是计算机图形学之父,因为他在 MIT 和犹他大学以及 Evans and Sutherland 公司所做的工作。
总之,我认识了他,有一次他鼓励我在加州理工学院做一些项目,即使我当时在 JPL。这些机构是有些关联的,所以我考虑了一下,列出了三个可能的项目。我故意把最上面和最下面的项目写得很无聊,而在中间写了“跳跃机器人”。
Ivan 是个非常聪明的工程师,也是一个真正的人才培养者,他一眼就看出了值得做的项目。所以他用了一部分自由支配资金,给了我大约 3000 美元来建造第一个模型。我亲自去车间,用自己的双手制作了第一个模型,虽然它并不能工作,只是一个初步的尝试。然后我和 Ivan 带着这个模型去了华盛顿。
在那些日子里,你可以直接走进 DARPA(美国国防高级研究计划局),在走廊里走走,看看谁在办公室。Ivan 以前在那里工作过,所以我们四处走动,查看办公室。我当时什么都不知道,基本上还是个新手,但 Ivan 带着我四处转。我们在办公室里找到了 Craig Fields。
Craig 后来成为了 DARPA 的负责人,但那时他是一个项目经理。我们走进去,我带着一个小 Samsonite 手提箱,打开后里面只有一个单腿跳跃机器人的骨架。我们展示给他看,你几乎可以看到他兴奋得流口水。他给了我 25 万美元的资金。他说,我愿意资助这个项目。当时我正要离开 JPL,还没决定下一步去哪里。后来我到了卡内基梅隆大学(CMU),他寄来了 25 万美元,这在 1980 年是很多的研究资金。
莱克斯·弗里德曼(Lex Fridman):
你是否看到了这个问题的发展方向?为什么这是一个重要的问题?不,我指的是平衡。我是说,它有腿,这与腿部运动有关。这涉及到我们在行走时人体解决的所有问题,所有的基本原理都在那里。
马克·雷伯特(Marc Raibert):
是的,我的意思是,当时的动机是尝试更深入了解动物运作的基本原理。但我们现在制造的那种实用机器,在当时完全没有出现在我的脑海中。作为学者,我当时主要只是尝试进行下一步研究,取得一些进展,让我的同事们印象深刻。
莱克斯·弗里德曼(Lex Fridman):
弹簧高跷、机器人、货物高跷。那么在技术方面,为了实现我们在视频中看到的效果,比如机器人成功跳跃并最终翻转,需要克服哪些挑战?
马克·雷伯特(Marc Raibert):
在最初的日子里,我需要一些比我更好的工程技术,于是我雇佣了 Ben Brown。我们各自以自己的方式对设计做出了贡献,最终想出了一个可以开始工作的方案。我对驱动系统有一些初步的想法。我们开始了这个项目。一旦你让物理机器工作得足够好,并且对自由度有足够的控制,保持平衡并不是那么难。
我们一开始让它在一个倾斜的气垫桌上悬浮,但那只给了我们大约 6 英尺的移动距离。所以一旦它开始工作,我们就换成了一个可以在房间里跑来跑去的设备。很难在没有看到它们的情况下解释这些,但你可能知道我在说什么,平衡器。接下来的大步骤是让它在三维空间中工作,这才是真正可怕的部分。
你知道,当时人们已经有了倒立摆系统,并且可以通过来回移动小车来保持平衡。但你能让它在三维空间中工作,同时还在跳跃吗?但事实证明,至少在我们当时达到的性能水平上,这并不是那么难做到的。
莱克斯·弗里德曼(Lex Fridman):
好的,你提到了倒立摆。你能解释一下一个在三维空间中跳跃的棍子是如何保持平衡的吗?它的驱动机制是什么样的?
马克·雷伯特(Marc Raibert):
简单来说,有三件事情在进行。首先,我们有一个系统让机器人跳跃,并且有一个系统在估算机器人离地面的高度。利用这个系统,弹簧中的能量可以存在三个地方:弹簧中、高度中和速度中。当机器人在跳跃的最高点时,所有的能量都集中在高度中。因此,通过测量跳得多高,可以了解很多关于运动循环的信息,并决定是否需要增加或减少能量。这是一个元素。
然后,有一个部分是决定脚的位置。如果你考虑在着地时脚相对于中心质量的位置,就像撑杆跳运动员一样。撑杆跳运动员必须在撑杆插入地面时让身体到达正确的位置。如果他们太靠前,会被向后抛;如果太靠后,会向前翻倒。他们需要主要向上跳以越过横杆。跳高运动员也是同样的道理。所以,我们需要计算脚放在哪里。我们做了一些相对简单的事情。
第三部分是保持身体的直立姿态。如果身体倾斜得太远,虽然可以跳跃并不断旋转,但会超出髋关节的运动范围。因此,我们必须在每次脚着地时在腿和身体之间施加扭矩来保持直立。你只能在脚着地时这样做,在空中,物理规律不允许。
莱克斯·弗里德曼(Lex Fridman):
失控的情况需要发展到什么程度,才会达到无法平衡或无法自我纠正的地步?
马克·雷伯特(Marc Raibert):
你问的问题正好切中要害。因为在那些日子里,我们并没有真正优化系统,它们本可以表现得更好。我们只是得到了一个初步解决方案,并在此基础上进行工作。此后几年里,有些人为我们工作,有些人为其他团队工作,他们提出了各种方程和算法,以更好地完成任务,使系统能够跑得更快。
我的一个学生致力于提高速度,另一个学生则致力于克服障碍物。因为在平地上跑步是一回事,但如果你在跑楼梯,你必须调整自己的位置,否则系统就无法正常运行,脚可能会踩在台阶的边缘。所以,如果你想要更实际、更实用的解决方案,就需要控制更多的自由度参数。
莱克斯·弗里德曼(Lex Fridman):
我认为了解早期的情况真的很有趣,因为你知道,相信自己,相信这里有一些有趣的东西存在。你提到找到了另一个人,Ben Brown。找到其他可以与你一起构建这个疯狂想法并使其成功的人是什么感觉?
马克·雷伯特(Marc Raibert):
也许我做过的最明智的事情就是找到合适的人才。回头看,我看到 Boston Dynamics 以及那里的所有优秀工程师,正是他们真正推动了事情的发展。你知道,我只是一个梦想家。
莱克斯·弗里德曼(Lex Fridman):
当你谈论仿生机器人或有腿机器人时,无论是类人机器人还是四足机器人,人们是否会怀疑这是否可能实现?你是否经常遇到周围的人对你表示怀疑?
马克·雷伯特(Marc Raibert):
我认为,对很多人来说,这两方面都有。一些人会说,哦,你为什么在这个愚蠢的问题上浪费时间。但同时,我也参加了很多活动,人们告诉我这激励了他们去挑战更难的事情。我认为,事实证明,腿部运动已经变得非常有用。
莱克斯·弗里德曼(Lex Fridman):
你有没有对像 Atlas 这样的机器人产生过怀疑?或者对 Big Dog 这样的项目呢?在每个阶段,你有没有觉得这是一个过于困难的问题?
马克·雷伯特(Marc Raibert):
我的意思是,一开始我并不是人形机器人的爱好者,因为这又回到了功能性的问题。形态不如功能性重要。而且,人形机器人在外观上占很大比重,但缺乏实际功能。作为一个机器人专家,这让我有些不满。我认为功能性真的很重要。这可能就是我一开始避免人形机器人的原因。但现在我告诉你,自从我们开始研究它们后,你可以看到它们对普通人和技术人员的影响。即使大多数人形机器人并不逼真,但它们有一种特殊的吸引力。
莱克斯·弗里德曼(Lex Fridman):
我们常常会将其拟人化,认为这是为了人类的利益。但就像 Spot 一样,你不仅能看到人性,还能看到我们在社交互动中发现的各种吸引人的特质。
马克·雷伯特(Marc Raibert):
Spot 也是如此。告诉你,我经常到处演讲,并带着 Spot 去很多地方,这真是令人惊叹。媒体喜欢说它们很可怕,人们会因此感到害怕。YouTube 评论者也喜欢说它很吓人。但当你带着 Spot 出去时,可能是因为自我选择的结果,你会遇到一群人,他们想拍照、自拍、操作机器人、抚摸它,甚至给它穿衣服。这真是太神奇了,尤其是它那黄色的外观。
成为机器人公司的转折点
莱克斯·弗里德曼(Lex Fridman):
那么,如果我们稍微回顾一下历史,你曾经提到,在 Boston Dynamics 的早期,你悄悄地在制作一个能跑的 Aibo,索尼的机器人狗。这对我来说是一个有趣的小历史片段。对于那些不知道的人来说,那只小狗机器人移动得很慢。它是如何变成 BigDog 的?这其中涉及了什么?在制作这个可爱的小狗和一个能携带大量负载并快速移动的机器之间,如何找到平衡?
马克·雷伯特(Marc Raibert):
当时的关联在于,波士顿动力公司(Boston Dynamics)主要是一家专注于物理模拟的公司。所以当我离开麻省理工学院(MIT)创办波士顿动力公司时,虽然有几年的时间重叠,但最初的概念并不是要创办一家机器人公司。我的意思是,我们的概念是利用开发的动态模拟工具来进行机器人或其他项目。
在与索尼(Sony)合作时,我们通过制作 Aibo Runner 项目重新回到了机器人领域。我们编写了一些工具来为 Curio 编程,Curio 是一个可以跳舞和做其他有趣动作的小型人形机器人。我认为它从未真正进入市场,尽管他们确实展示过它。回顾过去,我认为这让我们回到了应有的位置。
莱克斯·弗里德曼(Lex Fridman):
你重新找回了公司的灵魂。就是这样简单。
马克·雷伯特(Marc Raibert):
是的。
莱克斯·弗里德曼(Lex Fridman):
从那时起,你一直专注于机器人领域。你在 1992 年创立了波士顿动力公司(Boston Dynamics),对吗?你对早期有哪些美好的回忆?
马克·雷伯特(Marc Raibert):
我们曾经制造过一个设备,但实际上它并不是真正的机器人。它是一个外科手术模拟器,具有力反馈功能,应用了多种机器人技术。你通过一个镜子向下看,感觉就像在看自己正在操作的身体。你的手在镜子下面,手中的工具连接到另一家 MIT 衍生公司 Sensible Technologies 制造的力反馈设备上。他们制造了力反馈设备,我们连接了工具,并且开发了所有的软件和图形。所以我们有 3D 计算机图形。
这是在 90 年代末,当时我们使用的是 Silicon Graphics 计算机,大概有这么大,基本上是办公室里的加热器。我们在进行外科手术操作,比如吻合术,即将血管或身体里的其他管子缝合在一起。你可以感觉到并看到组织的移动过程。这真的很令人兴奋。这个想法是制作一个训练器来培训外科医生的操作技能。
我们建立了一个评分系统,通过采访外科医生得知操作中的注意事项。你不应该撕裂组织,也不应该触碰操作区域以外的地方。有很多规则。所以我们制造了这个东西,并把它带到一个外科手术贸易展览会上。外科医生几乎排起了长队。
我们记录并公布了他们的分数,就像视频游戏一样。这些人非常有竞争力,他们真的很喜欢这样做,他们会过来看到别人的分数更高,然后他们会回来尝试超越。但不久之后我们发现,我们以为外科医生会付钱来接受训练,而他们却认为我们应该付钱给他们,让他们教我们这些东西。外科医生并不愿意为此付费。我们想,也许可以把它卖给医院,让医院来培训外科医生。
但当时我们大概是一个 12 人或 15 人的公司,我记不清了。我们根本没有能力进行市场推广。那些年公司完全是自筹资金,直到 20 年后被 Google 收购才有了投资者。因此,我们没有资源去开拓医院市场。有一天,Rob 和我看着这个项目,我们说我们还为膝关节镜手术制造了另一个模拟器。我们认为这行不通,于是放弃了它,继续前进。
这对公司来说是一个里程碑,因为我们开始理解自己的定位,知道什么会成功,什么不会。尽管从技术上讲它非常有效且有趣。
莱克斯·弗里德曼(Lex Fridman):
你在波士顿动力公司建造的第一个机器人是大狗(Big Dog)吗?
马克·雷伯特(Marc Raibert):
嗯,当时有一个 Aibo 跑步者,但它甚至不是一个完整的机器人。它只是我们从 Aibo 上拆下来的腿,然后装上我们自己制作的身体。我们让它运作起来并展示给 Sony 的人看,那些年我们与 Sony 合作得非常紧密。有趣的是,那是在互联网和 Zoom 之前的事情。所以我们安装了六条 ISDN 线路,每周进行一次电话会议。那时的帧率非常低,大约是 10 赫兹。
你知道,跨越日语和英语的语言障碍是一个挑战。每周开会,试图理解彼此的意思,持续了好几年。这样做是很愉快的。他们真的很支持我们。他们似乎喜欢我们和我们正在做的事情。这是我们从一家仿真公司再次转变为一家机器人公司的真正转折点。
莱克斯·弗里德曼(Lex Fridman):
你从构建快速四足机器人中学到了哪些经验?
马克·雷伯特(Marc Raibert):
我们大多学到的是,当某个东西很小的时候,它运行起来并不那么令人兴奋。就像它在蹦蹦跳跳,你必须看慢动作才能觉得它有趣。如果你快速观看,它只是一个滑稽的东西。我做的一件事就是通过视频展示这些东西。从非常早期的跳跃机器开始,我一直关注的是,通过镜头看起来会怎么样,而用肉眼看运行起来并不那么酷。
莱克斯·弗里德曼(Lex Fridman):
请问你在机器人技术方面的下一个重要里程碑是什么?
马克·雷伯特(Marc Raibert):
我的意思是,你得承认,大狗(Big Dog)确实让我们声名鹊起,并且让团队真正凝聚在一起。我们扩大了公司规模。大狗是 Alan Rudolph 在 DARPA(美国国防高级研究计划局)启动一个生物力学项目的结果。
他发布了一个征求建议书(RFP),我记得有 42 份提案被提交,最终有三个获得了资助。一个是大狗,一个是攀爬机器人 Rise。这一切都开始顺利运转。我们雇佣了麦吉尔大学的教授 Martin Buehler,他在将大狗应用到实际环境中起到了极其重要的作用。这是一个关键步骤,真正愿意走出实验室,构建、测试和修复它,这也是我们公司的一种模式。
莱克斯·弗里德曼(Lex Fridman):
或许你可以纠正我。对于不了解 Big Dog 的人来说,它是一个大型的四足机器人,能够承载相当的重量。虽然它不是 Boston Dynamics 制造的最重的机器人,但也能负载不少。
马克·雷伯特(Marc Raibert):
嗯,这是第一个成功的项目。让我们回到腿实验室。我们建造了一只四足机器人,它能做很多 BigDog 能做的事情,但它的液压泵放在房间里,通过软管连接到机器人。它还有一台 VAX 计算机在隔壁房间,需要一个独立的房间,因为设备庞大,还需要空调,并且有一个非常复杂的总线连接到机器人。机器人本身只有执行器、陀螺仪和其他一些传感器用于感知,但所有的动力和计算都在外部。
BigDog 则将所有这些东西都集成在了平台上。它有一个汽油发动机作为动力源,这是一项非常复杂的任务,需要将发动机的旋转转化为液压动力,这就是我们如何驱动它的。所以在构建物理机器人和系统集成方面有很多学习的内容。然后还有它的控制系统。
莱克斯·弗里德曼(Lex Fridman):
所以对于 Big Dog,我们是把所有东西都整合到一个平台上,对吗?
马克·雷伯特(Marc Raibert):
你可以把它带到树林里。
莱克斯·弗里德曼(Lex Fridman):
是的,你成功了。你可以做到。
马克·雷伯特(Marc Raibert):
是的,我们确实做到了。我们花了很多时间在 Quantico 的海军陆战队基地,那里的小径被称为 Guadalcanal Trail。美国国防高级研究计划局(DARPA)设定的一个目标是让我们能够在这条充满挑战的小径上行走。我们的团队在那里花了很多时间。啊,那些日子真是有趣。
莱克斯·弗里德曼(Lex Fridman):
你好,和机器人一起徒步。你学到了什么,比如在小径和树林中如何让机器人保持平衡?暂且不谈树林,只谈现实世界。这是在现实世界中测试的一大进步。
马克·雷伯特(Marc Raibert):
虽然在树林里工作具有挑战性,但实际上在家里或办公室里工作更难。因为在树林里,你可以选择任何一条路径上山,只需要避开障碍物。至少在第一层面上,不会有损坏树林的问题。而在房子里,你不能留下擦痕,不能撞到墙壁。尤其是在早期,机器人撞到墙壁会非常不舒服。所以我认为这些实际上是我们面临的更大挑战。主要是让系统能够很好地协同工作,让硬件系统和控制系统都能正常运行。
在那些日子里,我们确实有一个人类操作员负责所有的视觉感知工作,比如在瓜达尔卡纳尔小径上行走时。虽然机器人能够自己平衡和放置脚步,但如果操作员没有做对事情,机器人就无法前进。但几年后,我们带着一个电动机器人回到了那里,这是 Spot 的前身。我们在控制和其他方面取得了很大进步,以至于一个完全的业余爱好者第一次就能操作机器人上下山,而在之前的计划中,我们花了好几年才达到这个水平。
莱克斯·弗里德曼(Lex Fridman):
那么,如果你快进一下,Big Dog 最终变成了什么样子?
马克·雷伯特(Marc Raibert):
所以 Big Dog 变成了 LS3,这是一个用于大负载运输的机器人。
莱克斯·弗里德曼(Lex Fridman):
等一下,它可以承载 400 磅。
马克·雷伯特(Marc Raibert):
它的设计承载能力是 400 磅,但我们让它承载了大约 1,000 磅。我们曾经让一个机器人背着另一个机器人,并且还拍摄了一个小片段记录这个场景。这大约是 20 年前的事情了,我们应该把它发布到某个地方。嗯,而且它可以移动很长的距离,达到 20 英里。是的,使用汽油。
从液压转向电动
莱克斯·弗里德曼(Lex Fridman):
那么,那次尝试之后发生了什么?LS3 之后呢?这又是如何导致 Spot 的出现的?
马克·雷伯特(Marc Raibert):
所以,BigDog 和 LS3 使用了发动机动力和液压驱动。后来我们制造了一种电动机器人,它由电池驱动电机,电机再驱动泵,但仍然是液压驱动的。是的,Larry 问我们能不能做一个重 60 磅的机器人,这样放在有人居住的房子里就不会那么吓人,这就是今天 Spot 的灵感来源。我们做了一个大小相似的原型,这是第一个全电动且非液压驱动的机器人。
莱克斯·弗里德曼(Lex Fridman):
你和 Larry Page 的对话内容是什么?他非常注重产品并且富有远见,这很有趣。顺便问一下,你们是如何讨论未来的机器人技术的?
马克·雷伯特(Marc Raibert):
我的意思是,事情几乎就像我刚才说的那么简单。他问我们能否做一个不那么吓人的小版本,或者他更喜欢一只大狗。如果它在你家里,我说,是的,我们可以做到。然后我们就开始了。
莱克斯·弗里德曼(Lex Fridman):
从液压系统转向电动系统是否会面临许多技术挑战?
马克·雷伯特(Marc Raibert):
你知道,我一直热爱液压技术,现在依然如此。液压技术非常出色。遗憾的是,外界似乎认为它已经过时,或者显得有些陈旧。确实,液压系统偶尔会发生泄漏,这是难以完全避免的。但如果你看它的性能,你会发现它在轻量化设计中能提供强大的动力。当然,我们在液压控制方面进行了大量创新。
大多数液压控制阀是在 50 年代为飞机设计的,足够坚固和安全,确保人类安全飞行。此后,液压控制阀的创新较少。这样说可能对制造阀门的人不公平,我相信他们确实进行了创新,但基本设计一直没有改变,仍有许多改进空间。
所以我们的工程师设计了新的阀门,比如在 Atlas 机器人中的那些,它们采用了新型电路,能够更高效地利用资源,体积更小、更轻。因此整个机器人也可以更小、更轻。我们还设计了一种液压动力装置,将许多组件集成在一个小巧的包里,大小约为一个足球,重约五公斤,能产生五千瓦的功率。当然,它需要电池来运行,但它包含了电动机、泵、过滤器、散热器来保持冷却,还有一些阀门,所有这些都集成在这个小包里。所以,液压技术仍然有很大的发展空间。
莱克斯·弗里德曼(Lex Fridman):
波士顿动力公司(Boston Dynamics)的机器人有一个显著特点,就是它们的运动非常优美,行走和奔跑都很自然,甚至翻转和投掷也很流畅。你能谈谈这些动作看起来自然的背后原理吗?
马克·雷伯特(Marc Raibert):
我认为,拥有优质的硬件是成功的关键之一。那些认为硬件不需要再创新的人是错误的。至少在我早期的工作中,采用动态方法非常重要。这种方法不仅考虑到未来运动的演变,还在信号处理时使用预测。伺服系统是反应性的,它会问“我现在在哪里?我要试着调整这个”,但你需要考虑未来可能发生的情况。
莱克斯·弗里德曼(Lex Fridman):
你觉得我们还有多长的路要走?
马克·雷伯特(Marc Raibert):
需要考虑时间吗?这很有趣,我认为这个时间只有几秒钟。但这里有一种有限视野的计算方法,你在重新计算,假设接下来一秒或一秒半会发生什么,然后你不断迭代。即使在十分之一秒后,你也会说,好吧,让我们再做一次,看看会发生什么。
你在观察障碍物的位置,脚会放在哪里,如何协调很多事情,尤其是在有障碍物并且同时需要保持平衡的情况下。这就是有限视野计算在做的很多事情。但如果你在做像翻筋斗这样的动作,你需要看得更远,对吧?如果你想稳稳着陆,你必须在起跳时就协调好动量和旋转等所有因素,以确保着陆在可控范围内。
莱克斯·弗里德曼(Lex Fridman):
着陆有多难?我的意思是,这非常难以控制。一旦你在空中,几乎无法控制任何事情。那么,要让它成功着陆有多难?首先,你用一个跳跃机器人做了翻转动作。
马克·雷伯特(Marc Raibert):
如果你看看我们第一次让机器人做空翻的情况,那是在一个平面上的机器人。它有一个支臂,所以只能在一个平面的表面上运动。我们称之为平面内运动。它可以前后移动、上下移动,还可以旋转。因此,计算如何让它成功着陆并不复杂。你需要考虑的是旋转所需的时间。跳跃的力量决定了你有多少时间。你还需要看它旋转的速度。如果这两点都做对了,那么当你着陆时,脚就会在正确的位置,你需要消除所有的旋转动量和线性动量。这并不难计算。
大约在 1985 或 1986 年,我们让一个简单的机器人做空翻。在 3D 环境中做同样的事情,计算其实是一样的,只是你需要在其他自由度上保持平衡。如果只是做空翻,那就是一个平面问题。
Ron Robson 是我的研究生,我们在麻省理工学院(MIT)时,首次让一个双足机器人做了 3D 空翻。为了获得足够的旋转速度,你需要收腿来增加旋转速度。他在如何稳定更复杂的动作方面做了一些非常有趣的工作。记住,他在来找我之前是一个冠军体操运动员,所以他有身体能力,而且他是一个工程师,所以他能够将这些转化为所需的数学和算法。
莱克斯·弗里德曼(Lex Fridman):
他知道人类是如何做到这一点的。你只需要让机器人也这样做。
马克·雷伯特(Marc Raibert):
同样不幸的是,当你意识到人类并不真正知道他们是怎么做到的。是的,我们接受过训练,并有学习的方法,但我们真的从物理学的角度理解我们在做什么吗?可能大多数体操运动员和其他运动员都不知道。
通过制造机器人,你在某种程度上部分理解了人类是如何行走的。我们大多数人在走路时并不会真正思考自己是如何走路的,对吧?也不会思考我们是如何让走路变得如此自然和高效的。
马克·雷伯特(Marc Raibert):
Atlas 机器人在行走方面仍然不像人类那样自然,尽管它已经越来越接近了。跑步方面已经接近人类,但行走仍然是一个挑战。
莱克斯·弗里德曼(Lex Fridman):
这很有趣,对吧?跑步更符合人类的本能。这表明越是积极进取,勇敢地探索未知领域,就越显得自然。走路总是有点像在跌倒,对吧?
马克·雷伯特(Marc Raibert):
关于膝盖,有一些有趣的地方。通过折叠和展开,它可以像人类的膝盖一样正常运作,并具有一定的弹性。在设计中,弹性非常重要。我们在波士顿动力公司(Boston Dynamics)早期有一个座右铭,那就是你必须先学会跑,然后才能学会走。
莱克斯·弗里德曼(Lex Fridman):
这是一个很好的观点。你们还有 Wildcat,这是在 Spot 之前的一个四足机器人,速度达到了每小时 19 英里,对吧?这是你建造过的最快的机器人吗?是的,可能是世界上最快的四足机器人。我不确定。
马克·雷伯特(Marc Raibert):
它可能是一只四足动物。当然,它也可能是最吵的。所以我们给它装了一个小型赛车引擎。结果,我们收到了三个街区外的投诉,抱怨它太吵了。
莱克斯·弗里德曼(Lex Fridman):
在腿部研究实验室,我注意到大多数机器人没有膝关节。那么,如何确定合适的执行器数量?需要哪些关节?需要满足哪些条件?我们人类有膝盖,还有脚上的各种结构。我猜脚趾对人类来说很重要,或者也许并不重要。我最近脚趾受伤了,跑步变得非常痛苦,所以这似乎很重要。那么,如何确定为了效率、功能和静态平衡,需要多少关节和执行器呢?
马克·雷伯特(Marc Raibert):
嗯,这总是在你真正想要达到的目标和基于你的资源或你所知道的实际可行的事情之间找到平衡。所以,我的意思是,使用单腿弹簧高跷的整个想法是为了简化。显然,它看起来不像人类。我认为技术科学家可以理解我们在捕捉一些对人类运动很重要的东西,即使它没有膝盖和脚踝。
我告诉你,Ben Brown 在我们讨论建造这个东西时画的第一张草图非常复杂,有无数的弹簧和关节。它看起来更像袋鼠或鸵鸟之类的东西,这是我们当时非常感兴趣的东西。是的,所以我的工作是说,好吧,让我们从更简单的设计开始,也许我们最终会达到那个目标。
莱克斯·弗里德曼(Lex Fridman):
我非常喜欢你们研究袋鼠和鸵鸟的这个想法。
马克·雷伯特(Marc Raibert):
是的,我们确实记录并数字化了马的运动数据。我还曾经解剖过一只鸵鸟,这真是一次非常了不起的经历。
莱克斯·弗里德曼(Lex Fridman):
关于腿部肌肉数量的问题,这可能听起来有点蠢,但我还是想问一下。没有其他问题了。
马克·雷伯特(Marc Raibert):
大部分特征都在羽毛上,羽毛覆盖了很多部位,包括膝关节。膝关节的位置很高。腿中间看起来像反向膝盖的部位实际上是脚踝。地面上看起来像脚的部分实际上是脚趾,是腿的延伸部分。所以我认为,这些动物的基本形态是相同的。
莱克斯·弗里德曼(Lex Fridman):
你认为哪种动物的动作最优美?你觉得哪种陆地动物最酷炫?这很有意思,因为鱼在水中游动也很酷炫。那么,有腿的陆地动物呢?
马克·雷伯特(Marc Raibert):
猎豹在慢动作下奔跑的画面非常令人惊叹。它们背部的动作很多,而且非常优雅。当然,它们移动得非常快。那些逃避猎豹的动物也非常有趣。比如叉角羚,它们会用四条腿同时跳跃,这种动作叫做“弹跳”。尤其是在一群叉角羚的时候,这种弹跳会让追捕它们的捕食者感到困惑。
莱克斯·弗里德曼(Lex Fridman):
所以他们会采取一些误导性的手段。
马克·雷伯特(Marc Raibert):
确实如此。它们会做出一些看似误导的动作。比如,当猎豹快速奔跑时,从正面看,它的尾巴在转弯时会甩动,这有助于它保持平衡。这非常令人兴奋。
莱克斯·弗里德曼(Lex Fridman):
我猜是因为我花了很多时间在飞机上。是的,确实如此。
马克·雷伯特(Marc Raibert):
它转弯和奔跑的速度都非常快。
莱克斯·弗里德曼(Lex Fridman):
这是尾巴的功能,还是需要与地面接触才能发挥作用?
马克·雷伯特(Marc Raibert):
身体的每个部分都可能有帮助,因为它们在追逐试图逃跑的目标,而这些目标也在四处躲闪。但如果我不提到这一点,那就太不公平了。你知道,人类也很厉害。看看体操运动员,尤其是现在,他们的表现简直令人难以置信。
莱克斯·弗里德曼(Lex Fridman):
事情是这样的,尤其是对于奥运级别的体操运动员。但你看,我认为可能会有奥运级别的猎豹。我们可能正在观看普通的猎豹,而实际上可能有一只非常特别的猎豹,能够做到你所说的那样。在你构建有腿机器人的过程中,膝盖的作用是什么时候开始显现的?
马克·雷伯特(Marc Raibert):
我完成了 Big Dog 的开发。Big Dog 是第一个,然后才有了 Little Dog。你知道,这里有一个很大的权衡。人类需要很多肌肉。可以说,这里有一个技术问题,涉及负功率。
当你收缩关节但向外推时,那就是负功率。如果没有地方储存它,负功率会非常昂贵。而在 Big Dog 中,大部分情况下,膝盖没有地方储存负功率。但 Big Dog 的腿部有弹簧,所以部分动作是通过弹性来实现的。后来在 Spot 中,我们把弹簧去掉了。因此,我们逐渐远离了腿部实验,更多地依赖能量驱动控制。
莱克斯·弗里德曼(Lex Fridman):
关于膝盖向前和向后弯曲,有什么值得讨论的吗?
马克·雷伯特(Marc Raibert):
当然。有一个叫做被动动态学的概念。它的意思是,虽然你可以使用计算机和执行器来控制运动,但在适当条件下,机械系统也可以自行产生运动。
大约在 80 年代中期或后期,Tad McGeer 开始研究这个概念。他制作了一个有腿的机械系统,这个系统可以在斜坡上行走,腿部能够折叠、展开并向前摆动,完成整个行走动作,而且没有使用计算机。只是对机械部分进行了调整,在某些地方添加了阻尼器和弹簧,使得机械动作得以实现。它本质上是一个机械计算系统。
这个有趣的想法是,运动不仅仅是大脑告诉身体该做什么,身体本身也是运动的参与者。
莱克斯·弗里德曼(Lex Fridman):
所以,一个优秀的机器人设计应该包含一个机械组件,即使没有控制系统,其运动也能高效进行。你是如何进行设计的?
马克·雷伯特(Marc Raibert):
我认为现在大多数机器人并没有这样做。大多数机器人主要依赖计算机进行运动控制。不过,控制系统会考虑机械装置的能力及其表现。否则,机器人就必须强制控制所有部件的运动。有些解决方案确实是这样做的,但我认为如果你充分利用机器的能力,最终会得到一个更高效、更优雅的结果。
运动智能和认知智能
莱克斯·弗里德曼(Lex Fridman):
你现在领导着新成立的波士顿动力 AI 研究所,该研究所专注于未来机器人设计。这可能是一个很好的机会,请你介绍一下 AI 研究所的宏大愿景。在此之前,你能否概述一下研究所的总体目标?此外,硬件在有机设计等方面仍然非常重要。
马克·雷伯特(Marc Raibert):
你知道,我喜欢将智能分为两个部分,一个是运动智能,另一个是认知智能。在我看来,Boston Dynamics 已经为运动智能设定了标准。这涉及到我们一直在讨论的所有内容,如机械设计、实时控制、能量学等等。但显然,人类和动物还有另一种智能。
我们可以制定计划。比如我们的会议在 9 点开始,我在 Google Maps 上查了一下,从家到这里大约需要 20 分钟,所以我决定在 8 点 40 分离开家,这就是我做的。这是一种简单的智能,但我们一直在使用。这就是我们认为在头脑中发生的事情。而我认为机器人在这方面是欠缺的。大多数机器人在这方面都相当笨拙,因此需要很多技术人员来编程以完成所有任务,这需要很长时间。
如果机器人要实现我们的梦想,它们需要变得更聪明。因此,AI 研究所的设计是将运动智能的物理性与认知智能结合起来。例如,我们正在尝试制造能够观看人类完成任务的机器人,理解它所看到的,然后自己完成任务。这是一种机器人在职培训(OJT)的范式。这相当困难,有点像科幻小说。我们的想法是着眼于更长的时间框架,致力于解决这些问题。我还有一长串类似的事情。
莱克斯·弗里德曼(Lex Fridman):
顺着这个思路,我们可以从你提到的许多事情入手。首先,运动智能是一个非常有趣的术语。这确实是一种智能。我们人类往往理所当然地认为自己在行走方面非常擅长。
马克·雷伯特(Marc Raibert):
使用我们的双手,与所有这些部件互动的机械原理。是的,这两件事。你知道,我不是在做广告。我触摸过这样的东西,看看我能做的所有事情,对吧?我可以杂耍,可以这样旋转,可以在不看的情况下旋转它。我可以从口袋里拿出这些东西,并弄清楚哪个是哪个,所有这些事情。是的,我认为我们还不太清楚这一切是如何运作的。
莱克斯·弗里德曼(Lex Fridman):
是的,我非常喜欢将其归类为运动智能。那么,在运动智能领域有哪些重大未解的问题呢?Boston Dynamics 通过 Spot 和 Atlas 一次又一次地展示了机器人可能实现的极限。但从更广泛的角度来看,运动智能方面的重大未解问题是什么?
马克·雷伯特(Marc Raibert):
我的意思是,你可以问一个问题,它们在商业上可行吗?能提高生产力吗?是的,我认为我们非常接近这一点,但还没有完全达到目标。大多数机器人公司都在挣扎。实际上,目前最大的障碍可能是认知能力的不足,即使是那些在物理上成功的机器人也是如此。
你总是可以让它们变得更高效、更轻便、更可靠。我认为可靠性是关键。我知道 Spot 团队一直在努力提高可靠性,并且取得了巨大的进展。现在有 15 个 Spot 机器人,其中许多被用于实际应用,每天都在使用。它们必须可靠地工作,他们已经做到了这一点,这非常令人兴奋,但实现这种可靠性需要巨大的努力。还有成本问题,需要降低成本。Spot 机器人仍然相当昂贵,但我认为它们不必如此。这需要采取不同的措施来实现。
现在,Boss Dynamics 主要由现代(Hyundai)拥有,我认为现代在制造汽车方面的技能可以用于制造更便宜、更可靠的机器人。
莱克斯·弗里德曼(Lex Fridman):
在研究中,您是如何在大胆创新和渐进式进展之间权衡的?
马克·雷伯特(Marc Raibert):
这是个好问题。我认为我们正在使用一种称为“循序渐进”的范式。我不认为这是必要的,这在我最初的提案中也提到过。
莱克斯·弗里德曼(Lex Fridman):
对于你的研究所来说,采用循序渐进的方法。如果你超过一年没有看到一个具体的阶段性成果,这可能是一个简化的过程,对吧?你不一定要解决所有目标的问题,即使你的目标需要几年时间才能实现。这些阶段性的成果会给你反馈和动力,因为通常会有一些成功的因素在里面。
马克·雷伯特(Marc Raibert):
所以,这就是我们一直在努力的信条。这正是波士顿动力公司(Boston Dynamics)的工作方式。你在前进的过程中取得进展并展示出来。即使不向外界展示,也要向自己展示。
莱克斯·弗里德曼(Lex Fridman):
你如何定义成功?你正在追求哪些里程碑?
马克·雷伯特(Marc Raibert):
通过之前提到的项目,我们在理解观察行为方面已经取得了一些进展。我们将观察一个人做某事的过程分解成多个步骤。比如,你看我做某事,我拿起这个东西,把它放在这里,再把另一个东西堆在上面。如果你只是看原始数据,很难看出这些动作的顺序。
将这些动作分解成各个部分并理解它们,这实际上是一个创造性和智能化的行为。这样你才能说,好的,我需要什么技能来完成这些事情?所以我们正在研究这个问题的前端部分。我们观察并将视频或实时的内容转化成我们认为正在发生的事情的描述,然后尝试将其对应到完成这些事情所需的技能上,可能还包括开发这些技能。因此,我们在多个方面都有一些进展。
莱克斯·弗里德曼(Lex Fridman):
看起来复杂的任务确实是复杂的。
马克·雷伯特(Marc Raibert):
确实很复杂,但有些部分并不难。比如安装座椅,只需将一个管子插入另一个管子,然后用锁扣固定,这应该是可以做到的。
莱克斯·弗里德曼(Lex Fridman):
在没有具体自行车模型的情况下,观看这种视频是否可行?
马克·雷伯特(Marc Raibert):
我认为是这样的,而且我觉得这是人们没有意识到的事情。让我解释一下导航的概念。通常,导航的基本范式是使用某种传感器来告诉你障碍物和开放区域的位置,建立一张地图,然后穿过这个空间。但如果我们是在进行实际操作,我给你一个任务,我不需要告诉你房间的任何细节,对吧?我们进来后,只是调整椅子,但我们没有提到房间的任何细节。你知道,我们可以在房间内导航。所以我认为有机会将这种导航技能应用到机器人中。我们希望能够做到这一点。
莱克斯·弗里德曼(Lex Fridman):
那么,机器学习在这些过程中起到了多大的作用?它是否越来越依赖于学习?
马克·雷伯特(Marc Raibert):
你知道,自从 ChatGPT 出现以来,已经有一年了。人们对此充满了巨大的兴趣和乐观态度。我认为机器学习还有很多东西可以学习。现在有很多不同种类的机器学习方法。我认为,用物理机器人做实际操作与处理语言和标记有些不同。是的,标记似乎不存在,像素值与单词不同。
但我认为在这方面还有很多可以探索的领域。我们有几个人在研究机器学习的方法。我不知道你是否知道,我们最近在苏黎世开设了一个办公室。Marco Hutter 是机器人强化学习领域的领导者之一,他是该办公室的主任。他仍然在苏黎世联邦理工学院(ETH Zurich)兼职,在那里他有一个非常出色的实验室。同时,他也将领导苏黎世办公室的工作。所以我们有一个良好的学习环境。
但我内心的一部分仍然认为,如果你看看世界上最令人印象深刻的表现,仍然是传统控制方法,比如模型预测控制(MPC)。你知道,Atlas 的表现大多是基于模型预测控制(MPC)。他们已经开始做一些非常了不起的学习工作。我不知道这些是否都已经展示出来了,但你会随着时间的推移看到它们。Marco 和其他人也做了一些很棒的工作。
莱克斯·弗里德曼(Lex Fridman):
在运动智能领域,传统方法似乎仍然表现最佳。
马克·雷伯特(Marc Raibert):
我认为我们会找到人工智能与机器人技术的结合点,并从中实现最佳的协同效果。我们研究所也正在为此努力。
技术无畏
莱克斯·弗里德曼(Lex Fridman):
如果可以的话,我想和你聊聊团队。你之前在波士顿动力公司、麻省理工学院(MIT)和卡内基梅隆大学(CMU)都组建了令人难以置信的团队,现在在 AI 研究所也是如此。你曾说过,一个伟大团队有四个组成部分:技术上的无畏、勤奋、勇敢和在技术中找到乐趣。你能解释一下每个部分吗?技术上的无畏,你指的是什么?
马克·雷伯特(Marc Raibert):
当然。技术无畏意味着愿意接受一个你尚未知道如何解决的问题,并通过研究找到切入点,或许是一个简化版本或简化的解决方案。从这个过程中学习,最终找到一个符合你目标的解决方案。我认为这真的很重要。
莱克斯·弗里德曼(Lex Fridman):
无畏精神之所以有效,是因为有些事情从未被尝试过。
马克·雷伯特(Marc Raibert):
有些事情你可能不知道该怎么做,但有些事情相对容易。在生活中,有些事情你可能会觉得简单。我的意思是,观察、理解和行动,这些都是巨大的挑战。
莱克斯·弗里德曼(Lex Fridman):
所以这是你们目前面临的一个重大挑战。我们能否大规模地观察人类,并通过这种观察使机器人在世界中成为有效的行动者?
马克·雷伯特(Marc Raibert):
我的意思是,我们还有其他类似的例子。我们有一个叫做“检查、诊断、修复”的项目。比如你打电话给洗碗机维修人员,他们会到你家检查机器。通常已经发现有些东西不工作了,但他们需要检查一下,找出问题所在,然后修复。我认为机器人应该能够做到这一点。
波士顿动力公司的 Spot 机器人已经在收集机器的数据,比如热数据、读数表、声音等。这些数据被用来判断机器是否健康。但目前这些数据的解释还不是由机器人完成的,当然,诊断和修复也还没有实现。但我认为这是可以做到的,这需要将 AI 与物理技能结合起来完成。
莱克斯·弗里德曼(Lex Fridman):
你指的是在物理世界中的修复。我迫不及待地想要解决人类的心理问题。好吧,让我们开始治疗吧。
马克·雷伯特(Marc Raibert):
那是另一回事。
莱克斯·弗里德曼(Lex Fridman):
虽然有所不同,但它们都是整体的一部分。再次强调,这是人类本性。
马克·雷伯特(Marc Raibert):
也许你是指说服自己,洗碗机坏了也没关系,直接手洗吧。
莱克斯·弗里德曼(Lex Fridman):
对,没错。就是这样,不要为小事烦恼。与其修理洗碗机,不如接受它坏了也没关系。这是一种不同的思维方式。为什么勤奋很重要?
马克·雷伯特(Marc Raibert):
如果你想要一个真正的机器人解决方案,它不能是一个非常狭窄的解决方案,否则在机器人执行任务或环境发生变化时,它会立即失效。那么如何实现这一点呢?我认为,应该采取一种方法,直到你对解决更大范围的问题感到满意,这就是我所说的稳健性。我还要强调动态性。我认为他们已经做到了。
你知道,我们有一些视频展示了工程师如何给机器人制造困难。比如 Spot 打开一扇门,然后有人推门使其无法正常打开,或者拉扯连接到机器人的绳子,干扰它的导航。我们还有一个视频,机器人在爬楼梯时,工程师拉扯绳子使其滑下楼梯。这完全不同于机器人仅仅看到楼梯、建立模型、小心翼翼地把脚放在每一级台阶上。但这可能正是机器人技术需要成功的地方。拥有一个更广泛的想法,即你想要提出一个稳健的解决方案,这就是我所说的稳健性。
莱克斯·弗里德曼(Lex Fridman):
所以,确实需要在各种条件下测试系统,并以多种方式对其进行干扰,对吧?结果就是产生了一些非常精彩的视频,真是令人惊叹。
机器人的失败营销
马克·雷伯特(Marc Raibert):
在早期使用第一个三维运动机器人时,我学到了一些东西。如果你只展示它正常运行的录像,人们可能不会觉得有什么特别之处。但如果你展示它摔倒几次的录像,人们就能看到它摔倒得多么容易和迅速,这样他们就会更欣赏机器人在正常运行时的表现。所以,我认为你刚才展示的机器人在通过门时被干扰或测试的反应,展示了它解决问题的能力范围。
莱克斯·弗里德曼(Lex Fridman):
系统的局限性和失败带来的挑战。如果你能看到失败与成功的对比,就会更加欣赏成功。此外,Boston Dynamics 的视频制作方式也非常出色,因为这些视频没有任何花哨的元素,没有额外的制作,只是展示了机器人的原始测试。
马克·雷伯特(Marc Raibert):
嗯,你知道,直到大约三四年前,我一直是大多数视频的最终编辑。我对视频的理念是不需要解释。如果观众看不懂,那说明视频做得不够好。如果你做了值得展示的事情,就让他们看到。不要用一堆标题或其他干扰拖慢节奏。只要做一些值得展示的事情,然后展示出来。这很棒,但要让人们接受这一点并不容易。
莱克斯·弗里德曼(Lex Fridman):
是的,我的意思是,人们总是想添加更多内容,但只需做一些值得展示的事情,并以出色的方式呈现,而不必额外添加其他东西。
马克·雷伯特(Marc Raibert):
是的,人们特别批评了 Big Dog 视频中有人类操控机器人的部分。我理解这种批评。当时,我们只是想展示这个机器人如何用腿爬坡,所以我们专注于这一点,认为这是展示的重点。人们关注的是自主能力,而我们关注的是运动能力。因此,我们根据人们的关注点做了很多调整。我们一直在努力保持诚实。
莱克斯·弗里德曼(Lex Fridman):
但也要展示一些很酷的东西,以这种原始的形式展示系统的极限。让我们看看系统在受到干扰时的表现,以及它的稳健性和弹性等特性。还有随着音乐跳舞,既大胆又有趣。
马克·雷伯特(Marc Raibert):
勇气,我认为这是最重要的因素。你知道,机器人技术非常困难,不会立刻成功。所以不要气馁,这就是勇气的真正含义。因此,通常当我谈论这些事情时,我会展示一些视频,展示一系列失败的片段。你知道,当你努力工作,建造你的机器,然后尝试时,它并没有按照你预期的那样运行,你必须有勇气去面对这一切。
莱克斯·弗里德曼(Lex Fridman):
要坚持下去,不断尝试。需要坚持多久呢?我的意思是,这些成果并不常见。能否讲讲 Spot 和 Atlas 背后的故事?在早期阶段,为了让 Atlas、Spot 和 Big Dog 正常工作,经历了多少次失败?
马克·雷伯特(Marc Raibert):
这是 Atlas 爬上三个大台阶的视频。它充满动感,非常令人兴奋,是一个真正的成就。我们尝试了 109 次,并且每一次都有视频记录。再次强调,这是波士顿动力公司的成果。虽然花了 109 次尝试,但一旦成功,表现就非常稳定。所以我们展示的不是最好的那一次,而是不断改进后的表现。
虽然不是每次尝试都展示,但每次尝试都是有意义的。你知道,这展示了一些意外的错误,比如当你说“开始”时,机器人就在起点处摔倒了。这与台阶无关,或者是感知系统没有正常工作,导致跳跃时错过了目标,或者某些部件坏了,油飞溅得到处都是。但这很有趣。
在那段时间里,我们对进化过程进行了大量控制。我记得花了六周时间才完成。我们进行了 109 次试验,因为需要编程。实际上是机器人在学习,但有人工在循环中辅助。因此,所有数据都是由人工驱动的。
莱克斯·弗里德曼(Lex Fridman):
好的。那么,你总是从失败中学习。在 109 次尝试中,你是如何保护 Atlas 不受损的呢?
马克·雷伯特(Marc Raibert):
这真是令人惊叹。Atlas 的一大成就是工程师们设计并制造了一台足够坚固的机器,它能够承受跌倒和其他测试,而不会每次都损坏。当然,它仍然会有损坏的情况。我们的工作模式之一就是让人们来修理这些设备。在从事这种工作时,必须考虑到这一点。
我有时会批评那些将精美设备放在架子上,不敢使用的人。我认为,如果你那样工作,是无法取得进展的。你需要做好设备损坏的准备,然后进行修理。这是工作的一部分。你知道,计划你的预算时,需要包括备用零件和一个团队等。
莱克斯·弗里德曼(Lex Fridman):
是的,即使它摔倒了 109 次,也没关系。所以真正的勇气不仅适用于 Spot,也适用于所有机器人。
马克·雷伯特(Marc Raibert):
此外,我认为这适用于任何值得做的事情。
莱克斯·弗里德曼(Lex Fridman):
特别是在现实世界中的系统,对吗?
马克·雷伯特(Marc Raibert):
技术上的乐趣非常有趣。我通常会在技术上找到乐趣。我认为作为一名工程师的生活真的很令人满足。你可以像工匠一样,用自己的双手、设计或擅长的工具来完成工作。能够亲自完成工作是非常令人满意的。与很多不得不做不喜欢的事情的人不同,工程师通常能够做自己喜欢的事情,这带来了很多满足感。
此外,在很多情况下,你可以对世界产生影响,因为你做了一些其他人钦佩的事情,这不仅仅是动手建造的乐趣。所以这是成为工程师的第二个好处。
第三个好处是,如果你有幸在一个团队中工作,能够从其他人的技能中受益,帮助你完成任务。
我们没有人拥有完成大多数项目所需的所有技能。如果你在一个与他人合作良好的团队中工作,那会非常令人满意。而且作为工程师,你通常还会得到报酬。所以在我看来,你实际上得到了四重回报。那么还有什么比这更好的呢?
莱克斯·弗里德曼(Lex Fridman):
在享受乐趣的同时还能赚钱。你喜欢工程的哪些方面?工程对你来说意味着什么?这个大工程究竟是什么?
马克·雷伯特(Marc Raibert):
我认为这两者兼而有之。既是科学家,又能像艺术家或创造者一样运用科学。科学家只能描述和研究已经存在的事物,而工程师则可以创造以前不存在的东西。所以我认为工程学是一种更高的使命。尽管大多数公众认为科学至高无上,而工程学次之,但我认为事实恰恰相反。
莱克斯·弗里德曼(Lex Fridman):
当你在前沿领域讨论机器人时,这实际上是一种艺术创作,因为你在做的是开创性的工作。然后是大规模生产,这也是一件非常美妙的事情。但是,当你创造第一个新机器人或新事物时,那就是一个全新的创造过程。
马克·雷伯特(Marc Raibert):
赋予金属或机器生命的感觉非常美妙。制作 Dan 的跳舞视频也非常有趣,这个视频引起了巨大的公众反响。我们会继续制作更多类似的视频,并在实验室进行更多相关的工作。
莱克斯·弗里德曼(Lex Fridman):
当无生命的金属被赋予生命的那一刻,对我来说,依然是神奇的。人类智慧能够创造出系统,将生命注入无生命的物体中,这真的非常令人惊叹,尤其是当它的规模达到人类可以直接感知和欣赏的程度时。
马克·雷伯特(Marc Raibert):
我认为,当你设计一个连杆,使其重量和强度都恰到好处时,这是非常令人满意的。是的,有些人会这样做,这是一种创造性的过程。我认为,让机器人以一种能让人联想到生命的方式移动是非常重要的。
如果这是一个高效的动作,它比其他机器人做得更快、更强。虽然我们通常不会比人类做得更强、更快,但在某些特定领域,我们正在接近这一目标。
我的意思是,我想让机器人跳舞。你知道,我们现在还远远达不到人类的舞蹈水平。我们请了一位著名的芭蕾舞演员,她一直在为机器人编排舞蹈动作。我们正在开发一些工具,使她能够以她的方式进行编舞,让机器人更容易理解并执行这些动作,并且已经开始取得一些有趣的成果。
莱克斯·弗里德曼(Lex Fridman):
我们应该提到有一个动作编排工具。我记得我看过它的几个版本,非常酷。你可以在时间轴上宏观控制机器人的各个部分的运动。
马克·雷伯特(Marc Raibert):
我们希望在这方面取得进展,使其更符合舞蹈界的表现方式,并提升表演的互动性和表现力。虽然我们已经取得了很大的进展,但仍有许多可能性等待探索。我希望能看到机器人与人类共舞的表演。目前,我们在舞蹈方面的几乎所有工作都是基于预设的时间轴。一旦按下开始按钮,机器人就会按照预定程序执行动作。它既不会倾听,也不会观察。我认为它应该具备这些能力。
莱克斯·弗里德曼(Lex Fridman):
我想我会非常喜欢看到一个专业的芭蕾舞演员在一个房间里独自教一个机器人跳舞的过程。这个机器人完全不懂舞蹈,只是在尝试理解简单的舞蹈动作。现在,Atlas 和 Spot 已经能够完美地按照节拍跳舞了。如果能看到机器人与人类互动学习的过程,那将会非常令人惊叹。
马克·雷伯特(Marc Raibert):
有一件很酷的事情正在发生,你知道布朗大学有一门叫做协作机器人学的课程。Sydney Skybetter 是一位舞蹈编导,他与计算机科学教授 Stefanie Tellex 合作教授这门课程。我认为他们还有一些研究生协助教学。在这门课上,有两个方向,学生们大多有计算机科学和舞蹈背景,他们编排出非常有趣的表演作品。我有时在演讲时会展示其中的一些作品。
莱克斯·弗里德曼(Lex Fridman):
让人类通过语言和动作更高效、更直观地教导机器人将会非常有趣。我意识到,人类不仅通过语言,还通过大量的肢体语言和复杂的细节进行交流。
马克·雷伯特(Marc Raibert):
完全同意。这确实是一个挑战。你知道,我们被要求让机器人与著名舞者同台表演。而舞者大约有 200 个活动自由度,每一个细微的动作都涉及头、颈、肩等部位,而机器人通常没有这些部位。要在他们旁边不显得笨拙,确实是一个艰巨的挑战。所以我们基本上避免了这种类型的表演,但我们会努力达到这个目标。
莱克斯·弗里德曼(Lex Fridman):
我认为即使自由受到限制,我们仍然可以选择一些 SaaS 和其他不同类型的服务。即使不能完全自由,我们也可以找到适合自己的东西。
马克·雷伯特(Marc Raibert):
我们也可以反其道而行之。比如,当你看到人类模仿机器人表演时,这是一种舞蹈风格,其中包含一些动作,比如弹跳和锁定。我认为机器人可以通过表现出不稳定的振荡和比人类更快的动作来超越人类。所以,这是我的一个计划,但我们还没有完全实现。
莱克斯·弗里德曼(Lex Fridman):
你提到了组建团队和机器人团队等。你是如何招聘到优秀工程师的?
马克·雷伯特(Marc Raibert):
我认为你甚至需要创造一个环境,让有才华的工程师能够在其中工作。这有点像先有鸡还是先有蛋的问题。如果你有一个有趣的工程环境,工程师们就会想在那里工作。我认为在波士顿动力公司(Boston Dynamics)发展这种环境花了很长时间。
事实上,当我们刚开始的时候,虽然我在卡内基梅隆大学(CMU)和麻省理工学院(MIT)的腿部实验室里有过建造东西的经验,但相比现在的波士顿动力公司,我们当时的工程技术水平并不那么高。但这是我们的目标。
还有一家名为 Sarcos 的机器人公司。我总是认为我们在计算方面有一定优势,而他们在硬件方面有一些优势。随着时间的推移,我认为我们达到了相同甚至更高的工程技术水平。同时,Sarcos 被收购了,然后经历了多次变革。我不太清楚他们目前的状况。所以,答案的一部分是,这花了很多年。
我认为你需要找到热爱机器人技术的人。在早期,我们的薪水较低,所以我们只吸引了那些真正热爱这项工作的人。我们还雇佣了一些可能没有专业学位的人,比如那些制造自行车和皮划艇的工匠。我们有一些来自创客社区的人,这对我们所做的工作来说非常重要。
莱克斯·弗里德曼(Lex Fridman):
无论是什么神奇的成分造就了一个伟大的创造者,那才是关键。
马克·雷伯特(Marc Raibert):
确实有一部分原因是这样。那些小时候在车库里修车或组装摩托车的人,通常会对机械工程产生浓厚的兴趣。
莱克斯·弗里德曼(Lex Fridman):
我认识的一些机器人学领域的学生和研究人员,他们总是充满活力和快乐。如果我把他们和另一类人比较,比如跳伞爱好者,其实他们也有类似的兴奋和活力。我认为这可能与他们不断经历失败有关。最终,成功建造某物的喜悦也是其中的一部分。你已经完成了一些项目,并在物理世界中实现了它们。视频也有助于展示机器人技术的实际应用,对吧?
马克·雷伯特(Marc Raibert):
哦,你知道,在波士顿动力公司(Boston Dynamics),我们变得广为人知。我记得有一次面试一个销售人员,他来自一家公司,他说,没人听说过他们的公司,但他们有非常好的产品。而你们,大家都知道你们是谁,但你们根本没有任何产品,这确实是真的。所以,我们感谢 YouTube。YouTube 出现了,我们赶上了这股浪潮,这对我们的公司产生了巨大的影响。
机器人的竞争与社交机器人的未来
莱克斯·弗里德曼(Lex Fridman):
我的意思是,这不仅对你的公司有重大影响,对整个机器人领域也是如此,帮助人们理解并激发对机器人可能性的想象。它们激发了人们的想象力、恐惧和各种情感反应,这对整个社会来说都非常有意义。而且,这可能也会激励那些想进入 AI 或产品领域的年轻人。
接下来,我想请教你一些关于竞争对手的问题。你一直对埃隆和特斯拉在 Optimus 机器人上的工作表示赞赏,他们的类人机器人。你怎么看待他们在类人机器人方面的努力?
马克·雷伯特(Marc Raibert):
你知道,我真的很钦佩埃隆·马斯克作为技术专家的成就。我认为他在特斯拉所做的事情简直令人难以置信。他能够将一个几乎无人问津的小众领域,发展到现在几乎每家汽车公司都在效仿他。所以你必须承认他的成就。
再看看 SpaceX,他在某些方面基本上超越了 NASA,虽然这可能有点夸张,但也差不多。所以,你知道,你不得不佩服这个人。而且,我不会低估他的任何能力。我不认为今天的 Optimus 能达到 Atlas 的水平。例如,我不知道,这有点难以与其他公司比较。
我访问过 Figure 公司,我认为他们做得很好,他们有一个优秀的团队。我也访问过 Electronic 公司,我认为他们也有一个优秀的团队,做得很好。但埃隆有很多资源,他有很大的野心。我对他的野心感到有些自豪。如果我读懂了其中的含义,很难不认为他看到 Atlas 所做的事情有一点启发作用。我希望确实如此。
莱克斯·弗里德曼(Lex Fridman):
你认为 Atlas 和 Optimus 将来会一起协作吗?
马克·雷伯特(Marc Raibert):
我很愿意主持这个事。你知道,现在我已经不在 Boston Dynamics 工作了。虽然我仍在董事会,但没有正式的工作联系。
莱克斯·弗里德曼(Lex Fridman):
AI 研究所是否与体育项目有合作?目前,Atlas 主要专注于这方面的研究。
马克·雷伯特(Marc Raibert):
我们有一个平台,拥有各种不同的机器人。我们购买了所有能买到的设备,所以我们有 Spot 机器人。我认为我们的车队规模相当大,具体数量我不清楚,但确实不少。我们还有几个 Animal 机器人。Animal 是由 Marco Hutter 创立的公司,尽管他现在不太参与了,但我们仍然有几个这样的机器人。此外,我们还拥有一批机械臂,比如 Franka 和 Universal Robots 的机械臂。尽管我们有制造设备的雄心,并且已经开始生产,但在初期阶段,我们主要是购买现成的设备。
莱克斯·弗里德曼(Lex Fridman):
您好,您是否会组织一次机器人聚会?对于这个领域,特别是类人机器人的竞争,您有什么看法?您对竞争感到兴奋,还是更倾向于友好的互动?
马克·雷伯特(Marc Raibert):
我认为,我不太考虑竞争。你知道,我不是一个商业人士。在波士顿动力公司(Boston Dynamics)的许多年里,我们并没有考虑竞争。我们只是专注于自己的事情。当时并没有什么产品是我们要竞争的。也许在争取 DARPA(美国国防高级研究计划局)资金时有一些竞争,我们在这方面确实做得很好。
但即使在那种情况下,我们最终也只是作为机器人供应商。比如在小狗项目中,我们只是制造机器人,并没有参与其他开发,除了开发机器人本身。在 DARPA 机器人挑战赛中,我们也没有竞争,只是提供了机器人。
现在在 AI 领域,我们在做认知方面的工作,感觉竞争更加激烈。你知道,在计算硬件、团队技能以及招聘人才方面的入门要求都更高。这是一个更加艰难的领域。所以我现在在认知方面更多地考虑竞争。在物理方面,感觉竞争还没有那么激烈。显然,有 10 家或 12 家类人机器人公司,可能还有我不知道的公司,他们肯定在竞争,未来也会有竞争。
莱克斯·弗里德曼(Lex Fridman):
四足机器人,尤其是仿生机器人,在降低成本方面还有多大空间?成本能降到多低?其中有多少是通过大规模生产实现的?像现代汽车这样的公司,如何在生产和工程创新之间找到平衡,并简化生产过程?
马克·雷伯特(Marc Raibert):
我认为我们还有很长的路要走。我不认为我们已经看到了谷底,或者说价格的最低点。我认为我们应该保持完全乐观。随着技术的进步,事情不必像现在这样昂贵。
回到竞争的话题,我想说一件事。我认为在四足机器人领域,其他公司销售四足机器人对波士顿动力(Boston Dynamics)来说是件好事。因为我相信用户心中的问题是,我想要哪种四足机器人?而不是,我能不能用四足机器人?四足机器人能不能完成我的工作?这更像是一个选择的问题,这是一个很好的局面。然后你只需要做你通常做的事情,让你的产品更好,进行竞争和销售等等。这也将是未来某个时候人类的选择方式。
莱克斯·弗里德曼(Lex Fridman):
当类人机器人变得非常普遍时,你甚至不会注意到它们的存在。这就像空气一样自然。你正在开创这个领域,或者说,这个领域正在逐渐成形。我的意思是,现在的关键在于实际的应用场景。能够盈利的机器人应用是一个巨大的挑战。
马克·雷伯特(Marc Raibert):
你知道,仓库自动化可能是目前唯一能在机器人领域实现盈利的应用。
莱克斯·弗里德曼(Lex Fridman):
是的。不过,我相信社交机器人开始真正盈利的时刻一定会到来,比如家用的类似波士顿动力公司 Spot 的机器人。而且未来家里会有大量这样的机器人。我不知道美国有多少只狗作为宠物,但我觉得我们会喜欢有一个智能伴侣在身边,它记得我们,见到我们时很兴奋,等等。
马克·雷伯特(Marc Raibert):
确实如此,最近制造这些产品的公司经历了很多失败。我记得有一年,有三家公司倒闭了。所以这并不容易。要同时满足性能、安全性和成本的要求,确实非常困难。
莱克斯·弗里德曼(Lex Fridman):
这确实很难。但正如你所说,有时候你有一个产品,但人们可能并不知道它的存在。因此,部分工作是通过视频或其他方式与公众互动,创造一种文化,让人们意识到他们需要这个产品。从某种角度来看,你可以有很多负面的看法。
你真的想要一个带摄像头的系统在你家里随处移动吗?如果它被正确地呈现,并且有合适的边界让你理解它的工作原理,很多人会愿意使用它。毕竟,我们都在使用智能手机,而智能手机也有摄像头在监视我们。
在你研究这些机器人的认知时,你认为它们能否达到人类或超人水平的智能?关于这个问题有很多讨论。最近,随着大语言模型的快速发展,这个话题变得更加热门。
马克·雷伯特(Marc Raibert):
我认为智能由许多不同的因素构成。在某些方面,计算机已经比人类更聪明,而在另一些方面,它们仍然远远落后。我认为需要一个详细的分类体系来得出这个结论。不过,关于 AGI(通用人工智能)的讨论让我感到困惑。所以我想问你一个问题,你认为世界上有比你更聪明的人吗?
即使计算机比人类更聪明,为什么我们要认为那是威胁呢?尤其是因为它们可以轻松变得更聪明,但仍然受我们控制,这基本上就是计算机的常态。
莱克斯·弗里德曼(Lex Fridman):
你不觉得那是威胁吗?
马克·雷伯特(Marc Raibert):
我不这么认为。
莱克斯·弗里德曼(Lex Fridman):
我认为人们担心这些系统会比人类聪明 10 倍、100 倍,甚至 1000 倍,并且按照不同于人类的道德和伦理准则运作,因此可能会以意想不到的方式失控,对人类造成无法预测的伤害。即使我们编程让它们执行某个任务,它们在执行过程中也可能会造成大量伤害。当它们比我们聪明 100 倍、1000 倍,甚至 10000 倍时,我们将无法阻止这些系统,甚至在伤害发生时也无法察觉,直到为时已晚。因此,你可以构建各种可能的情景,来描述由于超级智能系统导致世界终结的情况。
马克·雷伯特(Marc Raibert):
这有点像《奥本海默》电影中的那句台词,他们在思考第一次引发反应时,地球上的所有物质是否会……消失。我不记得他们用的动词是什么了。是链式反应,对吧?
我猜有可能,但我个人认为这不值得担心。我认为这是一个机会,需要在机会和风险之间找到平衡。任何技术都有其机会和风险。我会举汽车的例子。它们污染环境,每年大约有 125 万人因它们而丧生。尽管如此,我认为它们对人类来说是非常有用的。我们都喜欢,很多人喜欢它们。而那些技术问题是可以解决的。我认为它们正在变得更安全,至少有些汽车在变得更少污染。每一种技术都有类似的故事。
莱克斯·弗里德曼(Lex Fridman):
在机器人领域,有没有人曾带着负面动机对你说过,我不认为你能做到这种事?
马克·雷伯特(Marc Raibert):
我更愿意谈谈这个。在我们进行许多 DARPA(美国国防高级研究计划局)项目时,有一位名叫 Ed Tovar 的海军陆战队员,他现在仍在服役。他总是说,当有人说“哦,你不能那样做”时,他会问“为什么不呢?”这是一个很好的问题,我经常在思考时问自己,为什么我们不能那样做。我感谢他让我开阔了眼界,我喜欢这种挑战权威的态度。
在我任教于 MIT 时,有一段时间我负责本科生的指导工作,每学期学生们都会来找我一次。他们经常问我应该做什么。我常建议,如果没有资源、机会或技能的限制,你能想象自己在做什么?我会说,从这个想象开始,看看你能多大程度上接近这个目标,看看什么是现实的。换句话说,试着弄清楚你想做什么,然后去实现它。我认为很多人觉得自己被限制在一个固定的轨道上,机会有限。但实际上,机会通常比他们想象的要多得多。
莱克斯·弗里德曼(Lex Fridman):
是的,机会确实是无限的。但同时,你也需要选择一个方向,对吧?这就是勤奋。并且要真正追求它。有时候,真正特别的成果是在多年努力之后才会出现的。
马克·雷伯特(Marc Raibert):
当然,这可能需要一些时间。
莱克斯·弗里德曼(Lex Fridman):
我的意思是,你已经从事这项工作超过 40 年了。
马克·雷伯特(Marc Raibert):
有些人认为我对某种状态过于痴迷,对吧?他们问我为什么不尝试其他领域的工作。事实上,AI 研究所的一些灵感正是为了回应这种疑问。好吧,我已经在运动控制领域工作了很多年,现在是时候尝试一些新的挑战了。这确实是一个非常吸引人的机会。
莱克斯·弗里德曼(Lex Fridman):
你也希望以同样的方式展示这些内容。
马克·雷伯特(Marc Raibert):
关于破坏和其他事情,我希望我们能通过 YouTube 频道展示出来。展示运动技能是一回事,但在 YouTube 上展示认知功能要困难得多。我还没有完全弄清楚该如何实现。
莱克斯·弗里德曼(Lex Fridman):
可能有一种方法。为什么不呢?我也认为在某个任务上表现糟糕也是很有吸引力的,就像逐步改进一样。一个机器人在某个任务上表现得非常糟糕,然后慢慢变得更好。即使是在运动智能方面,比如学习走路,跌倒,然后慢慢掌握。我认为这其中有非常吸引人的地方。
我们喜欢缺陷,尤其是在认知任务上。笨拙是可以的,困惑和有点傻乎乎的也是可以的。在那个空间里,我们可以找到魅力。有一种激励人心的东西,就是一个机器人表现糟糕,然后慢慢变得不那么糟糕。
这揭示了我们自身的一些特质。最终,机器人最引人注目的地方在于它像一面镜子,反映出人类的独特之处。仅仅通过观察机器人模仿人类行为的过程,你就会意识到我们是多么独特。你认为这一切的意义何在?Marc,我们为什么在这里?在你尝试创造这些类人智能系统时,你必然会思考这些重大问题。
马克·雷伯特(Marc Raibert):
我不知道。我认为你必须在这里享受乐趣。这是我所知道的一切,否则就是浪费。没错。
莱克斯·弗里德曼(Lex Fridman):
这段旅程很短,所以尽情享受吧。Mark,我是你的忠实粉丝,能和你对话是我的荣幸。你的工作多年来一直令人惊叹,我迫不及待地想看到你在人工智能研究所的成果。我会急切地等待你的视频、演示以及下一次机器人展示会,也许到时候 Atlas 和 Optimus 会一起亮相。
马克·雷伯特(Marc Raibert):
这没问题,我很乐意。