近日,腾讯公司的一项新研究登上了 Nature 子刊封面,引发了广泛关注。这项研究让两只机器狗进行 “大逃杀” 比赛,展示了机器狗在复杂环境中的自主决策和战斗能力。比赛过程中,机器狗展现了多种策略,甚至在研究人员加入战斗后仍能继续进行。
机器狗技术的发展可以追溯到几年前,当时全球机器人开发领域的头部公司波士顿动力推出了 Spot,引起了广泛关注。2020 年,瑞士 ANYbotics 公司设计的机器狗 ANYmal 登上了 Science 子刊封面,展示了其在复杂环境中的表现。同年,腾讯 Robotics X 实验室推出了 Jamoca,成为国内首个能完成走梅花桩复杂挑战的机器狗。
腾讯的这项新研究进一步推动了机器狗技术的发展。研究团队采用了一种基于深度强化学习的 “多专家学习体系结构”(MELA),使机器狗能够在复杂环境中自主决策和适应变化。具体来说,MELA 通过一组经过训练的专家技能初始化,然后通过门控神经网络(GNN)学习这些技能的组合,生成自适应技能。在比赛过程中,MELA 不断混合多种深度神经网络(DNN),动态合成新的 DNN,以产生适应环境变化的行为。
这一研究的技术细节包括:
- 底部层控制:使用转矩控制打造关节阻抗,确保机器狗在不同地形上的稳定性。
- 顶部层控制:指定 DNN,确定关节固定点,调节姿势和关节转矩,从而建立力与环境的相互作用。
- 多专家学习体系结构:通过深度强化学习,从一组专家技能中学习生成自适应技能,确保机器狗在不同环境中的灵活性和适应性。
通过这样的框架,研究团队在机器狗身上成功演示了多种运动技能,比如在平路、楼梯、跷跷板、砾石堆等路面自主进行连贯的小跑、转向和跌倒后起身。同时,机器狗还展示了 MELA 生成行为的优势,能够适应一些不可见的、完全陌生的场景。
机器狗技术的进步不仅在实验室中得到了验证,也在多个实际应用场景中展现了其潜力。机器狗在安防巡检、物流运输、教育科研等领域的应用已经初见成效。例如,云深处科技设计的 “绝影” 机器狗在地震等自然灾害中的表现,使其成为救援行动中的工具。
与其他机器人技术相比,机器狗在灵活性和适应性方面具有优势。传统的轮式机器人在复杂地形上往往表现不佳,而机器狗则能够应对各种地形变化。此外,机器狗的自主决策能力使其在无人值守的环境中表现出色,减少了对人类操作的依赖。

