对于从事人形机器人运动控制的朋友来说,Xue Bin**(Jason)Peng** 的名字一定不会陌生。过去一年中,我们看到大量高质量的人形机器人拟人演示出现在各个平台上,而这些演示背后的技术基础,很多都可以追溯到 Jason 早期提出的一系列开创性工作,包括 DeepMimic、AMP(Adversarial Motion Priors) 和 ASE(Adversarial Skill Embedding) 等。
这些方法极大地降低了人形机器人模仿学习(Imitation Learning)的技术门槛,可以说,Jason 的研究奠定了今天人形机器人实现灵活、自然运动控制的重要基础。Xue Bin(Jason)Peng目前是西蒙弗雷泽大学(Simon Fraser University, SFU)的助理教授,同时也是英伟达(NVIDIA)的研究科学家。
他的研究工作主要位于计算机图形学与机器学习的交叉领域,重点关注使用强化学习进行虚拟角色运动控制。值得一提的是,Jason 的学术成长路径也极具代表性。他的导师——Michiel van de Panne、Pieter Abbeel和Sergey Levine,分别是角色动画(Character Animation)和机器人强化学习(Robotics + RL)领域最具影响力的顶尖教授。
Jason 在硕士阶段,师从不列颠哥伦比亚大学(UBC)的图形学专家 Michiel van de Panne,这位教授不仅是 Character Animation 领域的奠基人物之一,同时也是 Andrej Karpathy(前 Tesla AI 总监)的硕士导师和 ETH Computational Robotics Lab教授 Stelian Coros 的博士导师。
随后,他在加州大学伯克利分校(UC Berkeley)攻读博士学位,师从机器学习领域重量级学者 Sergey Levine 和 Pieter Abbeel,在强化学习(Reinforcement Learning)与机器人智能领域打下了扎实而深远的基础。
这期访谈,我们的话题覆盖Jason的研究经历以及他的几篇人形机器人全身运控的奠基性工作,包括他对未来通用控制器构建的思路以及对人形机器人硬件的建议。相信这期访谈对于从事人形机器人软硬件开发的朋友们多少会有些帮助。
本期节目也特别感谢国地共建具身智能机器人创新中心学术委员会主任张强作为特邀嘉宾主持。
以下为本文目录👇从图形学到机器人
导师的影响
从图形学到机器人的Sim2Real
机器人的挑战
怎么做Sim2Real
经典工作介绍
DeepMimic
AMP
ASE
Masked Mimic
强化学习vs模仿学习
机器人大模型
怎么看VLA?
在运控方面产业界是否超越了学术界?
未来的研究方向-通用控制器
未来的通用控制器怎么做?
Latent Space是否必要?
是否看好MOE?17. 对目前的人形机器人硬件有什么建议?
录音质量不是很好,感兴趣的朋友可以等几天在公众号“石麻笔记”上查看中文文字整理,或者可以在Substack上查看英文文字记录链接如下:open.substack.com)