We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode EP324-站在“人形机器人”的风口:我们究竟离真正的“具身智能”还有多久?

EP324-站在“人形机器人”的风口:我们究竟离真正的“具身智能”还有多久?

2025/4/8
logo of podcast 无时差研究所

无时差研究所

AI Deep Dive Transcript
People
A
A老师
王妈妈
Topics
A老师:我从事具身智能领域一年有余,此前专注于大模型研发。转向具身智能源于其直接提升生产力的潜力,特别是解放体力劳动和重复性劳动的巨大可能性。目前团队致力于多模态大模型的研发,目标是实现机器人对听觉、视觉、语言等多种模态信息的实时处理和交互,从而实现更复杂的指令理解和执行。 我认为具身智能与传统人工智能的关键区别在于其输出和应用场景。传统AI主要通过信息流输出结果,而具身智能则直接与物理世界交互,其输出直接影响物理环境。虽然两者底层AI原理相通,但具身智能对学习算法提出了更高要求,人们期待其学习方式与人类更为接近,但目前仍主要依赖传感器数据进行学习。 人类与机器学习方式存在根本差异。人类学习语言时会调动内部认知、经验和感受,而机器学习则依赖符号系统和数据关联。具身智能的意义在于,它能否突破单纯的数据驱动,实现对物理世界的更深层次理解,从而提升泛化能力。目前,具身智能最大的瓶颈在于任务泛化能力不足,这与数据不足和算法不成熟密切相关。数据不足导致模型难以覆盖足够多的场景,算法不成熟则限制了模型对物理世界的理解和预测能力。 我认为具身智能的实现是可行的,只是技术上存在诸多挑战。数据和算法是相辅相成的,高效的算法才能更好地利用数据,而充足的数据才能验证算法的有效性。目前,具身智能的训练方法多种多样,包括遥操作、合成数据、世界模型和强化学习等,每种方法都有其优缺点,没有一种方法能够一步到位。 我对于具身智能的长期发展持乐观态度,预计在未来十年到二十年内,该领域将取得显著进展。虽然目前技术瓶颈依然存在,但一些突破性进展的出现,例如ChatGPT和DeepSeek,表明具身智能的快速发展并非不可能。 关于伦理问题,我认为具身智能本身是中性的,但其应用可能带来社会变革。人们对AI失控的担忧是合理的,但目前的技术水平距离真正意义上的AI失控还很遥远。 柯柯:作为主持人,我更关注具身智能的商业化应用和社会影响。目前,具身智能在一些垂直领域已经取得了初步的商业化成功,例如工厂自动化和药房自动化。但这些应用场景通常较为单一,缺乏泛化能力。 具身智能在自动驾驶领域也展现出巨大的潜力,因为该领域拥有大量的数据和成熟的算法。此外,具身智能也开始在娱乐和服务领域崭露头角,例如商演机器人和陪伴机器人。这些应用场景更多地关注具身智能的情绪价值,而非单纯的生产效率。 我个人认为,具身智能的未来发展充满机遇和挑战。一方面,技术进步将不断推动具身智能的应用场景拓展和泛化能力提升;另一方面,伦理和社会问题也需要引起足够的重视,以确保具身智能技术能够造福人类。 王妈妈:作为主持人,我更关注具身智能的概念澄清和大众理解。具身智能的核心在于智能体与物理环境的直接交互,其输出直接影响物理世界。这与传统人工智能通过信息流输出结果有本质区别。 具身智能可以分为大脑和小脑两个部分。大脑负责任务规划和决策,小脑负责本体操控和运动控制。目前,许多公司专注于小脑的研发,例如宇树机器人,致力于提升机器人的运动控制能力。而A老师团队则专注于大脑的研发,致力于提升机器人的决策和规划能力。 关于具身智能的训练方式,目前主要包括遥操作、合成数据、世界模型和强化学习等。这些方法各有优缺点,需要根据具体情况选择合适的训练方式。 我个人认为,具身智能的未来发展将对社会生产关系带来深刻变革,但这种变革不一定是负面的。具身智能作为一种工具,其最终如何影响社会,取决于人类如何使用它。

Deep Dive

Shownotes Transcript

**【Insider】**今年春节,宇树机器人穿上了大花袄扭起秧歌、给全国人民拜年;3月,建立包括具身智能在内的未来产业投入增长机制被写进了政府工作报告。如此种种,似乎都在宣告着那些有机器人参与的未来即将到来。 近日金沙江创投主管合伙人朱啸虎对人形机器人行业存在泡沫的的发声也引发了大家的热议。朱啸虎在访谈抛出了重磅炸弹,声称“正批量退出人形机器人公司”“机器人共识集中但商业化不明”。 本期节目,我们将和国内相关领域顶尖研发机构的从业者A老师,一起聊聊具身智能到底是什么,现在究竟发展成了什么样,在可预见的将来,它将给我们普通人的生活带来怎样的影响?希望各位听友能够既对这一前沿科技有所了解、参与讨论不怵头,也能减少对技术发展带来的社会问题的焦虑! 接下来你将听到: ⭕️ 传统人工智能与具身智能的差别:关键在于场景与输出 ⭕️ 人与具身学习方法的差别:具身智能的一切都是指向「能指」 ⭕️ 「大脑」和「小脑」:把大象放进冰箱分三步属于「大脑」 ⭕️ 「大脑」的主要训练方式有哪些:「傻儿子终于会插秧啦」 ⭕️ 目前最大瓶颈:仍在群山环绕中,数据与算法都要往前走 ⭕️ 每当取得技术突破涌现,其他从业者会惋惜到喝大酒嘛? ⭕️ 关于实际应用:或在自动驾驶首先应用 也别忽略情绪价值 ⭕️ 关于伦理问题的恐慌:建议不用太恐慌~ 或许因为具身智能的发展,我们能够更加了解何谓「智能」,从而更加了解我们自己。关于具身智能的发展、应用和社会影响,欢迎在评论区和我们讨论互动~ 无时差研究所六周年周边来啦! 欧洲NFC有机苹果汁 x 无时差研究所超有态度环保袋 购买链接:https://my5353.com/kptMO 欢迎关注「无时差研究」所同名小红书、微博 如何加入听友群? 微信公众号搜索「无时差研究所」,后台回复「入群」,扫描小助手二维码就可以啦! “每一次准备播客的过程,都带我们走到了某一个小小议题的门口,而每个嘉宾都是一把钥匙,ta 领着我们看到了全新的、更大的世界,ta 让我对世界多了一些了解,即便每次都有一点点,它都成为了我们生命里的一个小小刻度,也希望它也能帮助到你~” 如果你喜欢我们,欢迎关注无时差研究所同名公众号给我们送来你的心意哦!同时欢迎在全平台搜索并订阅无时差研究所。