We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 当机器能自言自语:一年12场AI比赛后,深聊Agent、具身智能边界何在?-对谈Rex陈正翔-Vol60

当机器能自言自语:一年12场AI比赛后,深聊Agent、具身智能边界何在?-对谈Rex陈正翔-Vol60

2024/12/15
logo of podcast 脑放电波

脑放电波

AI Deep Dive AI Chapters Transcript
#ai product innovation#artificial intelligence and machine learning#ai entrepreneurship challenges#ai integration in product development#ai in creative process#biotechnology and neuroscience#ai market trends People
R
Rex 陈正翔
托马斯白
Topics
@Rex陈正翔 :Agent 的能力可能超出我们的想象和道德伦理,在实际应用中,需要考虑安全性和伦理问题。在开发轮椅项目过程中,采用AI加硬件的思路,利用Agent调用工具完成任务,并使用多模态模型提升用户体验。同时,他反思了传统硬件加AI的思路,认为AI加硬件更适合创业者,并对端到端技术路线提出质疑,认为其存在数据过拟合和数据收集难题。他认为,无监督学习,尤其是强化学习,更适合机器人训练,并看好开源力量推动机器人行业发展。他认为人形机器人从结构上并不复杂,未来可能在华强北组装。 @托马斯白 :AI加速了个人创造力,推动了创业项目的发展。他认为,多模态模型是未来,但现状可能需要多个模型协作。他回顾了巨身智能领域过去一年的进展,包括多模态、远程操控、动作克隆等,并对端到端技术路线提出质疑。他认为,家用人形机器人的价格和实用性是关键,并看好小团队创业的机会。 @Nixon :对多模态模型的应用和挑战进行了分析,认为端到端模型存在数据过拟合和数据收集难题,并对未来多模态模型的应用前景进行了展望。 Rex陈正翔:通过参加黑客马拉松,快速获得产品原型和用户反馈,并获得投资。他反思了开厂模式,转向Agent加硬件的思路,并对硬件解偶后可以用语言描述控制进行了探讨。他认为,多模态模型可以取代唤醒词,并可以识别非语言的声音。他认为,端侧小模型触发,云端大模型解决复杂问题,模型间协作无需复杂算法。他认为,端到端语音模型即将到来,现有工程工作可能被推翻。他认为,Agent的能力可能超出想象,引发伦理问题。他回顾了巨身智能领域过去一年的进展,并对端到端技术路线提出质疑。他认为,家用人形机器人的价格和实用性是关键,并看好小团队创业的机会。他认为,AI工具帮助一个人完成复杂项目,并对超级个体和复仇者联盟模式进行了探讨。他认为,文科生的价值被低估,并分享了自己的人生经历。

Deep Dive

Agent 的边界与超级小团队的崛起:一次与AI Hackathon 冠军的对话

我最近与一位特殊的硬件创业者Rex陈正翔深入交流,他过去一年在AI Hackathon中斩获无数冠军。这次对话,我们从他设计的轮椅原型机出发,探讨了Agent、具身智能、多模态、端侧模型以及“Always on”等技术热词背后的真实边界,以及为何在拥有独立完成软硬件开发能力后,他并不认可“超级个体”的叙事。

Agent 的能力:超出想象的边界

Rex的轮椅原型机并非简单的代步工具,而是集成了Agent技术的具身智能产品。它能够自动驾驶,识别环境,并根据模糊指令(例如“去阳台”)将使用者带到目的地。更令人印象深刻的是,它可以操控用户的手机,完成拨打电话、解锁智能门锁等操作。这体现了Agent的执行能力——它不仅能“思考”,更能“动手”。

然而,Agent的能力也带来了伦理挑战。Rex设想了一个极端场景:如果轮椅识别到使用者跌倒,它是否应该自行引发火灾来触发火警救援?这凸显了Agent潜在行为可能超出我们想象和道德伦理的边界,在实际应用中,安全性和伦理问题至关重要。

AI 加硬件:更适合创业者的思路

在开发轮椅的过程中,Rex采用了AI加硬件的思路,而非传统的硬件加AI。他认为,后者更适合大型企业,因为需要在高质量的硬件基础上叠加AI功能。而AI加硬件则更适合创业者,因为它从一开始就将AI作为核心,并以此构建硬件功能。

他详细解释了这种思路的优势:通过Agent调用工具,轮椅可以完成各种复杂任务。多模态模型的引入,则进一步提升了用户体验,例如通过观察使用者的凝视和非语言声音(如喘息声),来判断其状态,并做出相应反应。

对端到端技术的质疑:数据过拟合与收集难题

Rex对当前流行的端到端技术路线持质疑态度。他认为,端到端模型在训练过程中容易出现数据过拟合,尤其是在机器人领域,收集高质量、多样化的训练数据极其困难。他更倾向于无监督学习,特别是强化学习,因为它可以在虚拟环境中生成大量数据,并通过奖励和惩罚机制来训练机器人。

开源力量:机器人行业的未来

Rex看好开源力量在推动机器人行业发展中的作用。他认为,由于机器人技术的复杂性,不可能被少数几家公司垄断。开源社区的蓬勃发展,将加速技术迭代,降低开发门槛,最终可能催生出类似于华强北的机器人组装模式。他提到的“青龙机器人”就是一个很好的例子,它是一个由国家支持的开源人形机器人项目。

超级小团队的时代:文科生的价值

Rex并不认同“超级个体”的叙事,他更相信“超级小团队”的时代已经到来。AI工具的普及,降低了开发门槛,使得小型团队也能完成复杂的项目。他强调了文科生在这一浪潮中的重要性,认为他们的创造力和表达能力是科技产品不可或缺的元素。他甚至认为,未来科技产品可能像电影一样,成为集体创作的成果。

结语:AI 工具的赋能与未来展望

这次对话让我深刻体会到AI工具正在以前所未有的速度赋能个人创造力,推动着创业项目的发展。多模态模型、Agent技术以及开源力量,将重塑机器人行业,并为小型团队创造前所未有的机会。虽然家用人形机器人距离真正普及还有距离,但未来充满希望。 我们或许不需要等待一个“超级个体”的出现,而是期待更多“复仇者联盟”式的超级小团队,共同创造一个更智能、更便捷的未来。

Chapters
Rex分享了他从电动滑板创业的成功,到非洲卖假发的迷茫,再到回归AI领域,一年参加12场AI比赛的经历。
  • Rex的电动滑板项目在Kickstarter上众筹74万美元。
  • Rex曾因中国产品优势减弱,在非洲卖假发时感到焦虑。
  • Rex回归AI领域,一年参加12场AI比赛,探索AI技术的边界。

Shownotes Transcript

和初代出海硬件创业者,过去一年拿AI Hackthon冠军最多的Rex深入聊Agent与具身智能,从一款轮椅原型机开始,理解了多模态、端侧模型、Always on等技术热词的真实边界;以及能独立完成软硬件开发之后,为什么并不认可“超级个体”的叙事?

02:00 - 十年前因为Hackthon做出全球最轻电动滑板的故事;为什么从非洲回国一年参加了12次比赛

11:00 - 以小见大:在给老人做轮椅原型机的过程中发现了Agent 和具身智能的技术边界;机器人为何要将“自毁”作为一个功能?为什么端到端不一定是对的?我们在等待开源浪潮

1:26:35 - 一个人做出机器人的体验:超级个体不一定是最优解,但超级小团队的时代来了;十年两轮创业潮,这一次理解“文科生”很重要

欢迎在评论区留言发表你的感受与看法。

听友群限时开放,扫码来,过期也**欢迎添加脑放电波小助手微信(BrainAMP01)**加群参与讨论。

人物:

  • 嘉宾:Rex陈正翔
    硬件黑客,前电动滑板品牌STARY创始人。过去一年打了12场AI Hackthon。
    现在在适老化、家庭服务方向做很多产品原型寻找PMF
  • 主播:托马斯白-脑放电波主播,资深科技营销人,前XR创业公司CMO,科技媒体特约作者; Nixon-脑放电波主播,XR产品经理,前科技媒体记者.
  • 剪辑制作:蛋卷

**节目中用到的音乐:**来自 monkeyman535 的 90's Rock Style,地址 freesound.org;来自 kjartan_abel 的 Berlin Town,地址 freesound.org;基于 CC BY 4.0 DEED 使用

参考内容:轮椅Agent的Ask Me Anything / 能做家务的机器人还有多远?/ 「多模态」的 GPT-4 和 PaLM-E 会带来什么?/ 机器人项目Dobb·E和UMI / 青龙机器人

脑放电波往期节目精选(搜索关键词可收听)

脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题,帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们,如果您对本期节目有任何疑问,欢迎您给我们留言,如果您觉得这期内容对你有所帮助,欢迎您关注点赞收藏转发,这对我们非常重要。

We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Export Podcast Subscriptions