We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode AI Agent 智能体 真相和未来 | 硅谷徐老师对话英伟达、DeepMind大模型专家(上)

AI Agent 智能体 真相和未来 | 硅谷徐老师对话英伟达、DeepMind大模型专家(上)

2023/8/16
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
J
Jim Fan
戴涵俊
硅谷徐老师
Topics
硅谷徐老师:AI革命将使编程民主化,人人皆可编程;AI不只影响程序员,还会改变人们的工作方式,例如用AI查找并解释bug;企业场景中AI智能体落地应用仍有差距,但方向正确,未来客服等领域可应用;未来几年内,基于大语言模型的软件机器人将成为一等公民,改变软件开发和企业软件的使用方式;企业需要多种模型,既包括强大的基础模型,也包括针对特定领域的模型。 Jim Fan:AI智能体的应用包括软件、游戏和物理世界(机器人);对多智能体交互感兴趣,斯坦福Smallville虚拟小镇项目展示了多智能体在社会互动中的可能性;游戏是AI智能体最容易落地的应用场景,因为在游戏中,错误反而可能是特色;AI智能体应用的挑战大部分源于基础模型能力不足,GPT-5和GPT-6有望解决许多问题;最强的闭源模型和开源模型的差距会越来越大,因为闭源模型拥有更多算力和数据,以及更先进的算法。 戴涵俊:生成模型是其研究重点,包括算法、采样和优化,以及将研究应用于实际产品;最近关注的是如何更高效地对大语言模型进行采样,以实现实时化或降低延迟;AI智能体在虚拟世界和物理世界的应用方式不同,虚拟世界应用可通过写代码实现,物理世界应用需要多模态大模型;AI智能体在企业场景应用的挑战包括延迟、评估和错误处理;通过更好的自我训练,可以降低AI智能体的幻觉问题,例如通过编译器错误信息进行自我调试;大模型更像炼金术,一些核心技术难以复制,但人才流动和经验积累会缩小差距;最强的闭源模型和开源模型的差距将会越来越大,因为闭源模型拥有更多算力和数据,以及更先进的算法,且信息不对称。 Monica:对AI智能体在游戏领域的创新进展很关注,例如AI NPC;对AI智能体最终的实现方式有疑问,例如通过代码控制还是直接控制鼠标键盘

Deep Dive

Shownotes Transcript

年初火爆一时的斯坦福 Smallville「虚拟小镇」,现在宣布正式开源。硅谷人正在 all-in(全力投入) AI 智能体,希望能够创造出一个真实存在,又让人惊喜的「西部世界」,甚至让 AI 智能体们走入寻常人家,为人类的生活和工作效率带来巨大提升。

本期「科技早知道」与「OnBoard!」串台,由硅谷徐老师和合作主播 Monica 共同主持,邀请了曾在 OpenAI 工作和实习,从事 AI 智能体、大模型研究领域的两位大牛参与录制。他们分别是英伟达高级 AI 研究科学家 Jim Fan,和谷歌 DeepMind 研究员戴涵俊。

AI 智能体何时能够进入我们的生活,面临哪些挑战?为什么当今的大模型更像是「炼金术」? Llama 2 为何刚一发布就刺激大量创新出现? 在 AI 研究的道路上,如何避免被「贫穷限制了想象」?如果你想通过硅谷 AI 一线精英从业者那里了解未来即将发生的事情,这期节目一定不能错过。

(考虑到节目时间总长,分为上下两期发布,你现在听到的是上半期。下半期将于次日发布。由于话题专业性和嘉宾表达习惯,在本期节目中你可能会听到更多英文术语,请听友见谅。不明白的可以在小宇宙上留言提问,我们会尽力回答!)

CS PHD 的车牌 图:CS PHD车牌

主要话题 [03:55] 嘉宾个人+主攻方向/项目介绍 [11:48] Agent(AI 智能体)应该具备哪些核心构成? [16:00] 在企业场景里,有哪些和 AI 智能体有关的尝试?遇到哪些挑战? [21:43] 从 AINPC 和斯坦福虚拟小镇,看 AI 智能体技术在游戏方面的创新进展 [31:19] AI 写代码的精准度,何时能够追上人类工程师的水平? [39:11] 在充分利用 AI 智能体的未来,软件的世界会被怎样改变? [47:48] AI 智能体的市场,会出现「赢家通吃」现象吗? [54:20] Meta 的 Llama 2 问世,为何立刻刺激了大量大模型创新? [61:01] 你的论文,OpenAI 半年前就玩过了:开源和闭源模型差距只会越来越大 [63:57] 大模型像炼金,顶级人才都在 OpenAI、Google、Anthropic 之间流动 [67:57] 基础模型越来越强,特定领域模型的壁垒还存在吗?

本期人物 Jim Fan,英伟达高级 AI 研究科学家,曾在 OpenAI 实习,博士期间就读于斯坦福大学 戴涵俊,Google DeepMind 研究员,曾在 OpenAI 工作,博士期间就读于乔治亚理工大学 硅谷徐老师,硅谷连续创业者、人工智能高管、斯坦福商学院客座讲师,「科技早知道」主播 |推特:@H0wie_Xu| 微信公众号:硅谷云| AI 英文博客:howiexu.substack.com Monica,播客节目「Onboard!」主理人,美元 VC 投资人,前 AWS 硅谷团队+AI 创业公司打工人,公众号:M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学

延伸阅读

往期节目

加入我们 声动活泼正在招聘「节目监制」和「声音设计师」,查看详细讯息请 点击链接) 。如果你正准备在相关领域发挥专长、贡献能量,请联系我们。

欢迎加入声动胡同会员计划) 成为声动活泼会员,支持我们独立而无畏地持续创作,并让更多人听到这些声音。 支付 ¥365/年) 成为声动胡同常住民。加入后,你将会在「声动胡同」里体验到专属内容、参与社群活动,和听友们一起「声动活泼」。

在此之前,也欢迎你成为声动胡同闲逛者) ,免费体验会员内容、感受社群氛围。 了解更多会员计划详情,我们在声动胡同等你。)

幕后制作 监制:杜晨、刘灿、东君、闻晓(实习) 后期:迪卡普里鑫、六工(实习) 运营:瑞涵、Babs 设计:饭团

商务合作 声动活泼商务合作咨询)

关于声动活泼 用声音碰撞世界。声动活泼致力于为人们提供源源不断的思考养料。 我们还有这些播客:声东击西)、What's Next|科技早知道)、声动早咖啡)、商业WHY酱)、跳进兔子洞)、反潮流俱乐部)、泡腾 VC)、吃喝玩乐了不起) 如果你想获取热门节目文字稿,请添加微信公众号 声动活泼 如果想与我们交流,欢迎到即刻)找到我们 也期待你给我们写邮件交流,邮箱地址是:[email protected]) 如果你喜欢我们的节目,欢迎 打赏) 支持,或把我们的节目推荐给朋友

Special Guests: Jim Fan, Monica, and 戴涵俊.