We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

AI Agent 智能体真相和未来 | 硅谷徐老师对话英伟达、DeepMind大模型专家（上）

2023/8/16

What's Next｜科技早知道

AI Deep Dive AI Chapters Transcript

People

Jim Fan

戴

戴涵俊

硅

硅谷徐老师

Topics

硅谷徐老师：AI革命将使编程民主化，人人皆可编程；AI不只影响程序员，还会改变人们的工作方式，例如用AI查找并解释bug；企业场景中AI智能体落地应用仍有差距，但方向正确，未来客服等领域可应用；未来几年内，基于大语言模型的软件机器人将成为一等公民，改变软件开发和企业软件的使用方式；企业需要多种模型，既包括强大的基础模型，也包括针对特定领域的模型。 Jim Fan：AI智能体的应用包括软件、游戏和物理世界（机器人）；对多智能体交互感兴趣，斯坦福Smallville虚拟小镇项目展示了多智能体在社会互动中的可能性；游戏是AI智能体最容易落地的应用场景，因为在游戏中，错误反而可能是特色；AI智能体应用的挑战大部分源于基础模型能力不足，GPT-5和GPT-6有望解决许多问题；最强的闭源模型和开源模型的差距会越来越大，因为闭源模型拥有更多算力和数据，以及更先进的算法。戴涵俊：生成模型是其研究重点，包括算法、采样和优化，以及将研究应用于实际产品；最近关注的是如何更高效地对大语言模型进行采样，以实现实时化或降低延迟；AI智能体在虚拟世界和物理世界的应用方式不同，虚拟世界应用可通过写代码实现，物理世界应用需要多模态大模型；AI智能体在企业场景应用的挑战包括延迟、评估和错误处理；通过更好的自我训练，可以降低AI智能体的幻觉问题，例如通过编译器错误信息进行自我调试；大模型更像炼金术，一些核心技术难以复制，但人才流动和经验积累会缩小差距；最强的闭源模型和开源模型的差距将会越来越大，因为闭源模型拥有更多算力和数据，以及更先进的算法，且信息不对称。 Monica：对AI智能体在游戏领域的创新进展很关注，例如AI NPC；对AI智能体最终的实现方式有疑问，例如通过代码控制还是直接控制鼠标键盘

Deep Dive

Shownotes Transcript

年初火爆一时的斯坦福 Smallville「虚拟小镇」，现在宣布正式开源。硅谷人正在 all-in（全力投入） AI 智能体，希望能够创造出一个真实存在，又让人惊喜的「西部世界」，甚至让 AI 智能体们走入寻常人家，为人类的生活和工作效率带来巨大提升。

本期「科技早知道」与「OnBoard!」串台，由硅谷徐老师和合作主播 Monica 共同主持，邀请了曾在 OpenAI 工作和实习，从事 AI 智能体、大模型研究领域的两位大牛参与录制。他们分别是英伟达高级 AI 研究科学家 Jim Fan，和谷歌 DeepMind 研究员戴涵俊。

AI 智能体何时能够进入我们的生活，面临哪些挑战？为什么当今的大模型更像是「炼金术」？ Llama 2 为何刚一发布就刺激大量创新出现？在 AI 研究的道路上，如何避免被「贫穷限制了想象」？如果你想通过硅谷 AI 一线精英从业者那里了解未来即将发生的事情，这期节目一定不能错过。

（考虑到节目时间总长，分为上下两期发布，你现在听到的是上半期。下半期将于次日发布。由于话题专业性和嘉宾表达习惯，在本期节目中你可能会听到更多英文术语，请听友见谅。不明白的可以在小宇宙上留言提问，我们会尽力回答！）

CS PHD 的车牌图：CS PHD车牌

主要话题 [03:55] 嘉宾个人+主攻方向/项目介绍 [11:48] Agent（AI 智能体）应该具备哪些核心构成？ [16:00] 在企业场景里，有哪些和 AI 智能体有关的尝试？遇到哪些挑战？ [21:43] 从 AINPC 和斯坦福虚拟小镇，看 AI 智能体技术在游戏方面的创新进展 [31:19] AI 写代码的精准度，何时能够追上人类工程师的水平？ [39:11] 在充分利用 AI 智能体的未来，软件的世界会被怎样改变？ [47:48] AI 智能体的市场，会出现「赢家通吃」现象吗？ [54:20] Meta 的 Llama 2 问世，为何立刻刺激了大量大模型创新？ [61:01] 你的论文，OpenAI 半年前就玩过了：开源和闭源模型差距只会越来越大 [63:57] 大模型像炼金，顶级人才都在 OpenAI、Google、Anthropic 之间流动 [67:57] 基础模型越来越强，特定领域模型的壁垒还存在吗？

本期人物 Jim Fan，英伟达高级 AI 研究科学家，曾在 OpenAI 实习，博士期间就读于斯坦福大学 戴涵俊，Google DeepMind 研究员，曾在 OpenAI 工作，博士期间就读于乔治亚理工大学 硅谷徐老师，硅谷连续创业者、人工智能高管、斯坦福商学院客座讲师，「科技早知道」主播｜推特：@H0wie_Xu｜微信公众号：硅谷云｜ AI 英文博客：howiexu.substack.com Monica，播客节目「Onboard!」主理人，美元 VC 投资人，前 AWS 硅谷团队+AI 创业公司打工人，公众号：M小姐研习录 (ID: MissMStudy) 主理人 | 即刻：莫妮卡同学

延伸阅读

关于多模态：给静态大预言模型增加视觉能力的论文)
关于openai早先用game来解锁泛化能力的论文)

往期节目

加入我们 声动活泼正在招聘「节目监制」和「声音设计师」，查看详细讯息请点击链接) 。如果你正准备在相关领域发挥专长、贡献能量，请联系我们。

欢迎加入声动胡同会员计划) 成为声动活泼会员，支持我们独立而无畏地持续创作，并让更多人听到这些声音。支付 ¥365/年) 成为声动胡同常住民。加入后，你将会在「声动胡同」里体验到专属内容、参与社群活动，和听友们一起「声动活泼」。

在此之前，也欢迎你成为声动胡同闲逛者) ，免费体验会员内容、感受社群氛围。了解更多会员计划详情，我们在声动胡同等你。)

幕后制作 监制：杜晨、刘灿、东君、闻晓（实习）后期：迪卡普里鑫、六工（实习）运营：瑞涵、Babs 设计：饭团

商务合作 声动活泼商务合作咨询)

关于声动活泼 用声音碰撞世界。声动活泼致力于为人们提供源源不断的思考养料。我们还有这些播客：声东击西)、What's Next｜科技早知道)、声动早咖啡)、商业WHY酱)、跳进兔子洞)、反潮流俱乐部)、泡腾 VC)、吃喝玩乐了不起) 如果你想获取热门节目文字稿，请添加微信公众号 声动活泼 如果想与我们交流，欢迎到即刻)找到我们也期待你给我们写邮件交流，邮箱地址是：[email protected]) 如果你喜欢我们的节目，欢迎打赏) 支持，或把我们的节目推荐给朋友

Special Guests: Jim Fan, Monica, and 戴涵俊.

AI Agent 智能体 真相和未来 | 硅谷徐老师对话英伟达、DeepMind大模型专家（上） 01:13:53 Share

What's Next｜科技早知道

Deep Dive

Shownotes Transcript

AI Agent 智能体真相和未来 | 硅谷徐老师对话英伟达、DeepMind大模型专家（上）