We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Inside Deep Research with Isa Fulford: Building the Future of AI Agents

Inside Deep Research with Isa Fulford: Building the Future of AI Agents

2025/4/24
logo of podcast No Priors: Artificial Intelligence | Technology | Startups

No Priors: Artificial Intelligence | Technology | Startups

AI Deep Dive AI Chapters Transcript
People
I
Isa Fulford
Topics
Isa Fulford: 我和团队大约一年前开始研发 Deep Research,起初的想法是将内部先进的强化学习算法应用于日常用户的任务,例如在线浏览和信息整合。我们最初关注的是信息合成和阅读型任务,因为许多知识工作者都需要这些能力,而且这也被认为是AGI的必要前提。Deep Research 的开发是一个迭代过程,包括创建高质量的数据集、训练模型以及开发辅助模型进行网络浏览的工具。我们使用了人工训练和合成数据集,并设计了评估数据集的方法。Deep Research 的工具集包括基于文本的浏览器、访问嵌入式图像和PDF的能力,以及Python工具进行分析和计算。强化学习微调能提升模型在特定任务上的表现,但也要权衡成本和收益,只有在任务与现有模型训练数据差异巨大,或任务对业务至关重要时,才值得尝试。信息收集和研究的专业知识在各个领域都存在,Deep Research 通过关注任务结果而非过程来利用这些知识。我们采取了广泛的用户和领域专家参与的策略,这使得模型能够在多个领域取得成功。Deep Research 的主要失败模式是幻觉,但由于输出全面且耗时,用户对其信任度较高,并通过引用来降低风险。未来理想的代理应该能够进行研究并代表用户采取行动,这需要解决能力和安全问题。未来代理可能需要设置护栏和确认机制,以在提升能力的同时保证安全。Deep Research 未来改进方向包括扩展到可执行操作、访问私有数据以及提升现有能力。OpenAI 的文化鼓励员工将个人想法转化为产品,Deep Research 就是一个例子。Deep Research 在用户未预料到的领域被应用,这验证了其价值。Deep Research 在代码搜索和数据分析方面表现出色,这得益于其强大的基础模型和浏览能力。代理的记忆功能对于处理复杂任务至关重要,可以避免重复输入信息。强化学习在构建通用人工智能方面具有高效性和潜力,但数据质量和工具创建仍然是挑战。构建通用人工智能代理面临着安全问题、上下文管理和数据工具创建等挑战。Deep Research 适用于特定且明确的查询,尤其是在需要整合在线信息的情况下,并且能够生成比一般模型更全面的输出。Deep Research 的成功之处在于其在浏览任务上的有效性,但其失败模式有时也令人惊讶。Deep Research 的速度是一个需要改进的方面,未来将寻求在速度和深度之间取得平衡。未来一年内,人们可能会对代理能够完成的任务感到惊讶,并出现更统一的代理体验。统一的代理体验能够简化用户与不同代理的交互,并提供更自然的协作方式。

Deep Dive

Shownotes Transcript

On this episode of No Priors, Sarah sits down with Isa Fulford, one of the masterminds behind deep research. They unpack how the initiative began, the role of human expert data, and what it takes to build agents with real-world capability and even taste. Isa shares the differences between deep research and OpenAI’s o3 model, the challenges around latency, and how she sees agent capabilities evolving. Plus, OpenAI has announced that deep research is free for all US users starting today.

Sign up) for new podcasts every week. Email feedback to [email protected]

Follow us on Twitter: @NoPriorsPod) | @Saranormous) | @EladGil) | @IsaFulf)

Show Notes:

0:00 Deep research’s inception & evolution

6:12 Data creation 

7:20 Reinforcement fine-tuning

9:05 Why human expert data matters

11:23 Failure modes of agents

13:55 The roadmap ahead for Deep Research

18:32 How do agents develop taste? 

19:29 Experience and path to building a broadly capable agent

22:03 Deep research vs. o3

25:55 Latency

27:56 Predictions for agent capabilities