We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
People
A
Alex Carson
B
Benjerbeet
M
Michael Raspuzzi
V
VibeCode Zanjananda
主播
以丰富的内容和互动方式帮助学习者提高中文能力的播客主播。
Topics
主播: Anthropic推出的Claude for education,旨在通过对话式学习,培养学生的批判性思维能力,而非简单地提供答案。这解决了AI教育中可能出现的投机取巧问题,但最终学生的学习态度依然至关重要。 Benjerbeet: Claude for education的设计理念,直接解决了AI在教育领域中可能导致学生依赖快捷方式而非深入理解的核心风险。通过引导式推理而非直接给出答案,Anthropic创造了更接近数字导师而非答案引擎的产品。 Sergio Lojer: 我推出了我的新公司General Agents以及我们的第一个产品Ace。Ace是第一个实时电脑自动驾驶系统,它不是聊天机器人,而是使用鼠标和键盘以超人的速度为你完成电脑任务。Ace可以使用你电脑上的所有工具,从抓取图像到将其上传到Google Drive,它能完成人类能够完成的各种任务。 Amjad Massad: Ace令人难以置信的速度是一个巨大的突破。以往的电脑使用模型之所以没有取得商业上的重大突破,是因为它们速度缓慢且成本高昂。Ace解决了这个问题。 William Guss: Ace通过极速的全屏幕图像处理来运行。 Lindy Drope: Lindy的Swarm功能可以同时运行数百个代理,极大地提高了自动化效率。它能够在几秒钟内发送数百封个性化的电子邮件,而手动操作则需要一整天的时间。我们正在构建能够自主运行整个公司的AI员工。 Michael Raspuzzi: 我使用Lindy Loops进行了一次测试,尝试使用Perplexity和Anthropic进行一系列自定义深度研究代理。在准备我们下一次AI和健康黑客松时,我需要对不同的非侵入式成像模式进行快速更新。我输入了LFUS、FNIRS和超声波,它就完成了。手动操作需要一到两个小时,使用AI工具需要25分钟,而使用Lindy AI只需要两分钟。 Alex Carson: 代理集群允许AI代理复制自身以同时处理数百个任务。这项新功能通过允许代理在大型数据集上进行分治,立即扩展了AI自动化的可能性,而无需复杂的编码或自定义API连接。你提供任务列表,Lindy会自动生成重复的代理来同时处理每个项目。 Manny Medina: 使用几行代码,AI构建者可以专注于创建令人惊叹的代理,而我们则负责他们背后的业务引擎。 VibeCode Zanjananda: 创造并分享的喜悦是世界上最美好的感觉之一。通过VibeCode,我们希望让每个人都能体验到这种感觉。 Nicholas Charrière: Mocha采用了一种高度意见化的方式,基于我们在构建Pinterest和Nextdoor等顶级网络产品方面的经验。你描述结果,Mocha负责其余工作。

Deep Dive

Chapters
Anthropic's Claude for Education aims to improve learning by acting as a Socratic partner, prompting critical thinking instead of simply providing answers. It's currently being piloted at several universities.
  • Claude for Education is designed to encourage critical thinking.
  • It's being piloted at Northeastern University, the London School of Economics, and Champlain College.
  • The approach addresses concerns about AI encouraging shortcut thinking in education.

Shownotes Transcript

五家新兴公司标志着人们使用和构建 AI 的方式发生了巨大转变。General Agents 推出了 ACE,这是一种计算机自动驾驶系统,它使用鼠标和键盘比以往任何系统都快地完成任务。Lindy 推出了 Swarms,允许克隆代理同时处理数百个任务,从研究到外展。还有 Vibecode 和 Mocha。由以下机构提供:KPMG – 访问 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠https://kpmg.com/ai⁠⁠⁠⁠⁠⁠ 了解更多关于 KPMG 如何帮助您利用我们的 AI 解决方案创造价值的信息。Vanta - 简化合规性 - ⁠⁠⁠⁠⁠⁠⁠https://vanta.com/nlw来自 Superintelligent 的代理准备情况审核 - 访问 https://besuper.ai/ 以请求您公司的代理准备情况评分。AI Daily Brief 帮助您了解 AI 中最重要的新闻和讨论。订阅 AI Daily Brief 的播客版本,无论您在哪里收听:https://pod.link/1680633614订阅时事通讯:https://aidailybrief.beehiiv.com/加入我们的 Discord:https://bit.ly/aibreakdown </context> <raw_text>0 今天在 AI Daily Brief 上,我们将介绍五家新兴公司,它们展示了 AI 中一些最重要的主题和趋势。在此之前,在新闻头条中,一个 AI 实际上要求你思考。AI Daily Brief 是一款关于 AI 中最重要的新闻和讨论的每日播客和视频。要加入讨论,请关注我们节目说明中的 Discord 链接。♪

欢迎回到 AI Daily Brief 头条新闻版,大约五分钟内即可获得您所需的所有每日 AI 新闻。我们今天首先介绍 Anthropic,他们推出了一款针对教育的 Claude 特别版。这款名为“Claude for education”的产品旨在为大学生提供增强型 AI 学习体验。基本上,Anthropic 想要实现的目标,以及他们的关键见解是,虽然学生们纷纷将 AI 作为一种教育工具,但仅仅阅读 AI 的输出并不一定是一种很好的学习方式。

相反,这种新的学习模式将把 Claude 定位为一个苏格拉底式的伙伴,它参与对话并鼓励批判性思维。

Benjerbeet 写道,这种方法直接解决了许多教育工作者认为 AI 在教育中的核心风险,即像 ChatGPT 这样的工具鼓励捷径思维而不是更深入的理解。通过设计一个故意隐瞒答案以支持引导推理的 AI,Anthropic 创造的东西更像是一个数字导师而不是一个答案引擎。现在,Claude for Education 正在东北大学、伦敦政治经济学院和尚普兰学院的试点项目中推出。

东北大学的试点项目尤其雄心勃勃,该工具将在其 13 个全球校区为 5 万名学生和教职员工提供。该校已承诺在其 2025 年学术计划中将自己置于 AI 增强型教育的最前沿,这是有道理的,因为他们的校长 Joseph E. Aoun 最近出版了一本关于 AI 对教育影响的书籍。

Anthropic 写道,这几乎是经典之作。Andrew Allen 写道,当然,最终,这很大程度上取决于学生。他们是否会花时间真正尝试参与,或者他们只是会走捷径?

但最终,模型无法解决这个问题,就像教育工作者最终也无法解决这个问题一样。因此,我认为看到这些类型的实验和方法能够真正帮助那些愿意投入时间的人是很好的。

接下来是一个融资故事。文本到应用程序平台 Replit 正在洽谈以 30 亿美元的估值融资。彭博社报道称,该公司正寻求在一轮融资中筹集约 2 亿美元,这将使其目前的估值翻三倍。如果这轮融资完成,这将是对 vibe 编码工具是 AI 最热门的垂直领域之一的重大肯定,顺便说一句,我们将在今天的主题部分详细讨论这一点。Replit 上一次融资是在 2023 年 4 月,B 轮融资以 11 亿美元的估值筹集了 9700 万美元。

AnySphere 是竞争平台 Cursor 的创建者,目前也正在融资,据报道正在寻求 100 亿美元的估值。老实说,鉴于编码助手目前的增长速度,两家公司都不应该有任何问题能够达到目标。在 A16Z 最近对 AI 应用程序的调查中,他们发现编码平台的流量呈绝对抛物线式增长。Replit 首席执行官 Amjad Massad 最近证实了这波新用户正在转化为付费客户,他在 Reddit 上发布了一张活跃付费部署的图片,并表示:“……我见过的最平滑的指数曲线之一。”

说到 AI 业务,数据标注服务公司 Scale.ai 预计今年其收入将翻一番。据彭博社报道,该公司 2024 年的收入达到 8.7 亿美元,到年底已达到 15 亿美元的年化率。他们预计增长将持续下去,预测今年的收入将达到 20 亿美元。他们目前还在洽谈一项要约收购,该收购将使公司估值达到 250 亿美元,这将比他们去年 5 月完成的最后一轮融资的估值高出 80%。该公司被定位为 AI 培训的“优步”。

他们维持着一个庞大的承包商团队,为微软和 OpenAI 等公司完成标注任务。

最后,来自谷歌的一些有趣的消息。他们 AI 部门的重组仍在继续,Notebook LM 的负责人将接管 Gemini 产品。Semaphore 报道称,自谷歌聊天机器人项目还被称为 Bard 以来一直领导该项目的 Sissy Hsiao 将立即辞职。谷歌实验室负责人 Josh Woodward 将接替她的职位。Woodward 负责 Notebook LM 的发布,当然,这成为谷歌 AI 时代第一个突破性的成功产品。DeepMind 首席执行官 Demis Hassabis 在给员工的一份备忘录中表示,此举将“使我们更加专注于 Gemini 应用程序的下一个发展阶段”。

现在,这似乎最终是谷歌在组织和产品层面整合 AI 的延续。上个月,音频概述被整合为 Gemini 的一项基本功能,帮助这款旗舰助手成为谷歌 AI 产品的统一界面。在过去的六个月中,谷歌还将 Gemini 应用程序团队和 AI Studio 平台整合到 DeepMind 部门,将所有 AI 产品与他们的研究部门放在同一个保护伞下。

看,作为一个喜欢 Notebook LM 产品的人,我对那里领导层的晋升到更广泛的权力职位感到非常兴奋。所以让我们看看他们能创造什么。就目前而言,这就是今天的 AI Daily Brief 头条新闻版的全部内容。接下来是主题部分。今天的节目由 Superintelligent 和我们在 Lindy 的朋友们赞助。

在过去的几周里,你已经听我几次提到 Lindy 了。他们是一个代理构建平台,可以帮助你构建代理来自动化各种各样的功能、工作流程和服务,从数据输入到潜在客户生成到客户服务。他们基本上是一个构建未来所有代理的平台。

我们之前有一个优惠,对于 AI Daily Brief 的听众,如果您向 [email protected] 发送电子邮件,并在标题中写上“Lindy”,我们将把您与 Lindy 团队联系起来,他们可以在几天或几周内帮助您构建一个特定的定制代理,每年费用不到 20,000 美元。这是一种深入了解并体验代理的好方法。然而,今天,Lindy 宣布了一些非常酷的东西,特别是代理集群。如果你听过我的关于 AI 代理工作的“奇异博士”理论,这基本上就是它的现实版本。

与其让一个代理一次处理一个销售线索的研究,不如启动一个由 200 个 Lindy 代理组成的集群,所有这些代理都进行不同的研究并撰写定制电子邮件,这样,在几秒钟内,你就可以拥有 200 封针对不同潜在客户的定制电子邮件。我们一直在尝试使用集群进行研究、内容制作和销售。

这非常像对未来的展望。因此,如果您对 Linde 感兴趣,请向 [email protected] 发送邮件,在标题中注明 Linde,我们将立即回复您。

无论您是正在进行首次审计的初创公司创始人,还是经验丰富的安全专业人员正在扩展您的 GRC 计划,证明您对安全的承诺从未像现在这样重要或复杂。这就是 Vanta 的用武之地。企业使用 Vanta 通过自动化超过 35 个框架(如 SOC 2 和 ISO 27001)的合规性需求来建立信任。集中的安全工作流程可以将问卷调查完成速度提高 5 倍,并主动管理供应商风险。

Vanta 可以通过将您与审计师和专家联系起来以进行审计并快速建立您的安全程序来帮助您启动或扩展您的安全程序。此外,由于平台中使用了自动化和 AI,Vanta 可以为您节省时间,让您可以专注于公司建设。加入超过 9,000 家全球公司(如 Atlassian、Quora 和 Factory),他们使用 Vanta 实时管理风险并证明安全性。

在有限的时间内,本节听众可在 vanta.com/nlw 享受 Vanta 1,000 美元的优惠。网址是 v-a-n-t-a.com/nlw,可享受 1,000 美元的优惠。欢迎回到 AI Daily Brief。每天都感觉有数百万个新的酷炫 AI 初创公司推出。如此之多,以至于我们在这个节目中深入挖掘并报道全新的公司实际上是相当罕见的。

然而,在过去的几天里,我看到了一些公司,一方面它们令人印象深刻、有趣且潜力巨大,此外,它们也真正反映并讲述了目前正在塑造 AI 的关键趋势。因此,我们今天要做的就是看看这五家左右的新公司,所有这些公司都在过去 48 小时左右宣布,讨论它们或它们宣布的新产品,然后将它们放在更大的背景下。

首先,我们有 General Agents。首席执行官 Sergio Lojer(前特斯拉和谷歌 DeepMind 员工)写道:“今天,我将推出我的新公司 General Agents 及其首款产品。隆重推出 Ace,这是第一个实时计算机自动驾驶系统。Ace 不是聊天机器人。Ace 使用鼠标和键盘,以超人的速度为您完成计算机上的任务。”

顺便说一句,如果你观看这个节目,效果会更好,因为有很多例子。你应该能够在 Spotify 应用程序或 YouTube 上观看它。但 Shergil 继续说道,Ace 可以使用你计算机上的所有工具。共享的视频显示它抓取图像、将它们放入 Google Drive,以及通常人类会做的事情。

他们的预览视频还展示了交互方法。在 Premiere Pro 中,它显示用户使用 Ace 工具栏来例如将视频剪辑速度降低到 50%,使用“剪切”工具分割剪辑一次,然后导出它。同样,你使用语音指令,然后让 Ace 实际完成工作。他们指出,这不仅可以帮助提高速度和效率,还可以帮助你仍在学习如何使用的工具。

关于 Ace 还有很多其他方面,但他们强调的一大重点是它的速度。事实上,他们声称其速度比竞争对手的代理快 20 倍,使其成为他们所说的“更适合日常使用的工具”。速度绝对是吸引人们注意力的因素。Replit 首席执行官 Amjad Massad 表示:“‘令人难以置信的速度。计算机使用模型之所以没有取得重大的商业突破,是因为它们速度慢且成本高昂。这是一个巨大的突破。’”

William Guss(前 OpenAI 研究科学家,现任 General Agents 员工)写道:“当有人问它如何工作时?William 回应道:换句话说,它正在以极快的速度进行全屏幕截图图像处理。”

现在,除了速度之外,围绕它的讨论中,一些人指出,像这样的初创公司带来的进步意味着,在这个新时代,不仅仅是大实验室才能获得乐趣。Twitter 上的 F. Schumann 还指出,扩展人类创造力(延续昨天节目中的主题)是这种类型的计算机使用工具的副产品之一,正如他所说,任何人都可以操作软件,甚至不知道如何操作它。这是一个巨大的突破,当然不在我今年的宾果卡上。

因此,我认为这家初创公司代表了很多主题。总的来说,当然,代理是目前最重要的、最主要的 AI 进步类别。但更具体地说,这是通过计算机使用来扩展代理能力的想法。这是我们在去年年底开始看到的一些迹象,这似乎是向前迈出的重大一步。

显然,如果你听了昨天关于会让你彻夜难眠的五个快速变化的 AI 转变的节目,你就会听到我谈到扩展人类创造力。正如我们刚才听到的,能够与软件对话并让你的代理与你一起操作它确实扩展了一个人可以使用哪些软件工具。最后,计算机使用的速度现在超过了人类,我认为这让我们看到了未来的景象,在未来,AI 和代理不仅与人类一样高效,而且实际上在某些方面做得更好。

显然,AI 在许多方面已经做得更好,但这是一个高度直观的例子。

另一个主题,现在探索还为时过早,那就是美国最先进的代理能力能否像 Manus 等来自中国的最新版本那样具有病毒式传播性。在这种情况下,我们可能会受到一些限制,因为 General Agents 仅作为研究预览版提供,而不是作为完整产品提供,但这仍然是我将关注的事情。接下来是 Lindy,当然,虽然 Lindy 并不新鲜,但它的新 Swarm 功能是新的。我不会花太多时间在这个上面,因为我昨天已经讨论过了,但我认为联合创始人 Lindy Drope 实际上对这一点解释得很好。

她写道:

它在几秒钟内发送了 370 封不可能被忽视的个性化电子邮件,而手动操作则需要一整天的时间。我们正在构建能够自主运行整个公司的 AI 员工。

公司外部的人呢?Michael Raspuzzi 写道:第一次使用 Lindy Loops 进行测试,尝试使用困惑性和 Anthropic 的一系列自定义深度研究代理。背景信息是,我们正在为我们的下一个 AI 和健康黑客马拉松做准备,所以我想要对不同的非侵入式成像模式进行快速更新。我输入了 LFUS、FNIRS 和超声波,它就完成了。手动操作需要一到两个小时,使用 AI 工具需要 25 分钟,而使用 Lindy AI 则只需要两分钟。

来自 Alex Carson 的另一个测试。他们写道:代理集群允许 AI 代理复制自身以同时处理数百个任务。这项新功能通过允许代理在大型数据集上进行分而治之,而无需复杂的编码或自定义 API 连接,立即扩展了 AI 自动化的可能性。您提供任务列表,Lindy 会自动生成重复的代理来同时处理每个项目。

使用 YouTube 到博客文章的工作流程测试此功能显示了其令人印象深刻的潜力。我创建了一个简单的流程,当新的 URL 添加到电子表格时触发,创建一个循环来同时处理每个 URL,转录每个视频并生成格式专业的博客文章,然后返回所有已完成的文章和聊天消息。那么这里的主题是什么呢?不仅仅是代理。显然,我们已经将代理作为主要的主题进行了讨论。不,对我来说有趣的是,这实际上是我的“奇异博士”AI 代理工作理论的现实版本。

这不是对现有工作的逐一替换。这是如果你能够雇佣数百人而不是仅仅一个人来完成特定任务,那么你可以做的事情的早期阶段。Lindy 发送的 370 封个性化电子邮件就是一个例子,说明如何将其应用于销售。我认为在接下来的几个月里,我们将看到更多这样的情况,而且实际上需要新的功能可用,人们才能接近充分利用这些功能。

第三家初创公司名为 Paid,这是一个非常贴切的名字。

Manny Medina 写道:

只需几行代码,AI 构建者就可以专注于创建令人惊叹的代理,而我们则负责其背后的业务引擎。

更清晰地总结一下,他们的网站称之为 AI 代理的业务引擎。对我来说,这反映了一个事实,即代理现在正式从有趣的玩具和新奇事物转变为实际的生产就绪工具,这些工具将进入并改变我们工作的方式。Paid 是正在构建的关键基础设施的一个例子,它使代理能够充分发挥其潜力。实际上,现在人类员工所做的一切,我们周围的所有服务,都将在代理世界中拥有某种近似的版本。

这将在未来几年成为初创公司一个极其丰富的领域。正如你所看到的,Gusto 现在已经开始这样做了。接下来,我们将从代理转向另一个当前的巨大主题,当然,那就是 vibe 编码。为此,我们转向一家名为 VibeCode 的公司。

他们写道:为了让数十亿人能够进行 vibe 编码,我们需要一个具有 Cursor 的强大功能和 ChatGPT 的简单性的工具。他们认为,这就是他们构建的新应用程序 VibeCode。现在,这来自 Riley Brown 和他的联合创始人。Riley 是,我认为,世界上最大的 AI TikToker。但在过去的六个月左右的时间里,他真的全力投入到 vibe 编码中。

他一直在为自己构建东西,使用内容来提出关于创作者将来如何编码的新理论。这就是他和一些朋友基本上为自己构建的应用程序,用来做他想做的事情。

他展示的一个例子是在单个提示中进行移动视频游戏的 vibe 编码。如果你使用过像 lovable 和 bolt 这样的东西,那么这将是一个原生移动界面。VibeCode 没有专注于 Web 应用程序,而是从专注于移动应用程序开始。当兴奋的用户开始在公告线程上发布注册不起作用的消息时,VibeCode 基本上表示他们已经满了。

因此,就这里的主题而言,显然 vibe 编码本身就是一个很大的主题,但移动集成也确实令人着迷。正如 Eddie Yoon 指出的那样,现在与 vibe 编码的平均交互仍然是通过文本进行的,但想象一下使用语音进行 vibe 编码。有趣的是,当 Andrej Karpathy 最初谈到 vibe 编码时,他谈到他是如何使用 Whisper 与他的计算机对话来进行 vibe 编码的。所以在某种程度上,这将是整个事情开始的地方的实际体现。VibeCode Zanjananda 写道:当你构建一些东西并且其他人可以使用它时,世界上最好的感觉。

有了 VibeCode,我们希望让任何人都能获得这种感觉。当然,vibe 编码与人们产生共鸣的一大原因是它扩展了人类的创造力和创造能力。这并不是唯一的例子。vibe 编码者面临的挑战之一是,除了编写代码之外,还有很多其他部分。并且

其中一些事情仍然超出了人们的技术能力。当然,你可以使用 vibe 编码工具或单独的 LLM 来获得这些方面的帮助。所有 vibe 编码工具都有一些单按钮发布的版本。尽管如此,Andrej Karpathy 在大约一周前发布的推文中总结了许多人的感受:“……2025 年构建 Web 应用程序的现实情况是,这有点像组装宜家家具。没有包含电池的完整堆栈产品。你必须将许多单独的服务组合在一起并进行配置。”

前端和后端、托管、数据库、身份验证、Blob 存储、电子邮件、支付、后台作业、分析、监控、开发工具、密钥等。他继续说道:我对现代 Web 开发比较陌生,发现上述情况有点让人不知所措。例如,我很尴尬地分享,那天我花了三个小时来创建一个 Supabase 和一个 Vercel 应用程序并配置它,并解决了一些错误。一旦你稍微偏离文档中的入门教程,你就会突然进入荒野。

这甚至不是代码,而是配置、管道、编排、工作流程、最佳实践。谁能想出如何使其易于访问并开箱即用,对于人类和日益增多的 AI 来说尤其如此,他们将获得大量的荣耀。现在,许多 vibe 编码平台在评论中出现,说要密切关注。Lovable 的 Anton 说,这正是我们在 Lovable 正在构建的东西。然而,一位回复者 Nicholas Charrière 写道:这正是我们对 Mocha 的愿景。不是将所有开发工具粘合在一起并使其稍微更容易使用,而是一个完全集成的“一站式商店”。

这家公司 Mocha 也在几天前刚刚宣布。

Nicholas 写道:他继续说道:他继续说道:

只有一个。我们根据我们在构建 Pinterest 和 Nextdoor 等顶级 Web 产品方面的经验,采取了一种高度明确的方法。你描述结果,Mocha 负责其余部分。他们甚至举了一个你可以做的事情的例子。Nicholas 指出了 Tom,他是德克萨斯州的一家小型企业主,经营一家 HVAC 维修公司。Tom 使用 Mocha 为每个客户构建了定制的 Web 应用程序,具有个性化的品牌和功能,他说这使交易转化率、客户满意度和速度提高了 200%。

事实上,他在最后总结了我们的主题:我们正在进入一个每个人(不仅仅是工程师)都可以构建个人软件的时代。创意人士和个人软件的时代。我们对此感到无比兴奋。

我现在还没有机会深入研究 Mocha,但就我们将初创公司视为非常酷的事情本身以及反映趋势而言,很明显,这就是 vibe 编码的发展方向。这绝对是下一个前沿,是那些试图将事情推向原型设计并投入生产的人们所追求的目标。我认为实际端到端集成整个体验并非易事,但我认为这对于这些公司来说将完全是入门级的。

Bolt、Lovable 和 Mocha 之间将展开一场绝对激烈的竞争。而最大的受益者是我们所有人,因为我们可以构建以前从未可能构建的东西。

这就是名单,五家在过去一周推出的初创公司,它们反映了 AI 中一些最重要的趋势。再说一次,我们有 General Agents,他们发布了 Ace,这是一个实时计算机自动驾驶系统。Lindy 宣布了他们的代理集群。基本上,如果你曾经想要你自己的员工队伍,现在你可以拥有它了。Paid 正在构建代理基础设施,使代理更容易与金融轨道进行交互。

VibeCode 将 vibe 编码世界带到了移动端,而 Mocha 通过转向端到端体验来完全推进 vibe 编码。AI 仍然是世界上最有趣和最令人兴奋的领域,我很高兴能够每天与你们分享它。就目前而言,这就是今天的 AI Daily Brief 的全部内容。一如既往地感谢您的收听或观看,直到下次再见,和平。