We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode AI Startup Secures $17M to Reinvent How We Interact Online

AI Startup Secures $17M to Reinvent How We Interact Online

2025/4/16
logo of podcast Lex Fridman Podcast of AI

Lex Fridman Podcast of AI

AI Deep Dive AI Chapters Transcript
People
J
Jaeden Schafer
Topics
我今天想谈论一家AI初创公司BrowserUse,它刚刚筹集了1700万美元资金。这家公司正在开发一项技术,旨在使AI代理更容易地抓取、运行和理解网站内容,而用户甚至不会意识到这项技术的应用。 BrowserUse的核心技术是将网站转换为易于AI代理读取的文本和HTML格式。目前,许多AI代理依赖于视觉模型处理网页截图,效率低下。BrowserUse的技术则可以显著减少处理时间,提高AI代理的工作效率。 这项技术具有巨大的市场潜力。随着AI代理的普及,网站所有者将需要关注AI代理优化,以提高网站对AI代理的易用性和可访问性。BrowserUse的技术将成为关键工具,帮助网站所有者实现这一目标。 BrowserUse公司由两位数据科学硕士生创立,其开源项目在GitHub上获得了超过47000颗星,这表明该技术受到了开发者的广泛认可。未来,BrowserUse公司将与Shopify、Squarespace和WordPress等大型公司合作,进一步拓展市场。 BrowserUse的投资方包括Felicis、Astia Myers、Paul Graham和Nexus Venture Partners等知名机构,这进一步证明了该技术的价值和市场前景。

Deep Dive

Chapters
This chapter explores BrowserUse, an AI startup that secured $17 million in funding to improve how AI agents interact with websites. It focuses on the technology behind BrowserUse and its potential impact on the future of AI-website interaction.
  • BrowserUse is an AI startup that helps AI agents easily scrape and understand websites.
  • It converts websites into easily readable HTML text.
  • Current AI agents often use vision models, taking screenshots and processing them, which is slow and inefficient.
  • BrowserUse aims to speed up this process and make it more efficient for AI agents.

Shownotes Transcript

今天的播客中,我想谈谈一家刚刚筹集到1700万美元的AI初创公司,你将来可能每天都会与它互动,而你可能永远不会知道。这家公司叫做BrowserUse。所以这里真正有趣的是,他们究竟是如何做到让AI代理更容易抓取网站、在网站上运行、理解网站上发生的事情的,而你作为

将来可能使用这些AI代理的人甚至不会知道为什么这些AI代理在某些网站上的表现比其他网站好得多。这都要归功于BrowserUse。我想把它分解一下,因为我认为这是一个非常有趣的概念。但在我们深入探讨之前,如果你曾经想过利用AI工具来创办或发展任何类型的业务或你的职业,我很乐意让你成为AI Hustle School社区的一员。因此,我每周都会发布一个深入的视频。我已经录制了50多个视频,我详细介绍了

确切的工具、AI工具、如何使用它们、我如何使用AI来发展和扩展我目前的业务。所有这些,我都发布在一个独家学校社区中,每月19美元。过去,我每月收取100美元。现在有折扣。所以,如果你现在加入,将来我涨价时,你不会受到影响。但我们有超过300名成员。我会详细介绍我与AI一起进行的所有增长黑客行为,我的联合主持人Amy,他如何通过一个副业赚到2万美元,以及他如何利用AI来扩展它,

今年,我们正在做的所有不同的事情,数字,金钱,这一切是如何分解的,我们没有公开分享的东西,都在社区里。所以,如果这听起来很有趣,想利用AI工具来发展和扩展你的业务或职业,请查看A Hustle School社区。链接在描述中。好了,让我们进入BrowserUse。所以

我发现真正有趣的是,这是一家Y Combinator公司。这是他们2025年冬季的一批公司,相当新。我认为现在,当然,很多人都在谈论AI代理以及它们是什么。我认为很多人对AI代理的定义不同。

原因是,这有点偏差,因为很多人想宣称他们正在做的事情是,你知道,我们有一个AI代理,即使是OpenAI的Operator,我也会说,实际上,它不像100%完全自主完成任务的代理。好的,我们会跳过这一点。无论如何,有很多初创公司正在构建工具来改进这些AI代理,无论它们目前的形态是什么,或者它们未来的形态是什么,这些东西实际上是自主的。

能够使它们更好。所以BrowserUse本质上是很多开发者都在使用它,很多人对此感兴趣。他们基本上正在创建一个解决方案,使AI代理更容易使用和阅读网站。他们这样做的方法本质上是,他们本质上是去获取你的网站并将其

转换成可查看且易于抓取和供代理理解的HTML文本。目前,最好的AI代理模型,你可以想到,我认为像ChatGPT Operator和一些其他的,Cloud使用计算机。他们本质上是在使用视觉模型。所以他们会截取页面的屏幕截图,将其发送给模型,

他们甚至可能在他们的后端进行一些处理,在那里他们查看它,阅读它,决定在哪里点击。他们几乎绘制了屏幕上的像素图,并且说,嘿,点击这里,这样做。这就是它们的工作方式。就像截图,发送过去,弄清楚发生了什么,弄清楚他们需要做什么,发送点击位置。

然后发送回来,然后它这样做。所以它做得很快,但这本质上就是这些工作方式。现在,问题是,其中一个大问题是,截取屏幕截图、将其转换成文本、理解正在发生的事情的上下文以及完成任务的处理。这需要计算机处理时间。如果你考虑一下,如果你想到一个很多人可能正在互动的网站,也许今天有100个人正在使用Checkbox。

ChatGPT Operator去LinkedIn并帮助,你知道,创建一个所有向他们发送,你知道,好友请求或,你知道,连接请求的人员的电子表格,他们想向所有人问好,对吧?我不知道,这是一个随机的用例。所以假设有100人,或者假设有1万人在每天做这件事,使用当前系统,他们必须运行很多完全相同的流程和完全相同的屏幕截图,并将这些转换成

这些AI模型每天必须做1万次的事情。将来,你可能会说,也许每天会有1000万次。因此,有很多后处理可以完全消除,整个过程可以加快速度,因为如果这些网站决定自动拥有这种AI层工具来抓取他们的网站,并使其非常容易,本质上只是将其转换成易于阅读、易于理解的文本和HTML供这些AI模型使用,

那么它将加快AM模型运行的速度。无论如何,这本质上就是BrowserUse正在做的。我认为这是一个非常酷的概念

所以他们刚刚筹集了1700万美元。他们由Felicious、Astia Myers领导的这一轮融资。他们还有Paul Graham,对吧?Y Combinator的创始人,A Capital,Nexus Venture Partners。所有这些,所有这些都刚刚加入,并且已经报道了他们能够做到的事情。这是一轮新的融资。这家公司之所以出名或开始获得一些知名度是因为

有一家中国初创公司,ButterflyFX,他们在其主要工具中使用了BrowserUse。这是一个非常流行的工具。所以当这个东西流行起来的时候,每个人都想知道,嘿,是什么在驱动这个工具?这个东西到底是怎么工作的?所以正因为如此……

这就是BrowserUse出名的时候。所以这家公司的创立方式是Magnus Muller和Greg Zinnick,他们是创始人。他们去年创立了这家公司。他们正在通过ETH Zurich的学生项目之家加速器工作。所以他们都在从事

好吧,我想Muller过去一直在做一些网络抓取的工作,然后他在2024年遇到了Zunich。他们都在攻读数据科学硕士学位。当然,就像每个创业故事一样,

你会让这些天才聚集在一个房间里。他们决定他们想创造一些东西,那就是网络抓取和数据科学,把它们放在一起。我想AI代理的角度是在他们意识到用例时发展起来的,但他们确实开始做了一些事情。显然,他们花了五个星期就构建了BrowserUse的第一个演示。在那之后,它真的起飞了。他们将其开源。所以如果你去GitHub上查看,这个东西有

GitHub上有超过47000颗星。所以很多人显然对此非常兴奋。它有5000个分支。

是的,我认为这是开发者喜欢的东西。我认为将来我们可能会看到更多的是,我可以想象,就像,你可以想象世界大部分都在使用WordPress。今天大多数网站都是基于WordPress构建的。还有很多其他的,对吧?你可以说Squarespace等等,所有其他平台。我想在某个时候,对于大多数这些平台,你都可以获得一个插件,你可以启用它。它只会让BrowserUse运行在你的网站上,并创建一个AI代理可以很好地访问的版本。这样做的原因是至关重要的,因为

是的,它使代理更快等等。但网站所有者想要这个的原因是,他们说,这将是,这将像今天你进行搜索引擎优化以获得更多用户一样,对吧?你就像,我如何将自己优化到谷歌的顶部?我预测将来,我们将不得不关注代理优化,因为我们甚至不会进行很多谷歌搜索或所谓的谷歌搜索,在线搜索。我们只需要告诉我们的代理,嘿,你知道,帮我买这个东西,预订这个东西。我想,你知道,像,

你知道,你可能会说,嘿,AI代理,我想下周开始播客。请帮我买所有相关的设备,并将它们全部寄给我。好的,它必须进行研究。它必须找到设备。它必须找到购买设备的最佳地点。它自己正在做所有这些研究。公司将希望优化以使AI代理访问他们的网站。他们将做各种偷偷摸摸的事情,本质上是

为了做到这一点。但我认为BrowserUse将成为其中之一。就像AI代理一样,哦,你知道,也许其他网站更便宜,但我并没有完全理解那里有一些复杂的东西。我只是要去另一个网站,它看起来更直接,我更容易理解它。所以会有所有这些。我认为,当我展望未来时,AI代理优化将成为这些公司想要做的一件大事。所以每个人都基本上会想要让这个工具在他们的网站上运行,并使其更

易于阅读、访问和理解,以增加它实际上被,你知道,代理实际上购买他们的工具或使用他们的资源或获得他们的订阅或其他任何东西的可能性。所以我认为这是非常非常有趣的。所以

这里真正有趣的是他们对这件事所说的内容。显然,他们有大约20家公司在目前的Y Combinator冬季批次中使用BrowserUse。所以显然这些全新的初创公司已经开始使用它了。他们可以看到它的用途。

他们说:“有些公司来找我们说,我们能做些什么来让AI代理更容易浏览我们的网站?例如,像LinkedIn这样的网站,会不断改变网站的工作方式。因此,代理经常在这样的网站上失败。”据他们说,他们过去几年一直在研究进入AI代理领域,而BrowserUse感觉像是他们开始工作的完美事物。他们的主要投资者也一直在研究

投资这项业务多年,并很高兴将其添加到投资组合中。他们的主要投资者Myers说:“我们认为网络代理是下一个前沿,它真正有助于端到端自动化人类任务。网络AI代理是静态预训练模型(主要侧重于文本)与不断变化的数字环境之间的动态桥梁。”总而言之,我认为这是一项很棒的业务,筹集了1700万美元,我认为他们会做得很好

定位最终用户。现在,它就像开发者抓取它并在他们的电脑上运行它一样。这太棒了。但我认为,如果你看看大多数网站,你会看到大量的Shopify网站,大量的Squarespace网站,大量的WordPress网站。我认为你会看到像Shopify这样的大公司会获得插件或与像BrowserUse这样的公司达成协议来构建它。每个人将来都会致力于AI代理优化。我认为这将是一个没有人谈论的巨大新兴产业,但它确实

将会非常巨大。你知道,这将是某些公司赚取数亿美元和数十亿美元的秘诀,如果他们能够找到一个有趣的概念来关注的话。非常感谢您收听播客。如果您喜欢它或学到了什么新东西,如果您能在您收听播客的任何地方留下评论,我将不胜感激,在YouTube上

评论,订阅。我很乐意让你成为YouTube上的订阅者。如果您有兴趣加入AI Hustle School社区,描述中有一个链接,每月19美元。有超过50个视频向您展示如何利用AI工具来发展和扩展您的业务,如何赚取数千美元,以及如何利用AI将您的业务提升到一个新的水平。非常感谢您的收听,我们下次再见。