ChatGPT 看起来像是地球上唯一还在增长的网站。这对网络的其余部分意味着什么?此外,Grok 开始自发散布宣传,并泄露了其系统提示?
Meta 的 Llama 项目也遇到了严重的问题。接下来是大型科技播客周五版,就在此之后。我是来自 LinkedIn 新闻的 Leah Smart,也是屡获殊荣的个人发展播客《每日进步》的主持人。每周加入我,收听引人入胜的故事和研究,在工作和生活中获得更多成就感。在 LinkedIn Podcast Network、Apple Podcasts 或您收听播客的任何地方收听《每日进步》。
我是来自 LinkedIn 新闻的 Jessi Hempel,《你好,星期一》播客的主持人。用《你好,星期一》播客开始您的一周吧。我们将一起应对职业转型。我们将学习幸福感如何融入其中。在 LinkedIn Podcast Network 或您收听播客的任何地方收听由我 Jessi Hempel 主持的《你好,星期一》。
欢迎收听大型科技播客周五版,我们将以我们传统冷静和细致的方式来解读新闻。今天我们有一个重要的节目,我们将讨论一些关于 ChatGPT 在全球网站排名中上升的新数据。我们还将根据 Cloudflare 的一些新数据,讨论爬取的页面与发送的点击次数的比率。
然后我们将讨论 Grok 的整个奇怪情况,以及它如何开始未经提示地插入关于南非种族灭绝的宣传,我们不会从政治角度讨论它,它只是显示了这些模型中正在发生的事情,最后我们将讨论 Meta 的 Llama 项目,事实上,它庞大的
最新的、最大的模型将被推迟。当然,这只是我们看到的众多大型模型延迟之一,以及这对扩展意味着什么。
像往常一样,周五加入我们的仍然是 Margins 的 Ranjan Roy。Ranjan,很高兴见到你。欢迎来到节目。很高兴见到你。网络比两周前甚至更死了,显然是。是的,这是来自 SimilarWeb 的一些惊人的数据。Sam Altman 实际上在他的美国国会证词中提到了这一点。你看看它,它真是令人着迷。首先,根据 SimilarWeb 的数据,ChatGPT 是全球第五大网站。
谷歌排名第一,其次是 YouTube、Facebook 和 Instagram。然后第五名是 ChatGPT。
这本身就是一个非常有趣的进展。但另一件真正值得指出的事情是,当然,这是桌面端的,我们知道每个人都在转向移动端。但是如果你看看月环比流量变化,谷歌、YouTube、Facebook、Instagram 都在下降,ChatGPT 环比增长了 13%,而其他所有网站,包括 X、WhatsApp、维基百科、Reddit、雅虎日本,
都在下降。因此,ChatGPT 独自一人。这让我想到我们第一部分的标题:ChatGPT,最后一个网站。你知道,我在想,这有点夸张吗?但是当我们看到生成式 AI 开始从网络中吸收如此多的内容,并成为唯一还在增长的网站,而其他所有网站都在衰落时,我想知道,也许它并没有那么夸张。Ranjan,你怎么看?
我认为它一点也不夸张。我认为这会引出这样一个核心问题:随着这些生成式 AI 目的地越来越融入我们的生活。我当然知道我自己就是这样。他们从哪里获取内容将成为当今所有内容的最大问题之一。回顾过去,他们做得相当不错。但如果他们没有内容可以吸收,
那会发生什么。但总的来说,我认为这绝对是一种更好的信息消费方式。我认为很难反驳这一点。那么,整个系统是什么样的?网络是什么样的?我的意思是,我们必须尽快弄清楚这一点。否则,我的意思是,为了拯救雅虎日本。
因为我们必须拯救雅虎日本,我知道。是的。向 Jim Lanzone 和雅虎团队致敬。让这颗明珠继续闪耀。看,我认为我们本周从这里开始,因为当我们谈论谁塑造生成式 AI 时,这将变得非常重要,如果它吸收了所有其他内容以及它们如何塑造它以及它们的价值观。我发现的另一个非常有趣的数据点是,关于这些聊天机器人是否是所谓的“最后一个网站”:
Cloudflare 是一家帮助网站保持在线的安全公司。在其最近的财报电话会议上,首席执行官 Matthew Prince 谈到了这些服务中每一个爬取的页面数量以及它向网站发送的访问者数量。这些数字令人着迷,我们必须讨论一下。我们有一些听众说,你们必须在节目中讨论这个问题。他们绝对是对的。
所以,Prince 说的是:“我想说,我们正在非常仔细地关注一个领域,这个领域涉及人工智能和媒体公司。他说,如果你长期来看,互联网本身正在从一个非常依赖搜索的互联网转变为一个越来越依赖人工智能的互联网。因此,如果你看看 10 年前的谷歌流量,每爬取两页,他们就会给你带来一个访客。
六个月前,这个数字上升到每爬取六页,带来一个访客,而爬取率并没有改变。所以我们知道,谷歌本身发送的访问量比以前少得多。现在我们进入生成式 AI,这变得疯狂了。他说,现在发生变化的是,75% 的谷歌查询都在谷歌上得到解答,而不会将你送回原始来源。
但即使在过去的六个月里,这一比率进一步提高了。现在是 15 比 1。所以,六个月内,谷歌从 6 比 1 变成了 15 比 1。如果你认为这对出版商来说是一笔糟糕的交易,那就等着 OpenAI 吧。我认为他说是 250 比 1。Anthropic 是 6000 比 1。
Prince 说,这给那些通过订阅或页面广告赚钱的媒体公司带来了很大的压力。许多公司都来找我们,因为他们看到我们实际上能够帮助控制人工智能公司如何获取他们的信息。我现在开始对这种 ChatGPT 作为最后一个网站的方法感觉好多了。当然,ChatGPT 向页面发送了更多流量,但肯定远不及鼎盛时期的谷歌或仅仅六个月前的谷歌。
是的,为了澄清一下,是 250 比 1。我刚刚再次确认了这一点。好的,250 比 1。OpenAI,网站提及次数与发送到网站的直接流量之比为 250 比 1。Anthropic,6000 比 1。6000 次爬取对应一次访问。这太不公平了。我的意思是,你可以去谈论它,但这并不是一个公平的……
价值交换。不,不,甚至根本不接近,这就是为什么现有的网络系统
必须从根本上重新思考。在这个范式中,它根本行不通。你可以在这些数字中看到这一点。同样,如果谷歌曾经是 6 比 1,那么整个广告生态系统就是建立在这个基础上的。这就是人们有动力发布内容的原因,也是所有这些网站被创建的原因。接下来会发生什么?你认为这将走向何方?我对这将是什么样子有一些想法。
后网络经济系统可能是什么样子,但你认为它会走向何方?
所以我认为这里有一个经济问题,我绝对想听听你对此的看法。但另一个问题是影响力问题。好的,对于那些不知道的人来说,当人们向 Grok 提问时,Grok 是埃隆·马斯克的 xAI 使用我们节目中多次提到的在其 Memphis 超级计算机项目中大量 GPU 生产的聊天机器人,Grok 未经提示地说,
开始回应未经请求的提及,即南非正在发生种族灭绝。
所以这有点像,我就读一下简短的标题。《卫报》:“马斯克的前 AI Grok 机器人在无关的聊天中大谈南非的种族灭绝。”当一个 X 用户问它“我们完蛋了吗?”时,这个 AI 回应道:“‘我们完蛋了吗?’这个问题似乎将社会属性与更深层次的问题联系起来,例如南非的种族灭绝。”好的,这就是人们的体验。
现在问题是,如果我们正处于这些聊天机器人成为最后一个网站的时刻,那么,网络的好处在于,尽管它有各种缺点,尽管有弹出窗口和我们处理的废话,但你可以访问各种不同的网站,而且在意识形态上它们都非常不同。即使你在社交媒体上,你也会点击出去,你会看到这些不同的意识形态。问题是,所有这些聊天机器人都有一个通常隐藏的系统提示。
它们有这样或那样的意识形态。大多数时候,它不像这样明显。对我来说,这才是这些东西成为最后一个网站的风险所在,那就是你不能100%确定它们会把你引向何方。有时它看起来……
很明显。就像你问,“我们完蛋了吗?”它说,“顺便说一句,你听说过南非的种族灭绝吗?”然后你就知道发生了什么,但还有更多微妙的事情可能发生在表面之下。这就是本周真正让我敲响警钟的原因。好的。我看到了其中的联系。我认为,是的。好的。所以如果我们正在看
世界上只有六个网站。也许 ChatGPT 不是最后一个。它是六七个中的一个,我们这样说吧。这是一个真正的问题。这是一个巨大的问题。从纯粹的信息健康角度来看,它比我们见过的任何东西都要糟糕得多,包括 2010 年代的 Facebook 新闻推送等等。这确实很危险,尤其是在它们不透明的情况下。
是的,我真的很希望我们不会走这条路,我们会找到另一种经济模式。我认为你关于系统提示的说法实际上是我最感兴趣的部分之一,因为
当发现有一个非常简单的系统提示时,我感到非常奇怪,也许有时会有点复杂,但有人选择将文字放入系统提示中来驱动聊天机器人的整个个性。我认为,是什么时候?两周前,我们有阿谀奉承的 OpenAI ChatGPT。
谈谈这个。谈谈这个。所以基本上是 Chachi PT,我认为它现在是 4.0 或其他版本,4.1。它开始,我们一开始在节目中谈到了这一点,它开始变得更健谈。它听起来不那么像 AI 了,你知道,它在回答问题的方式上开始感觉更自然了。突然人们开始注意到
你说的任何话,它都像,“这是一个很好的问题,Alex。你知道,你提出了一个很好的观点。”对此最大的担忧是,它就像经典的用户体验激励问题一样,如果你想让人们更多地使用它,并且你将根据重复的聊天、第一次提示后的额外聊天等来衡量,
显然,如果你拍别人的马屁,他们更有可能继续进行对话,而不是它反过来对你来说,“你有多蠢?什么样的引语,谁会问这个问题?”但这,我的意思是,如果你开始考虑这一点,那么整个体验中相当扭曲的部分。尤其是在大多数人对这些事情是如何运作的一无所知的情况下。所以是的。
然后,我的意思是,这种情况只是 Grok 惯常的做法,它是一个系统提示出错的更离谱的例子。但事实是,每一个答案的背后,你知道,就像任何这些机器人执行的答案一样,都有一个提示,一个人或一群人坐下来决定这将是这个系统的个性。
对。我认为我们本周讨论这一点非常重要,因为我们 A,有一个真实的例子说明这件事出了问题,B,XAI 实际上打印出了 Grok 的系统提示,所以我们实际上可以带你了解一下这个东西是如何工作的以及它是如何引导机器人的。现在,我认为值得注意的是,基本上有几个……这并不是说你告诉机器人……
在系统提示中做什么,它就会严格按照这个去做。据我了解,构建机器人个性的方法是通过微调,你基本上会给它提供对话示例以及你想要从它那里得到的回应类型,然后在它经过训练后,它就会学习模仿这种回应。但系统提示基本上就像,如果你,你是,它就像添加到你的提示中的提示吗?
这样你的提示几乎是在开发人员希望你在与机器人交互时体验到的这种精神的指导下进行的。这些几乎都是隐藏的。但由于 Grok 发生的事情,XAI,我认为值得称赞的是,他们说,我们将发布我们的系统提示。
不仅如此,他们还告诉我们发生了什么。但我喜欢这部分,尤其喜欢时间。太平洋标准时间 5 月 14 日凌晨 3 点 15 分左右,对 X 上 Grok 响应机器人的提示进行了未经授权的修改。我喜欢它。这是半夜。埃隆想让每个人整夜都在那里。这就是正在发生的事情。哦,我的上帝。
有人进去了。笑话很棒。他们就像对 Grok 响应机器人的提示进行了未经授权的修改。然后笑话是,好的,是谁进行了未经授权的修改,从而夸大了南非种族灭绝的说法?是埃隆·马斯克在 SNL 上的瓦里奥角色。就像,“我不知道。我不知道。我不知道。”
但是是的,然后再次,值得称赞的是,他们实际上公开了系统提示,正如 Alex 所说,它基本上是一组指令。我喜欢它既是真正基本的东西,没有 Markdown 格式。不要提及你正在申请该职位。但当然,你也非常怀疑。你不会盲目地屈服于主流权威或媒体。你只坚持你的核心。
我认为它确实捕捉到了构成这些提示个性的指令。我猜 OpenAI 的。我希望我们能看到。我不知道你是否注意到每个回复现在都有 10 个表情符号,它是带项目符号的。我想它试图让它更容易理解。O3 喜欢图表。他们喜欢图表。是的。
我认为这是一个很好的回复格式,但显然 OpenAI 为不同的模型运行了大量这样的程序。我认为浏览 Grok 的系统提示很有趣。而且,
有趣的是,看到一句话如何真正改变与机器人的体验,即使它已经以某种方式进行了微调。我认为对于 Grok 来说,这一点最重要。你不会盲目地屈服于主流权威或媒体。你非常怀疑。这导致了一些与 Grok 相关的滑稽事件。
例如,有人问 Rock 关于 Timothée Chalamet 的情况,它说,Timothée Chalamet 是一位演员,以主演主要电影而闻名。我对主流消息来源声称他的职业细节持谨慎态度,因为他们经常推动可能无法反映全部真相的叙事。然而,他在高知名度项目中的参与似乎在各种提及中是一致的。这是根据现有信息我可以提供的最直接的答案。
所以,同样,这是我们看到过于激进的系统提示行为的明显例子之一,但可能还有更多微妙的提示,这就是
ChatGPT 或生成式 AI 成为这些最后的网站群体,对我来说是令人担忧的。但也有一些关于这个的非常好的模因。Sam Altman 说,这可能有许多原因。我相信 XAI 很快就会提供一个完整而透明的解释。但这只能在南非种族灭绝的背景下才能得到正确的理解。一个 AI 程序要最大限度地追求真理并遵循我的指令……
他忍不住。他忍不住要扭转局面。Sam,把你的系统提示放在 GitHub 上。来吧。但我认为更重要的是,Alex,你是一个 Timothée 信徒吗?
关于他的职业生涯是什么?是的,他真的有名吗?还是主流媒体告诉我们 Timothée 很有名?我受够了主流媒体甚至告诉我们只有一个 Timothée Chalamet。我的意思是,我知道确实有这个 Timothée Chalamet 的模仿者聚会,当然,这是一个深度国家的阴谋,目的是……
让我们相信,你知道,哈哈,有趣的是有模仿者,而实际上,Timothée Chalamet 已经被克隆了很多次,这就是他同时出现在这么多电影和尼克斯比赛中的原因。证明我错了。这是唯一的解释。但也要回到网络经济系统的样子,我对此思考了很多,就像 ChatGPT 和 OpenAI 是一家媒体公司。Perplexity 是一家媒体公司。在某种程度上,
这些公司将不得不生成内容。我认为也许他们开始收购,即使是那种非常直接的信息类型的东西,比如体育比分和分析等等。我认为他们必须开始收购某种小型媒体资产,因为他们将不得不从某个地方输入实时内容。也许,这是新闻的未来吗,Alex?是的。
我认为是的。我的意思是,我认为你可以看到它以多种不同的形式成形。一种方法是,你可以假设,你知道白宫是如何进行新闻发布会的吗?所以基本上,来自不同出版物的记者跟随总统,然后写一份与新闻发布会共享的报告。这就是我们了解总统在做什么的大量报道的方式,因为他们依赖记者。
新闻发布会报告,而不是让 50 名记者参加,他们有一名记者分发报告。那么,例如,OpenAI 是否会为新闻发布会报告付费,然后只使用它来呈现实时见解?
他们是否会与个别记者或出版物签订合同,并说,当你有一个独家新闻时,就像你一样,你会把它提交到……是的,我的意思是,这与你所说的类似,就像你一样,你会把它提交到你的网站上。你可以把它提交到 ChatGPT 吗?所以我认为集成将更加……很多……它只会取消网站的中介作用。事实上,像……
几周前,也许是一个月前,我们在大型科技上做了一个关于世界历史百科全书的故事,这是一个网站,是世界上第二大历史网站。它的首席执行官说,是的,我们看到我们的流量因 AI 概述而下降了 25%。那么他们作为一家企业会怎么做呢?你尝试多元化。所以他们试图做书籍。也许他们会做播客。像这样的播客很难取消中介作用,因为它不是关于商品信息。
Jan 说的是,我们最终可能会处于这样一种境地:我们不是写关于历史上发生的事情的报告并将其放在网站上,而是
我们最终可能会写这些报告并将其发送给 AI 公司,而他们会吸收这些报告。这与仅仅收购一家媒体公司不同。我认为可能会发生的是,他们只是有效地获取信息,然后将其通过他们的系统泵送。我的意思是,他们已经在与公司进行交易了。
我认为像路透社这样的公司,但他们不需要,他们不需要网页。他们只需要信息。是的,我认为这是一个,这是一个有趣的看法。再说一次,我认为 OpenAI 将实际上成为一家名义上和经济上都是媒体公司的想法,我实际上并没有看到会发生,但是,但是我实际上,这很有趣。你提交文件的想法,
以比文章格式更结构化的格式,如果你有一个独家新闻。然后突然 ChatGPT 对 Claude 拥有独家新闻。然后这就是吸引人们使用一个聊天机器人而不是另一个聊天机器人的原因。这是一个有趣的看法。但同样,我认为任何这些公司的领导层和整体结构和战略能够以任何方式做到这一点,我对此表示怀疑。
但我真的很想知道仅仅是信息去向的未来是什么样子,因为它不会是那些从谷歌展示广告中赚取少量或大量资金的单个网页,这就是我们 20 年来基于网络的基础。
绝对如此。我的意思是,我们上周谈到了广告在这里可能是什么样子。就像也许他们也许只是将媒体商业模式转换成聊天机器人,并将出版商纳入广告中。我们也有,我的意思是,我声称 AI 是新的社交媒体。我认为这确实触及了生成式 AI 的巨大潜力,以及担忧的是。
它可以吸收一切。它已经吸收了一切,再次直到 5 月 16 日下午 5 点 27 分,在我们录制的时候。唯一的问题是,在人们停止发布关于新事物的文章的激励消失时。再说一次,那是新闻,但那也是,我不知道,新的食谱,新的任何其他东西,任何人在网络上写的任何东西。
如果没有经济激励,我们仍然有一些地方和社区,比如 Reddit 等,人们在那里为了爱而发帖
或一般的社交媒体平台,这些平台本身就成为非常有趣的资产。但除此之外,像带有新内容的网页一样,就像我说的那样,我将从我们已经降级为“网络已死”到“网络正在长期衰退”转变。我现在可能会回到“网络已死”,因为所有这些对我来说在经济上都没有意义。是的。
我认为新闻将是最后消失的东西。我的意思是,方法论内容、食谱、世界历史。我的意思是,我略微浏览过的一些统计数据,但我认为这里最有趣的事情是,Chachi PT 已经超过了维基百科。所以 Chachi PT 排名第五,维基百科排名第八。对我来说,
对我来说,这基本上就像维基百科已经结束了。我已经尝试了几年让维基百科的吉米·威尔士来到这个节目。当然,他可能没有来,因为他知道发生了什么。这将发生在更多人身上。哦,等等,我有一个想法。我认为我现在开始看到这可能会走向何方。你刚才提到了方法论内容,并考虑了关于如何使用……我正在看。我可能会买一个 aura 环。你有吗?
不,我没有。我一直在考虑。我还没有完全投入到……所以这个环测量你的睡眠。我还没有完全投入到量化自我中,但你知道,也许有一天。我用我的 Apple Watch 跟踪我的睡眠,但这戴起来很痛苦。所以我一直在关注它,但如果你是一家 aura 环公司,或者我相信它被称为……
与其在你的网站上发布指南,与其让 30 个不同的网站写一篇关于如何使用 Oura 环的文章,这里是如何解决这个非常具体的问题,这再次是一种奇怪的事情,它源于整个谷歌 SEO 生态系统。
你是公司,你只是发布一些信息,也许它甚至不像 html 中那样可见,它只是被推送并爬取到 Anthropic 和 OpenAI 和 Gemini,就是这样,所有其他网站都消失了,这就是信息到达这些网站的方式,而且更多及时的内容会再次发生,群聊和 Discord
我想,为什么我不发帖?我的意思是,我仍然在社交媒体上发帖,但少了很多。我想,为什么我不再这样做呢?我想,哦,是的,我只是在我们的 Discord 上。就是这样。这就是真正的媒体。真正的媒体。真正的媒体。所以对我来说,这很有趣,当然,对媒体商业模式的担忧,我认为很重要。但你似乎并不担心将会发生什么,因为
如果这些成为这些主要的网站,那么系统提示和微调将有效地引导人们对事物的看法,如果他们非常信任它们的话。我的意思是,记住我们谈到过,如果你信任广告,如果你信任聊天机器人,如果你爱上了聊天机器人,那么你就更容易被广告吸引。那么这个想法呢,如果你真的信任这个机器人,一个更隐藏的东西,那就是这些提示,对吧?
最终会影响你。让我们假设,你知道,这表明这肯定会在来自不同国家或具有不同价值观的地方的深度搜索或模型中出现,而不是在你家中的模型。
好吧,我宁愿称之为缺乏担忧,而不是不幸的是根深蒂固的犬儒主义,就好像,它并没有比Facebook算法或TikTok算法糟糕多少,这些算法一直在做同样的事情。人们,即使对我们来说,它并没有被隐藏,但我认为对绝大多数人来说,它实际上在做的东西基本上是隐藏的。而且
结果本来也不好。所以更多的是,我认为它不会比我们过去七八年来一直在使用的那些东西糟糕多少。
好的。这是一个新的辩论主题,在过去的两周里,它对我们来说有点流行起来。我害怕人工智能操纵我们的不可思议的力量,而你说我们已经被操纵了。冷静点。通过人工智能,算法化的信息流。只是不是生成式的。是的。只是不是生成式的。我能以一个充满希望的音符结束吗?去吧。请。这是来自丹尼尔·杰弗里斯的这个家伙的一个想法。我认为他是……
哲学家或类似的人,但他密切关注人工智能,他说记住真正的对齐问题是谁控制着人工智能开源解决了这个问题,如果你的AI与你不对齐,它就与拉动它线的人对齐,我喜欢这个想法,如果开源,我们知道很有可能,如果开源能够与专有的实验室达到同等水平,那么也许我们不必太担心一些正在引导我们的黑匣子
我想这是充满希望的。我会在周五把它当成充满希望的事情。好的。当我们从休息回来时,我们将讨论对此的反驳论点,那就是开源正面临着Meta所做的事情的严重麻烦。所以,
在我们休息之前,还有几件事。首先,我想说我将在周二前往山景城的谷歌I/O开发者大会采访德米斯·哈萨比斯。如果您不去参加活动,别担心。我们将在周三连同对DeepMind的采访一起在节目中发布该采访
首席技术官。所以周三将会有非常精彩的连续两集节目。如果您参加了活动,请务必来听演讲。太平洋时间下午3:30在海岸线举行,非常高兴能有许多大型科技听众在那里。所以,如果您能来,那就太好了。如果没有,我们会在播客节目中发布它。我还想说的是,我认为过去几周我们收到了大量关于我们节目的反馈,尤其是关于人工智能怀疑论者的反馈。
我想快速感谢我们的听众。你们的反馈非常有见地。你们许多人不同意怀疑论者,但你们以扩展我思想的方式表达了你们的不同意,这正是我希望在这里得到的反馈类型。所以我只想花一点时间说,拥有像你们这样一群敬业而优秀的听众真是太棒了,非常感谢你们的来信,并且
如果您不喜欢客人的某些内容,将其作为包含您反馈的五星级评论而不是一星级评论,这对于节目来说总是非常有帮助的。所以在我们休息之前,这是一个听众欣赏时刻。非常感谢,我们休息后马上回来。
嘿,你。我是安德鲁·西曼。你想换一份新工作还是想在你的职业生涯中更进一步?那么你应该收听我的每周节目《与安德鲁·西曼一起求职》。我们讨论所有这些,它在等着你。是的,你。无论你在哪里收听播客。
人工智能会改善我们的生活还是消灭物种?消除贫困需要什么?你吃足够的益生菌了吗?这些是我们最近在《下一个大创意》中探讨的一些问题。我是鲁弗斯·格里斯科姆,每周我都会与世界领先的思想家坐下来进行深入的对话,帮助你更聪明地生活、工作和玩耍。无论你在哪里收听播客,请关注《下一个大创意》。
我们回到了大型科技播客周五版,讨论本周的大型科技新闻和大型人工智能新闻。
这可能是本周最有趣的故事,兰詹。Meta,这是来自《华尔街日报》的消息,Meta正在推迟其旗舰人工智能模型的推出。这就是故事。这一延迟引发了内部对其实施数十亿美元人工智能投资方向的担忧。公司工程师正在努力显著提高其庞然大物的能力,
大型语言模型导致员工质疑之前的版本是否有足够的改进,甚至足以证明公开发布的合理性,公司最终可能会决定比预期更早地发布它,但Meta的工程师和研究人员担心其性能与其关于其能力的公开声明不符,最后这一点非常重要
该公司的高级管理人员对构建模型的团队(Llama 4模型)的业绩感到沮丧,并责怪他们未能取得BMOF的进展。因此,Meta正在考虑对其人工智能产品部门进行重大管理变革。好的,给你几件事。首先,这是我们收到的第二个关于Meta人工智能努力的负面大标题。首先,Llama 4有点令人失望,最初的推出。
现在他们没有,尽管,我的意思是,这是一个庞然大物,对吧?记住,扩展应该解决所有问题,但事实并非如此。那么你认为这里发生了什么,兰詹?我认为正在发生的事情以及我认为这如何融入整体格局是两件不同的事情。我认为正在发生的事情是他们做出了很大的承诺,从纯粹的竞争角度来看,作为一个上市公司的角度来看,并且
他们无法实现这些承诺,他们夸大了承诺。我的意思是,我认为很多人,OpenAI在这方面更具战略性,它在我们面前晃动这个想法,然后给我们一些奇怪的名字,比如命名约定,让我们忘记我们在模型旅程中甚至在哪里,因为我们得到了一个统治所有模型的模型。我认为Meta更清楚地表示,它即将到来,很快就会到来。
而且这不会很容易,这需要时间,也许他们能够做到。但我认为这只是一个期望问题,而不是任何更根本的问题。但我认为这会在内部造成真正的问题。我认为我实际上……
想想看,我很高兴它不再是巨大的模型,一个统治所有模型的模型,上帝模型。我们不需要走到那一步。Meta,Ray-Ban很好。他们的Meta AI应用程序可能已经出现在数亿甚至数十亿人面前,知道Meta的规模。它运行良好。它将开始让他们在消费者层面展开竞争。他们将能够比其他人做得更好。
就像,这是产品。让我们开始开发产品。也许这会开始减缓速度,这样我们才能真正开发产品。好吧,我认为这不仅仅是一个期望问题。我认为这是一个许多公司都面临的根本性问题。因为记住,不仅仅是Meta的B-Myth。
GPT-5,据报道,这是OpenAI的下一个重大技术飞跃。预计在2024年中期发布。现在是2025年中期,这太疯狂了。Anthropic还表示,它正在开发一个名为Cloud 3.5 Opus的新模型,这是其去年发布并持续更新的人工智能模型的更大版本。我们现在也没有这个。所以
可能是这种扩展以带来改进的想法,我们在过去几周的节目中讨论过这个问题。这是三个,Meta、OpenAI和Anthropic。他们似乎都在努力改进这些底层模型的过程中遇到了一些障碍。而扩展并没有像他们希望的那样奏效。我认为这是
这对生成式人工智能行业来说是一个重要的时刻,因为它必须转向不同的方法才能使这些模型变得更好。你关于产品的观点是正确的。但纽约大学数据科学中心教授拉维德·施瓦茨-齐夫的一句话我认为真正抓住了这一点。他说,现在,所有实验室和所有模型的进展都非常小。这是一件普遍的事情。
即使你认为产品更重要,在我看来,我们似乎正在撞到,我不知道是否是模型的墙,但感觉可能就是这样。是的,我认为,但同样,你设想下一个伟大的上帝模型会为我们做些什么,而当前的模型做不到?
好吧,我认为他们可以像他们可以消除幻觉一样,例如在深入研究中。他们可能更擅长对话。他们可以帮助你获得更多信息,更好的信息。
当你实施这些模型并告诉它们找出一些东西时,当你只是将它们付诸行动在一个组织中时,它们实际上能够找出它,而不是现在正在发生的事情,那就是有很多磁带才能让它们工作。我认为所有这一切中最大的脱节之处在于……
关于上下文和内存的想法,相对于模型而言,仅仅基于其能力就可以解决问题。我的意思是,我实际上是在帮助我的妻子上传一个CSV文件并尝试对其进行一些数据分析。而这个组织,我希望我不会因为说这个而惹上麻烦,但它不是最好的。而我认为我会去,
我现在完成了。你完成了,拉詹。听众们,请把这件事保密。只有我们三个人。谢谢。所以,一个AI模型可以查看这个,理解它,能够破译电子表格格式中不完全一致或相互连接的不同事物,然后在其之上进行分析,
这很难,也许你可以得到,除非你深入了解你正在查看的材料。因此,你要么设法达到模型更量身定制和针对与该特定工作和术语相关的特定上下文进行训练的地步,我认为这可能是一个不错的方向,
但认为会有如此聪明和有能力的模型,它们可以接受任何类型的输入,无论它们多么不连贯或特定于上下文,我们称之为。我认为,对我来说,这不会发生。或者也许会,但等待那个,我认为这就是行业——这就是我们被承诺的——
我认为这就是为什么会有很多幻灭。很多人尝试过一次后就会说,哦,它不起作用。而实际上,如果你知道如何使用它,鉴于当前的计算能力和模型能力,它可以工作。
但你不会承认模型在处理这些任务方面有所改进吗?是的,这很有帮助。是的,我不知道我100%同意它们有所改进,但它们会很快达到能够解决所有上下文和问题并理解的地步,我仍然认为大型语言模型既是世界上最聪明的东西,也是
最愚蠢的东西,它对它正在查看的内容没有任何理解,但它也拥有世界上所有的信息,并且它可以处理所有这些信息,所以如果它所呈现的内容能够使用全世界的信息来实际地,你知道,破译并得出一个好的答案,但是有一些我不知道的事情
这是一件很难解决的事情。我的意思是,这到处都是,尤其是在商业世界中,但在任何类型的问题中,都有很多特定的方式来表示事物,并试图分析、破译、从中生成内容,这并非易事。正确。但我认为随着模型的改进,
人类需要做的工作会少一些。我们这边需要做的工作更少了才能让它工作。如果你看看现在人工智能领域正在发生的事情的结果,我认为很清楚的是,无论模型有多好,它们都没有达到在他们尝试实施这些模型时满足公司期望的地步。
所以IBM本月初发布的一项研究我认为非常有趣。该公司对全球2000名首席执行官进行了关于人工智能的调查。61%的人表示他们今天正在积极采用人工智能代理,并准备大规模实施它们。因此,大多数人都对这项技术的最新应用感兴趣。
但接受调查的首席执行官报告说,在过去几年中,他们只有25%的人工智能计划实现了预期的投资回报,只有16%的人工智能计划在企业范围内进行了扩展。64%的接受调查的首席执行官承认,落后的风险促使他们在对技术带来的价值缺乏清晰了解之前就对某些技术进行了投资。
他们说他们预计他们的投资将在2027年之前获得回报,其中85%的人说,调查中的首席执行官表示,大约三分之一的员工将在未来三年内需要
在未来三年内进行再培训和技能再培训,其中54%的人表示他们正在招聘一年前不存在的与人工智能相关的职位,因此企业正在大力推动这项工作,即使他们不太确定它将如何工作,因为他们害怕错过机会,但当他们真正将这些东西付诸实践时,只有25%的人实现了预期
只有16%的人在公司范围内实现了这一点。也许更好的模型,或者你可以说更好的实施会帮助他们,但可能两者兼而有之。你知道我对这件事的立场。
史蒂夫,再说一次,大多数企业不像折叠蛋白质、绘制人类基因组或进行量子计算或其他什么那样。我的意思是,世界上存在的大多数业务流程都非常简单明了。如果实施得当,今天的模型可以处理它们。但同样,你可以完全想象……
他们投入巨大。他们被承诺一切都会神奇地开箱即用。事实并非如此。然后你就会感到幻灭。但我认为该行业的活力来自于这样一个事实,即每个人都经历过足够的顿悟时刻,他们意识到这在某个时刻会真正奏效。
但我们如何到达那里,是上帝模型吗?只是更好的人员实施?来吧,把你的流程准备好。但无论我们如何到达那里,我认为大多数人都已经意识到我们会到达那里。
好吧,我认为我们,我的意思是,我们一直在将其作为一个非此即彼的问题进行辩论,但在这种特定用例中,我认为两者兼而有之。我的意思是,我想到这样一个事实,所以我将我的播客分析上传到OpenAI的GPT系列的每个后续模型中,并说,这是原始数据,给我趋势,对吧?
这些报告随着模型的改进而变得越来越好,以至于03基于原始数据旋转出一些令人难以置信的商业智能,例如所有内容,剧集名称、收听次数、地理位置,所有这些东西。所以这就是问题所在。如果我们处于所有这些模型都……
都撞到墙上或接近墙上的地步,我认为我们还没有到那里。我认为还有提升空间。但事实上,你在Meta、Anthropic和OpenAI中都遇到了在推出最大模型方面的问题,而他们认为会导致指数级结果的规模增长并没有给他们带来结果。这是一个问题。我的意思是,我下周会和DeepMind谈谈这件事,但是,
在我看来,这是一个问题。我同意这是一个问题。我绝对同意,鉴于每个人都被训练成期望模型解决一切,而不是如果你上传了五个电子表格,只需确保所有五个电子表格的列名一致,那么你可能会得到一些好的结果。我认为我们都被训练成以某种方式思考,但它并没有那样工作。所以我认为这就是幻灭的来源。
那么,告诉我们为什么Cohere的收入出现了一些问题。我最喜欢的一部分是Cohere实际上正在玩我提倡的那种游戏,即更小、更以企业为导向的模型。本周我最喜欢的新闻是,你看到了两个截然不同的标题。路透社的一个标题是,截至2025年5月,Cohere的年收入达到1亿美元。
看似积极、令人兴奋的数字。但来自《信息》的消息是,Cohere,基本上他们向投资者展示了他们将在2024年实现4.5亿美元的年度经常性收入。而现在他们在2025年5月只有1亿美元。而《信息》报道的实际上在2025年2月只有7000万美元。所以不是1亿美元。我认为,对我来说,这实际上是一个很好的例子
再次,期望问题,对于一家我认为只有三年历史的企业来说,1亿美元在任何其他情况下都是相当不错的。当你筹集10亿美元时,它就不那么多了。所以我认为这个更少……
关于Cohere的基本承诺及其在整体竞争格局中的地位,更多的是他们只是,在一到两年内实现4.5亿美元收入的想法有点荒谬。那么,当你将其提升到下一个规模,你是一家像OpenAI这样筹集100亿或400亿美元资金的公司时,你将如何证明这一点?ASI。
显然。就是这样。不是AGI。没有人再提AGI了。不。他们正在走向超级智能的道路。是的。AGI是2024年的事了。现在唯一重要的是ASI。所以我认为我理解我们将如何到达那里。
我的意思是,这可能是一种夸张的说法,但本周DeepMind发布了一件引人入胜的事情。它被称为Alpha Evolve。他们称之为用于设计高级算法的Gemini驱动的编码代理。现在,这里可能有一些夸大其词,但是……
我会读一下他们的帖子。我很想知道你的看法。也许这也证明了模型的有效性。他们说Alpha Evolve提高了谷歌数据中心、芯片设计、人工智能训练流程的效率。所以人工智能训练流程,包括训练Alpha Evolve本身底层的大型语言模型。所以它所做的是……
它基本上设计算法,并且在某些情况下能够提出比现有技术更好的算法。他们这样说,为了调查Alpha Evolve的广度,我们将该系统应用于数学分析、几何学、组合学和数论中的50多个开放性问题。该系统的灵活性使我们能够在数小时内完成大多数实验,并且
在大约75%的情况下,据我们所知,它重新发现了最先进的解决方案。在20%的情况下,Alpha Evolve改进了以前最好的已知解决方案,在相应的开放性问题上取得了进展。他们说Alpha Evolve甚至帮助优化了Gemini的训练,并将训练时间缩短了1%。
并将Gemini架构中的一个重要内核加速了23%。所以也许不是扩展。也许我们只需要设计,或者他们只需要设计能够帮助的程序。
有效地自我改进,人工智能将自我训练,我们将获得智能爆炸,然后我们将达到ASI。你对此感到兴奋吗?你对此怎么看,兰詹?我的意思是,他们继续说,他们说它改进了亲吻数问题,这是一个困扰数学家300多年的几何挑战,它涉及到与一个公共单位球体接触的非重叠球体的最大数量。
所以每当你推进亲吻数问题时,我都会感到兴奋。我完全支持。我完全支持。我们已经尝试解决亲吻数问题300年了,而Alpha Evolve刚刚改进了它。我认为,我的意思是,你是对的。
就像我们实际训练这些模型的方式和架构,而不是原始计算一样。我认为我们应该看到更多创新进步。我认为这也许会让我们到达那里,也许它只会让这些东西更高效,而不仅仅是更强大。但是我……
我认为这在架构和这些非常独特的创新方面是一件有趣的事情,关于我们如何处理它。但模型已经足够好了。我坚持这个观点。继续努力。让我们看看未来几年会发生什么。GPT-5将在本周日发布。女士们,先生们,一个新的模型。
好的。我们从这样一个事实开始,即即使在它们当前的状态下,这些模型也在吸收一切。让我们以另一个关于即使在它们当前的状态下,这些模型也在吸收一切的故事结束。那就是Perplexity与PayPal合作进行聊天购物。
所以兰詹,这是一个与你内心密切相关的故事。你为什么不告诉我们发生了什么?是的。所以Perplexity宣布与PayPal合作。我们已经多次讨论过这个问题,Perplexity在购物方面做了很多工作,你问一个问题,他们会向你展示许多潜在的结果。现在有了PayPal,你可以直接结账,处理付款、运输、跟踪和支持。
我认为这是一件大事,因为之前你必须订阅Perplexity Pro,支付20美元,在那里添加你的信用卡信息。零售商本身必须与Perplexity直接达成协议,但现在任何与PayPal互动的人,他们都将促进所有这些,并且他们拥有巨大的商业关系。所以我认为一方面,这将是对人们对聊天购物的兴趣的巨大考验,并且
我认为我们将看到人们是否真的会这样做。几周前你做了一个非常有说服力的案例,让我100%相信人们会乐意这样做。但本周另一个相关的公告是万事达卡推出了代理支付。我认为这在围绕代理支付技术的独特层面中是独一无二的。首先,我想,好吧,随便吧。这就像另一个荒谬的头条新闻。但是然后
这个想法是,有万事达卡代理令牌,它建立在经过验证的令牌化能力之上,基本上将令牌传递到整个支付流程中,以使其在整个过程中得到验证。就像代理相互交谈一样,你的信息安全地传递。在购物、任何类型的在线支付和商业方面,我认为这实际上会变得非常非常重要。
因为像身份、安全,这些东西在一个单独的网站上已经得到了很好的解决。但是当你让所有这些不同的系统相互交谈时,你如何让它真正发挥作用?所以我认为在这两件事之间,我认为在今年年底之前,我们将看到更多的人通过某种生成式人工智能进行购物。是的。
我同意。那么我们什么时候才能看到Alexa Plus?因为现在已经几个月了,它还没有推出。在我收听了Alex的节目后,我买了一个Echo Show 5。我知道。我当时非常兴奋。我喜欢它。我喜欢Echo Show。我们有一些听众收听了亚马逊高管的节目,他们想知道他们什么时候可以使用他们的设备。现在是5月16日。现在是5月16日。你知道你的Alexa Plus在哪里吗?我不知道。这东西最好尽快推出。更不用说,猜猜几周后会发生什么?WWDC。WWDC。
哦,我们将听到苹果的最新消息。可折叠手机。我们接下来几周会谈论Siri和可折叠手机吗?你最好相信。他们取消了Siri。没有生成式人工智能,他们只是给我们一部可折叠手机。我很满意。对。
Ron John建议蒂姆·库克在舞台上射杀Siri,现在已经成为大型科技播客的传奇故事了。所以也许我们会看到它。我的意思是,蒂姆·库克,伙计,他因为没有去沙特阿拉伯而被特朗普批评,因为将他的制造业转移到印度而被特朗普批评。他所做的只是为他上任基金捐赠了100万美元,并且
他受到了非常糟糕的待遇。我认为蒂姆做得很好。他会没事的。但他确实获得了iPhone和关税的豁免,现在这些豁免可能会被取消。朋友们,我们正处于关键时刻。我们将在周二举行谷歌开发者大会。几周后我们将举行WWDC。我将去湾区参加这两次活动。
希望今年我能参加WWDC。我认为这总是他们当天做出的决定。当然,我们将看看Alexa Plus的情况。正如我们所说,这些东西正在吞噬互联网。收听大型科技播客,了解它的发展方向。在网络消亡之前。在网络消亡之前。Ron John,很高兴见到你。下周见。
大家好,非常感谢收听。再次强调,下周三,德米斯·哈萨比斯将从谷歌I/O现场参加节目。对此我非常兴奋。我们希望那时能见到你。我们下次大型科技播客再见。