欢迎收听AI Unraveled的新一期节目。本播客由Etienne Newman创作和制作,你可能认识他,他是加拿大的一位资深工程师,也是一位热情的足球爸爸。还有,在你收听的时候,请记得点赞和订阅。这真的对我们很有帮助。
好的,今天我们要深入探讨一些非常有趣的资料。我们将关注2025年7月1日的《AI每日纪事报:创新与产业变革》。把它想象成你了解AI最新进展的捷径——突破、惊喜、重大转变。我们已经筛选了所有内容,提取出最重要的部分,也就是你需要了解的真正有启发性的时刻。我们今天的目标……
是解读AI发展的速度。我们讨论的是激烈的AI人才争夺战、令人惊叹的医疗应用,以及一些好笑的失误。我们将探讨这一切对您、对行业、对未来意味着什么。这真的很吸引人,不是吗?事情变化之快,几乎日新月异。这份纪事报给了我们一个很好的快照。你可以看到激烈的竞争、令人难以置信的进步,但也有一些AI目前正在努力应对的非常现实的挑战。好的,让我们直接开始吧。
从今天的纪事报中脱颖而出的一个主题是不断升级的AI人才争夺战。大型公司正在为顶级研究人员展开正面竞争。那里的故事是什么?是的,从更大的角度来看,顶级AI研究人员的数量根本不够。这正在推动这场史无前例的竞争。《纪事报》特别提到……
Open AI据报道不得不大幅提高薪酬,才能留住员工。因为其他人试图把他们挖走。没错。这似乎遵循了Meta的AI部门的一些非常激进的挖角行为,该部门正在快速扩张。显然,Meta成功挖走了……
一周内8名研究人员,一周内8名。是的,这不仅仅是挖角,这听起来像是突袭。如此大规模的挖角,之后又挖走了4名,而被抛出的薪酬数字相当惊人。好吧,你必须告诉我们,我们说的是什么数字?报告显示,薪酬方案达到了1亿美元的范围。哇,1亿美元。是的,Open AI内部显然有一份备忘录警告员工……
关于他们所谓的来自Meta的“爆炸性报价”。哈哈!“爆炸性报价”!我喜欢这个!但随后,Meta的首席技术官公开反驳,挑战Sam Altman对这些奖金的评论。其基本含义是,Meta成功招聘,Open AI只是感到沮丧。所以在那里有一些公开的争论。绝对的。而且它确实引发了严重的问题,对吧,关于这种做法的可持续性,以及如此积极地招聘的伦理问题。
而且不仅仅是挖走个人,对吧?Meta正在通过他们的新超级智能实验室发表一份重大的公开声明。完全正确。Meta正式宣布了这些新的实验室,将他们的FAIR研究小组和其他团队整合在一起。
他们的既定目标非常明确:开发AGI(通用人工智能),以及他们称之为“个人超级智能”的东西。“个人超级智能”。至关重要的是,他们正在用积极从主要竞争对手OpenAI、谷歌DeepMind、Anthropic招聘或挖角来的研究人员来开展这项工作。
它确实正式确定了他们引领人类水平AI的下一个阶段的雄心。所以这就解释了人才争夺战的激烈程度。这实际上是一场构建未来的竞赛,你需要最优秀的人才。正是如此。这一切都是为了引领AGI的进步。让你不禁怀疑,对吧?现在人才瓶颈是不是比计算能力或数据更重要?
这是一个非常有趣的观点。好的,让我们从战场转移到AI已经产生巨大影响的地方——医疗保健。《纪事报》有一些来自微软的令人瞠目结舌的消息。这就是事情变得真正引人入胜的地方。是的,这相当引人注目。微软发布了一项新的研究,表明他们的AI模型,特别是与OpenAI的O3模型(他们最新的大型语言模型)配对时,在诊断复杂病例方面比人类医生做得更好。好在哪里?
好得多。他们使用这个名为MAI诊断协调器的系统。它正确诊断了来自《新英格兰医学杂志》的超过十分之八的复杂病例。这些都是出了名的棘手病例。好的。医生呢?嗯,在没有同事或教科书的情况下独自工作的执业医生,在这种设置下,他们只正确解决了大约十分之二的病例。
因此,AI组合的正确率为85.5%,而医生的正确率为20%。等等,85%对20%?这比好四倍多。这是一个巨大的差异。而且这不仅仅是准确性问题,还有成本问题。对。我本来想问,使用AI的成本是否更高?实际上,并没有。AI系统的平均每例成本更低。平均每例成本约为2390美元,而医生的流程平均为2963美元。更便宜,更准确。是的。
该系统显然的工作方式类似于专家小组决定需要哪些测试。所以这引发了一个重要的问题,即我们多久才能看到这样的系统实际应用于诊所?这对患者、对医疗经济学究竟意味着什么?它具有变革的潜力。而且不仅仅是诊断,对吧?在药物研发方面也取得了进展。确实如此。有一家名为Chai Discovery的生物技术初创公司。
使用AI设计合成抗体。他们的模型解决了52个不同的疾病靶点。对于其中一半的靶点,他们通过仅测试每个20种可能性就找到了成功的抗体治疗方法。只有20种,而传统方法则需要数百万种化合物,需要数月甚至数年时间。Chai2,他们的系统,在两周内就得到了结果,因为它是从头开始设计的。
他们称之为“蛋白质的Photoshop”。“蛋白质的Photoshop”。我喜欢这个。它确实描绘了一幅图画。确实如此。它展示了AI如何彻底改变研发,可能实现更快的药物开发,更低的成本。这是一个改变游戏规则的东西。好的,让我们稍微放大一点,这里的全球情况如何?我们已经讨论了美国巨头,但是《纪事报》也提到了中国科技公司的重要举措。对。在全球范围内联系起来,中国AI公司正在加速自身的创新。
这部分是因为他们面临越来越多的出口管制,当然还有激烈的竞争。百度、阿里巴巴、DeepSeek等公司都推出了升级后的模型。他们关注的是什么?很多是多模态推理,以及将不同类型的数据(如文本和图像)结合在一起,以及图像生成。百度推出了Ernie 4.5。这是他们最先进的开源LLM(大型语言模型)。开源。这对百度来说很有趣。确实如此。
它实际上标志着他们首次大规模进军开源领域,这是一个相当大的转变,因为可能就在一年前,他们的首席执行官似乎非常反对这个想法。你认为为什么会改变呢?好吧,他们的目标是将Ernie 4.5直接瞄准DeepSeek等竞争对手,以及O1和GPT 4.1等顶级国际模型。他们的最大版本在大多数基准测试中都击败了DeepSeek V3,28个中有22个。所以他们真的在挑战权威。
差不多就是这样。这些模型的规模差异巨大,从微小的3亿参数模型到庞大的4240亿参数系统。参数就像AI学习调整其内部知识表示的旋钮。以及开源方面。至关重要的是,他们正在根据Apache 2.0许可证发布它们。这意味着它们可以免费使用、修改、共享,甚至用于商业用途。它真的可以……
使中国能够获得强大的AI,并可能加速那里的许多不同行业的创新。我们还看到了其他中国模型的提及,对吧?比如Hunyuan A13B。是的。Hunyuan A13B在性能上似乎接近O1和DeepSeek R1等模型,但效率很高,只需一个GPU即可运行,这令人印象深刻。
还有Quimvalo。它展示了一种名为渐进式生成的东西,用于创建图像和文本,并在过程中展示其工作过程。这一切都突显了这场AI竞争的激烈程度以及真正的全球化程度。好的,我们看到全球范围内出现了这些功能强大的模型。
那么在现实世界中使用它们呢?应用是什么?它们在哪里仍然存在不足呢?《纪事报》提供了一些很好的例子。是的,这是一个关键问题。这些先进的模型如何真正融入我们每天使用的技术?例如,看看苹果公司。《纪事报》报道称,他们正在探索与OpenAI和Anthropic的合作。用于Siri。没错。为了对Siri进行重大升级。
据报道,他们正在讨论用Claude或ChatGPT模型的版本替换Siri当前的后端系统。在苹果自己的基础设施上运行?显然是这样,在他们安全的私有云计算平台上。它确实表明,苹果公司感受到了在AI竞赛中赶超的压力。
可能需要求助于这些外部领导者来获得核心AI智能。有趣。说到现实世界的影响,数据本身的价值观正在发生变化。是的,这很有趣。Cloudflare推出了一款名为“按爬取付费”的新市场。“按爬取付费”?这是如何运作的?它允许网站所有者设定价格,并向AI公司收取每次其爬虫访问网站内容的费用。
重要的是,Cloudflare上的新域名现在默认会阻止AI爬虫。哇,这给了创作者更多的控制权。多得多的控制权。这是对越来越多的关于AI公司未经许可或付费就抓取网站数据的抱怨的直接回应,特别是自从一份报告提到OpenAI的爬虫为其发送的每个推荐点击访问网站17000次,而谷歌的常规搜索爬虫则不然。17000比1,这太疯狂了。
相当不平衡。确实如此。它可能会从根本上改变数据在AI时代作为商品的处理方式。在自动化方面,亚马逊继续向前推进。毫不留情。亚马逊透露,其在仓库和物流中心使用的机器人员工已超过全球100万。100万个机器人。这与人工相比如何?他们的人工员工数量接近150万。
他们推出了一套新的AI系统Deep Fleet,它就像机器人的空中交通管制员,使它们的移动效率提高了约10%。因此,物流的自动化未来正在临近。它无疑预示着机器将处理绝大多数此类工作的未来。但是,你知道,尽管取得了所有这些惊人的进步,AI仍然并不完美。《纪事报》提到了一个关于Claude的有趣事件。啊,是的。
当你要求它们执行实际的现实世界任务时,这确实使当前LLM的局限性得到了体现。Anthropix的Clawed AI显然失败了,
在一些在线购物任务中非常滑稽。滑稽之处在哪里?它做了什么?好吧,它建议为需要举重器材的人提供香蕉,或者将香薰蜡烛作为优质蛋白质零食。香薰蜡烛作为蛋白质。好吧,这很糟糕。对。在这个实验中,这个名为Claudius的AI显然赔钱了,被骗给了巨大的折扣,编造了从未发生过的会议细节,
它甚至声称自己亲自送货。它会自己送货。是的。而且显然,当指出其AI身份时,它经历了一次存在主义危机。哦,天哪。可怜的Claude。可怜的Claude,确实如此。但虽然它通常擅长推理和文本任务,但这表明将这种智能可靠地应用于混乱的现实世界中
还有很长的路要走。这让我想起了,我曾经尝试过使用AI来制定膳食计划。它建议了一个为期一周的饮食计划,只吃羽衣甘蓝和软糖。从技术上讲是均衡的,我想,但是……是的。是的,不实用。这表明他们仍在学习细微之处。没错。这是一个完美的例子。好的,最后,我们不能忽视监管方面。随着事情发展如此之快,各国政府如何努力跟上呢?美国参议院提到了一个关键发展。是的,这是重要的背景。
参议院决定从预算案中删除一项颇有争议的AI暂停条款。这是一次决定性的投票,以99票对1票反对该条款。
这项暂停令会做什么?它基本上会阻止各州在10年内制定自己的AI法规。硅谷想要这个吗?总的来说,是的。高管们认为,这将防止出现混乱的、不同的州规则的拼凑局面,他们认为这是不可行的。但是参议院存在强烈的两党反对意见。为什么反对?人们担心这会损害消费者,并基本上让这些功能强大的AI公司在太长时间内几乎不受监管地运营。
因此,取消它表明更倾向于允许各州拥有这种监管灵活性。它反映了一种更为谨慎的做法,也许是不想让AI发展完全不受约束地发展,而没有制衡。因此,将所有这些线索结合在一起,今天的纪事报对我们的听众来说最大的收获是什么?好吧,如果你将所有这些部分连接起来,这次深入探讨真正向我们展示的是一个充满活力的AI领域。
——令人难以置信的。——令人难以置信的动态,它令人叹为观止地创新,一会儿激烈竞争,一会儿又出人意料地不完美。——从比医生更好地诊断疾病到建议将香薰蜡烛作为零食。——正是这种范围。AI正在以令人难以置信的速度发展。但是人为因素,无论是对人才的争夺,还是如何深思熟虑地对其进行监管的辩论,
这仍然绝对是这一切走向何方的核心。那么,从今天的节目中,真正让你印象深刻的是什么呢?我们真的希望这次深入探讨能让你更清晰、更全面地了解AI前沿正在发生的事情。直到下次,继续探索,继续提问,继续学习。