OpenAI 成功为自己制造了危机本文来自虎岫科技组作者苏子华你好 我是本栏主播金涛
OpenAI 的算盘失算了 OpenAI 将一场原本可以两个小时讲完的发布会拆成了 12 天每天讲 15 分钟左右这场精心策划的营销盛宴给人制造了一种生怕错过的紧迫感 OpenAI 本以为可以吊足观众的胃口但它却成为了对手的靶子在过去 12 天里 Google 从未如此积极密集地发布自家 AI 产品进展而且每一次都是对 OpenAI 的狠狠狙击
在此期间 Google 先是发布了自己大语言模型 Gemini 2.0 在外媒评测中其在度模态能力和处理速度上相比 OpenAI 的 GPT-O1 已经有明显优势
接着,Google 又发布了对标 Sora 的视频生成模型 VOR,在实测中被认为很多方面好于 Sora,比如 VOR 在生成视频的真实感和细节上更强,而 Sora 在这些方面的表现相对较弱,更容易出现不自然的动作和物体,比如 VOR 可以让用户通过简单的提示来指定更多镜头类型和拍摄方式,使得视频生成过程更加灵活。
即便在第 12 天 OpenAI 一扫此前 11 天的平淡发布了新一代模型 GBT-O3 在各方面的性能上逼近 AGI 但用户并不买账人们认为 GBT-O3 依旧是期货如同曾经的 Sora 一样短期内无法向用户开放
另外在更早些时候根据非盈利组织 METR 在 11 月发布的一项评测 Anthropic 旗下的大模型 CloudSonic 3.5 在 7 项测试中的 5 项都超过了 OpenAI 的 OE Preview 这不代表 OpenAI 不强了毕竟它在三个月内连续发布两个顶尖模型 GBT-OE 和 GBT-O3 但奈何被对手们步步逼近曾经断层式领先的 OpenAI 在两年的时间里从神变为了优秀逐渐和越来越多的对手们站在了同一条起跑线上
甚至开始被超越 12 天的发布会 OpenAI 从万众期待变为口碑下坠而在发布会之外 OpenAI 的状况更是不容乐观为了尽快提高营收 OpenAI 首席商务官 Lean Eddy 表示公司一直在试图与医疗保健制造业和法律公司教育等行业客户达成合作比如 OpenAI 在今年 5 月发布了面向校园的 ChatGPT Audio 还招聘了美国在线教育巨头 Coursera 的前高管担任其教育业务负责人
而根据风投机构 Melo Ventures 的数据今年 OpenAI 在企业 AI 领域的市场份额从 50%下降至 34%而亚马逊支持的 Azeropic 市场份额翻了一番从 12%增至 24%那么 OpenAI 从万众期待到期望落空再到市场份额迅速丢失局面的急剧扭转是怎么发生的
据 The Information 报道就在 OpenAI 为期 12 天的漫长发布会期间又有两位核心人物从 OpenAI 离职其中一位是 OpenAI 元老级成员 Elec Redford 他在 2016 年加入曾经参与过 GPD-1 到 GPD-4O 的研发开源纹生图大模型 Stable Diffusion 的创始人 Emman Mostek 曾经如此评价 Elec Redford
如果他离职了,那 OpenAI 就垮定了。伴随着他的离职,GBD-1、GBD-2 两代模型的核心论文作者已经全部离开 OpenAI。可以说,2024 年成为了这家公司发展历史上重要的转折年份。曾经创建起 OpenAI 光环的人密集地在这一年离开,包括两位联合创始人,一位首席技术官,一位 GBD 创造以及安全和产品负责人,还有刚加入 7 个月就在前不久离开的一位 OpenAI 搜索主管。
他们极少数是自己创业大多数则是加入了 OpenAI 的竞争对手比如谷歌 亚马逊 微软等他们优化大模型的路径几乎都是基于更多的 GPU 数据和顶尖人才密切参与硅谷顶尖人才招聘的 DataBricks AI 副总裁 Namin Rao 最近在接受访谈时表示随着顶尖人才频繁地在不同组织之间流动几乎不再存在什么商业秘密了
他是一位连续创业者在将上一家公司 Mosaic ML 于 2023 年以 13 亿美元的价格卖给了 DataBricks 之后他开始负责 DataBricks 的 AI 产品数据分析公司 DataBricks 在本月刚刚完成了硅谷历史上最大一笔融资高达 100 亿美元
在他看来全球真正能够建立新的前沿大模型的研究人员数量小于 1000 人这也是为何这些顶尖人才的争夺战如此激烈的原因极少有一个行业顶尖人才能够如此频繁的跳槽供不应求的局面给了他们更大的自由和权利
Nevin Rao 说 在大模型赛道 研究人员在组织中拥有的影响力是前所未有的一个研究人员的想法可以完全改变产品 对一家公司的未来产生巨大影响这也是科技产业发挥个人英雄主义最好的舞台 OpenAI 核心人员的大量出走 无疑一边将崛起的秘密和影响力带给了对手 也一边瓦解了 OpenAI 的商业壁垒
在 OpenAI 连续举办了 12 天发布会的最后一天这本应是个大喜的日子华尔街日报却披露了一则重磅消息 GPT-5 的研发进展受阻据报道自 2023 年 3 月 GPT-4 发布以来 OpenAI 一直在全力推进 GPT-5 的研发工作 GPT-5 项目的内部代号为 Orion 至今已筹备了 18 个月之久作为 OpenAI 的最大投资者微软原本希望能够在今年年中看到新模型的问世但这一目标并未实现事实上 OpenAI
OpenAI 已经进行了至少两轮大规模训练而每轮训练都需要几个月时间处理海量的数据并且每次训练都会遇到新的技术难题知情人士透露单是 6 个月的训练运行计算成本可能已经达到约 5 亿美元如今是否值得投入如此巨额的资金已经让人动摇
此外 大模型训练所需的数据一般来自于书籍 学术出版物 新闻文章 社交媒体帖子等各种渠道经验表明 给大模型输入的数据越多 它的智能表现就越好然而 参与 Orion 项目的研究人员表示 现有的互联网数据已经不再足够他们需要更加多样化和高质量的数据已经离职的联合创始人 Illia 也曾指出 互联网上的数据接近枯竭
有知情人士透露,OpenAI 甚至开始探索所谓的合成数据,即由人工智能生成的数据,用以训练 Aurion。然而,研究表明,人工智能生成的数据往往会导致系统故障或产生无意义的回答。
为了训练大模型行业急需新的解决方案但什么方法才是最佳选择业内依然没有达成共识伊利亚也坦言自己完全不知道下一步会发生什么尽管如此部分业内人士认为尽管大模型的能力发展可能面临瓶颈但我们不必因此而过度焦虑如今的大模型已经远超过去的 AI 技术他们依然能够显著改变商业运营甚至重塑整个行业竞争格局
有 AI 投资人认为 AI 的传播热度或许在下降但 AI 领域每个月都有新的进展大模型正在逐渐深入到不同场景和行业中这些可能不那么容易出现在大众事业里可以说现在正是人工智能产业的黄金时代但 OpenAI 面临的挑战和危机却是比以往更多