字节跳动在大模型领域的快速进展主要归因于其创始人张一鸣的亲自参与和重视。从2023年下半年开始,张一鸣亲自招募顶尖人才,并明确了字节跳动将自主开发大模型和产品,不再对外投资。此外,字节跳动成立了专门的AI部门Flow,并投入了大量资源和资金,推动了大模型技术的快速发展。
大模型创业公司面临的主要挑战包括技术进化的不确定性、高估值带来的融资压力、产品体验的竞争以及来自大公司的激烈竞争。此外,开源模型的发展也给闭源模型带来了压力,创业公司需要在技术、产品和商业化之间找到平衡,同时应对大公司如字节跳动、阿里等的强势进入。
DeepSeek选择专注于技术探索而非商业化,是因为他们认为在当前阶段,技术的突破比商业模式更为重要。DeepSeek背后的量化基金公司换方拥有充足的资金支持,使得他们能够将全部资源投入到技术研发中,而不必急于考虑商业化。这种策略使得DeepSeek在技术领域取得了显著进展,尤其是在数学和推理能力方面。
阿里云在大模型领域的战略是成为智能时代的计算基础设施提供商。他们通过大规模GPU集群提供算力支持,并推出了模型服务层(MAS),包括模型搭建工具、调优工具和开源模型社区。阿里云的开源模型通义系列在全球范围内获得了广泛关注,下载量超过4000万次,衍生出5万多个模型,仅次于Meta的Lama系列。
大模型创业公司在2023年面临融资困难的主要原因是技术进化的不确定性以及大公司的强势进入。随着字节跳动、阿里等大公司在大模型领域的快速进展,创业公司的技术优势逐渐减弱,导致投资人对创业公司的前景产生疑虑。此外,高估值也使得后续融资变得更加困难,进一步加剧了创业公司的资金压力。
Kimi专注于生产力场景,追求智能的最大化提升,目标是打造一个入口级的产品。而MiniMax则采取了更加灵活的产品策略,推出了多种适应性产品,如虚拟社交和语音模型,强调让AI产品能够被更多人使用。Kimi的策略使其在知识工作者中获得了广泛认可,而MiniMax则在细分市场中取得了成功,如虚拟社交产品星野。
开源模型对大模型创业公司构成压力,因为开源模型降低了技术门槛,使得更多公司可以在开源基础上进行二次开发和创新。Meta和阿里等大公司积极推动开源模型的发展,进一步加剧了市场竞争。创业公司原本依赖闭源模型的技术优势逐渐被削弱,导致他们在产品体验和商业化上面临更大的挑战。
字节跳动在AI领域的组织架构通过成立专门的AI部门Flow来支持其大模型发展。Flow部门汇聚了多个产品线,如豆包、扣子、新会等,并获得了集团的大量资源支持。此外,字节跳动还通过跨部门的协作,推动大模型技术的研发和应用,确保其在AI领域的快速进展。
百度在大模型领域的进展相对缓慢,部分原因是其组织架构的复杂性。百度的基础大模型团队、2C产品团队和2B方案团队分属不同的事业群,导致跨部门协作和资源调配效率低下。此外,百度在预训练模型上的投入回报不确定,进一步影响了其在大模型领域的发展速度。
2023年,AI应用创业者呈现出轻装上阵的趋势,许多创业者选择不依赖VC融资,而是通过自有资金或产品上线后的现金流来支持项目。AI技术的普及降低了创业门槛,使得超级个体和小团队能够快速开发出具有全球竞争力的产品。此外,AI应用创业者更容易进入全球市场,语言障碍不再是问题,进一步推动了AI应用的蓬勃发展。
「稿件操作幕后,文字之外的更多想法和碎碎念。」
本期的主播是曼祺,很高兴和「十字路口 Crossing」)串台,一起来聊《晚点》11 月底发布的一篇文章《中国大模型生存战:巨头围剿,创业难熬》的操作故事和感受,这刚好也是一次大模型创业的年底“非系统”复盘。
这段时间,我感受了非常不同的 AI 面向:先是参加了十字路口和 Abotify 一起组织的一场 AI 创业和开发线下活动(1000 天后的 AI 世界),本来 150 人的活动,有 700 多人报名,最后我目测现场涌入了 200 多人;热火朝天和甚至“乱哄哄”的现场交流与碰撞,是如今的 AI 拼图之一。
而这前后,我们为准备大模型稿件做采访、数据整理和撰文时,又看到了拼图的另一面:字节等大公司来势汹汹,后来居上,它的大模型进展在 23 年下半年还被群嘲,如今已不可小觑——“中国的大象真的会跳舞”。最头部的一批创业公司,尤其是既做模型,又做应用的六小龙无不感受到这只“大象”的压力。
所以我们后来在年底的大模型创业生态稿件中,选择了这样一个主线:“巨头围剿,创业难熬”。本期就是和 「十字路口」一起聊聊这篇稿件的操作,以及更多报道之外的言外之意和“前排感受”。
「十字路口」的两位主播带来了和不同的视角:Koji (杨远骋),联合创办了街旁、新世相和躺岛,他自己现在也在做 AI 应用,是一位活跃的 AI 开发者,对各模型性能区别和 AI 应用的快速变化有一手观察;Ronghui,目前在一家专注科技投资的风险投资机构工作,之前是第一财经周刊驻硅谷的记者,她所在的机构也在积极投资 AI 项目。
时间线传送: Part 1 大模型创业变局:核心变量仍是技术进化的方向与速度 02:33 市场的核心分歧:技术进化的方向与速度? 04:35 if 进化快:也许有创业者能有一定的认知优势 & 模应一体也会更合理 08:16 if 进化慢:产品能力变得更重要 & 大模型头部公司融资不顺 10:00 神奇的 DeepSeek:不是大厂,但资源够多 11:55 不管进化快慢,开源对闭源都有压力 14:44 三种反馈:共鸣、中外关注差异、具体数据讨论 20:23 马云训话阿里投资部的段子背后 21:31 不是创业公司不顺利,是大厂衬托下显得不顺利 23:49 六小龙现状:Kimi 专注做 Kimi,零一不是没产品,智谱 AutoGLM 与手机合作 31:15 Kimi VS MiniMax:前者重注生产力,后者推出更多适应性产品;生产力是大公司的必争之地,MiniMax 星野、Talkie 在细分市场暂时比大厂产品更强 35:50 闫俊杰说追求 Intelligence with everyone;杨植麟说追求智能极限 44:34 大模型创业,一年花费到底多少?投资人的算法 VS OpenAI 花费 47:33 大模型创业公司不是面临一个挑战,而是一组纠缠的挑战 48:40 今日头条上线 1 年多时,就有 1000 万日活
Part 2 字节如何后来居上:招人才、定策略、建组织 52:13 字节在大模型上不如中国其它大公司,百度才是最早的 56:41 去年到今年,直接的变化:一号位亲自招人,确定自己做、不再对外投资,Flow 的成立 01:01:15 字节做 AI 的外部变量:海外的地缘压力 01:02:19 阿里的新战略:AI 驱动、公共云优先;未来的新看点:阿里云 VS 火山云 01:07:02 腾讯,可以后发制人 01:08:40 百度的组织张力,萝卜快跑反而成了百度今年的 AI 亮点
Part 3 应用在蓬勃生长,创业者没空悲观 01:11:45 十字路口xAbotify 线下活动,100 多名额,700 多人报名 01:12:44 超级个人+小团队的蓬勃发展 01:15:28 应用没有爆发?还是预期太高? 01:16:20 好用 AI 应用的例子:Recraft、Cursor 01:20:00 创始人没空悲观,他们一定在寻找出路 01:21:24 “战争不是由拼搏组成的,而是由等待和煎熬组成的。”
相关链接: 我们办了一场全程高能量的 AI 创业者聚会)
晚点独家丨大模型六小龙第一起分拆:零一万物计划独立 AI 游戏公司)
登场人物: Koji 街旁、新世相、躺岛联创,@即刻 杨远骋Koji) Ronghui 美元 VC,前《一财》硅谷记者,@即刻 Ronghui) 程曼祺 晚点科技报道负责人,@即刻:曼祺_火柴Q)
剪辑:十字路口团队
播客封面:《星球大战外传:侠盗一号》
关注《晚点 LatePost》公众号,阅读更多商业、科技文章: