cover of episode E278. 中国AI初创领先硅谷 | 硅谷内部震荡与竞争加剧

E278. 中国AI初创领先硅谷 | 硅谷内部震荡与竞争加剧

2025/1/26
logo of podcast 创新灯塔

创新灯塔

AI Deep Dive AI Chapters Transcript
People
西
西娅
Topics
@西娅 :中国AI初创公司深度求索(DeepSeek)发布的系列大模型,例如DeepSeek R1和DeepSeek V3,以极低的成本在性能上超越了硅谷巨头Meta和OpenAI的同类产品。其成功秘诀在于创新的训练方法和开源策略,打破了大模型训练对大量算力的依赖,也降低了人工智能创新的门槛。DeepSeek的成功引发了硅谷的震动,Meta内部甚至因此陷入恐慌,其高管高薪与DeepSeek低成本形成鲜明对比。全球最大开源平台Hugging Face也启动了类似项目,斯坦福和MIT等顶尖学府也开始将DeepSeek作为首选研究工具。这场由中国团队引发的AI范式变革正在重塑全球科技竞争格局,也让投资者开始质疑高额的AI投入是否合理。DeepSeek的成功,不仅是技术上的突破,更是对AI产业效率和创新模式的重新定义。

Deep Dive

Chapters
中国AI初创公司DeepSeek的DeepSeek-R1模型以低成本在数学、代码等任务中超越了OpenAI的模型,其开源战略迅速占领开发者社区,引发硅谷震动。DeepSeek的创新训练方法和成本优势,使其在AI领域实现弯道超车。
  • DeepSeek-R1模型在数学、代码等任务中与OpenAI的模型表现相当,成本却只有其1/30
  • DeepSeek-R1模型开源,迅速占领开发者社区
  • DeepSeek的创新训练方法,成本不到同类模型的十分之一

Shownotes Transcript

你好呀欢迎收听创新灯塔这是一档给你带来每日全球科技资讯的节目我是西娅每天都会为你解读科技和商业动态今天是 2025 年 1 月 27 号星期一让我们开始吧今天的节目将探讨几个演员注目的问题深度求索的 Deep Security 模型如何以低成本震撼硅谷 AI 界

开源战略如何帮助 DXeek 迅速占领开发者社区以及全球最大开源平台 Hugging Face 启动 OpenRE 项目意味着什么此外我们还将看看 Meta 如何应对这一挑战

其內部是否真的因 DeepSeek V3 的表現而陷入恐慌接下來讓我們來解鎖這些商業科技動態吧近日 Meta 工程師在美國科技論壇 Blind 上透露中國公司深度求所發布的 DeepSeeker 1 大模型這引發硅谷震動

這款模型在數學、代碼等任務中與 OpenAI 的 OE 評分秋色 AIME 數學測試得分 79.8%超越 OE 的 79.2%編程能力超過 96.3%人類選手而 API 成本僅為對手的 1/30 更令人驚訝的是

其前代產品 Deep-CG3 僅用 2048 塊 H800 芯片和 557 萬美元就完成訓練成本不到同類模型的十分之一這家成立僅兩年的公司打破了大模型依賴萬卡集群的規則

當 Mate 投入 6000 萬美元訓練 LIMA 3.1 時深度求索通過創新訓練方法實現彎道超車他們並棄傳統監督微調直接讓 AI 通過強化學習自我進化就像無需標準答案的學生模型只需遵守把思考寫在 Think 標籤內的格式要求就能在量子光學計算等專業領域超越對手

开源策略让 DeepSeek 迅速占领开发者社区 Reddit 用户惊叹其能本地运行自然杂志指出这是中国在芯片禁令下的突围样本硅谷焦虑正在蔓延 Scale AI 创始人坦言中国正以更低成本追赶英伟达科学家 Jim Fan 甚至讨论其 DeepSeek 能否接棒 OpenAI 使命

正如福布斯所言,這場競賽不再只是算力比拼更揭示了資源優化的驚人潛力當 600 萬美元就能創造頂尖模型人工智能創新的門檻正在崩塌近日

硅谷科技圈正被一場來自中國的 AI 風暴席捲加州大學伯克利分校的三位研究人員僅用 30 美元成本就附現了 DeepSeaCar EekZero 模型的頓悟時刻他們在名為 TinyZero 的項目中讓 3B 參數的基礎語言模型通過強化學習

在數字遊戲裡展現出自我驗證與糾錯能力當模型發現初始方案錯誤時會向人類解題班反覆推敲最終用加減乘除組合出正確答案

更令人驚嘆的是香港科技大學團隊他們僅用 8000 個數學樣本就讓 7B 參數的 Cuin2.5 模型在強化學習後數學推理能力超越使用 50 倍數據量的頂尖模型研究過程中出現戲劇性轉折當訓練進行到第 44 步時模型突然開始自發產生常戀式思考並在解題過程中加入讓我再檢查一遍的自我反思語句

這場低成本 AI 革命正引發連鎖反應全球最大開源平台 Hugging Face 已啟動 OpenRE 項目計畫完全復刻 DeepSeg 的技術路線斯坦福與 MIT 的研究者開始將 DeepSeg 作為首選工具由開發者台延期以替代 SharkGPT 的日常使用隨著應用商店排名飆升與下載量登頂這場由中國團隊點燃的 AI 范式變革正在重塑全球科技競爭格局

近日,中国 AI 初创公司深度求索在短短一个月内接连发布两款大模型以极低成本实现性能突破引发硅谷震动

Meta 内部匿名员工爆料称公司因 DeepSick V3 模型的优异表现陷入恐慌这款模型仅用 550 万美元训练预算便在基准测试中超越了 LiMA4 而 Meta 高管担任的年薪就已超过其总研发成本工程师们正连夜逆向分析技术细节管理层则面临巨额投入的问责压力

更令行業震驚的是 DeepSeek R1 開源推理模型在聊天機器人競技場綜合榜單躍居第三其價格僅為同類頂尖模型的三十分之一卻在代碼、數學等高難度領域拔得頭籌 Scale AI 創始人 Alexander Wan 直言這是中國科技界給美國的苦澀教訓指出當美國科技公司鬆懈時中國團隊正以更低成本、更快速度追趕

随着 DeepSeek R1 成为斯坦福、麻省理工等顶尖学府的首选研究工具外媒集体警示硅谷的技术护城河正在消融这场颠覆背后暗流涌动英伟达股价因 DeepSeek 突破性技术连遭重挫投资者开始质疑千亿美元及 AI 投入的合理性

當一家中國初創公司用不足硅谷高管薪酬的預算打造出世界級模型這場關於效率與創新的競賽或許正在改寫全球 AI 產業的遊戲規則 2025 年 1 月 20 日深夜中國團隊 DeepSick 向全球科技界投下一枚生水炸彈

這次由浙大畢業生梁文峰帶領的百人團隊突然開源了推理模型 DeepSeq-RE 的完整技術方案當硅谷工程師們測試後發現這款模型在數學、代碼等領域的表現竟與 OpenAI 的 OE 正式版旗鼓相當英偉達科學家感嘆我們正見證非美國公司實現 OpenAI 最初的開放使命故事要追溯到 17 年前全球金融危機時

23 岁的梁文峰在浙大实验室里带领同学尝试用机器学习预测金融市场波动当时大疆创始人汪涛曾向他递出橄榄枝但这位广东青年选择了一条更冒险的道路将人工智能与量化交易结合他创立的换方量化十年间管理规模突破千亿积累了全球顶尖的算力资源

2023 年 38 岁的梁文峰将全部筹码押注通用人工智能当同行们争相复刻 GPT 时他的团队却在重构底层模型架构 2024 年 5 月发布的 DeepSick VR 将推理成本降至 GPT-4 Turbo 的 70 分之一震惊业界

這支平均年齡 25 歲的團隊裡 95 後開發者羅弗利設計的核心算法甚至引來雷軍開出千萬年新挖角在瑞士達沃斯微軟 CEO 納德拉嚴肅表示必須認真對待中國這些突破而此刻的杭州兩灣豐仍保持著每天閱讀論文參與編程的習慣

這支由清北英建生組成的天才軍團正用每百萬 Token 僅一元的極致性價比重新定義全球 AI 競賽規則當字節跳動匆忙組建 AGI 研究團隊時 DeepSeek 也讓開源社區沸騰這才是真正的開放人工智能

近日美国总统特朗普签署行政令要求 TikTok 在 75 天内解决不卖就禁用的法律争议这场风波意外引发立场连锁反应主打生活方式分享的小红书在美国市场的日活跃用户数从禁令当天的 3250 万骤降

据第三方监测数据显示仅仅三天内其日活用户数较前一周下滑 17%甚至出现单日流失过半用户的极端情况这场数据地震背后映射出跨境互联网产品的蝴蝶效应

有趣的是,当 TikTok 和呼应政策不确定性陷入焦虑时小红书曾紧急上线中英文翻译功能试图承接难民但突如其来的行政令变化让这场用户迁徙戛然而止有观察者指出这既展现了全球化社交平台在政策夹缝中的脆弱性也暴露出用户迁徙浪潮的不可预测性硅谷的匿名职场论坛上 Meta 工程师的帖子掀起波澜

這位員工透露中國 AI 公司深度球所發布的 DeepSeek V3 模型正引發內部震盪這個訓練成本僅 558 萬美元的巨型模型在多項基準測試中演壓 Meta 的 Lena 系列更令團隊焦慮的是深度球所僅用 278.8 萬小時 H800 顯卡就完成訓練而 Meta 訓練 Lena3 系列消耗的算力足夠生產 15 個 DeepSeek E3

當團隊還在拆解 V3 模型的秘密時深度求索又在今年 1 月扔出更重磅的 DeepSeek IE 這個同步開源權重的模型不僅數學推理能力比肩 OpenAI 最新產品其極簡工程架構更讓 MetaEU 總的 AI 團隊陷入尷尬

匿名帖直指 Metech 生成式 AI 部門存在仁服於世的彎極某些高管的年薪已超過整個 V3 模型的訓練費用而類似的高薪管理者多達數十位這場效率革命正在動搖行業根基

伯克利教授、亞歷克斯、迪馬基斯公開承認深度求索的技術領先地位英偉達股價持有者開始擔憂算力需求銳減而最戲劇性的場景發生在 Meteor 會議室據稱管理層正在緊急討論如何向董事會解釋天價研發預算的合理性此刻所有人的目光都聚焦於即將發布的 Limite 4 這或許將決定開源 AI 領域的權杖歸屬

硅谷的清晨還帶著寒意但 OPEA 實驗室的燈光早已亮起 1 月 23 日這家公司巧然推出名為 Operator 的 AI 智能體它能在你的電腦上像真人一樣點擊鼠標輸入文字甚至遇到網頁卡頓時會自主思考解決方法當系統徹底卡殼這個數字員工會乖巧地將控制權交還人類彷彿在說老闆這部分還是您來處理吧

这种虚实交替的协作场景正在加速渗透现实就在上周旧金山的程序员马克发现 ChatGPT 新增的 Tasks 功能能帮他自动整理会议记要甚至每天早晨 7 点准时发送全球科技动态

而更让人意外的是 OpenAI 技术总监凯特琳在社交平台晒出的工作照里隐约可见人形机器人的金属关节这家成因数据不足解散机器人团队的公司正通过投资 Figure 等企业巧然重构物理世界的 AI 版图资本市场的硝烟同样浓烈

谷歌刚向 Anthropic 追加 10 亿美元投资马斯克的 XAI 就推出独立版 Grok 应用其 5G 数模式允许 AI 说出更接近真实人类的表达而在国会山马斯克主导的政府效率部开始运作他与奥特曼等科技领袖正在推动的星际之门项目计划用 5000 亿美元建造全美 AI 基础设施

这些暗流涌动的布局恰似奥特曼预言的那句今年我们或许会看到第一批 AI 同事真正加入职场你知道历史上的今天都发生过哪些事情吗?1. 1967 年 1 月 27 日美国阿波罗一号飞船在测试中发生火灾导致三名宇航员丧生这次事故暴露了阿波罗计划中的安全问题

促使 NASA 对飞船设计进行了重大改进为后续成功登月奠定了基础二、1984 年 1 月 27 日苹果公司发布了麦金塔电脑这款电脑以其图形用户界面和鼠标操作引领了个人电脑的革命对整个计算机行业产生了深远影响

3. 1996 年 1 月 27 日意大利天文学家在火星表面发现了液态水的证据这一发现证实了火星上存在水的可能性为寻找外星生命提供了重要线索 4. 2002 年 1 月 27 日美国国家航空航天局的火星奥德赛探测器成功进入火星轨道

他攜帶的 Gamma 射線光譜儀發現了火星土壤中的水分子為火星探測任務提供了寶貴數據 5.2010 年 1 月 27 日蘋果公司發布了 iPad 平板電腦這款設備其輕薄設計和多點觸控屏幕迅速成為市場上最暢銷的平板電腦引領了移動計算設備的潮流

6.2016 年 1 月 27 日,美国国家航空航天局宣布,通过开普勒太空望远镜发现了 1000 多颗新的系外行星,这一发现极大地扩展了我们对宇宙中行星多样性的认识,为寻找宜居行星提供了更多候选目标。

以上就是历史上 1 月 27 日发生的一些重要科技、财经、科学和航空航天事件这些事件不仅改变了人类的生活方式也推动了科学的进步和探索好了以上就是本期的所有内容感谢你的收听祝你今天过得愉快我们下期见