cover of episode E268. 智谱AI受美国出口管制影响 | NVIDIA推出体积最小AI超算

E268. 智谱AI受美国出口管制影响 | NVIDIA推出体积最小AI超算

2025/1/16
logo of podcast 创新灯塔

创新灯塔

AI Deep Dive AI Chapters Transcript
People
西
西娅
Topics
西娅:我关注到美国商务部将智谱AI列入出口管制实体清单,虽然智谱AI回应称不会对其业务产生实质影响,但这无疑给全球AI产业带来新的不确定性。美国此举也引发了其他科技巨头的反对,他们认为新的出口管制规则过于严格,可能会适得其反。 与此同时,大模型领域的价格战仍在持续,企业间的竞争日益激烈。在这样的背景下,英伟达更新了Blackwell架构路线图,优先考虑采用CoWoS封装的双芯片设计,并对B300系列处理器进行了大幅调整,提升了计算性能。这将对AI硬件的未来发展产生深远影响。港大推出的轻量级RAG神器MiniRAG也值得关注,它解决了传统RAG架构依赖大型语言模型的局限性,为边缘AI应用开辟了新方向。 此外,阿里巴巴也在调整其AI业务结构,旗下智能互联事业群现由智能信息事业群总裁吴嘉统管,天猫精灵硬件团队与夸克产品团队融合,这将有助于阿里建立起从内容AI应用到AI硬件的完整链条,推动大模型业务创新迭代。NVIDIA发布的Project DIGITS AI超算,体积小巧,性能强大,也预示着AI超算领域的未来发展趋势。总的来说,全球AI产业正经历着快速发展和深刻变革,既充满机遇,也面临挑战。

Deep Dive

Chapters
本部分探讨美国对智谱AI实施出口管制对全球AI产业,特别是智谱AI自身业务的影响。同时,分析了大模型行业的价格战,以及算力对大模型赛道的重要性。
  • 美国将智谱AI列入实体清单
  • 智谱AI回应称不会对业务产生实质影响
  • 大模型行业价格战
  • 算力成为大模型赛道关键

Shownotes Transcript

欢迎收听创新灯塔这是一档给你带来每日全球科技资讯的节目我是西娅每天都会为你解读科技和商业动态今天是 2025 年 1 月 17 号星期五让我们开始吧今天的节目将探讨美国如何通过最新的出口管制更新影响全球 AI 产业质普 AI 被列入黑名单是否真的不会影响企业务

我们还会了解英伟达如何通过其新的 GPU 设计推动大模型技术的进步这是否将改变 AI 硬件的未来此外我们将关注阿里如何调整其 AI 业务结构这对其大模型战略有何影响接下来让我们来解锁这些商业科技动态吧

美国商务部 1 月 15 日更新出口管制实体清单,智普 AI 成首家被列入的大模型公司,还列出 9 家其关联公司。美方称智普 AI 开发研究危害其国家安全等,智普回应称不会对业务产生实质影响,将继续为用户等提供服务。

1 月 13 日,美國發布《人工智能擴散暫行最終規則》將全球國家分三級進行 AI 出口管制中國等被禁購買 AI 芯片、高端 AI 芯片和必援 AI 大模型出口中國近乎全被禁止此規則遭多家美國科技巨頭反對英偉達、賈古文等通過不同方式表達批評認為新規過嚴會適得其反

而 OpenAI 公布 AI 经济蓝图报告,既表忠心又呼吁政府放松管制等此次 AI 出口管制力度空前,美国此举会影响本土大型科技公司利润后续可能有更多相关动作过去一年,大模型发展迅速,落地后打起价格战 2024 年年末阿里大幅降价,此前价格战虽带来流量,但也影响了企业利润

不过到 2025 年价格战又起字节跳动月支暗面等也加入降价大潮大模型企业在应用落地融资盈利等方面有了转折 2024 年 1 月至 11 月国内大模型中标项目及金额大幅增长百度阿里云相关营收也有提升且融资额有所回温如今算力成为大模型赛道关键全球头部企业积极布局

國內雖有智算中心建設熱潮但也面臨芯片依賴、能耗大、故障率高、利用率不足等問題不過相關方也在努力解決 2025 年大模型賽道主機調式創造實際價值不少企業轉向 AI 應用開發一些企業開啟磨害戰術但企業也不能放棄技術進步畢竟大模型的前景與技術正相關還得接著捲下去

據 TF International Securities 分析師 Ming-Chi Kuo 報導市值萬億美元的 GPU 製造巨頭英偉達更新了 Blackwell 架構路線圖優先考慮採用 Cowazel 封裝的雙芯片設計從今年第一季度起英偉達將專注於 200 系列 Blackwell GPU 的多芯片版本如 GB200、NVL72 單芯片版本 B200A 已停產

其 B300 系列也优先考虑多芯片型号单芯片电体制造优先几滴新款 B200 GPU 性能出色 GB200 与 GraySense CPU 结合能为 LL 推理工作负担提供 30 倍性能等 B300 系列处理器有大幅调整设计计算性能比 B200 系列高 50%还将采用 12Hz HBM 3E 内存对战等改进

此外,英偉達將重新設計 B300 和 GB300 的供應鏈,指銷售搭載特定模塊的 B300。而 CoreOS L 和 CoreOS S 是英偉達 CoreOS 3 平台不同版本,台積電正積極擴充 CoreOS 產能。港大皇超戰術團隊首發輕量級 RAG 神器 MiniRAG,1.5B 手機端可用。

傳統 RAG 架構依賴大型語言模型難以適應小型語言模型局限 MiniRAG 重新設計信息檢索和生成流程由語意、感知、異構圖縮影、清亮及知識檢索等創新組件研究團隊推出評測數據集「Rehear World」模擬真實場景實驗顯示將大型語言模型替換為小型語言模型時 GraphRAG 失效

Light RAG 性能大幅下降而 Mini RAG 性能降幅最大僅 21.26%且僅用約 1/4 存儲空間比如在複雜餐廳識別案例中查詢特定義大利餐廳名字 Light RAG 因小型語言模型局限檢索效果不佳 Mini RAG 則通過獨特機制成功定位目標餐廳 Maniagram

MiniRAG 至以突破應用瓶頸為邊緣 AI 應用開闢新方向項目鏈接:htps_github_udimiRAG 阿里的 AI2C 佈局調整仍在持續旗下智能互聯事業群現由智能信息事業群總裁吳嘉統管天貓精靈業務中心負責人宋剛將向其匯報

目前天貓精靈硬件團隊已和夸克產品團隊融合工作重點規劃新一代 AI 產品及融合夸克 AI 能力之後還將探索 AI 眼鏡等新硬件方向此前 12 月

阿里通益产品团队已从阿里云智能整体划入阿里智能信息事业群如今该事业群除了并入的通益天猫精灵还有夸克等业务此次调整使其建立起从内容 AI 应用到 AI 硬件的完整链条利于大模型业务创新迭代天猫精灵诞生于 AI 1.0 时代入口大战曾经历销量变化等

如今大模型發展給相關領域帶來新機會天貓精靈也有諸多創新動作如 2024 年 5 月新品 X6 搭載夸克 AI 大模型服務等且 2025 年 AI 硬件有望掀起創新浪潮

NVIDIA 在 CES 展前發布會帶來了名為 Project DIGITS 的 AI 超算其被稱為目前體積最小的 AI 超算約範核大小內部採用定製 GB10 超級芯片融合了特定架構的 GPU 及合作研發的 CPU 還配備獨立互聯芯片等

存儲上有 128GB 統一內存及 4TB 固態硬碟它主要作為 AI 開發平台單台可離線運行 200B 參數級大模型兩台可合體帶動 405B 參數量大模型開發訓練

不過,業界人士 Rajakoduri 等對其提出質疑認為其用 FP4 格式計算浮點性能有誇大之嫌但實際上 ProjectsDIGITS 出貨會預裝相關 Linux 系統及系列 AI 軟件庫等有其特定用途未來也可能成為相關領域有力挑戰者 NVIDIA 對桌面及 PC 的 CPU 還有進一步計畫

你知道歷史上的今天都發生過哪些事情嗎?在 1893 年 1 月 17 日英國物理學家威廉·拉姆奇發現了亞氣這是一種稀有氣體廣泛應用於照明和保護氣體等領域這一發現對於化學元素的研究和應用產生了深遠的影響

1966 年 1 月 17 日,美国宇航员埃德·怀特在双子星 4 号任务中进行了美国历史上第一次太空行走这次太空行走不仅展示了人类在太空中的活动能力也为后续的太空探索任务奠定了基础 1989 年 1 月 17 日苏联戈尔巴乔夫和美国总统布什在马尔他举行会晤讨论了削减核武器和改善美苏关系的问题

这次会晤对于冷战时期的国际关系和核裁军进程具有重要意义 2002 年 1 月 17 日美国在线与时代华纳合并成为当时全球最大的媒体公司这次合并标志着互联网与传统媒体的融合对于全球媒体产业的发展产生了深远影响

2010 年 1 月 17 日中国成功发射了第三颗北斗导航卫星这是中国北斗卫星导航系统的重要组成部分北斗系统的建设对于提高中国在全球导航定位领域的竞争力具有重要意义 2019 年 1 月 17 日美国国家航空航天局宣布其新视野号探测器成功飞越了位于太阳系边缘的科伊伯代天体天涯海角

这次飞跃是人类探测器首次近距离观测科伊伯代天体对于研究太阳系的形成和演化具有重要意义这些事件不仅展示了人类在科技、财经、科学和航空航天等领域的不断探索和进步也为我们今天的社会发展和科技创新提供了宝贵的经验和启示好了以上就是本期的所有内容感谢你的收听祝你今天过得愉快我们下期见