We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode DeepSeek深度解读|走私显卡蒸馏OpenAI,天才少女550万美元打落美帝万亿市值?

DeepSeek深度解读|走私显卡蒸馏OpenAI,天才少女550万美元打落美帝万亿市值?

2025/2/8
logo of podcast 李自然说

李自然说

AI Deep Dive AI Chapters Transcript
People
李自然
领导Bootloader,专注于AI技术转化和商业化,成功协助多个出海团队。
韩东
Topics
李自然: DeepSeek的崛起对英伟达的市值造成了冲击,并在全球范围内引发了广泛的关注和讨论。然而,随之而来的是各种质疑和争议,包括被指责为套壳OpenAI,模型蒸馏自OpenAI,甚至使用走私显卡。这些说法在网上广泛传播,但真假难辨。我希望通过这次直播,能够和大家一起探讨DeepSeek的真实情况,以及美国对中国AI行业的限制会带来什么影响。 韩东: 我认为DeepSeek是否套壳OpenAI需要更专业的鉴定,不能仅凭一句“我是OpenAI的模型”就断定。现在的 Frontier 模型或多或少会从其他模型得到一些 Input,但这不代表整个就套了别人的壳。另外,DeepSeek的技术报告提到用80万个推理数据样本,对千万和拉玛做了一些蒸馏。DeepSeek用R1生成推理数据,蒸馏出学生模型,效果比直接对模型做RL还要强。DeepSeek开创了一个很有想象力的方向,用不多的样本数据做SFT就可以把蒸馏的事情搞得更加成功。 李自然: 我觉得DeepSeek大概率不像套壳,因为Gemini也可能拿了中文的数据,Cloud也说自己是ChallengeVT。而且,网上很多人怀疑DeepSeek的技术,说DeepSeek是不是套壳的一个东西。但我觉得,DeepSeek的技术文档有很多针对H800芯片的优化,几乎榨干了H800芯片的所有性能,包括带宽利用率达到理论值的95%。所以我个人倾向于DeepSeek是在H800上面训练出来的,而且换方囤卡时间很长,用走私卡的可能性不高。

Deep Dive

Shownotes Transcript

最近Deepseek火了,不仅让英伟达市值大跌,引发全球关注,还在多国应用榜上夺冠。但随之而来的是质疑和争议:有人说它是套壳,有人声称找到了代码证据。美国政府甚至想制裁它,限制芯片出口。各种说法满天飞,真假难辨。今天聊聊这家公司究竟有多厉害,它的技术原理是什么,美国对中国AI行业的限制会带来什么影响? -时间线- 02:01 中国科技崛起的象征,美国围堵的挑战! 05:55 Deepseek和其优秀的AI团队 11:50 深度学习中的蒸馏技术 17:43 Deepseek与OpenAI的关联性 23:41 Deepseek的API问题 29:38 大模型应用层崛起 35:31 中国半导体行业的挑战与机遇 41:28 开源战略:Deepseek在西方世界的讨论与影响力 47:26 AI公司的谣言与事实 53:21 V3模型的工程优化成就与成本节约 01:05:15 深度学习与人工智能 -互动方式- 李自然个人微信:liziran5460