Deepseek的出圈,超越了仅作为科技行业的一个热点,实际变成了具有一定社会影响的事件。从行业角度,它实现了技术突破,成本指数级下降,模型能力可与国际顶尖一战;从国民情绪角度,它是中国本土创新、硬核创新的一道曙光,尤其是中美对垒、科技竞速的大背景下,其价值可能要在十年后回看时才更具意义。
这些精彩,都指向了Deepseek的创始人梁文锋。模型V3和R1的成就背后,实际上在技术路线判断、组织创新的方式、人才的获取和选择,包括梁文锋自己的人生路径、对终极理想的刻画上,处处可见他鲜明的、“非共识”的观点。他为什么做出这些选择,什么支持了他做出这些选择,才是我们最好奇最想探讨的。
所有的范式都会失效,唯有看本质的能力不变。
——
【时光机】
02:20什么是大模型
03:24它能做哪些传统机器学习模型做不了事
06:15为什么大模型需要GPU而不是CPU
09:58Deepseek为啥突然出圈
15:47大模型的商业模式
20:47Deepseek模型的强对大众有什么影响
23:02Deepseek的AGI理念和践行
26:33梁文锋的人生履历
32:32“非共识”选择一:土博,新人,甚至素人
37:24“非共识”选择二:模型创新的信念和路径
34:27大模型人才画像
41:34什么是第一性原理
46:11为什么商业组织花大钱搞研究:风险收益比可控的决策
51:16为什么看似有先见之明地屯了万卡:AI三要素的组合不变
55:19为什么只用本土人才搞大模型:所有的套路都是上一时代的产物
01:00:37为什么创新需要尽可能少的干预:创新的本质是波动,核心是留白
01:09:36梁文锋为什么选择量化作为职业赛道
——
【主播】
CK:16年金融大厂搬砖工,商业爱好者,干过投研,做过销售,梦想是成为一名小老板
Jessica:13年互联网大厂人类观察员,潜水攀岩,希望体验世界+探索自我