We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

解构Deepseek：创新背后的第一性原理

2025/1/25

美好生意

AI Deep Dive Transcript

People

Jessica

专注于卡拉OK设置和技巧的专家

Topics

CK: 我作为一名金融从业者，关注Deepseek是因为它在人工智能领域的突破性进展及其对金融市场的影响。Deepseek的出圈，不仅体现在技术层面，更重要的是它对全社会的辐射影响，引发了广泛关注。 Jessica: Deepseek的成功，源于其在技术、成本和开源方面的突破。其模型的性价比极高，性能逼近甚至部分超越国际领先水平，并引发了行业价格战。同时，Deepseek的开源策略进一步提升了其影响力，推动了行业发展。 Jessica: 大模型相比传统机器学习模型，模型规模、数据量和算力需求都更大，能够处理更复杂的任务，例如自然语言处理、多模态信息融合和复杂任务处理等。大模型需要GPU而不是CPU，是因为AI计算的并行处理需求，而GPU擅长并行计算。 CK: Deepseek的商业模式主要包括API收费、定制化解决方案和订阅会员费三种，未来可能还会出现软硬件结合的模式。大模型的应用场景非常广泛，例如客服、广告营销、虚拟人直播等，都将对人们的生活产生深远影响。

Deep Dive

Shownotes Transcript

Deepseek的出圈，超越了仅作为科技行业的一个热点，实际变成了具有一定社会影响的事件。从行业角度，它实现了技术突破，成本指数级下降，模型能力可与国际顶尖一战；从国民情绪角度，它是中国本土创新、硬核创新的一道曙光，尤其是中美对垒、科技竞速的大背景下，其价值可能要在十年后回看时才更具意义。

这些精彩，都指向了Deepseek的创始人梁文锋。模型V3和R1的成就背后，实际上在技术路线判断、组织创新的方式、人才的获取和选择，包括梁文锋自己的人生路径、对终极理想的刻画上，处处可见他鲜明的、“非共识”的观点。他为什么做出这些选择，什么支持了他做出这些选择，才是我们最好奇最想探讨的。

所有的范式都会失效，唯有看本质的能力不变。

——

【时光机】

02:20什么是大模型

03:24它能做哪些传统机器学习模型做不了事

06:15为什么大模型需要GPU而不是CPU

09:58Deepseek为啥突然出圈

15:47大模型的商业模式

20:47Deepseek模型的强对大众有什么影响

23:02Deepseek的AGI理念和践行

26:33梁文锋的人生履历

32:32“非共识”选择一：土博，新人，甚至素人

37:24“非共识”选择二：模型创新的信念和路径

34:27大模型人才画像

41:34什么是第一性原理

46:11为什么商业组织花大钱搞研究：风险收益比可控的决策

51:16为什么看似有先见之明地屯了万卡：AI三要素的组合不变

55:19为什么只用本土人才搞大模型：所有的套路都是上一时代的产物

01:00:37为什么创新需要尽可能少的干预：创新的本质是波动，核心是留白

01:09:36梁文锋为什么选择量化作为职业赛道

——

【主播】

CK：16年金融大厂搬砖工，商业爱好者，干过投研，做过销售，梦想是成为一名小老板

Jessica：13年互联网大厂人类观察员，潜水攀岩，希望体验世界+探索自我

解构Deepseek：创新背后的第一性原理 01:14:34 Share

美好生意

Deep Dive

Shownotes Transcript

解构Deepseek：创新背后的第一性原理