We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 解构Deepseek:创新背后的第一性原理

解构Deepseek:创新背后的第一性原理

2025/1/25
logo of podcast 美好生意

美好生意

AI Deep Dive Transcript
People
J
Jessica
专注于卡拉OK设置和技巧的专家
Topics
CK: 我作为一名金融从业者,关注Deepseek是因为它在人工智能领域的突破性进展及其对金融市场的影响。Deepseek的出圈,不仅体现在技术层面,更重要的是它对全社会的辐射影响,引发了广泛关注。 Jessica: Deepseek的成功,源于其在技术、成本和开源方面的突破。其模型的性价比极高,性能逼近甚至部分超越国际领先水平,并引发了行业价格战。同时,Deepseek的开源策略进一步提升了其影响力,推动了行业发展。 Jessica: 大模型相比传统机器学习模型,模型规模、数据量和算力需求都更大,能够处理更复杂的任务,例如自然语言处理、多模态信息融合和复杂任务处理等。大模型需要GPU而不是CPU,是因为AI计算的并行处理需求,而GPU擅长并行计算。 CK: Deepseek的商业模式主要包括API收费、定制化解决方案和订阅会员费三种,未来可能还会出现软硬件结合的模式。大模型的应用场景非常广泛,例如客服、广告营销、虚拟人直播等,都将对人们的生活产生深远影响。

Deep Dive

Shownotes Transcript

Deepseek的出圈,超越了仅作为科技行业的一个热点,实际变成了具有一定社会影响的事件。从行业角度,它实现了技术突破,成本指数级下降,模型能力可与国际顶尖一战;从国民情绪角度,它是中国本土创新、硬核创新的一道曙光,尤其是中美对垒、科技竞速的大背景下,其价值可能要在十年后回看时才更具意义。

这些精彩,都指向了Deepseek的创始人梁文锋。模型V3和R1的成就背后,实际上在技术路线判断、组织创新的方式、人才的获取和选择,包括梁文锋自己的人生路径、对终极理想的刻画上,处处可见他鲜明的、“非共识”的观点。他为什么做出这些选择,什么支持了他做出这些选择,才是我们最好奇最想探讨的。

所有的范式都会失效,唯有看本质的能力不变。

——

【时光机】

02:20什么是大模型

03:24它能做哪些传统机器学习模型做不了事

06:15为什么大模型需要GPU而不是CPU

09:58Deepseek为啥突然出圈

15:47大模型的商业模式

20:47Deepseek模型的强对大众有什么影响

23:02Deepseek的AGI理念和践行

26:33梁文锋的人生履历

32:32“非共识”选择一:土博,新人,甚至素人

37:24“非共识”选择二:模型创新的信念和路径

34:27大模型人才画像

41:34什么是第一性原理

46:11为什么商业组织花大钱搞研究:风险收益比可控的决策

51:16为什么看似有先见之明地屯了万卡:AI三要素的组合不变

55:19为什么只用本土人才搞大模型:所有的套路都是上一时代的产物

01:00:37为什么创新需要尽可能少的干预:创新的本质是波动,核心是留白

01:09:36梁文锋为什么选择量化作为职业赛道

——

【主播】

CK:16年金融大厂搬砖工,商业爱好者,干过投研,做过销售,梦想是成为一名小老板

Jessica:13年互联网大厂人类观察员,潜水攀岩,希望体验世界+探索自我