We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

E296. AI风险受关注 | Anthropic、DeepSeek等新进展

2025/2/27

创新灯塔

AI Deep Dive Transcript

People

Anthropic

David Luan

DeepSeek团队

Yoshua Bengio 等研究者

快

快手、中科院、南大合作团队

西

西娅

黄

黄佳

Topics

西娅: 我关注到通用人工智能发展带来的AI失控风险，以及当前AI训练方法中存在目标偏差等问题。 Yoshua Bengio 等研究者: 我们开发了非智能体AI系统Scientist AI，通过限制行动能力和目标导向性来降低AI风险，并重新定义人机协作的伦理边界。该系统由世界模型和问答推理机器组成，旨在加速科学发现并作为其他AI系统的安全护栏。 Anthropic: 我们发布了混合模型Claude 3.7 Sonnet，它结合了即时硬杂和深度思考，提升了数学编码和代码能力。此外，我们接近完成新一轮融资，这将增强我们的实力并对行业产生积极影响。然而，我们仍然面临商业化等挑战。 David Luan: DeepSeek的发布引发了股票暴跌，但这其实是新大模型先提升智能再提升效率的转折点。人们最初的理解有误。我还讨论了大模型的局限性以及强化学习的价值，并回顾了GPT-4的缺陷以及Adept公司专注于实用智能以解决Agent可靠性问题的努力。 DeepSeek团队: 我们开源了DeepGEMM，这是一个针对Hopper架构GPU优化的矩阵乘法库，其核心代码简洁，性能却优于现有方案，在不同矩阵处理场景下都展现出优势，例如小批量数据处理时速度提升高达2.7倍。黄佳: DeepSeek团队在模型开发方面具有核心创新，例如坚持长期主义和开源理念，并通过蒸馏技术提升其他开源模型性能。我们像特斯拉一样，出手精准，并拥有许多核心创新。快手、中科院、南大合作团队: 我们从数据级、奖励模型和训练算法三个层面入手，提升多模态大语言模型的对齐发展，在多个评估维度上取得性能增益，例如基于提出的数据级和对齐算法对Level OV7B模型微调后，绘画能力平均提升19.5%，安全性平均提升60%。我们还引入了包含E20K精细标注偏好比较对的数据集，并提出了基于批评的奖励模型等创新举措。

Deep Dive

Shownotes Transcript

今天的节目将探讨通用人工智能发展下AI失控风险该如何应对？图灵奖得主开发的非智能体AI系统Scientist AI如何重新定义人机协作伦理边界？Anthropic发布的Claude 3.7 Sonnet有何优势，其融资进展又将对行业产生何种影响？DeepSeek开源周带来的DeepGEMM为何能以简洁代码实现高性能？快手、中科院、南大合作推动的多模态大语言模型对齐发展有哪些成果？接下来让我们来解锁这些商业科技动态吧

00:00:55 AI发展新况：风险关注、新系统及Anthropic消息

00:02:34 红点创投访谈David Luan及DeepSeek新成果

00:04:26 DeepSeek及相关合作成果与展望

00:06:22 DeepSeek开源DeepGEMM相关情况及历史今日事

本期主播：西娅

后期：西娅

收听平台：小宇宙、喜马拉雅、Apple Podcast 等。

如果喜欢我们的节目，欢迎点赞评论转发。

E296. AI风险受关注 | Anthropic、DeepSeek等新进展 09:31 Share

创新灯塔

Deep Dive

Shownotes Transcript

E296. AI风险受关注 | Anthropic、DeepSeek等新进展