We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode E296. AI风险受关注 | Anthropic、DeepSeek等新进展

E296. AI风险受关注 | Anthropic、DeepSeek等新进展

2025/2/27
logo of podcast 创新灯塔

创新灯塔

AI Deep Dive Transcript
People
A
Anthropic
D
David Luan
D
DeepSeek团队
Y
Yoshua Bengio 等研究者
快手、中科院、南大合作团队
西
西娅
黄佳
Topics
西娅: 我关注到通用人工智能发展带来的AI失控风险,以及当前AI训练方法中存在目标偏差等问题。 Yoshua Bengio 等研究者: 我们开发了非智能体AI系统Scientist AI,通过限制行动能力和目标导向性来降低AI风险,并重新定义人机协作的伦理边界。该系统由世界模型和问答推理机器组成,旨在加速科学发现并作为其他AI系统的安全护栏。 Anthropic: 我们发布了混合模型Claude 3.7 Sonnet,它结合了即时硬杂和深度思考,提升了数学编码和代码能力。此外,我们接近完成新一轮融资,这将增强我们的实力并对行业产生积极影响。然而,我们仍然面临商业化等挑战。 David Luan: DeepSeek的发布引发了股票暴跌,但这其实是新大模型先提升智能再提升效率的转折点。人们最初的理解有误。我还讨论了大模型的局限性以及强化学习的价值,并回顾了GPT-4的缺陷以及Adept公司专注于实用智能以解决Agent可靠性问题的努力。 DeepSeek团队: 我们开源了DeepGEMM,这是一个针对Hopper架构GPU优化的矩阵乘法库,其核心代码简洁,性能却优于现有方案,在不同矩阵处理场景下都展现出优势,例如小批量数据处理时速度提升高达2.7倍。 黄佳: DeepSeek团队在模型开发方面具有核心创新,例如坚持长期主义和开源理念,并通过蒸馏技术提升其他开源模型性能。我们像特斯拉一样,出手精准,并拥有许多核心创新。 快手、中科院、南大合作团队: 我们从数据级、奖励模型和训练算法三个层面入手,提升多模态大语言模型的对齐发展,在多个评估维度上取得性能增益,例如基于提出的数据级和对齐算法对Level OV7B模型微调后,绘画能力平均提升19.5%,安全性平均提升60%。我们还引入了包含E20K精细标注偏好比较对的数据集,并提出了基于批评的奖励模型等创新举措。

Deep Dive

Shownotes Transcript

今天的节目将探讨通用人工智能发展下AI失控风险该如何应对?图灵奖得主开发的非智能体AI系统Scientist AI如何重新定义人机协作伦理边界?Anthropic发布的Claude 3.7 Sonnet有何优势,其融资进展又将对行业产生何种影响?DeepSeek开源周带来的DeepGEMM为何能以简洁代码实现高性能?快手、中科院、南大合作推动的多模态大语言模型对齐发展有哪些成果?接下来让我们来解锁这些商业科技动态吧

00:00:55 AI发展新况:风险关注、新系统及Anthropic消息 

00:02:34 红点创投访谈David Luan及DeepSeek新成果 

00:04:26 DeepSeek及相关合作成果与展望 

00:06:22 DeepSeek开源DeepGEMM相关情况及历史今日事 

    本期主播:西娅

    后期:西娅

    收听平台:小宇宙、喜马拉雅、Apple Podcast 等。

    如果喜欢我们的节目,欢迎点赞评论转发。