本期节目我们请到了大语言模型的专家Mengdi来给我们介绍一些大语言模型是怎么回事,DeepSeek有什么特别之处,以及大语言模型的推理能力等话题。
嘉宾:Mengdi 主播:斯图亚特、Vindy、Cat 策划:斯图亚特 剪辑&时间线:季雨清
00:00:59) 从支持向量机到强化学习
00:04:45) All in大模型
00:06:17) 什么是大语言模型
00:09:43) ChatGPT时刻
00:10:20) 为什么被称为语言模型
00:14:16) ChatGPT如何大力出奇迹
00:20:51) ChatGPT时刻后的创新
00:23:19) DeepSeek
00:26:19) 业内怎么看DeepSeek的出圈点
00:28:20) 为什么是OpenAI
00:29:20) 为什么推理依靠强化学习
00:30:35) 推理是否可以泛化
00:39:07) 推理泛化的局限
00:43:34) 推理的未来
00:45:30) 什么是蒸馏
00:52:37) DeepSeek对当前研究的影响
00:56:00) 大模型领域的发展方向
00:58:49) AI Agent
00:59:21) 通用人工智能
01:01:54) 未来科研怎么走
01:05:00) AI应用
01:06:40) 进入AI核心圈需要做什么准备
关于「牛油果烤面包」 「牛油果烤面包」播客入选2020苹果最佳播客,获得年度编辑推荐,聊科技发展趋势,聊各行业来龙去脉。我们坐标硅谷,邀请第一线的资深专家分享给大家听!
欢迎您在每期节目下方给我们留言,和我们的主播互动交流,或是添加微信小助手nygkmb2022,加入微信听友群。如果您对我们的志愿者工作有兴趣,请点击 这个链接) 看我们的招募帖;你有什么有趣的话题,想来作牛油果烤面包的嘉宾,或是对节目有任何的意见或建议,欢迎发邮件和我们联系。我们的邮件地址是:[email protected]
图片: Generated by Dall-E
片头片尾音乐: Courante 1st Cello Suite Exzel Music Publishing (freemusicpublicdomain.com) Licensed under Creative Commons: By Attribution 3.0 http://creativecommons.org/licenses/by/3.0/)