We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode E107|AI大爆发:OpenAI极早期历史 ,以及图像领域的GPT moment|AIGC特辑

E107|AI大爆发:OpenAI极早期历史 ,以及图像领域的GPT moment|AIGC特辑

2023/4/26
logo of podcast 硅谷101

硅谷101

AI Deep Dive AI Chapters Transcript
People
J
Jim Fan
泓君
Topics
泓君:就OpenAI的早期发展、大模型技术趋势以及未来发展方向与Jim Fan进行了深入探讨,涵盖了OpenAI早期团队构成、技术选择、资金投入、以及大模型的未来市场格局等多个方面。Jim Fan分享了他作为OpenAI首位实习生的亲身经历,以及对大模型技术发展趋势的独到见解。 Jim Fan:详细介绍了他在OpenAI实习期间参与的项目OpenAI Universe,以及对通用智能体和AGI的理解。他回顾了OpenAI早期团队成员的专业背景和研究方向,并分析了Alec Radford对GPT技术发展的重要贡献。他认为,OpenAI早期并未意识到单纯增加算力就能实现大模型,但其研究为之后的大模型发展埋下了种子。GPT-2的涌现智能促使OpenAI下注大规模算力投入,最终成就了GPT-3。他还探讨了数据选择(例如Reddit数据集)对模型生成内容的影响,以及吸引顶尖研究者加入OpenAI的原因(研究自由和公司资源)。 Jim Fan:对未来大模型市场格局的预测是不会是赢者通吃,而是多个大模型共存,每个模型都有自己的专长,并会向多模态方向发展。他认为定义AGI意义不大,更重要的是分析模型的经济价值和社会价值,并指出人工智能是一场新的工业革命,其影响力可能比前几次工业革命加起来都大。他还探讨了大模型未来是通才还是专才的问题,认为通才模型加上插件或特定领域微调的模式将会是未来方向。他详细解释了Segment Anything模型的突破点,以及它对无人驾驶和机器人领域的影响,并将其称为图像领域的‘GPT moment’。最后,他还分享了他对多模态研究和人工智能决策研究的看法,以及他对人工智能未来发展速度的预测。

Deep Dive

Chapters
本期节目邀请了OpenAI的第一个实习生Jim Fan,他分享了在OpenAI极早期(2016年)的实习经历,以及与公司早期大神级科学家们共事的感受。他详细描述了当时OpenAI的研究氛围、研究方向以及对未来大模型发展的初步探索。
  • Jim Fan是OpenAI的第一个实习生,于2016年加入。
  • OpenAI早期团队成员均为业界响当当的大牛,例如GAN的发明者Ian Goodfellow,Adam优化器的发明者Diederik Kingma等。
  • Jim Fan参与的项目是OpenAI Universe,旨在探索通用决策智能体。
  • Alec Radford在Transformer出现之前,就已提出训练大型语言模型,并使用简单的目标函数(预测下一个单词)进行训练,这为后来的GPT模型奠定了基础。
  • OpenAI早期便尝试使用Reddit等非学术数据集进行模型训练,以生成更生动、更富情感的文本。
  • 当时的研究人员并未意识到单纯增加算力和数据就能实现大模型,但这种想法的种子已在当时埋下。

Shownotes Transcript

对于创业公司而言,前十个人最为重要,它会塑造一家公司的基因与文化。我们也想知道,除了信念,到底有没有一些实验上的数据反馈与方法,让OpenAI早期愿意坚定去堆算力。这期节目很幸运,我们找到了OpenAI的第一个实习生,他见证了OpenAI极早期的时刻。 这期音频聊了聊OpenAI极早期的一小段历史,我们的同名视频节目《硅谷101》),也做了一个45分钟的视频,以讲故事的方法去梳理盘点OpenAI的整个成长历程),欢迎对后面的故事感兴趣的同学去关注。

另外,在我们采访前,一篇叫做Segment Anything的论文)又让人工智能圈沸腾了,我们这期嘉宾将它称之为图像识别领域的“GPT- moment”。本期,我们也将解读这篇论文为什么如此有价值以及会如何改变无人驾驶与机器人行业。正如嘉宾所说,人工智能正在几何爆炸式发展,比前两场工业革命大很多,今天我们在播客里提到的难以解决的问题,可能明天就解决了。

本期节目片头是与B站联合定制的推广信息,如果大家对片头提到的人工智能合集感兴趣,可以点击这个链接)

【主播】 泓君,资深媒体人 【嘉宾】 Jim Fan,现英伟达AI科学家,EX-OpenAI and Google AI,斯坦福计算机PhD(twitter:@DrJimFan)

【你将听到】 00:04 开场推荐:B站AIGC视频合集 02:45 正片 03:20 成为OpenAI的第一个实习生,细数坐在身边的大神们 08:45 没有人意识到加算力就可以实现大模型,但2016年已经种下了种子 12:33 GPT2加入数据之后,涌现出智能 13:45 小创新:当Reddit被引入训练数据集,有情景有情感 15:35 不只是Elon Musk与Sam Altman,四位科学家对OpenAI的技术影响更大 16:42 什么在吸引顶级研究者:研究自由与公司资源 18:15 未来大模型的市场格局:不会是赢者通吃 20:36 定义AGI无意义,但要分析模型能带来的经济价值与社会价值 21:40 人工智能是一场新的工业革命,比前两场工业革命大很多 22:58 大模型未来是通才还是专才? 26:59 图像领域的GPT-moment来了:Segment Anything 30:10 无人驾驶、机器人领域将发生大变化 31:13 当计算机视觉可以分割一个从未见过的物体 32:28 语言模型更像操作系统,一场新的人机交互的革命 34:30 GPT3出来很久,做成了聊天的交互方式才引爆互联网 37:17 大模型可以帮忙定机票吗?可以,但挑战点很多 38:25 无法判断是否是钓鱼网站 39:23 不需要输入prompt词的多模态 40:23 为何从机器人研究转向多模态研究 41:48 人工智能几何爆炸式发展,今天的难题可能明天就被解决了

【BGM】 Fast Forward, Pause - Rebecca Mardal Come Clean (baegel Remix) (Instrumental Version) - Gloria Tells 【后期】 AMEI

【在这里找到我们】 公众账号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Google Podcast|Amazon Music 联系我们:[email protected])

Special Guest: Jim Fan.