OpenAI从来没让人失望过。一石激起千层浪,在春季发布会上推出最新大模型 GPT-4o ,能够实时“推理”音频、视觉和文本,这种多模态能力,在教育、医疗等领域将带来具大的应用潜力。
本期我们将围绕“GPT4o”带来的新变革、新机会,邀请我们的新嘉宾@AI算法工程师刘崇寒,一起与我们探讨相关问题。
欢迎你的聆听~
#AIGC #AI #人工智能
【ShowNotes】
00:26 OpenAI 的发布会后是什么样的感觉?
**00:57 **多模态:端到端
09:16 Pi和4o技术背后的差异
**12:46 **快乐的说 apple 是一个token,很丧的说 apple 是另外一个token
15:29 SORA为什么让人惊艳?
**17:13 **开源会落后?
**18:03 **随时打断随时接上,背后的技术难度在哪儿?
22:27 scaling law 失效了吗
**25:22 **文本卷过后,卷 long context、MoE、强化学习
**32:16 **4o免费开放,API价格下调,背后意味着什么?
**35:02 **我们人类和机器的交互方式是不是发生了变化?
**38:01 **苹果IOS18内置大模型
**39:26 **手机会向新的硬件设备迁移吗?
41:03 "指令"的消失
**42:00 ** 4o展现出“恰当”的幽默,这件事有多难?
**44:50 ** Claude和 GPT到底有什么差异
47:43 为什么国内很多人觉得KIMI好用?
**52:24 **模型的好坏:普通人评判模型好不好用 vs 专业的人评判模型好不好用
53:25 现在离 AGI 的距离还有多遥远啊?
54:16 4o的发布对创业方向有什么影响
**59:33 ** 4o怎么能够用到我们自己的工作当中?
【关于主播】
包子:
AI商业应用专家/总工程师,互联网连续创业者,爱好思考和认知。
ID:包子阿巴阿巴
修饼:
科普博主,出版科普读物《迷你物理学》,AI短片创作者。
ID:修饼/修饼想当然
【关于我们】
从AI商业化视角,聊聊AI能不能把所有行业重新做一遍。
聊聊ai领域的新发现、新机会、新认知。
出发,一起看看未来~
【听友交流】
关注公众号:银河早餐铺
微信号:Edward_y