大家好,欢迎收听 AIRC 特别快讯,我是鹏鹏这里是 OpenAI12 天的回顾中章从第 8 天到第 12 天依然给我们带来许多重要的更新接下来让我们快速的浏览最后这 5 天的亮点内容吧
第八天主要给我们带来的是网页和移动端搜索功能的升级首先我们先来看看网页端网页端主要更新了以下三个内容第一个是自动判断是否需要网络搜索并新增搜索网页按钮第二个是支持了电影视频酒店等丰富的搜索结果以图像和列表的形式呈现
可以基于上下文来提问第三点是可以根据明确的网站链接快速的跳转像 Netflix 可以想象有了这个功能之后我们基本上就可以在 OpenAI 上进行一些实时的搜索功能这点有点像 PurpleXCT 然后是移动端的更新移动端它集成了地图的功能可以更加直观的导航然后也优化了本地搜索
其次增加了语音模式的搜索实现了 Search as you talk 通过语音轻松搜索旅行信息和天气的内容相比国内的模型 Chadbot 方面国内搜索其实早有做了但是像语音这一块是一个非常好的点国产大模型也可以跟一下接下来我们来看一下第九天第九天主要是 O1 API 的发布
这里我给大家简单的总结了一下 O1 API 的几个核心能力第一个是函数调用它允许 O1 和外部工具的 API 进行交互内部测试显示性能比 GBT-4O 有显著提升具体错误率降低了 34%第二点是生成了符合 JSON 格式的响应确保 100%的遵守模式以及支持复杂应用的数据提取在测试中处理时间比 4O 缩短了 20%
第三点也是最重要的一点,就是增加了开发者的消息。新的系统消息设置提供开发者更高程度的行为控制,以及适合开发者复杂多层次的应用程序逻辑。第四点是视觉输入,支持分析图像内容,当然这点主要应用在一些制造业或者是科学领域,比如说检测表单之类的。
第五点是推理参数可调它允许开发者调整计算时间以优化不同任务的成本与延迟接下来我们来看一下第十天第十天主要是 AI 通话与 WhatsApp 的支持新增了一个全新的互动模式就是它允许美国用户通过电话接入让不熟悉智能手机的用户也能通过拨号来访问 AI 每个月享用 15 分钟的免费通话
另外一方面它集成了 WhatsApp 这个是只要你有 WhatsApp 就可以跟 ChatGPT 通过文字与语音对话就不需要额外去下载其他应用这项更新的旨在让 AI 更加贴近生活随时随地的为用户提供这种交流和陪伴
我们不得不说 OpenAI 在产品营销上确实是有一定的洞察力的这一点的话我觉得国内一些 2C 的模型厂商其实可以借鉴一下
接下来我们来看一下第 11 天第 11 天主要是桌面端的协同与快捷功能第 11 天内容其实前几天有大致的分享到主要是 ChatGPT 可以访问 PC 应用的窗面窗口内容为用户提供上下文相关的回答无需手动复制和粘贴然后能支持上下文的感知以及快速启动这些功能在 Mac 上已经是支持了然后 Windows 版本会在最近推出
最后我们来看一下第 12 天 OpenAI 在发布会的最后一天给大家带来了一个全新的模型的预告就是 O3 这款突破性的模型不仅在性能上实现了质的飞跃还首次通过了 AI 基准测试 ARC AGI 成为该领域里程碑的成果我们简单来说一下几个核心点第一个就是刚说 ARC AGI 的基准测试
那么 O3 成为第一个突破这个基准的模型低计算模式下得分是 7.5%高计算模式下得分是 87.5%那么为什么有两个成绩呢因为 O3 它支持低思考程度和高思考程度两种设置
高思考程度的算力也是直接拉码虽然成本很高但是它的性能却是随着计算量的增加而提高所以能达到这个水平然后他们还介绍这两种推理模式的应用场景像低计算量模式它是优化了成本和性能比较适用于广泛的应用场景
相反高计算量模式它的成本虽然高但是它能适应更加复杂的新任务那么这个模型什么时候可以用呢 OpenAI 也做了一个简单的预告 O3 mini 的话预计是在明年 1 月底发布 O3 的正式版会再晚一点
关于 O3 模型的具体工作原理我们也只能进行一些简单的推测 O3 模型的核心机制似乎是在 token 空间内进行自然语言程序搜索和执行在测试时模型会在可能的思维链空间中搜索这些思维链它描述了解决任务所需要的步骤
我们后期也会为大家带来更多关于 O3 模型的深度探讨好了以上就是本期的全部内容欢乐的时光总是那么的短暂相信 OpenAI 的这 12 天的发布会也给大家留下了比较深刻的印象我们的特别快讯节目也到这里就结束了感谢大家的陪伴如果你也喜欢本期内容的话求转发求推荐求收藏那么我们下期再见