大家好, 欢迎来到 脑 放 电波。 脑 放 电波 是 一档 关注 科技前沿 品牌营销 和 个人成长 的 谈话 类节目。 每期 带给 您 一个 有趣 的 话题, 帮 您 在 信息 严重 过载 的 现代 世界 小幅 自我 迭代。 我是 托马斯。
我是 尼克斯。 是从 他 熟悉 的 地方, 用 他 熟悉 的 方式 来 享受 了 这个 A I 的 好处。 而 不是说 我 让 一个 AI 去 帮 我 去 杜撰 我的 想法、 语气 和 情感。
他 竟然 去 玩起 了 这种 谐音 梗, 管 自己 叫 apple intelligence。 这个 其实 在 营销 的 自信 度 上 其实 是 差 了 一个 级别 的。
在 某 一次 财 报上, 他 讲 自己的 优势。 我 提供 相同 级别 的 免费 的 A I 服务, 我的 成本 是 最低 的。 所以 这个 未来 有可能 是一个 非常重要 的 一个 优势。 大家好, 又是 一年 的 W W D C。 我们 录制 的 时候 是 刚刚 看 完了 这个 主题 演讲, 然后 再加上 看 完了 第一天 的 这个 开发者 课程, 我们 觉得 今年 的 W W D C 和 去年 发布 vision pro 一样, 也是 非常 有料 的 一次 盛会。
对, 很多 朋友 应该 是从 去年 的 wwdc 开始 听 我们 节目 的, 当时 我们 其实 迎来 了 vision pro 的 历史性 的 发布。 在 今年 的 W W D C, 苹果 第一次 发布 了 它 完整 的 A I 战略。 其实 也是 过去 的 两年 里面, 整个 科技 行业 最大 的 兴奋点 就是 A I 的 这个 A I G C 的这 一波 热潮, 苹果 终于 算是 赶上 趟 了, 其实 我们 发现 很多 的 媒体 的 报道 其实 没有 抓住 重点, 他们 更多 的 关注 GPT4O 的 引入, 以及 苹果 的 一些 AIGC 的 能力。 但 在 我们 看来, 这些 都 不是 这一次 苹果 A I 能力 真正 强大 和 厉害 的 地方。 所以 在 本次 的 这 期 节目 里, 我相信 大家 如果 听 完 我们 这 期 节目, 我们会 整体 的 跟 大家 去 分析 一下, 在 这次 W W D C 上, 苹果 发布 的 apple intelligence 究竟 强 在哪里。
我们 非常幸运, 我们在 录制 的 时候, 我们 刚好 看完 了的 苹果 在 第一天 给 开发者 的 2到3个 小的 session。 其实 它 把 很多 在 发布会 上 没有 讲到 apple intelligence s 对于 开发者 生态 的 一些 诉求 想法, 甚至 这些 设计 理念 非常 完整 的 呈现 了。 我们 除此之外, 我们 甚至 还 看到 苹果 在 整个 系统 及 A I 架构 上 的 一个 先进性。 或者 是 说 再 甚至 再 往前一步, 它的 云 服务, 它的 芯片 到底 这个 到底 是 怎么样? 构成 了 一个 apple intelligence 非常 强 的 一个点。 我们 希望 深入 代码, 深入 这些 在 发布会 上 没有 讲 的 内容, 为你 聊 一 聊 强 在哪儿。
当然了, 这次 的 这个 发布 里 我们 也 看到 了 一些 隐患 和 问题。 接下来 我们会 在 第二 趴 跟 大家 解析, 我们 看到 了 哪些 一个 巨人 身上 的 弱点。
以及 第三 部分, 其实 我们 想 讨论 一些 商业 层面 的 一些 问题。 比如说 在 苹果 举行 这次 发布会 之前, 其实 很多人 一直 把 苹果 跟 google 和 open eye 来去 对比。 他 觉得 你 没有 这种 很强 的 一些 个 季度 大 模型。 但是 我 觉得 今天 过后, 我相信你 应该 不会 再 把 这三家 公司 放在 一块儿 了。 因为 至少 你 会 发现 苹果 至少 跟 他们 俩 完全 不在 一个 生态位 上, 苹果 也 完全 不需要 去 超越 他们, 对 吧? 除此之外 的话, 也有 几个 经典 的 商业 问题, 我 觉得 我们 这 一期 要 简单 的 聊 一下。 比如说 A I 手机 到底 是不是 一个 正确 的 A I 硬件 的 一个 答案, 以及 就是说 苹果 代表 AI 手机 这个 阵营 算是 交卷 了, 那 算是 短期 交卷 对 吧? 那 长期 来看 苹果 的 优势 到底 会 是什么?
好, 我们 就 先 进入 正题, 我们 话 不多 说到底 wwdc 发布 了 一些 什么东西 呢? 我们 请 ny x 来做 一个 快速 的 介绍。
好吧? 因为 发布会 的 凌晨, 我们 简单 的 说 一下。 如果 你是 iphone 手机 的 用户 来说 的话, 你 今天 你 现在 你可以 更好 的 控制 你的 主 屏幕 和 控制中心。 然后 如果 你是 ipad 用户 的话, 你 OK 你 现在 有 计算器 可以 用了。 然后 如果 你是 mac 的 用户 的话, OK 你可以 把 你的 手机 的 屏幕 投到 你的 mac 上, 然后 在 你的 麦克 上 直接 用 你的 手机 A P P。 除此之外 关于 苹果 手表 ipod s 也有 一些 更新, 但是 这些 全都 不是 重点, 这 都 不是 重点。
今天 我们 这 期 节目 就 聚焦 一个 重点, 叫做 apple intelligence, 就是 这个 所谓 的 苹果 的 这个 A I。 但是 apple E L L I G S 的话, 其实 现在看来 很多人 觉得很有 料 的, 是什么 能够 帮助 我 去 回 邮件 对 吧? 然后 能有 这种 更 自动化 和 智能化 的 通知 提醒, 以及 有 一些 所谓 的 什么 什么 消除 旁边 不需要 的 人, 对 吧? 你 拍 个 照片, 你 把 旁边 不需要 的 人 消除 掉, 有 类似 这样的 一些 功能。 但是 我们 也 想说 这些 东西 其实 也 不是 重点, 包括 刚才 我们 提到 的 GPT4O 这些 东西 通通 都 不是 重点。 我们 今天 要 核心 讲 的 重点 其实 是 来自于 说 apple intelligence。 是 所以 就 到 第一 部分, 我们 来 讲一讲 我们我们 从 细节 里面 看到 了 apple 做 的 非常 好的 一些 地方。
对, 在在 这次 W W D C 上 苹果 也 把 它的 vision O S 做了 小幅 的 更新, 并且 公布 了 vision pro 在 全球 的 其他 市场 的 上市 时间。 我们 现在 知道 6月28 号, 中国市场 将 迎来 国行 版 的 vision pro, 起价 应该 是 29999。 那 关于 这次 vision O S 的 升级 和 中国 版 的 国行 的 内容, 我们会 在 后续 的 节目 里 专题 为 大家 介绍。 所以 今天 我们 就 聚焦 apple intelligence 到底 强 在哪里 这件 事情。
O K 好, 我们 还是 聚焦 在 apple intelligence 这个 部分, 然后 讲一讲 它 强 在哪里。 其实 apple echlin gis 最最 容易 让人 想到 的 部分, 其实 就是 所谓 的 说 现在 上了 这个 大 模型 之后, 应该 是 有 AIGC 的 这个 能力, 对 吧? 那 苹果 这次 开放 了 哪些 AIGC 的 能力 呢? 其实 是 围绕 着 生成 图片 和 生成 文字 来 的那 在 生成 文字 领域 的话, 其实 它 展现 的 几个 展现 的 几个 最 重要 的 应用。 比如说 帮你 这个 写, 帮你 重新 写 一个 邮件 的 回复, 帮你 润色 对 吧? 然后 在 生成 图片 部分 的话, 主要是 能够 帮你 生成 一些 图像, 甚至 是 说 很 搞笑的 就是 又 一次 拿 生成 表情包 这个 东西 来说 事情。 但是 我自己 看 了 一下 这个 开发者 的 这个 session, 苹果 还 非常 强调 一个点, 叫做 什么 呢? 叫做 所有的 应用 你 今天 都 可以 非常 轻松 的 接入 我的 这 几个 AI, 生成 图片, 生成 文字 的 这个 能力, 对 吧? 我 把 它 简单 的 概括 为 三段 代码, 让 你的 A P P 免费 升级 为 AI APP。
实际上 这些 能力, 如果 大家 对 A I 有所 关注 的话, 你 会 发现 它 其实 是 通用 的, 几乎 在 所有的 平台 都能 看到 的 这种 能力。 但是 在 作为 一个 平台, 平台 上 的 A P P 如果 都要 去 接入 这些 大 模型。 其实 对于 每一个 独立 的 A P P 的 开发者 来说, 它的 这个 工作量 和 难度 其实 蛮 大 的。 因为他 需要 自己 去 搞定 它的 这个 大 模型 的 A P I, 然后 通过 云端 的 接入 能够 实现 一小部分 独立 的 内容。 但是 今天 苹果 提供 的 这些 A P I, 它 能够 让 所有的 A P P 被 打通。
这些 A P P 通过 他的 刚才 提到 的 这个 三段 代码。 比如说 你是 文字 的 内容, 你 只需要 把 代码 加 在 你 这个 标准化 的 文字 的 这个 框架 内, 你 就可以 让 这 段 这些 文字 可以 被 apple 的 A I 所 访问。 那么 它 就可以 帮你 去 完成。 比如说 rewrite, 它 可以 帮你 重新 定义 其他 的 语气, 重写, 发现 你的 语法错误 并 修正, 帮你 润色 这段话, 或者 是 帮你 summarize 一段 很长 的 内容, 这些 就 变成 一个 这些 其实 我们 常见 的 大 语言 模型 的 基本 能力。 但 这些 能力 通过 非常简单 的 方式 就让 苹果 生态 内 的 A P P 快速 的 获得。 不需要 任何 额外 的 努力, 你 甚至 不需要 去 担心 我的 tokens, 我需要 用 谁家 的 A P I 等等, 苹果 我 就 帮你 搞定 了。
非常重要 的 一个点 是 免费。 因为 现在 很多 A I 应用, 它 一 上来 其实 就 收费, 对 吧? 就是 因为 说 他在 云端 的 维护 成本 其实 非常 贵。 但是 苹果 这一次 非常 慷慨, 一 上来 就是说 所有的 人都 是 免费, 可以 直接去 调用 这些 A P P 的。
然后 这个 点 的话, 其实我 觉得 就和 很多 的 手机 厂商, 或者说 同行, 其实 是 就 拉 出了 比较 大 的 一些 差距。 因为 同行 目前 在 说 A I 能力 的 时候, 他们 可能 还是 几个 领域 的 功能。 他在 说 我 有 很 好的 图像处理 能力, 我 有 很 好的 语音识别 能力, 我 有 很 好的 信息检索 能力, 然后 这些 东西 都 是我 这个 系统 直接 帮你 做好 了。 就 好像 三星 他在 他的 手机 在 国内 做 图片处理, 他 会说 我是 power 的 百度 或者 美图。 那你 你那 你 当然 可以 想象 说 三星 其实 作为 三星 作为 这个 应用 的 开发者, 他 其实 会有 一个 成本, 他 要 去 给 美图 付 token 的 钱。
对 吧? 是的, 如果 以 这个 手机 厂商 来说 的话, 目前 苹果 应该 是 第一个 提供了 它的 生态系统 里面 完整 的 A I 的 交付 能力 的 一个 厂商。 这 里面 当然 刚才 提到 免费 对 吧? 提到 这个 非常简单 的 A P I 的 接入。 这个 其实 背后 是 苹果 非常 强 的 开发者 的这 一套 生态 的 这个 生态系统 的 能力, 带来 的 这种 平台, 埃及 的 A I 的 这种 赋能 的 能力。
其实 像 三星 刚才 提到 它它 可能 在 国内 跟 百度 合作, 在 海外 它 基本上 是 跟 G 合作, 谷歌 的 A I 这些 合作 仅限于 他的 自己的 一些 点状 的 A I 的 应用。 比如说 我的 图像 的 一些 基本 的 A I 能力。 比如说 可能 我 有 这种 录音 的 summary 的 这种 录音 的 这种 总结 的 能力。 那 这些 能力 都是 他 自己的 官方 的 地方 的 应用, 通过 接入 谷歌 来完成 一个 又 一个 的 A I 能力。 但是 它 整体 的 手机, 首先 它 在 端 侧 应该 是 没有 很 明确 的 A I 能力。 第二, 这些 能力 其实 他 没有 开放 给 他的 开发者, 开发者 其实 是 无法 调用 和 他 这个 本机 的 能力 的。
把 A I 能力 给 到 开发者 有 什么样 的 好处 呢? 我 觉得 现在 可以 大胆 下一个 预测, 一个月 之内 至少 有 5000个所谓 的 A I M powered 的 这个 A P P, 对 吧? 会 在 apple 的 生态 里面 出现。 所以 你 就可以 想象 这个 数量 上 的 一个 巨大 领先, 它 马上 就能 体现 出来 了。 而且 刚才 提到 就是说 刚才 托马斯 提到 就 生 图 的 那个 能力, 就 生 图 的 那个 能力 我真的 印象 特别 深刻, 因为 它 叫做 image playground A P I。 那个 A P I 真的 就是我 看 课程 它 就是 三段 代码, 就 复制粘贴 进去。 然后 他 就在 自己的 ipad 上 调试, 是 那个 ipad 就能 生成 图片 了, 它是 一个 笔记 软件, 马上 就能 生成 图片。
我说 这个 接入 的 门槛 太低 了。 而且 说到 接入 门槛 低 这件 事情, 其实 苹果 真的 不是 第一次 在 做 这样的 事情。 就是 我们 想 它的 开发者 生态 好, 一方面 是 有 号召力, 另外 一方面 就是 工具 门槛 低, 工具类 的 全。
我 举 一个 例子, 在 2023年 的 时候, 其实我 去 看 W W D T decision, 就是 当时 还没有 transformer 这种 很强 的 这种 大 模型, 对 吧? 但是 当时 的 苹果 它 都能 卷 到 什么 程度 呢? 比如说 你 机器学习, 你 要 用 这个, 你 要 做 人脸识别, 对 吧? 当时 苹果 能 想到 什么 需求 呢? 就是 有的 开发者 他 要 识别 猫 脸、 狗脸, 然后 你 继续 学习, 你 要 识别 人体 的 姿态, 苹果 那个 时候 就能 想到 说 有的 开发者 他 要 识别 狗 的 姿态。 所以 你 就 想 这是 多 小众 的 需求。
所以 苹果 在 那个 时候 就 已经 把 这种 模型 训练 好, 直接 内置在 系统 底层, 说 你 开发者 是 直接 12GAPI 调用 就 好了。 我 觉得 通过 这 几个 例子, 所以 可以 预见 苹果 的 这个 生态 会 非常 好。 而且 我 觉得 接下来 我要 做 一些 点评。
其实 苹果 的 这个 做法, 其实 它 解决 了 几个 问题。 比如说 第一个 所谓 的 A I 应用, 它是 没有 走向 大众 市场 的 kde APP 的, 是的, 就 哪怕 是 说 我们 投资人 经常 讲 的 一些 什么 correct 点 AI 大家 都 知道 它 还是 亚文化 的 产物, 对 吧? 就是 这个 本质 的 问题 就是说 你 今天 跟 一个 聊天机器人 做 很深的 互动 这件 事情。 我 上个月 看 一个 分析报告, 就是 在 中国 和 美国 其实 都 是一个 渗透率 没有 超过 5% 的 一个 事情。 也就是 只有 5% 以内 的 人 在 使用 这些 聊天机器人。 所以 从 交互 上 来说, 这样的 聊天机器人 和 语音, 它的 这个 状态 它 就是 错的, 所以 它 会 出现 什么 情况 呢? 比如说 我 看到 一个 例子, 就是说 某一 版 的 W P S, 它 把 它 因为 接入 了 A I 他 把 那个 图形界面 他 砍 得 比较 狠, 很多 button 砍 得 比较 狠, 结果 就会 导致 一个 问题, 就是 很多 用户 其实 他 就 发现 他 常用 的 那个 功能 找不到 了, 他的 效率 反而 降低 了。
我 能够 看到 有一个 亮点 其实 是 蛮 受 好评 的。 就是 叫做 说 有人 在 对比 说 谷歌 的 A I 是 告诉 你说 我 能 帮你 回 邮件, 我 能 直接 帮你 把 那个 邮件 写 完。 但是 苹果 的 A I 不是 这样, 苹果 的 A I 它是 它的 写作 那个 部分, 它 有一个 功能 叫做 smart reply。 它的 smart reply 是什么 状态 呢? 它 并 不是说 直接 帮你 咔嚓 一段话 帮你 写 出来, 而是 他 理解 了 发给你 那个那个 邮件 之后, 他 给 了 你 几个 选项, 比如说 他是 一个 活动 邀请, 那 就会 问 你说 你到底 要不要 参与, 以及 就是说 你到底 是 怎么 过去, 是 uber 打车 过去 还是 怎么 过去?
苹果 的 人是 先 理解 了 用户 到底 想 表达 什么 意思 和 态度, 然后 我 再 帮你 写 东西 出来。 也就是说 那个 基于 图形界面 的 交互 还是 在 的。 从 交互 上 来说 是 用户 更 熟悉 的 G U I, 从 APP 的 选择 上 来说 是 用户 更 熟悉 的 原有 的 那些 非 A I 的 APP 对 吧? 那 从 这 两个 点 上 来说, 我要 夸 一下 苹果。
我 觉得 苹果 这个 点 其实 做 的 挺 符合 所谓 的 用户 价值 的。 就是 用户 是用 是从 他 熟悉 的 地方, 用 他 熟悉 的 方式 来 享受 了 这个 A I 的 好处。 而 不是说 我 让 一个 A I 去 帮 我 去 杜撰 我的 想法、 语气 和 情感。
是的, 苹果 它 其实 接入 A I 的 方式 并不是 像 我们 之前 聊过 的 A I 硬件 那样, 希望 整体 从 底层 重构 交互, 对 吧? 不再 有 G O I 了。 我们 用 这个 rapidly r 一 通过 对话 的 方式 或者 是 A I P 投影 出 一些 东西 来 就 把 事儿 干了。 苹果 的 思路 还是 非常简单 的, 就是我 如何 在 现有 的 框架 内, 我 跟 开发者 的 生态 不变 的 情况下, 我 如何 用 我 现在 的 phone factor, 我的 一个 屏幕, 一个 平板, 一个 这样的 设备 去 最 快捷 的 完成 用户 的 需求。 那 显然 G U I 是 不可能 跳过 的, 因为 我们 知道 视觉 的 效率 仍然 是 最高 的对 吧? 我 既然 有 这样的 设备, 我 为什么 一定要 去 强调 说 我 跟 你的 交互 就 通过 语言 就 好了, 我不需要 这种 更 高效 的 一种 表 格式 的 这种 对话 或者 是 这种 交互。 当然 其实 苹果 这次 在 交互 上 也有 很多 的 迭代 跟 革新, 一会儿 我们 讲 siri 的 时候 会 聊到。 整体 来说 苹果 的 这种 A I 的 接入 是 更 符合 用户需求 的。 它是 平台 级 的, 赋予 了 整个 平台 A I 能力 的 这种 接入 方式。
刚才 讲 了 就是 A I 是 generate 的 东西。 其实 接下来 还 会有 一个 重头戏, 就是 苹果 的 这次 apple chAllenge es 其实 它 理解 的 能力 也 非常 强, 甚至 是 行动 的 能力 也 开始 出现了, 对 吧? 所以 这个 其实 就是 它的 关于 整个 A I 的 这个 系统 架构 了。
然后 刚才 既然 提到 了 这个 系统 级 的 能力, 其实 我们 还是 要 回过头来 跟 大家 在 完整 的 介绍 一下 apple intelligence 这个 整体 的 架构。 它 其实 整体 的 架构 除了 刚才 我们 提到 的 两个 部分。 第一个 叫 language, 对 吧? 就是 语言 的 这个 大 模型。 第二个 是 image, 它 有一个 diffusion 的 大 模型 之外, 其实 它 还有 更 重要 的 两个 地方, 要 体现 它 平台 级 能力 的 地方。 第一个 叫做 action, 也就是说 苹果 的 大 模型, 它 不是说 我 只 会说 或者 只会 造出 一张 图片 来, 它是 可以 跟 你的 手机 完成 一次 action, 完成 一次 交互 和 执行 一个 任务 的那 这个 点 其实 是 非常重要 的那 再 下来 一个点 叫 personal context, 就是 它 能够 理解 你的 用户 的 个人 的 情境, 它 能够 识别 用户 的 意图, 他 甚至 能够 懂 你那 这些 地方 其实 在 整个 apple 的 演示 里面 做了 非常 多 的 展现。 就是 用户 他 其实 是 一体 两面 的 东西, 就是 用 他 能够 用 语言 去 跟 用户 交互。
通过 长期 的 交互, 通过 一些 系统 级 的 非 系统 级 的 一些 应用, 它 能够 识别 你的 personal context, 里面 可能 包括 了 你的 个人 的 驾照 的 号码。 它 从 一张照片 的 截图 里 就可以 得到, 对 吧? 他 可以 了解到 你 很多 对话 的 上下文。 然后 根据 这些 信息, 它 在 能够 通过 这种 多轮 对话, 或者说 这种 个人化 的 对话 的 内容, 去 识别 你 真正 的 意图, 并 完成 最后的 action。
这些 能力 其实 贯穿 在 整个 apple intelligence 里面。 尤其是 核心 的 siri 的 变化。 我们 可以 看到 这一次 的 siri 有着 非常 大 的 变化。 首先 它的 交互方式 做了 一个 彻底 的 革新。 过去 我们在 讲 siri 的 时候, 我们在 呼唤 它的 时候, 它 会 出现 一个 圆形 的 siri 的 这个 图标。 在 整个 界面 的 最 下面, 我是一个 pop P O P 的 一个 弹 出的 优先级 高于 原来 访问 层级 的 这样的 一个 一 一个 进程。
现在 siri 的 交互 变成 一个 彩色的 一个 边框, 它 会 出现 在 你 整个 手机 的 外 框, 并且 以 彩虹 的 方式 来 呈现, 让 你知道 它 现在 在 激活 了。 但是 与此同时, 你 原来 在 浏览 的 内容, 它是 呈现 在 同一个 层级 内 的。 所以 你 就 知道 了 O K 这个 siri 它 不是 弹出来 单独 工作 的, 它是 能够 跟 我 目前 屏幕 上 显示的 东西 做 交互 的这 一点 是 非常 对 这一点 是 非常重要 的。
就是 他 如何 去 完成 action, 用户 如何 去 理解 这个 siri 的 能力。 其实 这就是 一个 非常 核心 的 点, 就是 它 能够 调用 和 读取 你的 屏幕。 Apple 管 这个 功能 叫 on screen awareness。 就是 当 这个 东西 被 激活 的 时候, 当你 现在 在 看 的 这个 画面, 不管 是什么 画面, 当 外圈 出现 一圈 siri 的 时候, 其实 你 在 跟 它的 交互 的 时候, 它 就能 理解 你 现在 说的是 这个 屏幕 上 的 东西 了。
举 个 例子, 在 wwdc 上 其实 苹果 做了 一个 demo, 它 其实 在 一个 场景 下, 他 可能 需要 为 他 订 一个 车 去 参加 他 女儿 的 一个 演出。 首先 他 知道 你的 女儿 是谁, 因为 根据 之前 的 email 的 记录, 他 知道 你的 女儿 是 这个人。 并且 他 知道 在 几天 前 你 收到 了 一封 email, 这个 email 里 提到 了 他 女儿 几天 前 发出 来 的 演出 的 详情。 他 又 知道 你 接下来 有一个 会议, 是否 跟 这个 女儿 的 演出 的 时间 和 地点 有所 冲突。 并且 他 还能 预估 从 你的 公司 开 完 会, 再到 你 女儿 的 这个 剧场 之间 的 交通状况。 然后 来 帮你 去 判断 他 接下来 要 定 一个 什么样 的 时间 的 schedule, 放到 你的 这个 日程表 里面。
那 这 里面 其实 它它 涉及 到了 非常 多 的 信息, 首先 它 有 personal context。 他 知道 你 女儿 是谁, 他 知道 你的 日程, 他 知道 你 女儿 发给你 了 一个 当 他 要 参加 这个 演出 的 时间 地点 的 信息。 然后 他 知道 你的 需求 之后, 他 会 去 判断 这些 复杂 的 personal context 里面 的 情景 是什么。 就是我 开 完 会 之后 到底 能不能 赶上 演出。 他 去 提取 你的 本地 的 信息 以及 交通 要素, 他 会 去 判断 那个 时间点 的 交通 是否能够 能够 搞得 定。 最终 他 整理 和 提炼 你 所有的 这些 信息 之后, 给出 一个 最终 的 一个 日常 的 提醒 和和 交出 行 的 这种 建议。
就是 听起来 好像 很 简单, 实际上 这 背后 是 需要 整个 apple intelligence 在 端 侧 的 模型 有着 非常 强 的 能力。 有着 而且 它的 整体 架构 非常 完整, 才能 不但 理解 用户 的 语义, 而且 知道 用户 的 personal context, 同时 还能 完成 action。 这个 action 在 这个 demo 里面, 它 展示 的 是 预定 日程 的 这种 能力。
刚才 这个 例子 里, 比如说 涉及到 联系人、 邮件、 照片 对 吧? 包括 这个 calendar 日常 在 I P I 里面, 他们 把 这个 东西 叫做 domain 就是 域。 目前 来看 的话, apple 这一次 第一批 出来 的 东门 有 12种, 可能 联系人 是一种 多面, 照片 是一种 多 面对 吧? 其实 可以 理解 为是 12种模态, 有种 有 就是 相当于 说有 12种模态 的 信息, 他 现在 是 可以 他 现在 是 可以 识别, 并且 在 本地 建立 一个 你的 索引 的。 这个 索引 就 构成 了 对于 你 个人 情境 的 一个 认知, 对 吧?
说到 这里, 我 觉得 我们 还是 可以 为 大家 简单 介绍 一下, 这次 苹果 apple intelligent 背后 的 这个 端 侧 的 模型。 在 苹果 官方 把 它 称之为 foundation model。 这个 foundation model 我们在 它的 这个 开发者 网站 上 看到 应该 是一个 应该 是 两个 模型。 一个 是 在在 端 侧 的, 它是 一个 大概 30亿参数 的 单元 模型。 从 参数 的 向量 来讲, 从 参 数量 来讲, 其实 没有 达到 目前 端 侧 手机 能力 的 上限。 我 觉得 苹果 应该 是在 性能 和 功耗 中间 找 了 一个 平衡点, 所以 它是 一个 30亿参数 的 大 模型。 我们 知道 很多 厂商 其实 已经 可以 做到 70亿参数 的 这个 端子 大 模型 了。
这个 模型 它 区别 于 其他 的 这种 端 侧 大 模型, 他用 一个 基座 模型 在 上面 运行 了 不同 的 fight tuning 的 这种 苹果 把 它 称为 adapter。 举例, 有有 一些 它 可能 是 用来 做 summarized 的, 就是 用来 做 总结 的, 有 一些 是 用来 做 这种 邮件 回复 的, 有 一些 是 专门 去做 rewrite, 就是 它 有 不同 的 这种 这种 不同 的 这种 文字 的 这种 写法, 不同 的 这种 revived 模型。 相当于 它 有 它 针对 一个 语言 模型 有 不同 的 这种 adapter。 通过 这些 所谓 的 调整器, 让 一个 模型 适用 刚才 提到 的 各种各样 的 场景。
这个 是一个 在 端 侧 的 模型。 同时 其实 苹果 提到 他们 还有一个 在云端 的 更大 的 一个 基于 服务器 的 一个 语言 模型。 同时 它 还有 两个 很 重要 的 模块, 一个 叫 semantic index, 这个 地方 就是 用来 放 他 所有的 用户 个人 的 信息 的那 苹果 提到 它是 用 一种 非常 安全 的 模式, 他 不是 都 他 不是 获得 你 所有的 信息, 他是 把 需要 的 信息提取 出来, 比如 刚才 我们 提到 的 一系列 的 你 女儿 是谁 对 吧? 你 接下来 的 日程 等等, 它 会 放在 这个 semantics index 里面。 他 会 用 这个 index, 同时 有 会有 一个 叫 APP intense 的 two box。 我们在 下一个 阶段 会 跟 大家 讲 了。
其实 它 就是 一个 非常重要 的, 让 apple 可以 通过 action 的 方式 去 跨 应用 的 做 执行 的 这么 一个 模块。 通过 这样 一个 非常复杂 的 架构, 但是 其实 又 非常 清晰 的 架构, 用户 的 需求 可以 从 它 叫 semantic index 里面 被 提取 出来。 然后 理解 之后 再 通过 这个 APP tex 去 执行。 然后 通过 这个 大元 模型 去 完成 这 一系列 的这 这 这个 过程 中的 这种 模型 的 这种 语义 的 识别, 以及 有的 时候 甚至 是 直接 的 一个 语言 的 输出 等等。 它 就 完成 了 苹果 整体 的 apple intelligence 这个 底层 的 架构。 基于 这样的 架构 可以 做到 我们 刚才 讲 的, 苹果 可以 完成 很 重要 的 这个 action 的 动作。 并且 能够 personal personal 的 去 根据 你的 需求 去 理解 你的 意图。
对 关于 在 action 之前 我 最后 说 一下, 就是现在 其实 你 已经 意识到 说 苹果 的 siri 其实 已经 是 能够 识别 到 你 非常丰富 的 个人信息 了也 能够 识别 到 说 哪些 功能 是 能够 解决 你的 问题 的对 吧? 那 它的 那 这样的 功能 它的 接入 成本 有 多 高 呢? 在 那个 开发者 课程 里面 的 信息 也是 很 让 我 震撼。 首先 就是说 你 A P P 里面 的 所有的 菜单 内容 和 文字, 你是 不需要 任何 代码 的。 开发者 不需要 改 任何 代码, 然后 siri 就会 自动 的 新的 siri 就会 自动 的 知道 你的 A P P 里面 都有 哪些 功能。 如果你 想做 的 更好 一点, 比如说 你 希望 可以 通过 直接 通过 siri 来去 搜索 你 A P P 里面 那些 图片, 或者 是 A P P 里面 的 一些 邮件, 对 吧? 所谓 的 这种 domain, 一种 domain 其实 就 一行 代码 就可以 了, 所以 这个 成本 也是 很低。 就像 总共 12个模态, 对 吧? 你的 A P P 不可能 有 12个模态 的 所有 信息, 你的 A P P 可能 就 三四个 模态 的 信息。 那你 就 你 你 开发者 就 三 四行 代码 O K 写进去 O K 那 未来 新的 siri 对 你的 这个 A A P P 的 支持 就会 非常 好, 对 吧?
然后 接下来 就是 下一个 托马斯 提到 的 就是 apple intense 的 这个 action 能力。 我 先 解释一下 apple intense 是什么? Up intense 它 不是 今天 提到 的 全新 的 一个 概念, 这 概念 其实 在 apple 之前 的 这个 手机 上 是 有 这个 功能 的。 这个 功能 的 核心点 就是说 他 把 这个 A P P 里面 的 核心 功能, 它 把 它 拿出来 放在 外面 换成 快捷 指令。
如果 你是 苹果 手机 的 用户, 你 今天 通过 这个 下拉 的 这个 动作, 你 就可以 唤起 一个 搜索框, 对 吧? 然后 你 在 搜索框 里面, 比如说 你 直接 说 拼 多多 这 三个字, 你 会 发现 拼 多多 给 了 你 几个 最简单 的 功能。 比如说 拍照搜 商品, 比如说 查看 自己的 物流。 因为 拼 多多 认为 自己 这个 是 产品 是 最 核心 被 调用 的 功能。 所以 他 就是说 这个 功能 你 都 不用 打开 你的 页面, 通过 spotlight 的 这种 聚焦 搜索 的 方式, 一旦 出现 拼 多多 这个 关键词, 我 就 推荐 你 使用 这个 功能 就 好了。 所以 这个 是 apple intense 的 这个 是 apple intense 的 一个 基础。 它 其实 苹果 之前 就 已经 在 做 这样的 功能, 就是 他 带 他 让 开发者 能够 选出 自己 最 重要 的 一个 功能。 这样的话 能够 让 你的 能够 让 用户 尽可能 的 去 尽可能 短 的 路径 去 把 它 调用 起来。
对 吧? 那 这是 我们 现在 看到 的 苹果 埋 了 很多很多年 的 shortcuts。 对, 今天 终于 被 用到 A I 的 能力 上面 了。
就 APP tense 的 整个 设计 理念, 我 觉得 还是 非常 的 值得 拿出来 讲一讲 的。 他 就 认为 说 今天 人 在 使用 A P P 的 时候, 在 不断 的 流程 里 走。 但是 人 总是 会 在 不同 的 A P P 之间 切换 的 时候 陷入 摩擦。 这个 摩擦 是什么? 我 就举 一个 例子, 比如说 我 有的 时候 经常 会 陷入 那种 问题, 我想要 进 小红 书 搜 一个 东西。 但是 可能 点进去 之后, 小红 书 的 第一条 笔记 很 吸引 我。 OK 这个 时候 完蛋了, 我 就 开始 浏览 了, 我 就 我 我 就 我 就 没有 在 小红 书上 搜索 东西 了, 对 吧? 所以说 所以说 所以说 apple 设计 这套 东西, 它的 核心理念 就是 帮助人 去 找到自己 的 应用 的 核心 功能, 然后 不要 经历 在 应用 之间 来回 切换 的 这种 摩擦。
截止 今天, apple 宣布 说 自己的 这种 类似 比如说 拼 多多 直接 查看 物流 这样的 这种 指令, 它 有 100类操作, 可能 是 开始 播放 音乐 算是 一类。 它的 action 那个 具体 的 action 动作 是什么 呢? 比如说 他 给 了 两个 例子。 第一个 例子 说 你 会 遇到 的 一个 情况 是 说 你的 手机 放在 自拍 杆 上, 但 这个 时候 你 人 距离 自拍 杆 是 有 一定 距离 的那 逻辑 上 这个 时候 他 最 理想 的 方式 直接 你是 应该 直接 唤醒 siri, 然后 就让 他说 拍摄, 用 某某 模式 拍摄 一张 什么样 的 照片 或者 视频 就 完 事儿 了。 而 不是 自己 跑到 那个 相机 面前 或者 去 让人 来 帮你 拍。
也有 第二个 例子, 我 觉得 也 挺好。 就是说 他 就举 了 一个 例子 说, 比如说 你 在 开会 的 时候 你 会 记 那个 笔记。 如果你在 开会 之后, 你 要 快速 的 去 发 一个 所谓 的 会议记录。 那你 就可以 一句话 跟 siri 说, 把 我 最新 一条 备忘录 里面 的 这段话, 你 把 它 复制粘贴 到 邮件 里面 去。 OK 所以 是 所以 就 通过 APP intense 的 方式, 就 把 你 备忘录 里 的话 提取 出来, 就 贴 到 那个 邮件 里。 最后 只需要 做 一下 校正, 然后 点一下 发送 按钮 就 发出 去就 好了。
第一个 例子 实际上 是 应用 内 的 操作, 就是你 在 一个 相机 的 应用 里面 打开 一个 新的 模式 对 吧? 对。 然后 第二个, 实际上 是 跨 应用 的 一个 操作 了, 就是 相当于 你 从 备忘录 里面 复制, 然后 粘贴 到 邮件 里, 然后 帮你 写 好 标题, 或者 是 帮你 打开 一个 发送窗口。 那 这 里面 其实 就 涉及到 多步 跨 应用 的 这种 操作。 这个 其实 就 需要 APP intense 的 介入 了。
这个 例子 其实 展现 的 还是 苹果 自己的 第一 方 的 这个 应用, 因为 我们 知道 每一次 的 开发者 大会 之后, 大概 三个月 左右 才会 是 产品 上市。 那 这个 时间 就 其实 就是 给 开发者 去 准备 说 你可以 先 把 这些 事情 准备 好。 我们 相信 在 九月份, 在 下一代 iphone 发布 的 时候, 应该 会有 足够 多 的 APP 已经 支持 这些 action。 也许 你 那个 时候 用 这个 siri 能够 操作 的, 能够 执行 的 这些 应用 的 可能性 就会 变得 更 多了。
事实上 在 我 看到 的 那个 开发者 课程 里, 他 几乎 是 已经 很 确定性 的 把 秋天 的 卖点 说 出来 了。 他说 今年 晚些时候 我们 还 会有 两个 非常重要 的 能力。 第一个 叫做 应用 内 操作, 就是 帮助 你 完成 action 的 那个 动作。 比如说 那个 邮件 到了 秋天, 你就是 给 动 动嘴, 它 就 帮你 发出 去了, 你 就 不用 自己 去 点 那个 button 以及 他 能 做什么 呢? 它 叫做 多个 意图 的 结合。
什么 叫 两个 意图 的 结合? 我给你 举 个 例子, 就 比如说 刚才 说 的 邮件 的 那个 案例。 他 就是你 把 文字 从 备忘录 粘 复制粘贴 到 邮件, 这个 是一个 意图 对 吧? 但是 你 其实 人 还 会有 第二个 意图 是什么? 然后 第二个 意图 是 说 我希望 把 这个 邮件 直接 发出 去。 所以说 两个 意图 结合 就 意味着 在 刚才 那个 场景 下, 那个 邮件 点 发送 的 人 就 不是你 了。 你 就 直接去 跟 孙俪 说一句, 他 就 复制粘贴 过来 直接 给你 发出 去了。
这个 就 意味着 说, 苹果 的 下一步 就是 能够 把 多个 所谓 的 apple intense 跟 你 结合起来, 然后 形成 一个 工作流, 或者 形成 一个 完整 的 动作。 这样 你 就会 想要 说动 动嘴 就 给你 查完 地图, 然后 打车, 对 吧? 那 这样的 场景 就会 真正 的 到来。
实际上 我们 讲 了 这么 多, 大家 其实 如果 对 A I 比较 了解 的 就 应该 能 听 出来。 这个 实际上 就是 目前 在 A I 整个 领域 里面 非常 火热 的 A I agent 概念, 通过 这种 把把 任务 分级, 有 多个 任务 按序 执行 的 这种 能力。 本身 它 其实 就是 一个 像 copilot, 像 agent 一样 在 帮助 你 执行 干活 的 这种 能力。
其实 我们 很早 可能 在 一年前 大家 就在 讲 A I agent 对 吧? 但是 真正 落下来 的 实际上 是 苹果 的 这个 A I intelligence, 在 基于 它的 这个 siri 的 这种 action 的 能力。 我 觉得 其实 刚才 我们 讲 的 这个 点, 因为 第二点 就是 整个 apple intelligence 的 这个 基本 能力。 不管 是 我们 讲 的 这个 siri 的 这种 执行 action 的 能力, 还是 它的 这个 APP intent 的 能力, 它 其实 都 是一个 系统 级 的 A I 呈现 出来 的, 能够 赋能 整个 生态系统 的 整个 手机 系统 下 的 应用 的 能力。 这个 是我 觉得 到 现在 为止, 应该 苹果 在 这方面 实现 了 一个 后发 先 至 的 领先。 因为 过去 大家 不是 都说 苹果 A I 落后 了 吗? 那 今天 我们 看到 他在 他他 交出来 的 这份 答卷, 起码 在 平台 级 的 这个 A I 的 能力 上, 我们 觉得 他是 重新 做到 了 领先 的 位置。
以及 接下来 就是 苹果 还 非常 强调 的 两件 事情。 比如说 苹果 会 强调 说 我 绝大部分 的 功能 都 是在 本地 来进行 运算 的对 吧? 那 在 本地 运算 这件 事情, 其实我 可能 半年前 讲 这个 事情, 我自己 是 没什么 感觉 的。 但 到 最近 我 挺 有 感觉, 因为 最近 出差 比较 多, 然后 我 老 用 那个 语音输入 法。 我 原来 用 的 是 搜狗, 是要 联网 的, 要 联网 的 输入法。 它 经常 会有 一个 问题, 就是说 有的 时候 你 突然 进 地下室, 或者 突然 进出 那个 出租车, 你 那种 网络 时候 切换 的 时候, 你的 语音输入 法 就 会有 问题。 但是, 我 最近 切 了 苹果 自带 的 那个 本地 的 输入法, 我 就 发现, 不用 管 网络 怎么样 识别 都很 稳。 然后 因为 经常 用 搜狗 的 时候, 经常 会 出现 一个 问题, 就是说 你说 到 下 半句 开始 进入 网络 不好 的 状态, 他 可能 整个 下 半句 他 都 没 东西 了, 他 都 不给 你 识别 了, 苹果 不至于, 苹果 好歹 说下 半句 可能 有一点 错误率 而已, 仅仅 是 这样。
端 测 A I 的 它的 潜在 的 优势, 首先 它 免费 对 吧? 我们 就 出 一些 电费 就 好了, 也能 有 更好 的 这种 性能 的 表现。 对我 觉得 是 这个 可能 是 端 侧 A I 的 一个 很 重要 的 优势。 因为 之前 整个 A A I 体系 下, 真正 的 big player 大玩家 都是 在云端 云 测 A I 在 发力。 那 在 端 测 A I 上, 我们 今天 可能 迎来 了 最有 实力 的 选手 之一。
就是 苹果。 当然 这个 端 测 M I 门槛 也不 低, 至少 是 A 17 pro 芯片, 如果 是 手机 的话, 那 就是 要 iphone 15 pro, 如果 是 mac 电脑 的话, 得 是 M 一起 跳。
这个 是 从 某 一个 维度 上 看, 它 其实 也 带来 了 未来 潜在 的 这种 换机 的 需求。 如果你 要 想 体验。 因为 其实 过去 我 觉得 苹果 跟 整个 手机 的 生态 都 面临 换机 时间 越拉越 长 的 这个 问题。 就是 大家 觉得 我 换手机 没有 什么 收益 了。 那 可能 也许在 这 一代, 如果 苹果 的 整个 端 侧 A I 整个 apple intelligence 获得成功。 那么 我们 也许 会 看到 一轮 非常 明确 的 为了 A I 带来 的 这种 手机 的 换机 潮, 会对 整个 行业 其实 是一个 提振。
讲完 了 手机 上 的 芯片, 其实 这次 在云端 的 芯片 我们 也 看到 有 非常 亮眼 的 表现。 其实 在 上个月 底, 其实 彭博社 包括 上一次 上个季度 苹果 的 财报 会议, 其实 里面 都 提到 了 苹果 正在 做 一件 事情, 叫做 苹果 正在 做自己 的 A I D C。 就是 A I 数据中心 核心 信息 是 两个, 核心 用 的 是 M2 ultra 芯片。 第二个 信息 是 这个 数据, 用 这个 芯片 和 自 建 数据中心 最重要的事 情 是 这些 数据 全都 要 做 黑盒 处理。 就像 一个 黑色的 盒子 一样, 你 在 外部 是 看不到 数据 内部 的 处理 机制 的。 它 核心 的 点 是要 叫做 让 即便 让 苹果 的 员工 也没有 办法 访问 这些 数据, 就是说 即便 我是 处理 这个 数据 的 人, 苹果 我是 处理 这个 数据 的 公司, 那 事实上 我 也没有 办法 去 访问 这些 数据。 但 这 里面 涉及到 非常 多 的 加密技术, 它 发明 了 一个 概念 叫做 私有 云计算, private cloud compute P C C。 然后 我们 甚至 看到 苹果 的 安全部门 专门 写 了 一篇 非常 长 的 文章, 就是 在 讲 这个 P C C 它的 架构 优势。
但是 总结 起来 的话, 我 觉得 就是 几个 东西。 第一个 它 用到 了 iphone 级别 的 芯片 加密, 就是 iphone 存储 你 个人信息、 生物 信息。 它 其实 是 有一个 专门 的 所谓 的 芯片 专区, 无法 被 破解, 那 它 就是 iphone 级别 的 芯片 加密。 第二个 就是 叫做 你 所有的 数据 在 传输 的 时候, 它是 端 到 端的 这种 加密。
如果 大家 有 兴趣 的话, 可以 去 了解 一些 常用 的 比特币 之类 的 一些 加密算法, 就 类似的 一些 东西 以及 就是说 他说 他 非常重要 的 一个点, 他说 我 开放 给 第三方 的 安全 的 计算机 的 研究 人员 来去 审计 我 这套 系统 到底 安全 不安全。 如果你 审计 出来 我 这套 系统 有问题, 我会 给你 赏金。 对, 所以 开放 第三方 审计 也是 他们 非常 强调 的 一个点, 就是说 我会 给 一些 数据 的 镜像 来 代表 我 这个 系统 是 怎么 工作 的。 你 所有 有 兴趣 的 研究 人员, 你 就可以 申请 来去 看我 这个 系统 的 代码 之类 的 一些 东西。
是的, 这里 必须 得 说 一下, 其实 过去 比如 ChatGPT 对 吧? 然后 OpenAI 的 一些 模型 都 传出 过 信息 泄露 的 事件。 比如说 最早 我记得 是 三星 还是 哪家 公司, 他们 有 一些 未 发布 的 产品 信息 都 被 ChatGPT 学习 成了 语料 人, 甚至 通过 某种 方式 就 泄露 出来 了。 包括 谷歌 其实 在在 它 作为 一个 大公司, 它 其实 在 信息安全 的 维度 也是 饱受 质疑。 因为 它 其实 是 通过 一些 个人信息 来做 定制 化 的 广告 推送 来 赚钱 的。 Facebook 就 不用说 了, 那那 更加 是 这个 face。 扎克伯格 其实 在 这块 也有 很多 的 争议。 唯一 有 一家 公司 就是 苹果, 它 在 privacy 这件 事情 上 可以 说是 这么 多 科技 巨头, 每一个 都有 原罪。 只有 苹果 可能 在 privacy 上 是 有 正当性 的 这么 一个 企业。
对 所谓 的 正当性 是 举 个 例子, 比如说 我们 讲 过 苹果 广告 对 吧? 就现在 手机 厂商 里 有 且 只有 苹果 是 能够。 比如说 我 生活 在北京, 他 连续 包 一片 公交站 下来, 然后 每一个 公交站 牌 写 的 都是 苹果 的 安全 怎么样。 这个 很 iphone 是的, 对 吧? 就是 只有 苹果 是 能够 大张旗鼓 的 跟 用户 去做 这种 沟通, 然后 用户 最终 会 觉得 说 符合 逻辑, 对 吧? 这 符合 我 对 苹果 的 一贯 的 印象。
对, 一方面 苹果 在 价值观 上 非常 强调 隐私, 它 甚至 把 它 高于 这种 什么。 因为 比如说 过去 有 那种 故事, 就是 F B I 拿了 一台 犯罪分子 的 手机 交给 苹果 说 你 给我 解密 了, 苹果 说 我 解 不了。 他 不是说 我 拒绝 F E I, 而是 我在 能力 上 我 就 做不到。 因为我 的 加密 就是我 自己 都 破解 不了 的 那种 加密, 这是 就是 苹果 在 价值观 上, 在 它的 产品 力 上, 在 他 投入 的 资源 上, 确实 花了 非常 多 的 精力 在 所谓 隐私保护 这件 事情 上。 同时 刚才 尼克斯 也 提到 了, 他在 marketing 上 也 不遗余力 的 去 不断 的 去 把 这点 做 强化。 因为 这是 我的价值观, 我 产品 也 做了 很多 在 这方面 的 投入。 那 我 当然 要说 给 大家 听, 让 大家 相信。 有了 这么多年 的 积累, 包括 大家 应该 都 见过 那个 logo, 一个苹果 上面 那个 标 变成 了 一个 锁, 它 甚至 为此 专门 设计 了 一个 icon 你 就 知道 这个 公司 对他 有 多 重视 了。
在 这种 情况下, 刚才 可能 nixon 巴拉巴拉 讲 了 很多, 这次 的 这个 private cloud computer 带来 了 什么样 的 好处。 1234大家 是 信 的, 尽管 我相信 大部分 人, 包括 我自己, 其实 说实话 对他 这 里面 的 隐私 性 的 这些 技术细节 都 不甚了解。 但是 1234 每 一条 说 下来, 你是 相信 OK 这些 信息。 如果 是我 交给 苹果, 即便 它 传到 了 它的 云端 服务器, 那 他说 了不 保存信息 它 就 不会 保存。 他说 了 我 弄完 了 下来, 甚至 服务器 不知道 我是谁, 我 就 相信 他说 的, 但是 其他人 我 就 不相信 了。
对, 所以 我 觉得 privacy 这个 事情 上 真的 是一个 marketing 的 显学, 你知道吗? 这个 就是 属于 marketing 上。
只有 苹果 能 说。 对, 所以 在在 这一点 上, 我 觉得 刚才 我们在 开场 的 时候 特意 说 了 确认 GPT4O 接入 苹果 这件 事情。 可能 是 很多 科技 媒体 在 讲 W W D C 的 时候 的 这个 头条 是 它的 标题, 但 我们 认为 不重要, 为什么呢? 因为 其实 我们 讲到 这里, 都 没有 ChatGPT 什么 事儿。 就是 so far 90% 的 或者 大部分 的 A I 的 应用, 我们 看到 的 是 通过 苹果 的 端 侧 的 自 研 的 模型, 以及 它 在 云 测 刚才 提到 这个 有着 完整 的 隐私保护 的 云端 的 更 大规模 的 模型 来完成 的那 除此之外 的 苹果 认为 说 OK 我 本地 能力 无法企及 的 这些 应用, 它 会 它 才会 传给 云端 的 ChatGPT, 就 GPT4O 来完成。 那 这个 过程中, 它 还 会有 一个 非常 明确 的 提示, 就是你 现在 你 这个 信息 将 被 传给 GP4O 那你 是否 同意? 如果你 同意, 他 才会 把 你的 图片 也好, 你 需要 优化 的 内容 也好, 传给 这个 GP4O 所以 在 整个 今天 的 整体 的 apple intelligence 的 这个 整体 架构 里面, 其实 GP4O 更 像是 一个 外挂 的 补充。
因为 苹果 毕竟 是 第一次 推出 它的 大 模型 的 这样的 一个 基座 跟 它的 能力。 我们 相信, 尽管 我们 今天 说 的 很 好啊, 它 能够 rewrite, 它 能够 生 图生 文。 但是 刚才 也 提到 了 它的 整体 的 能力 其实 是 略逊 于 GPT4 的对 吧? 对它 仍然 是一个 在 3.5到4 之间 的 这种 模型 能力 的 这样的 一个 水平 的 模型。 而且 我相信 在 早期 应该 是 会有 各种各样 的 问题 的。
因此 苹果 提供了 一个 额外 的 服务, 那么 在 美国市场 它 提供 的 是 GPT4O, 我们 之前 也 听说 在 中国市场, 也许 它 会 跟 百度 合作。 来完成 这个 部分 的 需要 外传 的 这个 部分 的 云 的 架构。 那 其实 我们 就 我们的 观点 就是 这个 事情 并 不重要。 因为 我们 以 苹果 的 这个 供应商 的 这个 管理 的 方式, 它 一定 会有 多种 的 接入。 那 我们 之前 其实 也 听说 觉 明 在 跟 苹果 做 接洽 从 现在 看到 的 信息 来看, 应该 是 OpenAI 胜出 了, 就 没 来 没有 在 这次 wwdc 看到 任何 的 合作 的 迹象。 那 有可能 暂时 落败, 但是 也 不好 吧。 未来 也许 苹果 会 提供 更多 的 接入, 就 像你 在 safari 里面 你可以 选择 你 用 什么样 的 这个 搜索引擎 一样。 那你 未来 也许 外挂 的 这个 大 模型, 你是 可以 去 选 我要 用 哪个 哪 一家 的, 所以 其实 是否 接入 GP4O 其实 并不是 这次 的 重点。
我们 看到 一个苹果 端 云 结合 的, 通过 两个 模型 完整 的 隐私保护, 让 用户 对 尤其是 欧美 的 用户, 对 这样的 一个 手机 可以 放心 的 把 你 自己的 信息, 从 你的 驾照 号码 到 你 妈 是谁, 到 你 接下来 的 所有 安排 都 交给 苹果。 我 觉得 这件 事情 其实 是 挺 不容易 的。 他 对 这个 信任感 的 建立, 真的 是 这么多年 来 苹果 在 私有化 上 做了 这 一系列 的 努力 带来 的 在在 这种 隐私保护 上 做了 一系列 的 努力 带来 的 这种 最终 的 结果 就是 用户 如果 最后, 当然 现在 产品 还没 上市, 但是 产品 上市, 我相信 用户, 尤其是 苹果 的 这种 长期 用户, 他是 会 在 影视 上 对 苹果 有 足够 信心 的。 哪怕 是 今天我 把, 所有的 大 模型 的 信息 上 云 了, 那 这个 我 认为 他们 也是 能够 接受 的。 实际上 i cloud 所有的 信息 就是 上 云 的那 只不过 苹果 有了 非常 强 的 这种 加密 和 隐私 的 处理。 而 对我 我 觉得 这点 是 苹果 的 真的 是 它的 特权 之一。 它的 隐私保护。
对 好吧, 那 夸 了 苹果 夸 的 差不多 了。 我 最后 上 一个 彩蛋, 就是 苹果 接下来 即便 是以 相同 的 芯片, 但是 他的 A I 能力, 尤其 端 侧 的 I 能力 可能 也是 会 不断 增强 的。 在 机器学习 部分 的 这个 开发 的 课程 里 给 了 一个 例子, 就是 mac O S 从 上 一个 版本 叫做 soa。 更新 到 下一个 版本 叫做 sqa 它 能够 实现 同样 的 一个 模型, 它的 运行 时间 减半, 以及 它的 内存 占用 直接 降到 了 只有 八 原来的 8分之1。 所以 这个 也是 一个 我 觉得 很 值得 期待 的 一个 东西。 就是 接下来 即便 是 同样 的 芯片, 苹果 也 能够 展现 AI 能力 的 不断 的 增强, 对 吧?
对 这件 事情 其实 还是 蛮 重要 的。 我 觉得 在这里 再 补充 一下, 其实 这也是 苹果 区别 于 其他 的 厂商 的 一个 非常重要 的 优势, 就是 它 有 软硬件 体化 的 这种 生态 的 能力。 它的 硬件, 它的 芯片, 从 当时 那个 m chip 多, 我记得 其实 大概 一 去年 其实 就有 很多。 包括 苹果 自己 发 了 一些 论文, 跟 提供了 一些 模型, 就是 能够 跑 在 这个 M M2 ultra 上面 的 一些 模型。 这种 效率 其实 某种程度 上 是 优于 很多 家用 设备 的。 它 甚至 可以 达到 某 一些 这种 NVIDIA 的 这种 服务器 级别 的 G P U 的 算 力 才能 达到 的 这个 效果。 就是 因为 它 可以 针对 自己的 芯片 去做 专门 的 这种 算法 的 优化。 这件 事情 的 优势 在 未来 也是 会 继续 提升 的。
而 相比之下 其他 的 厂商, 不管 是 A I 厂商, 比如 OpenAI, 比如 百度 这些 专门 做大 模型 的 厂商, 他们 在 算 力 端 仍然 需要 有求于 NVIDIA, 对 吧? 那 手机 厂商 他 其实 用 的 也 不是 自己的 这个 芯片, 他他他 需要 用 高通, 需要 用 M T K, 先 用 别人 的 芯片。 那 这 里面 它的 软硬件 的 打通 的 能力 一定 会 比 苹果 要 更 差 或者 是 更慢。 这 几个 优势 就是 我们 看到 的 苹果 真正 强大 的 地方。 就是 在 这次 WWDC2024 苹果 发布 了 apple intelligent 之后, 我们 认为 从 刚才 讲到 的 三个 方面, 苹果 仍然 是 非常 强大 的。 包括 开发者 生态 的 强大, 系统 级 的 A I 架构 的 这种 底层 架构 的 强大, 以及 它 硬件 体系 带来 的 芯片 的 强大 和 这种 隐私保护 云 服务 的 强大。
好吧, 我们 接下来 说 点 不太好 听 的, 我们 觉得 还是 要 客观 的 去 衡量 一下, 苹果 这次 做 的 到底 好不好, 它的 领先 性 到底 怎么样, 然后 我们 如果 从 这个 维度 来看, 其实 会 发现 苹果 有 很多 所谓 不 那么 强 的 地方。
我 觉得 可以 从 几个 维度 来看, 我们 认为 首先 他的 A I 的 领先 性 可能 就要 打 一个 问号 了。 因为 过去 我们 讲 苹果 A I 落后 了, 今天 我们 讲 了 很多 A I 强大 的 地方。 但是 我们 仍然 能 要 看到, 它 在 整个 A I 的 底层 能力 上 它 不是 领先 的。 如果 他 真的 足够 领先, 他 其实 不需要 找 一个 OpenAI 来 合作 的对 吧? 他 应该 能 自己 搞定 所有。 比如说 像 我们 刚才 说 的, 他 足够 自信 的话, 那 我的 端 侧 A I 加 我的 一个 云端 的 模型, 我 为什么 还需要 OpenAI 和 百度 来 作为 我的 这个 外挂 的 这个 生态 呢?
基于 此 我们 也 看到, 其实 elon musk 发起 了 非常 猛烈 的 批评, 对 吧? 他他 其实 就 认为 说 那你 这个 数据 就 不安全 了, 他 当然 我们 刚才 已经 论证 了, 其实 苹果 的 数据线 起码 他 可以 让 大众 相信 它是 安全 的对, 但是 伊隆 马斯克 说 那那 不行, 你 这个 相当于 包括 他 也 发 了 一些 这种 搞笑图, 就是 一两个 印度人 喝喝 这个 椰子 的 这个 图, 我们会 放到 show note 里面。 他的 意思 就是说 苹果 处理 完 的 数据 交给 了 OpenAI, 你 还 用 什么 来说 你 自己是 安全 的, 用 这种 方式 来来来 攻击 苹果。 应该说 这次 反正 elon musk 真的 是 连发 数 火力全开。
但 我 觉得 这里是 elon mask 不太好 的 地方, 就是 elon musk 显然 是一个 没有 看 发布会 的 人, 就是 因为他 发布会 里 说 的 很 清楚, 就是说 有 一些 任务 完全 处理 不了, 我会 给你个 弹窗, 我问 你 愿不愿意 把 这条 信息 分享 给 OpenAI。 而且 在 那个 发布会 里 也很 非常 重点 的 强调 说, OpenAI 是 不会 去 记录 和 追踪 这个 数据 的, 它 只会 完成 处理, 然后 给你 返回 结果。 但是 这个 细节 其实 很多人 没有 意识到, 因为 mask 这个 梗 图 今天 在 很多 微信 群 里 都 被 转 了, 所以 还是 造成 了 大家 对 他的 一些 误解, 对 吧? 所以 我 觉得 从 结果 上 来说 其实 不太好。
应该说 伊隆 马斯克 不一定 是 没 看啊, 他 可能 是看 了, 但 他 装傻 而已。 因为 毕竟 他们是 有 一些 竞争 关系 的 这个 公司, 他 还 非常 夸张 的。 最近 他 刚才 又 可能 又 发 了 一条 说 所有 来 我们 特斯拉 访问 的 客户, 如果 带 的 是 一台 iphone 的话, 要把 这个 iphone 锁 到 法拉第笼 里面, 就是 完全 隔绝 信号 的 那个那个 笼子, 就有 有点像 我们 过去 说 特斯拉 不能 再 开进 国家机关 一样, 他 以后 iphone 不能 带进 特斯拉 的 园区 了。 这个 其实 是 我 觉得 这是 伊隆 马斯 的 风格, 他 一直 在 做 这种 事情。
同时 我们 也 看到 来自 A I 圈 的 人 也 对 苹果 进行了 一些 的 攻击。 应该说 就是 大家 认为 苹果 实际上 发布 的 很多 的 核心 的 能力, 其实 是 整个 A I 圈子 里面 很多 应用。 或者 是 创业 公司 也好, 或者 是 A I 的 厂商 也好, 他们 已经 发布 过 的 能力。 这些 能力 其实 没有 什么 神奇 的, 苹果 只不过 是在 利用 它的 认知 差 在 放大 它的 A I 能力。 这里 其实 我们 如果 看 整个 wwdc 24, 你 会 发现 在 它 主 keynote 的 环节, 确实 苹果 用了 非常 大 的 篇幅 去 讲 它的 生 图 的 这个 能力 带来 了 什么样 的 体验, 去 讲 它的 这个 大 语言 模型 在 这种 重写 帮你 重新 润色 的 环节 有 多好。 用。 在帮 你 把 这个 email 去 summary 这种 能力, 甚至 是 包括 比如说 通话录音 之后, 帮你 summary 这些 能力 做得 有 多好。 那 这些 能力, 其实 我们 多多少少 在 现有 的 一些 应用 里 我们 都能 看到。
对 吧? 最最 显著 的 就是 苹果 几乎 所有的 能力, 都能 找到 一个 在 A I 领域 现在 现在 被 公认为 比较 好的 一个 产品。 比如说 它的 重写 能力 其实 就 跟 notion 撞车, 撞车 非常 多 对 吧? 然后 它的 这个 录音 通话 自动 总结 的 这个 能力, 可能 今年 买 安卓 手机, 但 凡是 一个 可能 3 2000块 以上, 我 觉得 应该 都有 这个 能力 了。
所以 很大 的 这个 预期 的 落差 是 来自于 过往 我们 认为 苹果 一直 是 智能 设备 上 软件 和 交互 应该 怎么做 的 一个 领导者, 是的, 哪怕 是 最近 一次 他 做出 了 灵动 岛 这样的 东西? 有 如此 毁誉参半。 但是 后来 你 大家 会 发现 这个 东西 非常 有用, 对 吧? 很快 形成了 业界 共识。 你 就 想 苹果 历史上 发布 过 多少 这种 软件 交互 上 非常 惊艳 的 东西。 但是 今天 就是 这些 东西 没有 这些 东西 如果 你是 熟悉 A I 的 应用 生态 的 人, 你 会 发现 所有 他 给你的 这些 能力, 你 都能 找到 已经 发布 的 原型, 然后 直接 跟 他 做 横向 测评。
所以 这个 其实 是 这是为什么 李楠 会 批评 他, 就是 苹果 是在 利用 认知 差。 所谓 认知 差 就是 大 语言 模型 的 应用。 今天 是一个 渗透率 不到 5% 1个 状态。 但是 苹果 有 超强 的 marketing 声量, 苹果 会 让 百分之百 的 人 觉得 这些 能力 就是 苹果 最 开始 苹果 才有 的。 对对对, 然后 间接 还 挤占 了 很多 开发者 的 生存空间, 怎么讲 呢? 对 我们 对于 苹果 去 要求 比较高, 就是 不能说 你 做好, 你 要 做出 原来 没有 的 东西, 那 才是 符合 你的 江湖 地位, 对 吧? 对, 所以 其实 是在 补 作业, 并 不是说 有 很多 很 领先 的 东西。
我 以及 我们 想要 说 的 不太好 的 第三个 点 就是 显然 这次 交付 是 有问题 的。 如果你 去 看 苹果 的 新闻稿, 有行 小字 会 让 你 绝望。 美国 用户 今年夏天 英语 就能 开始 适配 apple intelligence, 但是 如果 要 适配 到 你的 本地 语言, 比如说 中文, 2、 五年 才有 才能 做 上 交付。 也就是说 苹果 今天 放了 一个 半年 的 卫星, 苹果 过往 几乎 极少 有 放 半年 以上 卫星 的 这个 先例。 而且 你 要 想 这 颗卫星 是 最最 核心 的 apple intelligence 功能, 半年 时间 在 安卓 手机 体系 里面 都 够 迭代 下一代 旗舰 了。
也就是说, 比如 现在 如果你 去 安装 一个 I O S 的 beta 版, 它 里面 是 没有 这个 大 语言 模型 的。 就是 你是 享受 不到 刚才 讲 的 apple intelligence 的 能力 的对, 因为他 现在 其实 还没有 ready 对它 整个 产品 的 ready, 我相信 是 跟 整个 iphone 16这1代 手机 一起 上市。 也就是说 我们 今天 在 我们这一代 的 iphone 仍然 是一个 没有 搭配 这个 A I 能力 的 传统 的 iphone。 全球 只有 美国市场 能够 在 今年 这 一代 iphone 上 享受到 这种 A I 能力。 到了 2025年, 也就是 iphone 17这1代, 我们 才能够 拿到 一个 国行 版 的 基于 中国大陆 的 这个 版本 的 这种 apple intelligence s 的 产品 的 时候。 就像 刚才 尼克森 讲 的, 我们 可能 国内 的 手机 品牌 甚至 是 三星。 因为 我们 看到 三星 S 24, 实际上 它 交付 的 产品 是 包含 了 与 百度 合作 的 一些 A I 能力 的那 到 那个 时候 已经 叠 两代 的 国产 厂商, 也许在 刚才 我们 看到 的 一些 领域 就 会有 机会 追赶 甚至 反超 苹果 的 这种 A I 体验 了。
所以 交互 没有 做好。 除了 时间之外, 还有 第二个 问题, 就是 目前 看 芯片 的 门槛 也 比较高, 对 吧? Iphone 15 pro 如果 是 手机用户 要 一定要 买 iphone 15 pro, 这个 门槛 确实 是 挺 高 的, 这个 人群 确实 是 挺 小众 的。
也就是 iphone 15都不行 对 吧?
对, iphone 15都不行。 因为 iphone 15的芯片 是 A 17, 不是 A 17 pro。
最后 我 觉得 还是 从 营销 的 角度, 我 觉得 也 暴。 露 了 苹果 的 一些 不自信。 因为 其实 在 昨天晚上 发布会 开始 之前, 我 还 专门 发 了 一条 微博。 我说 还是 不太 敢 相信 apple intelligence。 因为 这个 其实 在 之前 就 曝光 了, 说 苹果 会 把 它的 A I 叫做 apple intelligence。 Apple intelligence 的 开头 字母 其实 合 起来 也 叫 A I 这个 其实 是一个 英文版 的 谐音 梗, 在我看来 artificial intelligence 是 A I 人工智能。 今天 apple 说 我 叫 苹果 智能, 用 这样的 一个 谐音 梗 的 方式 来 把 自己的 A I 产品 做了 一次 定义。 这个 跟 过去 非常 强大 的 苹果, 其实 是 形成了 一个 非常 鲜明 的 对比。
如果 大家 听 过 我们 之前 关于 苹果 的 节目, 大家 应该 会 知道, 就 苹果 有 很多 禁用 词, 对 吧? 它 在 它的 语言 体系 里面, 它 会 自己 去 建立 一个 在 自己 体系 内 的 名称, 而 不会 使用 广泛 使用 的 名称。 在 这次 发布会 之前 的 大部分 发布会 里面, 应该 是 99% 的 发布会 里面, 苹果 是 不用 A I 这个 词 的, 它 有 它 自己的 词, 牛肉 engine, deep thinking, machine learning, 他 把 A I 解 构成 一个 具体 的 应用 体验, 然后 来 对应 它 每一个 A I 优化 的 细节 的 这种 体验。 但是 今天 他 还是 屈服 了, 他 叫 了 一个 谐音 梗 的 方式, 把 他 自己的 这个 A I 的 名字 其实 也 叫 了 A I 我们 可以 看到 一个 非常 直接 的 对比, 就是 苹果 推出 的 这个 A R 设备, 或者 我们 叫 它 一个 的 一个 设备 vision pro 在 整个 过程中 其实 他 既 没有 提 A R 也没有 提 V R 也没有 提 M R 甚至 也没有 T X R, 他 管 它 叫 spatial computing 空间 计算。 这就是 一个 很 典型 的 重新 定义 一个 行业, 甚至 一个 市场 的 这种 自信。 因为 我们 今天 当然 vision pro 还有 很多 的 争议, 对 吧? 他他 可能 也 面临 很多 的 挑战。 但是 毫无疑问, 它 对它 相比 其他 的 竞争对手 来讲, 它 至少 有 2到3年 的 这种 彻彻底底 的 领先, 这个 是 毫无疑问 的那 因此 他 也有 足够 强 的 自信 说, 我 今天 不要 叫 你们的 事, 不管 是 M R V R 甚至 元 宇宙 我 都 不要 叫我 要 重新 定义 这个 东西, 叫 空间 计算。
我们 再 反观 他他 竟然 去 玩起 了 这种 谐音 梗, 管 自己 叫 apple intelligence。 这个 其实 在 营销 的 自信 度 上 其实 是 差 了 一个 级别 的。
但 我 觉得 营销 的 自信 度, 这是 表象, 就是 深层次。 其实 刚才 已经 说过, 就是 在 全球 所有 手机 厂商 都在 交付 定义 自己的 A I 旗舰 手机 的 时候, 苹果 还在 放 一个 所谓 的 A I O S 的 一个 期货, 对 吧? 所以 我 觉得 这里 可以 举 一个 实际 的 例子 对比。
比如说 今天 我们 提到 的 这个 a intent 对 吧? 就是 识别 你的 你 在 APP 上 想要 交互 什么东西, 然后 自动 帮你 完成。 其实 这个 东西 今天 的 安卓 手机 厂商 没有 吗? 那 比如说 荣耀 手机 里面, 它 就会 有一个 能力。 就是说 如果你 是在 微信 里面 复制 了 一段 地址, 对 吧? 它 会 根据 那个 地址 的 属性, 就是你 复制粘贴 那个 地址。
它 长 按 这个 地址 的 时候, 它 会 做 语义 的 识别。 然后 也是 通过 一个 端 侧 的 模型 去 判断 这是 一段 地址 还是 一个 日程。 然后 根据 它的 不同 的 属性, 它 会给 你的 选项 是 不一样的。 如果 它是 一段 地址, 它 弹 出的 就是 一个 地图 的 选择, 以及 一个 滴滴 打车 的 选择。 如果 这是 一段 像 日程 的 东西, 它 就会 弹 出 一个 日程 提醒 的 这个 设 日程 的 一个 选项。 然后 你 只要 把 它 拖 到 这个 产品 叫 任意门, 只要 把 它 拖 到 这个 右边 打开 的 一个 应用 的 列表 里面, 它 就可以 自动 帮你 定 日程 打车 或者 是 直接 帮你 导航。
所以 你 就 想 这个 是不是 一种 所谓 的 个人 情景 的 感知, 这个 是不是 一种 基础 的 跨 应用 的 信息 流转。 其实 它 距离 所谓 的 帮你 做 action 那 一步 也 已经 很 近 了。
对不对? 实际上 荣耀 在 这个 所谓 意图 识别 人机交互 这个 领域, 实际上 做 的 还是 确实 很早 的。 他的 这个 悠悠 助理 也 能够 有 一定 的 用户 的 这种 记忆 的 能力。 包括 刚才 举 的 这个 magic portal, 就 这个 任意门 的 例子, 它 能够 很 好的 去 识别 用户 的 意图。 当然 这个 可能 目前 看到 的 还是 一个 很 基础 的 一个 应用 形态。 但是 我们 能 看到 它 其实 是在 苹果 之前 推出 的对, 那 也 代表 苹果 可能 也 不是说 我 就 开创 了 这个 领域。 他 可能 在在 这件 事情 上 它的 领先 度, 我们 其实 也能 大概 能够 做 一个 判断。 以上 其实 也就是 我们 认为 苹果 在 A I 这件 事情 上 看起来 不是 那么 不可 超越 了, 他 提供 的 选择, 他 能够 做到 的 这些 能力, 也许在 未来 的 一年 左右, 我们 就能 看到 其他 的 手机 品牌 follow, 其他 的 手机 品牌 能够 追赶 甚至 反超 苹果 的 这个 可能性 已经 有了。 这件 事情 其实 在 过去 在 手机 领域 已经 很多年 没有 看到 了。
对 基础 的 A I 能力 没有 领先, 然后 实际 的 交付 有点 搞 认知 差 对 吧? 没有 很 惊艳 的 独创 的 东西, 交付 还是 个 期货, 最后 营销 玩 新高 吧? 啊, 当然 咸鱼 梗 我们 对比 了, 就是 跟 安卓 厂商 对比, 你 好像 跟 对比 其他 旗舰 手机 也 没 差 那么 多, 对 吧? 所以 这个 其实 是一个 我们 不能说 失望, 但是 还是 说 我们 觉得 这个 是 不太 有 优势 的 这么个 地方。
好听 不好听 的 都 说完 了, 我们 最后 我们 聊 几个 商业 类 话题。 大家 都说 A I 硬件 的 目的 就是 为了 替代 手机, 对 吧? 就是 都是 幻想 着 自己 能 塑造 一个 万亿 级 市场。 所以 A I 手机 我 觉得 今天 到 苹果 的 这次 发布, 应该 算是 一个 阶段性 的 一个 形态。 已经 定义 完了 对 吧? 就是 你的 开发者 生态 怎么样, 你的 系统 能力 是 什么样, 你的 甚至 到 你的 芯片 和 云 服务, 我 觉得 是一个 很 完整 的 一份 答卷 了。 所以 今天 我们 来 可以 来 聊 一 聊 这个 问题, 叫做 A I 手机 是不是 正确 答案。
A I 手机 我 现在 要 第一个 事情 叫做 从 今天 来看 G U I 到底 有没有 过时。 目前 来看 的话, 其实 G U I 还是 非常重要 的。 因为 回顾 我们 之前 说 的 两个 点, 第一个 点 是 说 G U I 其实 它是 用户 跟 A I 交互, 它 还是 非常重要 的 一个 输入 和 输出, 对 吧? 在 这个 阶段 用户 是 完全 没有 办法 跳过 G U I 的那 第二个 点 是 G U I 里面 包含 了 非常 多 的 模态 的 信息。 比如说 这个 交互 界面 里 包含 了 一个 邮件, 包含 一个 日程。 这些 模态 的 信息 现在开始 被 直接 被 以 A P I 的 形式, 就是 被 siri 和 apple tent 的 这样的 A P I 的 形式 来去 理解, 最终 转化成 了 所谓 的 A I 服务 给你。 所以说 G U I 承载 着 越来越多 模态 的 一个 信息 输入。 今天 来看 其实 G U I 今天 尚未 过时 对 吧?
其实 这个 地方 我们 其实 在 之前 一期 节目 里 跟 东 彪 科技 的 李楠 我们 也有 过 很 深入 的 探讨, 对 吧? 那 南 总 作为 A I 硬件 的 这个 公司 的 C E O, 他 其实 很 明确 的 表达 了 他的 观点。 他 认为 下一代 的 这个 范式 一定 是 A I 硬件, 那 A I 手机 不是 正确 答案。 在 我们 看来, 其实 如果说 把 时间 拉 到 十年 以后, 也许 这个 答案 是 正确 的。 但是 在 今天 这个 阶段, 甚至 是 我们 可能 从现在开始 再 往后 看, 5到10年, A I 手机 可能 都是 未来 5到10年的 正确 答案 之一。 我们 不 把话 说 死。
G O I 显然 也是 作为 手机 的 一个 U I 的 承载, 有 这么多年 的 交互 的 迭代, 我 认为 它是 没有 过时 的。 而且 刚才 提到 多 模态, 其实 手机 今天 它的 很大 的 优势 就在于 在 它的 这个 多 模态 的 信息 输入, 其实 能力 上 并 不弱 于 大部分 的 A I 硬件。 因为 当我们 提到 A I 硬件 的 时候, 上 一期 在 节目 里面 有 总结 A I 硬件 的 不可能 三角。 它的 这个 续航 时间 全天候, 它的 传感器 跟 模态 足够 丰富, 以及 它的 重量 足以 让 你 支撑 全天 的 佩戴, 这 三点 是 无法 同时 具备 的。 他 就 决定 了 这个 产品 的 在现阶段, 它的 妥协 的 结果 一定 是 模态 相对 是 反而 没有 那么 丰富 的。 它 可能 只有 1到2个 模态。 而 手机 可以 从 声音 到 图像, 从 语音 到 视觉, 它 都 会有 一个 完整 的 交互 的 范式。 它 只不过 没有 那么 的 always on, 它 可能 是 今天 A I 手机 相比 A I 硬件 的 一个 短板。
但是 也许 当我们 把 A I 硬件 看作 是 A I 手机 的 延展, 而 不是 竞争对手 的 时候, 它 可以 很 好的 解决 这个 问题。 我 通过 手机 来完成 算 力 的 这个 汇聚 和 中转, 和 通讯 的 中转。 通过 一个 轻量级 的 设备 去 完成 一些 always on 的 模态 的 这种 获取 这种 结合。 也许 是一个 未来 正确 的 A I 手机 的 答案, A I 加 手机 或者说 手机 加 A I 的 方式。 对, 所以 G O I 没有 过时。 手机 现在 看起来 好像 还 蛮 正确 的。 就 是从 苹果 这份 答卷 来看, 我们 可以 再 往后 再 看一看。
对, 而且 在 G Y 没有 被 干掉 的 前提 下, 之前 对于 手机 难以 转型 做 A I 硬件。 这 还有一个 质疑, 就是说 因为 手机 公司 都 是要 靠 应用 分发 的 收入 去来 提升 利润 的, 或者 就是说 应用 分发 是 手机 在 销售利润 上 的 一个 生死线。 但 目前 来看 的话, 因为 G Y 没有 被 干掉, 所以 也就是说 用户 直接 跳过 A P P。 然后 的话 直接 调用 各种各样 的 A P I 去 完成 自己的 任务。 这件 事情 其实 还是 没有 实现, 所以 我们 反而 没 能 看到。 就是 可能 接下来 两三年 之内, 凡是 说 因为 所有的 A P P 你 都能 很 好的 接入。 比如说 I O S 上 的 A P P 都能 很 好的 接入 apple intense 的这 套 框架, 反而 会 实现 一个 很 好的 一个 作用。
就是说 其实 你的 A P P 的 一些 功能, 其实 是 更容易 被 消费者 所 发现 的。 因为 原来 这些 消费者 认识 这些 功能, 他 得 去 记 那个 入口 在哪里, 怎么样 去 操作。 就 比如说 你 要 用 调用 拼 多多 的 那个 拍照搜 一个 产品。 那 原来 你是 需要 知道 说 A P P 的 拍照 那个 按钮 按钮 在哪里? 对, 按钮 在哪里。 但 现在 不用, 你 只需要 跟 siri 说 调用 用 拼 多多 帮 我搜 一下 这个 产品 是什么, 对 吧?
所以 我 觉得 反而 他 还 解决 了 一个 问题。 就是说 现在 的 手机, 现在 所谓 苹果 定义 的 这种 手机 A I O S, 它 甚至 是 在帮 开发者 在 分发 了 应用 之后, 他 还 帮 开发者 来保 活跃, 帮 开发者 自己的 一些 功能 可能 更好 被 挖掘 出来。 所以, 反而 是 能够 提升 一部分 应用 的 打开 率 的。 至少 对于 中小型 的 开发者 和 一些 长尾 的 一些 场景, 其实 它是 有 更高 的 用户 价值 的。
对我 觉得 这个 地方, 其实 也是 一样, 就是 关于 A I 硬件 和 A I 手机 的 这个 讨论 里面, 它 其实 关键点 在于 到底 今天 你是 在 做 一个 A I 加 的 应用, 还是 做 一个 加 A I 的 应用。 那 这里 区别 在 什么 呢? 区别 就是 A I 加 的 应用 意味着 你的 本体 是一个 A I 的。 比如说 你是 个 A I 的 创业者, 或者 是一个 A I 的 公司, 你 先 有了 A I 的 能力, 然后 去 加上 各个领域、 各个 场景、 各个 应用, 去 生成 一个 新的 范式。 这个 有点 像是 比如 rapid 21PAI pin 这些 原生 的 A I 应用。 它 有一个 底层 的 A I 能力。
或者 类似 me the journey 这样的, 就是 纯 靠 说 几句话 就 给你 删 图 的 这种 应用, 对 吧?
是的, 那 这 是一个 一个 范式, 另外一个 范式 叫 A I。 加 A I 的 逻辑 是什么 呢? 有点像 过去 我们 讲 的 加 互联网 对 吧? 或者 是 所谓 加 数字化。 它 更 像是 在 解决 一个 现有 的 生态, 现有 的 应用 体系 下。 我们 通过 把 A I 作为 一个 基本 的 要素 加入到 你的 这个 现有 的 工作流, 或者 是 现有 的 这种 执行 的 体系 里面。 是否 可以 让 你的 整个 效率 变 高。
其实 苹果 显然 他在 做 的 事情 就是 手机 加 A I 和 应用 加 A I, 今天我 的 本体 仍然 是一个 手机, 你的 本体 仍然 是一个 应用。 其实 他 提到 了 很多 第三方 的 应用, 在 它 整个 开发者 的 这个 大会 的 流程 里面。 这些 应用 通过 很 简单 的 方式, 我 让 你 零 成本 低成本 的 接入 一个 A I 的 能力。 这个 A I 能力 通过 端 侧 的 算 力 也好, 通过 我的 云端 算 力, 目前 也是 免费 给 提供 给你的 方式, 让 你 具备 了 A I 能力。 来 让 你 这个 应用 不管 是 变得 更好 用, 还是 焕发 生命力, 还是 有 更好 的 促 活 的 能力。 其实 它 都 是一种 对 现有 的 开发者 生态 的 一种 促进。
而 不是说 我要 颠覆 整个 行业 了, 我要 让 A P P 被 干掉, 对 吧? 我 直接 跳过 所有的 A P P 去 用 语音 的 方式 去 交互。 这个 可能 现在 再 回头看 这种 带有 非常 强 的 革命性 的 这种 这种 这种 话 术, 可能 想想 还是 不如 一种 渐进式 的 把把 这个 A I 能力 接入 到 现有 的 应用 里面, 感觉 它的 这种 transition 会 更 顺畅 一些。
也许 真正 的 未来 在 20年后 或者 10年、 15年 以后, 确实 就是 一个 都 不要说 是 A I P 了, 他 可能 是一个 机器人 就在 你 旁边 对 吧? 或者 是一个 贾维斯 就在 你的眼睛 里面, 那你 都 不用 去 处理 这些 细节 的 事情。 所谓 的 A P P 带来 的 这些 应用 就 由 贾维斯 去 干 就 好了。 那个那个 也许 是 遥远的未来, 但是 在 当下 的 这么 1到5年 内, 你 用户 的 长期 的 这种 使用 习惯 已经 被 培养 的。 当下, 其实 你 以 目前 的 这种 科技 能力, 我们我们 觉得 更 合理 的 可能 还是 加 A I 的 方式 去 访问 一个 应用, 去 使用 你 现在 的 这种 设备, 也许 会 加 A A I 也 包括 我们 刚才 提到 的 加 一个 A I 设备 的 外设, variable device 对 吧? 去 增强 你 这个 整体 的 A I 体验, 这 可能 是一个 更 现实 的 路径。
对 好了, 那 关于 A I 手机 到底 是不是 正确 答案, 我们 就 先聊 到 这。 然后 接下来 我们 聊 第二个 关于 商业 的 话题。 就是我 觉得 到 今天 其实 基本上 大家 可以 去 昧 了, 应该 不会 有人 再 把 apple 和 OpenAI 和 google 放在 一起 了, 对 吧? 就是 今天 OpenAI 的 姿态 之 低。
第一层 解读 是因为 苹果 依然 掌握 了 全世界 最好的 应用 分发 的 入口。 所以说 你 会 联想到 说 为什么 为什么 OpenAI 为什么 GPT 的 这个 用户 的 大规模 增长 已经 好久 没有 出现了, 已经 过去 好久 了。 以及 就是说 现在 但 凡是 个 什么 A I 的 应用, 你 一 上来 就得 赚钱, 对 吧? 原因 无非 就是 因为 你的 获 客 成本 太高了。 你 也可以 看到 在 发布会 里 完全 没有 把 OpenAI GPT S O 作为 任何 的 亮点, 这个 姿态 摆 得 非常低。 其实 深层 原因 就是 因为 今天 苹果 告诉 所有的 人都 是 说 我不需要 自己 做 模型。 我可以 用 任何 的 开源 的 模型 或者 是 安全 的 模型 都 OK。 我自己 的 长期 目标 一定 是要 把 云端 的 那个 大 模型 用 我自己 的 部署 在 我自己 的 服务器 上。
关于 这点 我 觉得 我可以 做 一个 对比。 就是 过去 苹果 在 第一次 引入 intel 的 时候, 当时 他 之前 是用 自己的 power mac 他用 不是 intel 的 处理器, 是 sum 还是 谁的 一个 处理器 的 时候, 他 第一次 引入 intel 的 处理器, 进入 max 产品线 的 时候, 他是 把 intel 的 副总裁 请 到 现场 上台, 两个人 握手 发表 战略 合作 的 这样的 宣言, 是以 这样的 方式 往 下 推进 的。 然后 乔布斯 在 发布 iphone 的 时候, 现场 也 把 google 的 总裁 请 到了 现场, 他们 也 一样 握手 战略 发布会。 但 今天 GPT4O 这么 重要 的, 我们 认为是 爆炸性 的 新闻, 对 吧? 引入 苹果 了, close still 没有 任何 的 OpenAI 的 这种 环节。 Sam 奥特曼 去了 现场, 但 不但 也 只不过 就像 一个 被 邀请 去 的 K O 和 媒体 一样, 坐在 下面, 然后 听 完了 全场 发布会。 在 这个 发布会 过程中, 他 连 一个 视频 的 致辞 都 没有。 其实 已经 反映 了 苹果 跟 OpenAI 之间 的 在在 这次 合作 上 的 地位。
当然 在 网上 有 很多 讨论, 就是说 到底 这次 合作 是谁 给谁 钱。 我 觉得 就 有的人 说 这个 应该 是 open a 要 给 苹果 钱, 因为 这样 他 才有 这样的 机会。 因为 对比 的 是 谷歌, 谷歌 要 独占 它的 搜索, 要 一年 要付 好多好多 钱, 就 10亿美元, 甚至 更多, 这个 数字 我们 没有 查证。
那 还有 一种 说法 是 说, 这个 OpenAI 是 有 成本 的对 吧? 这么 大量 的 巨量 的 苹果 用户 未来 对 它的 调用, 怎么 可能 苹果 不 给钱 呢? 而且 苹果 的 模型 能力 这么 差, 你 不 给钱 人家 不给 你 用 怎么办? 但 我们 其实 基本上 基于 刚才 的 分析, 就是 两个 合作伙伴 之间 的 利益, 或者说 他们的 权利 的 高下, 其实我 我们 认为 很 典型。
应该 是 苹果 占 绝对优势 的那 今天 他他 选择 了 一个 最好的 模型, 就是 ChatGPT, GPT4O 接入 它的 这个 系统。 当然 他他 愿意 选择 open I 是因为 open I 现在 是 最强, 对 吧? 但是 他 完全 可以在 未来 以及 我们 认为 他 大 概率 会 做 的 事情 就是 他 会 接入 更多 的 模型。 比如说 明确 会 在 中国市场 接入 百度。 在 海外 捐 米 其实 也 一直 在 聊, 我相信 没有 被 拒绝, 他 也许在 某一天 会 成为 一个 备选。 在 这个 前提 下, 我 认为 苹果 当然 是要 付钱 的, 因为 OpenAI 要 生存 对 吧? 但是 苹果 应该 会 拿到 一个 非常 好的 价格, 在 它的 token 的 这个 成本 上。
事实上 我 觉得 这一点 就是 苹果 可能 苹果 整个 公司, 尤其 在 智能手机 这种 业务 上, 它 可能 未来 的 一个 优势。 其实 很大程度 上 是 它它 的 云 服务 成本 足够 低, 以及 本 因为你 想, 未来 可能 大家 当 大家 都 觉得 A I 手机 I P C 了, 对 吧? 这个 时候 你 会 发现 说 所有的 硬件 公司 的 开支 里面 会 多 一项 叫做 云 服务, 一个 大头 叫 云 服务 的 钱。 这个 钱 过往 没有 那么 高 的那 这个 时候 其实 苹果 会 发现 说, 第一, 它它 对于 外部 的 第三方 模型 它 足够 强势, 它 拿 的 价格 是 好的。 但 还有 非常重要 的 一个点, 是因为 其他 公司 他的 数据中心 都是 买 英伟 达 的 计算 卡。
对 吧?
是的, 但是 苹果 是用 自己的 苹果 是用 自己的 这个 芯片 来 去做 这个 事情。 所以 就 想 对你 就 想 就在 芯片 这种 市场, 可能 一来 一回 在 核心 的 芯片 上 可能 一两倍 的 价差 就 出来 了。 我 认为 未来 可能 苹果 有一天 他 会 在 某 一次 财 报上, 他 讲 自己的 优势。 我 提供 相同 级别 的 免费 的 AI 服务, 我的 成本 是 最低 的。 所以 这个 未来 有可能 是一个 非常重要 的 一个 优势。
我 最后 是 提 一个 问题 我 非常 希望 各位 听众 能 跟 我们 互动 一下。 因为 这个 问题 我在 准备 的 时候, 我 其实 没有 想 清楚。 就是 其实 今天我 觉得 我还在 媒体 里面 看到 两种 完全不同 的 分析 的 声音。
第一种 声音 认为 说 苹果 今天 给 到 所有人 的 这样的 A I 的 能力。 A I 的 这个 架构 其实 对于 开发者 非常 友好, 对 吧? 不 只是 今天 wwdc 再去 回溯, 其实 苹果 过往 给 了 开发者 非常 方便 的 工具 去 训练 和 移植 自己的 模型。 然后 甚至 一些 常用 的 模型 自己 A P I 直接 调用 了, 对 吧? 比如说 我们 提到 的 就是 识别 动物 的 脸, 猫 脸、 狗脸 这种 就是 苹果 模型 先 做好。 这种 前提 下, 其实 是 非常 有利于 这种 技术实力 不强 的 开发者。
你 随便 自学 一下, 你 就 能够 去 写 苹果 的 应用。 但 现在 升级 为 随便 自学 一下, 你 就能 在 苹果 的 系统 上 做 一个 A I 应用, 对 吧? 所以 开发者 有人 认为 这是 非常 大 的 机会。
当然 也 有人 认为 说 今天 看到 了 一个 非常 不好 的 一个 情况, 叫做 不管 是 苹果 这种 做 系统 的 厂商, 还是 OpenAI 这种 做做 大 模型 的 厂商, 所有的 人都 想 把 中间 的 开发者 干掉, 对 吧? 是的, 对我 都 把 这 中间 的 开发者 干掉。 尤其是 就像 有一个 帖子 叫做 苹果 今天 杀死 了 叫做 什么 8个APP 对 吧? 然后 这 里面 可能 有 3个APP 是 A I A P P。 比如说 帮你 重写 那个 邮件, 就有 一个 非常 著名 的 一个 应用 叫做 grammy。 如果你 写 英文 邮件, 你 很难 没听说过 这个 应用。 对我 就 用过。 对他 就 被 干掉 了。
所以 还有 另外 一种 声音, 就是 认为 这个 是一个 开发者 非常 糟糕 的 一个 时代。 尤其是 在 A I 这个 方向, 就是 不管 做 系统 的 还是 做 大 模型 的 人都 想 把 你 干掉。 所以 我 其实 希望 大家 在 评论 区 能 跟 我们 互动 一下, 讲一讲 你 觉得 现在 对于 开发者 的 苹果 的 他 这套 安排, 对 开发者 究竟 是 友好 还是 不 友好 的。 所以 这 是我的 问题。
我 抛砖引玉 一下 其实 苹果 的 生态 在 过去 一直 都有 同样 的 两面。 在 正面 苹果 的 开发者 生态 应该 是 所有 手机软件 生态 里面 最 赚钱 的 生态, 对 吧? 其他 的 生态 没有 苹果 这么 优秀 的对 开发者 友好 的、 容易 上手 的、 完善 的。 不管 是 文档 还是 整个 A P I 的 接口, 还是 它 提供 的 一系列 的 服务, 应该说 都是 最 优秀 的那 它 带来 了 这种 苹果 在 生态系统 上 的 这种 特权 的 能力, 以及 开发者 赚钱 的 可能性。 几乎 所有的 开发者 真的 赚 到 钱 的 大部分 都 是在 这个 平台 的, 不管 是 付费 意愿, 用户 的 质量, 还是 你 做出来 的 这个 应用 的 这种 可 迁移 度, 在 多个 平台 之间 的 这种 能力。 包括 今天 我们 看到 的, 你可以 非常 轻松 的 接入 A I 的 这种 可能性。 苹果 并没有 去 扼杀 这些 优秀 应用 的 未来 的 盈利能力 和 留给 开发者 的 机会。
但是 在 另一面, 其实 苹果 一直 在 扼杀 一些 应用。 它 因为 它 每每 叠 一代, 它 基本上 官方 都会 推出 一两个 新的 应用。 比如说 今天 ipad 上 有 计算器 了, 刚才 在 开头 的 时候 提 了 一下, 其实 他 就 杀死 了 可能 在 ipad 上 卖 的 很好 的那 几个 计算器, 对 吧? 我们 其实 有 提到 过 vision pro 在在 这个 系统 早期 有 一些 基础 的 应用。 比如说 一个 新闻 的 一个 导航条, 可能 就 卖到 了 早期 微信 N O S 里面 的 前几名。 那 这些 应用 都 是在 一个 生态系统 的 完善 的 过程中 会 被 苹果 迭代 掉 的。 就是 苹果 认为 这种 级别 的 工具 应该 由 我 来做。 当然 什么 工具 决定 由由 他 来做, 这个 确实 是 苹果 自己 来决定 的那 确实 作为 一个 开发者, 你 在 苹果 这个 生态 里面, 如果你 躺在 过去 的 某 一个 应用领域 里面, 想 躺 着 赚 一辈子 钱 显然 是 不可能 的。
苹果 基本上 会有 各种 方式, 尤其是 这种 简单 的 应用 场景, 它 会 把 它 替换 掉, 像 今天 我们 看到 的 这种 被被 替代 的 这种 这些 这些 APP, 刚才 mix 也 提到 了 好几个, 这些 都是 逐步 会 被 替代 掉 的 一些 简单 的 应用。 或者说 苹果 认为 这个 第一 方 的, 就 比如说 一些 基础 的 A I 能力, A I 消除 对 吧? 或者 是我 帮你 重新 summarize 一个 备忘录, 这些 系统 级 的 应用 苹果 一定 会 自己 拿走。 但是 他在 整个 开发者 的 这个 应用 大会 上, 还 他 也 展示 了 很多 接入 我的 这个 应用 给你 带来 的 这种 提升 的 这些 应用。
那 这些 其实 这些 开发者 是 有 足够 赚钱 的的 这个 可能性 的那 另外一个 有可能 会 被 干掉 的 开发者, 其实 就是 我们 前面 讲到 的 这种 A I device, 就是 A I 硬件, 举 个 例子, 就是 这次 苹果 支持 了 A I 通话 的 summary, 这件 事情 其实 还 蛮 意外 的, 因为 苹果 对 隐私保护 的 态度 之 坚决, 使得 长期以来 使用 iphone 无法 通话录音 变成 了 一个 刚 区 和 痛点。 有 一家 叫 proud 的 这个 产品, 它 其实 就是 通过 磁吸 的 方式 在 手机 后面 吸上 一片 很薄 的 做工 非常 精美 的 录音机 来完成 A I 的 通话录音。 并且 帮你 做 summary, 帮你 做 总结 等等。 但是 今天 我们 其实 在 看 proud 的 这个 核心 的 场景, 就是 这种 通话录音 的 场景, 其实 就 被 苹果 用 一个 升级 的 迭代 彻底 的 干掉 了。
当然 我们 知道 proud 可能 还有 一些 其他 的 场景, 对 吧? 它 可以 它是 一个 很 优秀 的 A I 设备。 它 不光 能 通话录音, 它 还 可以 做 一些 比如说 会议 的 录音, 一些 交谈, 商业 洽谈 的 录音 等等。
但是 我们 相信未来 的 proud 的 路 可能 会 比 之前 要 难 走 很多。 因为 其实我 我们 知道 大部分 的 这个 场景, 它它 的 核心 场景 还是 一个 通话录音。 刚 需 的 场景 基于 它的 延展, 然后 刚才 可能 还 提到 了 notion 的 A I 等等。 但是 我 觉得 notion A I 倒 未必 会 被 干掉, 就 好像 其实 一个 优秀 的 笔记 软件, 它是 可以 有 跟 这个 官方 的 备忘录 一战 之 力 的。 比如说 印象笔记 这么多年 了, 它 其实 还 健在 吗? 你 应该 还在 用, 对 吧? 那 像 类似 这样的 应用, 如果如果 你 足够 优秀, 你是 可以 跟 平台 级 的 一些 第一 方 的 应用 掰手腕 的。 但 如果你 只是 一个 简单 的 一个 A I summary 的 一个 备忘录, 那你 很 可能 会 被 干掉, 这个 是 毫无疑问 的。
所以 总结 一下, 我 认为 苹果 当然 会 干掉 一部分 的 开发者, 但是 它的 整个 生态 可能 会 因此 变得 更 丰富。 它的 开发者 入场 的 这个 总体 的 意愿 和 数量 可能 还会 变得 更多。 因为 A I 的 接入 它 有 更多 的 想象 空间, 有 更多 的 人 可能 他 有 带着 一个 idea, 我要 用 A I 来 实现 一个 什么 事情。 但 苦于 他 过去 的 能力, 他 可能 做不了 这件 事情。 但是 今天 他 有 机会 去 用 这种 简单 的 方式 接入 一个 A I 来 实现 开发 A I device ai APP 的 这种 可能性。 因为 我们 知道 这 一轮 A I 其实 很多 开发者 是 很 兴奋 的对 吧? 对, 所以 大概是 这 样子。
欢迎 大家 在 评论 区 和 我们 互动, 告诉 我们 这次 wwdc 有 哪些 关于 苹果 的 A I 的 功能, 你是 印象 很 深刻 的, 你 有 什么样 的 看法? 以及 最后一个 问题, 就是 开发者 到底 还有 没有 前途, 也 希望 跟 大家 互动 一下, 好吧?
好的, 本期 节目 就 到 这里, 谢谢 大家, 谢谢。
感谢 收听 脑 放 电波, 欢迎 在 苹果 播客、 小宇宙、 喜马拉雅 等 播客 客户端 搜索 脑 放 电波, 找到 并 关注 我们。 如果你 觉得 这 期 内容 对你 有所 帮助, 欢迎 你 在 评论 区 留下 反馈, 这 对 我们 非常重要。