We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 老王者与新泡沫:苹果Vision Pro发售前新功能让人落泪,AI 硬件开始刷屏-Vol39

老王者与新泡沫:苹果Vision Pro发售前新功能让人落泪,AI 硬件开始刷屏-Vol39

2023/12/18
logo of podcast 脑放电波

脑放电波

AI Deep Dive AI Chapters Transcript
People
N
Nixon
托马斯
Topics
托马斯认为苹果Vision Pro将于近期发售,空间视频功能或将成为其杀手级应用,但高昂的价格限制了其市场普及;iPhone大规模用户基础为空间视频内容创作提供了巨大潜力,苹果正试图通过iPhone生态系统推动3D视频发展,催熟XR行业;未来AI应用将根据设备特性进行分类,PC端侧AI将专注于信息服务和设计,手机端侧AI将专注于时效性强的应用。 Nixon认为AI Pin作为一款早期形态的AI硬件产品,其成功可能性较低,其交互方式和功能与智能眼镜相比没有明显优势;AR眼镜是目前最适合作为AI硬件的设备形态,但其技术仍需进一步发展;Rewind是一款能够记录屏幕内容和语音的应用,并计划推出相应的硬件设备,但其商业成功可能性存疑;一些务实的AI硬件产品通过解决用户刚需获得市场成功,其宣传方式更注重实际应用而非概念炒作;AI硬件产品从概念到成功需要漫长的周期,许多早期产品最终未能取得商业成功;许多AI硬件产品从概念提出到实际应用需要经过漫长的研发和迭代过程。

Deep Dive

Chapters
讨论苹果Vision Pro的空间视频功能及其潜在的市场影响,分析其技术特点和用户体验。
  • Vision Pro的空间视频功能通过iPhone 15拍摄,利用双摄像头实现3D效果。
  • 媒体和用户体验反馈显示,空间视频能够带来强烈的沉浸感和情感共鸣。
  • Vision Pro的显示技术和清晰度被认为是提升沉浸感的关键因素。

Shownotes Transcript

大家好, 欢迎来到 脑 放 电波。 脑 放 电波 是 一档 关注 科技前沿 品牌营销 和 个人成长 的 谈话 类节目。 每期 带给 您 一个 有趣 的 话题, 帮 您 在 信息 严重 过载 的 现代 世界 小幅 自我 迭代。 我是 托马斯。

我是。

nixon。 上周 我 跟 nixon 在深圳 我们 见 了 一次 面, 聊 了 一个 下午, 然后 聊到 了 很多 行业 里面 最近 发生 的 一些 事情。 刚好 我们 从 几个 渠道 得知, 苹果 的 vision pro 也就是 苹果 的 第一款 空间 计算 设备, 将 提前 到 1月份 左右 发售。 这个 是 来自 黑猫警长 008的消息, 他 曾经 在 一月份 做客 过 我们的 播客。

我们 从 mac rumors mark german 这些 海外 的 媒体 的 渠道 看到 的 说法, 基本上 也都 在 三月份 以前 我们 就能 买到 一台 vision pro 了。 但是 仅限 北美, 大家 还是 很 振奋 的。 因为 之前 我们的 预期 应该 是在 六月份 左右, 它 其实 也有 一些 最新 的 一些 进展。 苹果 面向 开发者 以及 面向 媒体 又 开放 了 几轮 的 试用 和 体验。 我们在 网上 也 看到 了 很多 的 讨论, 我们 这 期 节目 可能 会 跟 大家 聊 一 聊 vision pro 马上 就要 发售 了。 我们 过去 的这 段时间 里 它 有 哪些 进化, 以及 我们 需要 还需要 了解 哪些 事情。 如果我们 要 买 怎么 买 等等。 接下来 我们 可能 也会 再聊 一 聊 在 A R 硬件 或者说 在 A I 硬件 这个 领域 里面 还有 哪些 热门 的 东西。 比如说 A I pin, 我相信 大家 也 之前 也 已经 听说过 了, 等一下 我们 也会 聊到 这个 话题。

这 一期 其实 就 我自己 个人 来 而言, 正好 把 我 可能 过去 四五年 做 的 东西 都能 串 在一起。 在 X R 行业, 然后 最早 的 元 宇宙 再到 现在, 可能 今天 苹果 有 新的 一些 卖点, 不一样的 一些 东西。 然后 再加上 说 我 参与 到 这个 电台 这个 事情 里面 来, 然后 就会 发现 说 我们 开始 关注 AI, 然后 发现 说 AI 可 穿 这个 事情 跟 我自己 的 工作 好像 也有 关系。 所以 我 觉得 今天 这 一期 相当于 把 我们 最近 关注 的 一些 话题, 甚至 我在 最近 几年 工作 里面 看 这些 产品 起起伏伏的 一些 观点, 我们 都 表达 一下。

大概是 这么 一期 节目, 对 尼克斯 应该 是 经历 过 好几轮 各种 行业 至 暗 时刻 了 对 吧?

对, 是的, 我 可能 工作 七年, 然后 经历 过 的 各种 大 裁员 之类 的 不下于 五伦。

也 算是 幸存者。 对 O K 好, 那 我们 就 先聊 一 聊 vision pro 开售 这个 事情。 Vision pro 6月份 发布 之后, 其实 大家 在 早期 看到 的 很多 信息, 基本上 反映 出来 它 还是 一个 非常 早期 的 产品。 它的 软件 应该 是 完全 没有 ready 的。 在 大家 最早 试用 的 时候, 它 提供 的 所有的 试用 是 非常 有限, 并且 要 按照 一个 非常 严格 的 顺序 去 体验。 经过 了 这么久, 感觉 现在 应该 有 更多 的 这个 体验 跟 消息 出来。 你 听到 哪些 觉得 比较 有意思 的 应用 吗?

有意思 的 应用 最近 主要 就是 三季 视频 了。 因为 这 两天 苹果 官方 请 了 几个 美国 的 记者 又 去 体验 这个 东西。 然后 正好 是 iphone 15的pro 和 15的pro max 更新 了 这个 最新 的 I O S 版本 之后, 它 就可以 拍 那个 空间 视频 了。 所以 我们 看到 好几个 美国 记者 就在 里面 写, 说 感动 的 让 我 落泪, 对 吧? 他们 拍 了 一些 比如说 自己的 亲人 坐在 对面 跟 自己 说话, 自己 家里的 小狗 向 自己 跑 来。 他 就 用 那个 iphone 15拍成 了 有 双目 立体 信息 的 一个 视频, 然后 丢 到 微信 pro 里面 看。

最近 苹果 请 了 一批 媒体 去 看 这个 vision pro, 然后 这次 他 允许 这些 记者 带着 自己的 空间 视频 去。 我记得 六月份 的 时候, 苹果 应该 是 准备 了 1到2段 他们 用 vision pro 拍 的 这个 三 弟 视频, 然后 里面 有 小朋友 过生日, 类似 这样的 场景。 当时 的 媒体 老师 们 的 反馈 里面, 其实 也是 空间 视频 是 他们 认为 最 正 看 的 一个 场景。 然后 这次 区别 就是 记者 自己 带着 自己 拍 的 空间 视频 去 看。 那些 看 回来的 记者 的 反应 就是 非常 夸张, 什么 感动 的 不行, 对, 或者 是 这个 东西 太 神奇 了, 这是 一部分 反馈。 然后 我 看到 一些 国内 的 媒体 为主 的, 包括 有 一些 开发者 的, 他们的 反馈 也都 是 那种 什么 虚拟 与 现实 的 结合, 我 戴上 就 不想 摘下来 等等, 有着 非常 夸张 的 这种 说法。

虽然 我 还没有 体验 过 vision pro, 但是 我也 用 这个 iphone 15 pro, 前段时间 刚刚 升级 了 最新 的 IOS17.2。 我也 拍 了 几段 空间 视频, 是用 quest 3就meta 的 这个 quest 3的这个 头 显。 通过 一些 转换 的 工具, 我 也能 用 它 来看 我 用 iphone 15拍的 这个 空间 视频。

怎么说呢? 首先 我的感受 可能 就 没有 那么 amazing, 因为 媒体人 真的 是 说 起来 就是 非常 的 amazing。 我 认为 这个 跟 他们 可能 用 vision pro 看 有关系, 那 我在 快 三上 看, 只能 说 还好。 首先 是 这样的, 就是 iphone 15 pro 或者 是 15 pro max 它的 拍照 空间 视频 的 方式 是 把 手机 横 过来, 然后 用 它的 广角 摄像头 和 它的 主 摄 来 拍 同一个 画面。 然后 利用 这 两个 摄像头 的 视差 来 实现 左右眼 的 这个 视差, 来 实现 最终 的 3D的 效果。

其实 相当于 两个 摄像头 就 模拟 了 你的 两只 眼睛 看到 同一个 物体 的 不同 的 角度。 然后 你 就 3D的.

iphone 拍出来 的 空间 视频 就有 两个 问题 了。 第一个 问题 很 明显, 广角 的 这个 摄像头, 它是 需要 裁切 到 像 主 摄 那样的 画幅, 它 才能 实现 左右眼 的 画幅 一致。 它 本来 广角镜头 大家 知道 本身 的 画质 都是 差 于 主 摄 的, 再加上 他 要 裁切 中间 的 一小块, 所以 会 导致 它的 这个 画质 会 明显 的 要 劣于 它的 主 摄。 所以 戴上去 看 的 感觉 就是你 总 觉得 有 一只眼睛 有 那么 一点点 近视 的 感觉, 这是 第一个 问题。

第二个 问题 就是 iphone 15的2个 摄像头, 如果 大家 去 看 的话, 它的 距离 是 非常 近 的。 它 比 我们的 瞳距, 就是 我们 两个 眼睛 的 距离 是要 近 很多 的这 也 导致 了 iphone 15 pro 或者 pro max 它 拍出来 的 这种 3D视频 的 深度 感, 在我看来 是 不够 的。 所谓 深度 感 就是 它的 3D的 效果 的 这个 程度, 我 觉得 沉浸 感 是 O K 的。 我 用 那个 quest 3在播放 的 时候, 它是 一个 默认 就 相对 大 的 一个 画幅, 可以 占满 你 整个 可视角度, 它 可以 占满 我 觉得 是 沉浸 的。 但是 在 这 里面 只有 最 靠 前 的 这个 物体 可以 有 那么 1.3D 的 感觉。 再 远 的 这个 画面, 其实 我们在 一个 论坛 里 讨论 到, 大家 提到 这个 说 有点像 2.1D 就是 它 离 3D距离 还是 蛮 远 的。 这个 主要原因 我 觉得 就是 跟 两个 摄像头 的 距离 有关。

是不是 有点 类似 于 有的 时候 去 看 那个 3D电影, 你 发现 好像 只有 那个 字幕 是 3D的, 或者 就是说 只有 一 电影 里 的 剑 冲 你 飞过来 的 时候 那一瞬间 你 才 觉得 这个 电影 是 3D的, 其他 时候 你 就 觉得 它 就是 一个 2D的 东西。

是的, 3D电影 也是 一个 过去 刚 出来 的 时候, 大家 觉得 很 震撼 的 时候, 大家 有没有 看过 i max 3D如果 看过 的话, MX3D 在 刚 开场 的 时候 会有 一段 动画 倒计时, 就是你 要 让我们一起 来 享受 这场 视听 盛宴, 然后 就会 从 十 开始 倒计时。 那个 十一 开始 是一个 平面 的 石, 然后 忽然 变得 非常 的 这个 颜色 非常 的 艳丽, 然后 变成 一个 三 弟 的 石, 然后 向 你 扑面而来。 19 87654321, 整个 IMAX3D 的 电影, 最有 三 弟 感 的 就是 那个。

开头 就 前 十秒。

对, 就 前面 10秒。 然后 后面 大部分 时候, 除非 你看 的 是 卡梅隆 的 阿凡达, 大部分 的 三 弟 现在 都是 伪 3D的 拍摄。 因为 真正 的 3D拍摄 的 成本 太高了, 它 都是 后期 做 的, 所以 你 看起来 没有 什么 三 弟 感, 这个 很 正常。

说 回 我 用 快速 三 看 空间 视频 的 感受, 总的 感觉 来讲 就是 还 不错。 但是 真的 没有 到 这些 媒体 的 这么 amazing 的 这种 感觉。 我在 想 是不是 用 vision pro 看起来 会有 不同 的 感觉 呢?

那 肯定 vision pro 屏幕 它的 这种 色域 清晰度, 最终 那种 拟真 感 是 好 很多。 就是 你看 这些 记者 他的 描述, 他 把 我 带回 了 我 拍照 的 那个 时候。 因为 它 最终 呈现 的 效果 就 好像 是 说 你家 门前 的 那个 落地窗。 但是 你 通过 窗子 外面 看到 的 是你 当时 的 那个 情境, 它 塑造 的 有 一点点 像 那个 叫做 记忆 闪回 的 那种, 就是你 透过 一个 窗户 看到 你 曾经 的 记忆, 他 有 这种 3D感, 他 就会 觉得 说 那个人 就是 在 你的 那个 窗户 背后 的 那种感觉。 他 不是说 从 那种 很 技术 的 方式 去 讲 这个 事情, 说什么 立体感 很 好啊, 他们 就是说 真的 把 我 带回 了 那一天, 真的 把 我 带回 了 我和我 的 亲人, 我 给 我的女儿 庆祝 生日 的那 一天, 我的 小狗 向 我 扑 来 的那 一天, 他们 讲 的 都是 这种 很 人文 的 story。

我 觉得 一方面 这是 它的 产品 特性, 但是 一方面 这个 也是 苹果 不管 是从 产品 定义 上 还是 在 marketing 上 对 这个 事情 的 一个 策略。 就是 这个 事情 一定 不是 什么 精妙 品质 的 影像, 一定 不是 这样。 但 这个 事情 一定 是 说, 当你 自己 能够 拍 3D视频 之后, 你知道 你 会有 那种 代入 感 吗? 如果 那个 视频 是你 自己 拍 的, 那个 是你 自己的 回忆。 你 从 情感 上 来说, 你 一定 会 就像 我们的 电台 名字 一样。 你 会 脑 放 一下 吗? 你 会 觉得 这个 事情 是 更爽 的, 我 觉得 这个 是一个 可以 理解 的 一个 事情。

我 虽然 还没有 试 过 vision pro, 但是 也 听到 一些 试 过 的 朋友 说, 他 可能 是在 空间感 上, 尤其 像 空间 视频, 它 会有 的 加强 一些 这种 纵深 的 这种 3D的 效果。 以及 我 认为 有 个 关键 的 点, 还是 在 整个 显示 设备 的 清晰度。 真正 的 跨过 了 鸿沟 之后, 它 跟 我们 现在 看到 这个 还没有 跨过 鸿沟 的 产品 的 这种 差异 应该 是 非常 巨大 的。

微信 pro 的 清晰度 它是 现有 quest 3的2倍。 它的 那个 屏幕 的 材质 是 这种 导演 用 的 这种 拍摄 的 监视器 的 这种 材质, 叫做 Michael o LED 的 一种 特殊 材质 的 屏幕。 所以 我 觉得 它 跟 这种 显示的 一些 最 基础 的 技术。

是 有关系 的对, 因为 如果 大家 经历 过 那种 V C D 时代, 我不知道 听 友 有没有 看过 V C D, 有些 年轻 的 听 友 可能 未必 看过 了, 大家 都 可能 从 直接 从 这个 D V D 开始 看 的。 V C D 的 分辨率 应该 是 270P 左右, 320P 就是 非常 模糊 的, 可以 用 模糊 来形容。 然后 后面 出了 D V D 之后, 就 进入 到 应该 是 480P 到 720P 的 样子。 高清 的那 那种 视频 的 冲击力 跟 模糊 的 感觉 其实 差距 巨大。 就 第一次 你看 高清 的 片子 是 也是 会 被 震撼 到 的。

苹果 在 提供了 这种 单目 4K的 这种 分辨率 之后, 它 可能 让 你 看到 的 视频 的 那种 真实 程度 就 去掉 了 很多。 比如 抹布 效应, 或者 是 那种 看起来 就 很 假的, 不够 真实的 这种 穿透 的 这种 感觉 的 时候, 它 可能 就是 会 增加 你的 这个 真实度 的 这种 体验。 这种 真实度 一旦 跨过 了 那条 线, 我们 现在 也 不好 说 它 到底 是 多少 分辨率 率, 或者 是 如何 做到 就可以 跨过。 你 只要 跨过 了 那条 线, 可能 在 体验 上 就是 完全不同 的 这个 感觉。

跨过 了 体验 的 阈值 或者。

叫 体验 的 金线。

对对对, 所以 回到 那个 点 上来, 就是 很多人 认为 vision pro 这个 东西, 原来 它的 概念 叫做 什么 空间 计算, 但 现在 我们 接触 到 的 一些 行业 里 的 观点, 他们 可能 反而 不太 强调 计算 的 概念。 他们 认为 3D视频 才会 是, 或者说 空间 视频 才会 是 这 台 设备 最强 的 东西, 他们 叫做 killer APP。 科技 行业 喜欢喜欢 叫 这个 概念, 我 觉得 确实 是 有 killed up 的 潜力, 一方面 是 确实 是 产品 的 素质, 美国 记者 都 落泪 了。

我 我 其次 就是说 我 上周 其实 有幸 在 一些 相似 的 一些 A R 眼镜 上, 因为 A R 眼镜 的 清晰度 跟 那个 vision pro 是 很 相似 的。 然后 我在 一些 A R 眼镜 上 看 了 几段 空间 视频, 我 觉得 确实 是 有 这个 潜力。 因为 当时 我看 的 是一个 海浪 的 一个 空间 视频, 真的 就 觉得 那个 海浪 就 快 泼 溅 到 我 身上 了。 最后 一个点 是 苹果 的 pro 和 pro max 这种 产品线, 它 一年 可能 要 出 个 几千万 台 对 吧? 对, 也就是说 原来 我们在 讲 X R 是一个 很小 众 的 一个 玩具 这种 东西, 但 现在 有有 几千万 人 可以 为 他 拍摄 一种 专门 格式 的 视频。 我 觉得 这个 事情 实在是 太 有 想象 空间 了。 就是 我们 这种 小众 行业 的 人, 没有想象 过 有 几千万 人 能够 为你 生产 视频 的这 一天, 我 觉得 太。

魔幻 了。 对, 应该说 X R 行业 长期 就是 被 这个 用户数量, 设备 的 数量 以及 内容 所困。 没有 足够 多 的 内容, 没有 足够 多 的 应用, 这是 一直 困扰 整个 X R 行业 的 一个 痛点。 在三 弟 这件 事情 上 其实 也是 这样。 因为 刚才 提到 了 3D电影, 其实 3D电影 非常 早 了, 应该 是在 阿凡达 一 前后, 甚至 更 早就 开始 有 3DI max 3D的 这个 电影 的 风潮。 甚至 有 一段时间 家里 买的 电视, 高 稍微 高端 一点 的 都 必须 买 3D电视, 就 配 上 几副 眼镜。 我不知道 你们 有没有 记得 那 段时间, 就是你 买 三星 也好, 买 长虹 也好。

我 有 印象 它的 原理 就是你 要 戴 个 眼镜, 一个 镜片 是 蓝 的, 一个 镜片 是 红 的, 他 要 去 滤 那个 光 对 吧? 然后 最后 实现 一个 3D效果。

你说的 那个 叫 红蓝 3D那个 我 印象 中 应该 没有用 在 电视 上。 OK 还是 这种 电子 快门 式 的 眼镜。 它 通过 左右 插 帧 的 方式, 左边 挡住 右边 看, 右边 挡住 左边 看。 然后 这个 时候 屏幕 匹配 你的 那个 真率 去 播放 左右眼 不同 内容 来 实现 3D的 感觉。 大概是 用 那种 技术, 一般 电影院 里 用 的 是 那种 偏正 片 的 技术。 我 觉得 大概 就 火 了 个 几年, 后面 就 没有人 再买 了也 没 现在 你 买到 了 新 电视 也 不支持 3D了, 你 甚至 可以 理解 为 它是 一种 被 放弃 的 技术。 这 里面 归根结底 就是 因为 内容 源 不够。

一方面 用 3D的 i max 的 相机, 专门 的 有 一种 摄像机 是 i max 的 那个 录影机, 本身 就是 一个 专门 的 设备。 3D相当于 两个 镜头, 它 本身 就是 一个 非常 贵 的 一个 设备。 所以 大部分 的 电影, 它 其实 不用 拍 少数 电影 用 那个 拍 成本 就会 非常 高。 大部分 不用 他 拍, 用 后期 去做 的 效果 又 不好。

刚才 也 讲 了, 所以 导致 我 虽然 有 这个 眼镜, 我 有 这个 设备, 但是 我没有 东西 看。 这个 是不是 很 像 我们 V R 现在 面临 的 困境。 对, 到 后面 就 没了 这 3D你 不 觉得 3D电影 都 变少 了 吗?

就是 我们 现在 去 看 大片, 有 一段时间 我记得 电影圈 里面 还在 喊 一个 口号, 说 我们 要 拒绝 伪 3D1个是 它 贵, 第二 它 效果 还没有 二弟 的 好。 因为 在 早期 激光 投影 还没有 普及, 电影院 如果 要 用 3D的 时候, 你 戴 那个 眼镜 它 会 变暗 很多, 所以 你的 观影 体验 甚至 还会 变差。 大家 就 喊 说 我们 要 拒绝 伪 3D后面 就 真的 没有了。 现在 大家 看 的 都是 2D为主 的 电影, 叫 少数 的 大片 阿凡达 二 什么, 你 才能 重新 戴上 眼镜 去 看 一个 三 弟 的 片子。 其实 大家 都是 被 同样 的 事情 困扰, 就是 内容。 这就是 为什么 空间 视频 被 业界 普遍 看好。

就 像你 刚才 讲 的, 四千多 万 的 设备 加上 每个人 可以 录 自己的 内容, 直接 就 使得 它 变成 了 一个 非常 有 价值 的 一个 应用 场景。 与 之 一起 被 提及 的 是 另外一个 叫 全景 照片。 我们 iphone 里面 有 个 全景 模式, 我相信 大家 出去 旅游 的 时候 都 拍 过。 就 面对 一个 很 广阔 的 风景 的 时候, 你 就会 端 着 手机 横向 扫 一遍, 扫出 一张 超长 的 照片。 这个 照片 其实 在 手机 上 看 体验 很差, 就是 一 长条, 然后 你 要 放大, 然后 一点点 拖动 看, 完全 没有 感觉。 但是 那些 记者 哭, 他 除了 哭 那个 空间 视频 之外, 他们 还在 全景 照片 面前 也 哭了。

对 对 这个 我 也得 描述 一下 这个 体验, 它是 相当于 说 原来的 那个 全景 照片 确实 会 存在 问题。 你 拍 了 之后 肯定 你 这辈子 不会 再看 他 一次。 对, 但是 微信 pro 它的 设计 是 说, 你可以 把 你 手机 上 原来 拍 过 的 全景 照片 拿出来, 然后 让 这个 全景 照片 你 当时 拍 的 可能 是 绕 了 180度 或者 360度 对 吧? 然后 那个 全景 照片 就像 一个 清明上河图 的 卷轴 一样, 它 就 环绕 在你身边。

对, 卷轴 是 平 着 打开, 它 还 不是, 它是 一个 环形, 围绕 你的 这样的 一个 打开 的 状态。

它是 环形 的。 所以 它 其实我 看到 那 几个 记者 的 反馈 也是 说 这个 东西 它 有 一种 伪 3D的 效果。 但 总而言之, 它 还是 有 很强 的 沉浸 感。 因为 画幅 足够 大, 它 能够 让 你 带 你 回到 当时 的 那个 情境 里面 去。 3D视频 和 全景 的 照片, 应该 都会 是 整个 vision pro 到来 之后, 整个 苹果 生态 里面 会 很 重要 的 两种 音视频 题材。

我 觉得 如果 将来 vision pro 出了, 然后 我 买到 了, 那 我 第一件 事情 应该 是 把 我 apple 相册 里面, 我 点 开 我的 那个 全景 照片 的 那个 图库, 里面 应该 是 有 那么 几百张 照片, 挨个 点 开 一个 一个 看。 这 可能 是 我要 做 的 第一件 事情。 那 说 回 这个, 它 是不是 能 成为 它的 一个 杀手 级 应用? 我 觉得 因为 我们 过去 定义 杀手 级 应用, 就是我 买 这个 设备 回来, 或者说 它 甚至 可以 成为 我 买 这个 设备 的 理由, 对 吧? 以 我 目前 带 快 三 看 这个 空间 视频 的 感觉, 我 觉得 如果 是 这样的 体验, 那 一定 是 不行 的那 如果我们 想象 在 vision pro 上, 我们 能 得到 一个 完全 不一样的, 完全 震撼 的、 过 线 的、 超过 金线 的 这样的 一个 体验。 那 我 觉得 空间 视频 是 有 机会 成为 一个 在 vision pro 上 一个 非常 主流 的 应用 的。 但是 在 第一代 v pro 目前 的 定价 的 框架 下, 我 觉得 他 恐怕 也没有 办法 成为 对 这个 设备 的 购买 产生 多大 的 驱动力。 因为 如果 仅仅 是 成为 一个 照片 或者 是 视频 的 查看器, 一个 3499 美元 的 设备, 大部分 人是 不会 下手 去 买的。

你 有 很多 便宜 的 视频 查看器 可以 选择, 就是 一些 便宜 的 头 显。

是。 所以 我 觉得 这个 微信 pro 肯定 在 上市 以后, 还需要 有 其他 的 理由 让 用户 觉得 说 我 把它买 回来 是 能够 用得上 的。 那么 这个 设备 才有可能 会有 更大 的 想象 空间。 那就 其实 其实 那 就说 回 空间 计算 了, 我们 今天 就在 这块 儿 就 不 展开 了。 说到 这个 你 离 供应链 比较 近, 到底 现在 供应链 说 要 卖 多少 台 vision pro, 我 看到 了 几种 不同 的 说法。

我 觉得 小 几百万 台 就是 了不起 的 了。 但是 如果你 去 参考 同价位 段 的 笔记本电脑 出货量 的话, 就 100万台 不到。 所以 这个 事情 一定 是 声量 大于 销量 的。 我 甚至 是 苹果 也 已经 预见到 这件 事情。

所以 苹果 的 发售 策略 叫做 说 你 必须 到 我的 线下 店, 你 必须 到 美国 的 线下 店 亲自 去 挑选, 我 都不 允许 你 线上 买, 对 吧? 一方面 是因为 他他 也 做不了 那么 多, 卖 不了 那么 多。 另外 一方面 是 说 他 早期 他 就是 要 筛选 对 这个 事情 确实 是 很 狂热 的 这种 用户。

当然 他 会给 一些 理由, 比如说 你是 亚洲人 还是 欧美人, 你的 那个 脸 的 宽度 不一样, 你 需要 用 的 那个 面罩 就 不一样, 对 吧? 他 肯定 会给 很多 理由 说 你 肯定 要 到 我们 这儿, 让 我 来 亲自 服务 一下 你, 你 才是 一个 好的 体验。 他 这样的 商业 策略, 他 也是 为了 控制 预期, 我 也没有 生产 很多, 我 这个 价格 也 卖 不出 很多。 但 我希望 来来 买的 人都 是一个 很 好的 体验 和 很 好的 口 背, 回去 反向 筛选 一下 用户。 但是 这个 时候 如果说 你 去 跟 一个 投资人 或者 一个 分析师 去 讲, 他 肯定 会 觉得 很 失望 了。 他 肯定 会 觉得 说 这个 东西 声量 是 和 销量 是 极其 不 匹配 的。

OK 说完 销量, 最后 再说 回来 苹果 最近 有一个 消息, 就是说 从 iphone 16的那个 数字 版 标准版 开始, 16 plus、 16 pro、 16 pro max 就 全部 他 好像 都想 支持 那个 空间 视频 的 拍摄。 因为他 想 把 那个 摄像头 全部 都 改成 横 的 平 的 放在 两个 放在 一起。 最近 网上 有 一些 泄露 图, 所以 目前 就是 看到 说 苹果 甚至 为了 愿意 为了 三季 视频 改更 多 的 产品, 改更 多 的 手机 的 这个 设计。

它 有点 类似 于 苹果 也 在 催熟 这个 行业, 其实 V R 行业 经历 过 好几轮 催熟 了, 最 开始 叫做 纸板 V R。 就是 一个 cardboard 的 那种 东西, 然后 board 对对对, 100人民币 左右, 然后 你 把 你的 手机 放在 里面, 它 有 两个 镜片, 然后 就可以看 那个 立体 的 东西。 这是 一轮 催熟。 Meta 做 那个 quest 一体机, 然后 加补 可能 最 便宜 的 时候 就 2000人民币 不到。 然后 这是 第二轮 催熟, 这 确实 也有 一些 效果, 当时 就 把 元 宇宙 的 这个 故事 讲 圆 了, 搞 到 一个 一千万 多万台 的 一个 出货量, 它 一年 可能 就是 一个 任天堂 游戏机 的 一个 体量 了。 我 其实 就是 那个 时候 入 的 行。

然后 在 中间 我们 又 看到 说 我们 大家 又 去 讲 那个 混合 现实 的 概念, 再到 苹果 发布 讲 空间 计算 的 这个 概念, 这就是 两 波 的 浪潮。 接下来 苹果 又 再来一个 叫做 告诉 大家 说 我们 要 做 3D视频, 我要 用 手机 的 这个 大 的 生态 带动 三 弟 视频 的 生产, 能够 让 我的 微信 pro 卖 得 更好。 我自己 作为 从业者, 我 确实 就 是从 元 宇宙 开始, 元 宇宙 混合 现实 空间 计算 3D视频 我 这 四轮 催熟 了。

对我 我 觉得 这 里面 的 区别 就在于 元 宇宙 混合 现实 这 两轮 苹果 没有 玩。 苹果 下场 开始 它 其实 推 的 就是 空间 计算。 这 一轮 我 觉得 空间 计算 像是 苹果 在 to b to d 的 这种 口号 的 这个 方向, 就是我 要 做 空间 计算。 大家 跟着我 上 三 弟 视频, 有点 像是 它 面向 消费者 的 一个 宣言, 你 买回来 干嘛?

对对对。

确实 有 这个 意思。 其实 三 弟 视频 它 其实 是 它是 空间 计算 的 大 的 帽子 下 的 一个 呈现 的 维度。 我 用 3D视频 来 告诉 这些 消费者 你 应该 干什么。 因为你 跟 消费者 讲 空间 计算, 这个 就 大家 说 有什么 好 计算 的对 吧?

是的, 对。 但是 3D视频 这个 事情, 你知道 当年 联想 跟 谷歌 合作 过, 大概是 一个 一千多块 钱 的 一个 3D相机。 我们 国内 的 厂商 现在 很 流行 的 叫 insta 360, 他 当年 也是 很 激进 的 去 再去 做 这种 3D视频 的 这种 机器。 但是 这些 公司 不管 你 产品设计 的 再 怎么 好, 你 最终 前面 做 的 东西 就 炮灰 了。 但是 苹果 今天 就是 简简单单 的 一代 手机, 改 个 设计, 那 记者 就 开始 落泪 了。 我 觉得 还是 得 感叹 一下, 这就是 苹果 的 特权, 造 话题 的 这个 能力 确实 是 太 强 了。

对, 因为 苹果 可能 是 也是 这个 星球 上 消费 电子 的, 不管 是 营销 能力 还是 产品 定义 的 能力, 都是 首屈一指 的 公司 了。 所以 应该说 X R 行业 终于 迎来 了 一位 真正 的 大佬, 所以 我们 可以 接下来 期待 一下。 因为 一月份 马上 就要 发生 了, 我们 看看 是不是 能 真的 在 最新 的 说法 是 1月27 号, 其实 接近 二月 了, 所以 我 觉得 几个 传言 都 指向 2到3月份 美国 发售 这件 事情。 所以 我们 刚才 聊 了 一 聊 这个 炙手可热 的 空间 计算 硬件 vision pro。

其实 我们 还想 聊 另外一个 话题, 就是 A I 的 硬件 是 怎么样 的。 因为 我们 过去 其实 聊 了 很多 期 的 A I 大部分 时间 在 聊 的 还是 A I 的 这个 底层 架构, 它的 软件、 算法 等等。 比如 ChatGPT, 文心 一言, 我们在 电脑 里 用到 的 这些 聊天 的 这个 A P P。 但 其实 所有的 软件 都是 需要 硬件 来 承载 的。 我们 今天 的 手机 也好, 电脑 也好, 它 其实 都是 为 上 一代 的 计算 设备 来 准备 和 服务 的。 我们 今天 在 电脑 上 打开 一个 ChatGPT, 它 其实 也是 一个 大家 可以 理解 为 降 维 的 形式, 让 你 去 感受 什么 是 A I 我们 认为 未来 A I 的 生态 一旦 成熟, 我们 一定 会 看到 新的 硬件 形态 出现, 或者 是 现有 的 硬件 形态 针对 A I 进行 迭代 的 这个 结果 会 出现。 其实 这个 刚好 我们 之前 没有 聊过, 今天 就 跟 大家 聊 一 聊到 现在 这个 时间点, 我们 看到 了 哪些 有意思 的 在 A I 这个 领域 的 硬件 形态。

首先 要说 的 可能 就是 大家 都有 听说 了, 可以 说是 一夜 爆 红 的 一个 A I 的 设计 叫 A I pin。 它 其实 就是 一个 小方块 通过 一个 别针 别 在 胸口, 对 吧? 有点像 一个 徽章。 我们 请 尼克森 跟 大家 介绍 一下 是个 什么东西。

这个 小方块 有 三个 东西, 它 有一个 投影 的 功能, 它 可以 把 一个 U I 界面 的 一个 东西 投影 在 你的 手上, 这是 它 第一个 功能。 第二个 就是 它 有一个 摄像头, 它 可以 看到 你 面前 的 是 什么东西, 第三 就是 它 有 麦克风 和 那个 扬声器, 它 可以 听 你 说话, 然后 跟 你 去 互动。 然后 这个 产品 它是 summer 奥特曼, 就是 open I 的 C E O 他 投资 的 一个 项目, 创始人 好像 原来 也是 iphone 还是 ipad 的 设计师, 反正 背景 很好。 然后 我在这里 放 一段 音频, 你 一听 你 就 你 肯定 就 知道 他在 讲 的 这个 场景 是什么, 他是 这个 产品 的 宣传片。 Can this.

yes, dry inference are low when you .

go what we hear? Hey, what should I get here?

我在这里 该 点 什么 呢?

第一个 场景 就是 一个女人 在 购物, 然后 拿起 一个 火龙果, 他 就 问 那个 A I P, 他说 我 能不能 吃 这个 东西, 他 就是 问 有没有 忌口。 其次 就是说 一个 老外在中国 旅游, 他 就是 问 说 我应该 点菜 点 什么, 他 就 按 那个 胸 上 的 方块, 然后 那个 方块 就 自动 把 他的 那个 英文翻译 成了 中文, 他 就可以 跟 那个 中国餐馆 里 的 一些 人 去 互动 了。 它 就是 这么 一个 东西, 主打 的 一个 东西 就是说 它是 随时 挂 在 你的 胸口, 然后 你 需要 的 时候 你 就 按 它 一下, 他 就可以 去 听 你 说话, 他 就可以 去 感知 你 面前 正在 有 什么东西, 然后 就 问 他 一个 问题, 然后 他 就可以 调用 那个 OpenAI 的 能力, 对 吧? ChatGPT 的 能力 他 就会 帮你 去 解答 你的 问题, 不管 是 翻译 的 问题 还是 什么样。 有人 把 它 叫做 可 穿戴 的 手机, 它 就是 这么 一个 概念。

这 款 产品 爆 红, 我 觉得 一方面 是因为 它是 sam altman 投资 的 一个 硬件。 另一方面 它的 形态 可能 大部分 的 普通人 是 第一次 见到, 因为他 把 屏幕 取消 了, 这是 可能 它 跟 手机 的 一个 最大 的 区别。 第二, 它 可以 增加 了 一些 特别的 交互方式, 主要是 通过 声音 来 控制, 因为 我们 知道 大 语言 模型, 它 其实 本身 就是 一个 language ui 你 用 语言 去 跟 它 直接 交互, 来 实现 一些 得到 一些 结果。 那 它 能 呈现 的 这个 方式, 它 其实 也是 多 模态 的。 包括 声音, 包括 识别 你 面前 的 这个 视频 或者 是 真实的 图像 等等。 它 其实 展现 了 一个 想象 的 生活方式, 就是我 未来 有一个 助手 别 在 胸前, 他 就像 像 一个 小机器人 一样。 我 让 他 看 的 时候 他 就 看我 让 他说 他 就说 他 有 一些 交互方式 也很 有意思, 他 就 相当于 把手 放在 胸口 这个 前面 大概 10厘米 的 位置, 然后 他 就会 在 上面 通过 投影 的 方式 投放 出 一个 界面 来, 这个 界面 就可以 让 你 跟 他 有一个 简单 的 交互。 Yes or no 等等。

我 先 说 一下 我的 感觉, 我 认为 这个 是一个 非常 早期 形态 的 一个 A I 的 硬件 产品, 它 几乎 不可能 取得成功, 这 是我的 一个 断言。 当然 我 可能 会 被 打脸, 我 也很 很高兴 看到 自己 被 打脸。 因为 那那 代表 A I 就 真的 是 超过 我们 预期 的 在在 成长 了。

因为我 跟 ny x 我们 都是 非常 关注 X R 这个 领域, 所以 在 我们 看来, 他 能 做 的 所有的 事情, 其实 一个 smart glass 都是 可以 做到 的。 就是 一个 智能眼镜 可以 做到 99.9%, 甚至 是 120% 这个 设备 能 做 的 事情。 首先 它的 交互 没有了 屏幕, 那 它的 这个 交互方式 还需要 你 腾出 一只手 来去 对它 完成 操作。 这件 事情 其实 跟 我们在 X R 里面 讲 的 最多 的 一个 概念 就 叫 解放 你的 双手。 是 相比之下 它 还 倒退 了。 因为 它 只能 解放 你的 单手, 它 跟 手机 需要 占用 的 手 是 一样 多 的, 它 至少 需要 占用 你 一只手, 你 用 这 只手 去 在 一个 非常 简陋 的 屏幕 上去 交互, 其实 在 这个 场景 下, 它 甚至 没有 手机 好用。 你 想 把手 放在 胸前 10厘米 的 位置 上下 翻动, 那 我 直接 在 这个 地方 拿出 一只 手机, 其实 能 做到 99% 的 效果。

第二, 它 可能 相比 手机 的 优势 在于 它 有一个 长期 跟 你 视角 相同 的 摄像头, 帮你 感知 你 面前 的 世界, 对 吧? 那 这件 事情 其实 在 智能眼镜 这个 维度 我 觉得 解决 的 更好。 因为 智能眼镜 的 摄像头 离 我的眼睛 更 近, 他的 视角 他 跟 我 看到 的 东西 的 一致性 会 更高。 他 本来 能够 拍 到 的 或者 是 看到 的 东西 也是 超过 胸前 这个 小 别针 的。 所以 在我看来 它 描绘 了 一个 很 美好的 一个 A I 的的 愿景。 可是 这个 愿景 在我看来 它 甚至 还没有 一个 智能眼镜, 他 还有 那个 愿景 美好。

所以 这就是我 我说 的 就是 每一个 新时代 的 到来, 一定 会 伴随 大量 的 硬件 的 前期 的 尝试。 就 好像 智能手机 在 iphone 定义 形态 之前 的 各种各样 的 智能手机 的 形态。 在 vision pro 定义 清晰 空间 计算 设备 应该 长 什么样 之前, 我们 看到 了 几十种 各种各样 的 从 car board 到 第一代 的 meta 的 quest, 各种各样 的 眼镜 我们 也 看到 了。 但是 这些 眼镜, 这些 手机 我 觉得 就 跟 今天 的 AIP1样。 我们 接下来 可能 会 看到 很多 各式各样 的 A I 硬件, 但 这些 硬件 可能 在 被 定义 清楚 之前, 他们 可能 都 只是 一个 实验室 里面 的, 或者 是 一些 最前沿 的 投资 人口 中的 玩物。 但 他 真的 不会 普及 到 普罗大众 的 手上, 这 是我的 观点。

lisa 你可以 可以 聊 一 聊, 我 有 相似 的 观点, 但是 我不是 跟 A R 眼镜 比, 我是 跟 那个 手机 比。 因为我 看 了 一个 他的 demo, 就是 他 发 一个 短信 给 别人, 我 就 发现 说 他 处理 这样的 工作, 他的 语音 不是 足够 好, 就是说 他 甚至 都 没有 做到 像 今天 siri 今天 siri 如果你 让 他在 你的 通讯录 或者 微信 的 通讯录 里面 找一个人 发 信息, siri 是 可以 跟 你 对话 两 三轮 就可以 帮你 把 这个 事儿 干 了的。 但是 A I P 现在 还 做不到 这个 程度, 然后 他 就 只能 说 你 自己 把手 伸出 来, 然后 他 把 那个 U I 投影 在 你的 手上。 总而言之 是一个 非常 别扭 和 低效 的 交互。 大概 就是你 在 手机 上 很快 就 把 那个 字 打完 发出 去了。 然后 你 可能 在 A I P 上 你是 十倍 的 时间 看着 很酷, 但是 你 花了 十倍 的 时间 你 才 把 那个 信息 发出 去。

就是 A I P 它 只是 解决 了 一个 未来 我们 要 长时间 跟 A I 相处, 这是 很 简单 的 第一步 问题。 它 叫做 说 他 鼓励 你 尽可能 的 用 自然语言 交互, 以及 就是说 他 愿意 让 你 长时间 去 佩戴 一个 硬件。 就是 今天 我们 哪怕 用 手机, 你 也会 存在 一个 问题, 说 当你 线下 你 要 去 跟人 交流 什么的 时候, 你 那个 手机 你 逻辑 上 你是 不应该 拿出来 的, 你 还是 更多 时候 还是 揣 兜里, 他是 没有 在 工作 的。 所以 A I P 它 只是 为了 它 只是 解决 了 第一步 问题, 叫做 自然语言 交互 和 长时间 变态 付出 的 代价, 就是 你的 效率 是 反向 降低 了。 他 那个 设备 给 我的 感觉 就是说 他是 为 那种 手上 永远 都有 事情 的 人 来 设计 的。 大家 对于 这个 所谓 的 A I 硬件, 其实 A R 就是 算是 最大 的 A I 硬件。

这类 A I 硬件 我 觉得 未来 它 需要 有 两个 很 重要 的 要素。 第一个 要素 就是 它的 硬件 技术, 它 要 发展到 说 它是 能够 always on 的。 不管 是 它的 麦克风 还是 摄像头, 它是 能够 持续的 开启 的。 然后 它 能够 彻底 非常 清楚 的 了解 你 生活 的 背景 信息, 我 觉得 这是 第一个 要素。 第二个 要素 是 说 它 能够 直接 的 去 帮你 执行 一些 任务, 而 不是说 你 要 经过 反复 的 一个 U I 的 一个 确认 或者 去 交互。 我 觉得 在 这 两件 事情 大 语言 模型 能够 搞定 之前 来说, 我 觉得 这类 硬件 设备 它的 交互 效率 都是 比不过 手机 的。 所以 就是 这类 设备 因为 陷入 那个 怪圈, 就是说 看起来 概念 篇 非常 厉害, 但是 事实上 你 实际 用 起来 你 会 觉得 很 笨。 我们会 把 那个 链接 和 图片 放在 那个 show notes 里, 有 兴趣 可以 看一下。

是的, 它 看起来 很酷, 但是 实际上 没有用。 这个 基本上 就是 我们 对 A I P 的 还有一个 吐槽。 是对。

是的。

那 除了 A I P 以外, 实际上 我们 可以 聊 一 聊 还有 哪些 A I 的 设备 现在已经 有了, 或者 是 马上 就要 出来。 其中 有一个 就是 刚才 提到 的 A R 眼镜, 这块 其实 我们 之前 聊过 不少, 我们 今天 不 展开, 就是 类似 雷朋 的 那个 smart glass, 雷朋 和 meta 做 的 那个那个 眼镜。 那个 可能 是 在现阶段 我们 能够 想到 的 最 适合 做 A R 设备 的 这么 一个 设备 形态。 就是 一个 眼镜 它 可以 always on 的 侦测 周围 的 所有的 内容。 它 有 个 摄像头, 它 在 这个 眼镜腿 的 部分, 它 有一个 麦克风 可以 跟 你 交互。 它 又有 一定 的 低功耗 的 方式, 可以 让 这个 镜片 有一个 交互 的 内容 写 在 这 上面。 最好 是 眼 动 的 这个 设备, 就 基本上 满足 我们 所有 对 A R 设备 的 想象。

当然 现状 是什么 呢? 现状 是 这个 摄像头 是 有了, 但是 它 不能 always on。 那 这个 眼镜 但凡 有 显示, 它的 这个 体积 和 它的 续航 时间 就要 大幅 降低。 所以 要么 就是 一个 笨重 的 有 显示, 要么 就是 一个 轻便 的 无 显示。 那 现在 唯一 可能 ready 的 就是 它 这个 麦克风 和 它 这个 音箱 在 这个 镜 腿 上, 以及 它 整个 产品 形态, 我 觉得 是 比较 明确 了。 其实 说白了 就是 雷朋 眼镜, 就是 一个 墨镜 的 这个 形态。 除此之外, 大家 今天 想 买到 一个 马上 能 用 的 A I 的 A R 眼镜带 A I 能力 的 A R 眼镜, 起码 在 我们 录制 节目 的 现在 我们 还 实现 不了。 只是 我们 认为 这个 方向 是 非常 明确 且 有 机会 的。 除此之外 nixon 你 也可以 聊 一 聊 还有 哪些 现在已经 知道 的 A A I 的 可 穿戴 的 设备。

还有一个 比较 疯狂的 有 一家 公司 叫 rewind, 中文翻译 为 叫 倒带。 它 这个 应用 现在 在 I O S 上, 就是 它 能够 利用 苹果 的 M 系列 芯片 和 手机 上 的 A 系列 芯片 的 那种 低功耗 能力。 它 可以 做到 每 两秒钟 还是 5秒钟 给你的 屏幕 截 一次 图。 然后 的话 给 它 压缩 在一起, 然后 喂给 你 本地 的 一个 模型 去 训练, 他 就 能够 替代。 你 记得 那个 笔记, 你知道 吧? 因为他 每天 你 在 屏幕 上 做 的 所有的 东西, 看 的 所有的 东西, 他 都能 截图 下来, 然后 去 识别。 变成 了 一个 真的 是 记忆力 超 好的 助理 的 那种感觉。

对, 这是 我们 之前 有 一次 聊到 过 的 一个 软件, 现在 有 很多人 已经 开始 用了, 对 吧?

软件 其实 现在 很 火, 然后 很多 这种 硅谷 一些 这种 可能 比较 先锋 的 人, 隐私 也不 那么 在意 的 人, 他们 确实 有用, 愿意 用 这个 东西 确实 替代 了 原来你 要 用 那个 印象笔记 或者 有道云笔记 对 吧? 这些 东西 去 记录 东西 和 找 东西 的 那个 世界。 但是 这家 公司 他 明年 要 出 个 硬件, 听起来 挺 疯狂的。 他 就是 把 一个 麦克风 挂 在 你的 脖子 上, 它 售价 特别 便宜, 只要 五十九 美金。 他的 意思 就是说 记录 你 每天 说 的 所有 的话。 然后 的话 就 把 这种 个人信息 助理 的 这种 概念 就 更 推 进一步 了。 你知道 吧? 他 就是 每天 你 身边 说 你说 了 什么 话, 你 做 过 什么 承诺, 是 吧? 你 就 不要忘记 你 有什么 代办, 你 就 不要忘记 回头 他们 那个 麦克风 帮你 记录下来 了, 然后 你 去 问答, 他 就会 提醒 你, 或者 自动 帮你 生成 代办 事项, 就这样 的 一个 东西。 然后 现在 还在 预售, 我 觉得 这个 也是 一个 挺 丰 疯狂的 一个 想法。

就 比如说 你说 明天 就 开始 跑步, 他 到 明天 就 跟 你说, 你 昨天 说 了 要 跑步 的。

是 这样 吗? 对对对, 他 就是 会 干 这样的 一些 事情。

对我 觉得 这个 它 相当于 记录 你 所有的 语料, 对 吗?

对, 是的, 记录 你说的 所有 的话。

我 觉得 这个 还 蛮 酷 的。 因为 大家 都 知道 大 模型 其实 是要 学习 很多 语料 的。 其实 现在 有 很多人 他在 做 一件 事情, 就是 把 他 自己 发 过 的 blog, 写 过 的 文章, 甚至 是 发 过 的 twitter 或者 是 微博, 把 它 集合起来。 集合起来 之后 变成 一个 数字化 的 自己, 然后 把 这个 变成 一个 chatbot。 然后 你 跟 他 聊天, 发现 他 对于 很多 问题 的 反馈 跟 你是 一样的。 这件 事情 其实 你的 语料 越 丰富, 它 就 越 接近 你。 他 甚至 可以 数字化 一个, 你 所有的 这个 输出 就 完全 match 你 这个 人的 正常 的 反应 进行 细 思 极 恐。

但是 我 又 很 期待, 因为 我们 想象 一下, 它 甚至 可以 帮你 解决 很多 工作 问题。 因为 很多 时候 我们 在工作中, 其实 就是 在 做 决策, 我要 选 A 还是 选 B 我 为什么 选 A 为什么 选 B 我们 假设 我们 戴 这个 麦克风 戴 了 一年 好了, 他 有 一 这一年 所有的 工作 场合 的 每一个 决策, 包括 你 所有的 生活习惯。 你。 然后 再 结合 我们 刚才 说 的 你的 所有 twitter, 你的 微博, 你 发 的 极客, 你的 文章, 你的 blog, 你的 这个 公众 号 等等。 我们 把 它 come back together。 全部 混混 在一起 之后, 他 可能 就是 一个 数字化 的, 你 这个 想象 空间 是 非常 大 的。

其实我 并 不太 看好 这个 产品 有 商业 成功, 但是 我 觉得 它 在 概念 上 带给 我的 这种 期待 程度 是 很高 的。 也许 有一个 成熟 版 的 设备, 就 比如说 是我 刚才 说 的 这个 A R 眼镜。 因为 我们 刚才 提到 了, 你 要 想 真的 形成 一个 大 模型 的 A I 硬件, 你 要 做 的 第一件 事情 是 always on, 你 要 时刻 常开。 这个 always on 其实 包括 了 摄像头 和 麦克风, 其实 我们 就让 他 一直 记录 就 好了, 我不需要 带 一个 麦克风, 我 戴 我的 A R 眼镜, 我 一天 24小时 带着 他 帮 我 完成 这件 事情。 我 用 我的 这个 眼镜 接入 他的 这个 rewind 软件 来 实现 这个 功能。 我 其实 很 期待 这件 事情, 因为我 特别 需要 一个 数字化 的 自己。

就 数字化 自己 先来 一个 数字化 的 助理, 我 确实 对 这个 事情 是 有 我 也有 需求。 比如说 上周 我们 去 参加 一些 这个 活动, 可能 见 不同 的 人 回来了 之后, 我 晚上 就得 花 1个小时 时间, 把 这一天 我 得 回忆 一下, 就是 今天 见 了 哪些 人, 聊 了 哪些 东西, 有有 一些 点 可能 是 这些 信息 是 我要 关注 的, 我 就得 专门 花时间 去 记录。 但 如果 以后 有 这个 东西, 就能 把 这个 事儿 的 时间, 那 1个小时 的 时间 就 给 省 下来 了。 但 总体 来说 这件 事情 我就是 这种 所谓 A I 可 穿戴 这种 概念, 确实 是在 这种 大公司 和 投资人 的 这个 兴趣 点 上。 因为 历史 已经 证明, 像 meta 亚马逊, 百度 就 百度 有 个 小 度 智能 音箱, 这类 的 公司 他们 真的 是 无数次 想要 把 这种 摄像头 和 麦克风 放在 你的 这个 家 里面。 他 为了 更好 的 了解 你, 然后 帮助 你 去 完成 一些 服务, 也 帮助 他 商业 变现。 我们 聊 一点 大家 用 的 用 得到 的 东西。 大家 现在 最能 用 得到 的 A I 硬件 其实 是你的 手机, 对 吧?

对, 刚才 提到 了 这个 A I 的 硬件 有 两个 方向。 一个 方向 就是 完全 创新 的 现在 不存在 的 品类。 第二个 方向 就是 重构 现在 我们在 用 的 一些 智能 设备, 比如说 手机, 比如说 电脑。 在 手机 这个 维度, 由 高通 从 今年 它 推出 了 它 新一代 的 处理器 里面 就 开始 非常 强调 的 一件 事情 叫 端 侧 AI, 叫 on device A I 所谓 端 测 A I 就是 这个 A I 是 跑 在 你的 手机 里, 而 不是 跑 在 服务器 上。 它的 这个 N P O 越来越 强, 所以 他 越来越 可以 做 这件 事情 了。 苹果 在 端 侧 前面 投入 的 更 早 更 领先。 到 今天 高通 其实 逐渐 已经 赶上来, 他们 已经 具备 了 这样的 能力。

苹果 手机 的 用户 的话, 可能 最近 感触 比较 深 的, 应该 最近 半年 你 随便 拍 一张照片, 那个 照片 里 只要 有 文字, 然后 你 去 按 那个 文字, 它 都 可以 自动 给你 O C R 了, 自动 可以 把 文字 识别 出来, 然后 就可以 去 复制 了。 这 一轮 及 手机 公司 的 宣传 里面, 我 看到 了 一个 很 好的 场景, 就是 他 会 把 一个人 跟 你 说话, 比如说 明天 我们 去, 明天 我们去哪儿 吃饭, 它 会 自动识别 屏幕 上 那个 文字。 然后 好像 是 他 会给 你 一个 快捷 指令, 怎么样 他 然后 你 就可以 去 选 说 是不是 要 生成 一个 日常 放在 你的 日历 里, 你 会 回头 你 就 不需要 去 翻 那个 聊天记录 了。 你 到了 那个 日历 那个 时间 就会 提醒 你 要 出门 吃饭 跟 谁谁。 所以 我 觉得 这个 是 很快 所有人 都能 体验 到 的 一个 很 好的 一个 案例。 就是 他 手机 上 的 A I 有了 识别 文字 的 能力, 不管 是 图片 里 的 文字 还是 软件 里 的 文字。 然后 他 就可以 给你 提供 一些 及时 的 一些 服务。

我 今天 看 了 几个 案例, 我 觉得 蛮 不错 的。 比如说 vivo 他们是 做了 一个 针对 盲人 的 一个 模型, 他 就是说 你 拿着 那个 手机, 他 就会 你 面前 是一个 桌子 还是 一个 什么东西, 用 那个 25个 字 左右 给你 描述 出来。 盲人 用 手机 去 看到 一个 乐谱, 他 能把 那个 乐谱 给你 弹奏 出来。 这些 东西 对于 这个 人群 的 生活 还是 有 很 好的 一个 帮助 的。

然后 谷歌 的话 是 做 比较 多 的 影像 相关 的 一些 东西。 比如说 你 拍 了 一个 照片 对 吧, 中间 可能 是一个 景区, 有有 一些 人 你 不 想要你 就有 个 有 个 橡皮擦 的 一个 功能 就可以 就 给 它 抹掉, 它 就能 提供 这样的 一些 服务。 这些 端 上 的 一些 手机 上 的 模型, 它 现在 它 不会 是 那种 像 ChatGPT 那种 很 惊艳 的, 但是 你 接下来 你 能 体验 到 很多 小的 功能, 我 觉得 还 蛮 好玩的。

其实我 也 跟 一个 做 A I 的 朋友 聊过 这个 事情, 就是 对于 这个 手机 上 的 这种 端 侧 的 大 模型, 大家 在 业内 什么 看法? 那 基本上 他的 回答 就是说, 因为 现在 其实 云上 的 那个 模型, 大家 都 还没有 玩 的 特别 溜, 就是 大家 还 不知道 它 能够 提供 什么样 真正 的 应用 场景。 其实 说白了, 你看 我们 聊 了 这么 多, 我们 现在 最 主流 的 在 这个 应用 层面 用 大 模型 的 方式 还是 chatbot。 我们 还是 在 一个 界面 里 跟 他 聊天 来 实现 一些 功能。 所以, 它 具体 到 能力 更弱 的 可能 大部分 是 七个 billion 的 这种 参数 的 这种 大 模型。

在 手机 端的 这个 应用, 其实 他们 觉得 现阶段 能 做 的 事情 还是 比较 少 的那 我 觉得 可能 端 侧 还是 有 端 侧 的 优势。 其实 苹果 为什么 在 端 侧 发力, 实际上 是因为 在 端 侧 手机 的 一些 及时 的 反馈, 以及 更 快速 的 回复, 以及 它 在 成本 上 的 优势。 因为 我不需要 一个 巨大 的 服务器 来 提供 这个 算 力。 算 力 其实 是 用户 买 回家 自己 花钱 的, 它 可以 带来 更好 的 这种 成本 的 这种 优势。 来解决 一些 在 手机 端的 一些 可能 跟 个人信息 相关度 更高 的 一些 数据处理 的 时候, 它 会 更有 优势。 就像 刚才 non 提到 的, 它 可以 读取 你的 本地 的 信息, 而且 它 在 本地 做 运算, 对于 用户 来讲, 在 隐私 上 他们 感受 会 更好。 他 觉得 我的 这些 个人信息 不会 被 传到 云端 的 某个 地方, 被 一个 抠 脚 的 程序员 看到, 他 会 产生 更好 的 这种 安全感。 所以 这个 是 手机 端的 状况。

P C 端 实际上 我 觉得 很快 大家 也会 再 推出 一系列 的 这种 所谓 的 A I 的 P C, 或者 是 E C 端的 端 侧 大 模型。 可能 也是 实现 类似的 作用。 它 可能 在 你的 电脑 里面 帮你 处理 你的 这个 电脑 里 的 一些 信息, 来 提供 一些 服务。

坦白讲 现在 我们 还 看不到 太 明确 的, 或者说 太 杀手 级 的 这些 应用 场景。 我们 看到 的 是 很多 小的 在 体验 上 的 优化。 这些 优化 肯定 是 让你在 用 手机 的 时候 会 感觉 更好 的, 这点 是 毫无疑问 的那 比如说 你 在 拍照 上, 对 吧? 因为 我们 手机 是 很多 时候 是 用来 拍照 的, 使用 上 它 会 逐步 的 一点一点 的 优化, 让 你 觉得 我在 手机 的 后台 放 这么 一个 大 模型 是 值得 的。

这件 事情 我 觉得 还是会 蛮 快 的, 因为 手机 的 迭代 很快, 那 可能 这 一两年。 我们 就会 看到 它 越来越 有用, 它 应该 是 这样的 一个 过程。 就是 有点像 我们 每次 更新 完 电脑, 每次 换 完 新的 平台, 刚 开始 他 好像 都是 性能 过剩 的。 所以 最新 出的 显卡 可以 把 当下 所有的 游戏 跑 得 溜溜 的。 可能 过 个 两年 新 出来 的 游戏 或者 新 出来 的 应用 就会 把 你的 电脑 再 跑 满。

我 觉得 未来手机 端的 端 侧 的 这个 大 模型 的 能力, 也是 会 以 类似的 方式 迭代。 随着 硬件 变得 越来越 强, 它 能够 装 的 大 模型 就 越来越大, 它的 性能 就 越来越 强。 这么 强 的 性能, 不管 是 手机 厂商 还是 开发者, 他们 总归 能 找到 一个 落地 的 地方 让 他 去 实现。 只不过 这件 事情 我们 现在 就 只能 对 空 聊 一 聊, 但是 我 觉得 未来 可 期。

但是 今天 如果你 去 看 所有 手机 厂商 的 那个 大 模型 的 宣传片, 我看 了 之后 我 觉得 是 很 泼冷水 的。 他们 都在 重复 做 那个 ChatGPT, 基于 聊天机器人 跟 它 互动。 然后 我看 了 之后, 我 一开始 我 没 想 明白, 我说 我记得 哪家 公司 它 最 离谱 的 有一个 场景, 他说 你 把 那个 P D F 的 论文 丢 给他, 然后 他 把 你 subway, 我说 我 读 论文 我 干嘛 用 手机? 我 读 论文 我 肯定 是 电脑, 然后 外接 屏幕 接 起来 我 肯定 reference, 对 吧? 很多 不懂 的 词汇 我 现场 查, 我 觉得 这样 才 高效, 对 吧? 现在 大家 传播 的 方式, 几家 公司, 就是 告诉 你说 你 那个 手机 上 原来的 那个 笨笨 的 AI 语音助手, 现在 可以 聊天 了, 可以 像 一个 Chat GPT1样 给你 去 做什么 文字 的 改写 总结。 我 觉得 这个 方式 大家 可能 为了 蹭 这个 热点 是 也 实在是 没办法 了, 只能 这么 讲。

是的, 坦白说 现在 很多 厂商, 不客气 的 讲, 他们 只是 在 站位 而已。 大家 在 这个 事情 上 被 A I 吓 到了。 因为他 过去 的 一年 里面 过于 的 夸张 的 增速, 让 大家 觉得 说 我 如果 不 赶快 站 到 这个 位置, 可能 这个 位置 就 没了。 所以 现在 很多 厂商 就像 你说的, 他们 在 很多 应用 的 理解 上, 他们 在 demo 的 展现 上 就 已经 呈现 了 说 他 其实 并没有 很 理解 说 我 这个 事情 到底 能 干什么。 那 我 就 先 copy 一下 ChatGPT 做 的 那些 事情, 告诉你 手机 也能 做。 这个 特别 像 智能手机 这个 领域 刚刚开始 的 时候, 你 在 windows C E 的 这个 智能手机 上 展示 一个 网页 一样。 你看 我手机 能 上网, 当事人 的 反应 就是我 为什么 要 拿 手机 那么 小的 屏幕 上网? 如果 大家 还记得 的话, 那个 时候 3.5寸 就是 大屏 了, 非常 小的 屏幕。

所以 我 这里 有一个 总结 和 预测, 就是我 觉得 我们 用 得到 的 东西, 可能 未来 A I 是 分类 的。 就是你 在 电脑 上, 它 承载 的 是 一些 很重 的 信息服务 或者 是 设计。 什么 叫 信息服务? 就 比如说 你 做 一个 GPT, 帮你 去 搜寻 某个 品类 卖 的 最好的 商品, 对 吧? 然后 给你 列 个 表, 就 这种 属于 信息服务, 你 用 那个 Midjourney 给你 生成 一张 高清 的 大 图。 这个 设计类 的, 我 觉得 P C 上 的 A I 以后 可能 是 干 这个 事儿。

那 手机 上 的 A I, 我 觉得 它的 优势 其实 是, 尤其 手机 摄像头 都 那么好, 对 吧? 你 更容易 获得 图像 和 音频 的 信息, 我 觉得 这 一方面。 另外 一方面 就是 因为 手机 它是 跟着 我们 去 移动 的, 它 有 移动 的 属性 和 时效性 强 的 一些 属性。 所以说 我 觉得 有可能 手机 上 可能 未来 比较 好的 就是 刚才 比如说 我 刚才 提到 的 说 识别 你 朋友 约 你的 那个 时间 的 那个 文字, 然后 给你 生成 一个 日程, 明天 提醒 你 什么时候 去 吃饭。 然后 苹果 手机 最近 有一个 功能 是你 拿 那个 摄像头 去 拍 那个 衣服 的 标签, 它 自动 会 告诉你 应该 怎么 洗, 它 自动 去 识别 那个 东西。 我 觉得 手机 特别 适合 时效性 强 的 这种 A I, 或者 是 说 甚至 是 说 直接 在 手机 上 帮你 完成 一些 这个 动作。 比如说 直接 导航, 你 到 什么 地方, 或者 帮你 点 个 外卖, 对 吧?

那 未来 还 会有 一类 A I, 就是 这种 我们 叫做 X R 设备 上 或者 可 穿戴 设备 上 的 A I 这种 A I 它 逻辑 上 它 应该 是 更加 的 偏向 说 你 要 全天候 的 去 用 它, 或者 多 模态 的 交互, 或者 是 说 你 需要 这个 A I 它 非常 理解 你 所处 的 那个 环境 和 那个 和 你 正在 做 的 事情, 那 可能 是 这样的 一个 概念。 从 手机 这里 我 觉得 讲 一下, 其实 现在 手机 上 看到 的 A I 都 不是 一个 很 正确 的 打开方式。 除此之外 的话, 还有 一类 A I 的 硬件, 就是 上周 在深圳 看到 的, 我 觉得 特别 亮眼。

因为 那种 硬件 就是你 一看 就 觉得 说, 真的 是 解决 生活 中的 刚 需 产品, 做 的 贼 好。 我 看到 了 一个 卡片 录音机, 它 就是 利用 iphone 的 mega soft 那个 磁铁, 就 贴 在 你的 iphone 背面。 它 解决 一个 问题, 你知道 iphone 是 没有 那个 通话录音 的, 对 吧? 但是 它 那个 东西 贴 在 你的 背后, 它 就可以 去 感知 你 iphone 通话 时候 的 震动。 它 就 相当于 说 可以 通过 类似 于 骨传导 的 方式, 把 那个 iphone 的 声音 都 给 录下来。 它 就是 一个 录音机。

那个 录音机 它 可以在 你 手机 联网 的 时候, 它 把 音频 丢 到 云端 去, 然后 让 那个 ChatGPT 的 一个 服务 去 识别 它它 就 变成 了 一个 能够 自动 帮你 去 总结 你 今天 跟 周围 的 人 所有的 对话 的 一个 特殊 的 一个 录音笔。 就 总结 一个 思维导图, 然后 哪些 人 要 有什么 代办, 我 就可以 全给你 总结 出来。 我 觉得 这个 点就 很好。 因为 很多 欧美 的 商务人士, 他 确实 是 有用 这个 录音笔 的 习惯。 他 这个 东西 就 特别 好的, 一下子 就 彻底 提 效 了, 就 相当于 是一个 A I 录音笔。 你 还 解决 这个 iphone 不能 录音 的 问题, 这个 产品 就 做 的 挺好的。 它 其实 不是 特别的 有 想象力, 但是 你 实际 看过 那个 东西, 你 就会 觉得 说 那那 确实 是 有 时效 解决 我 工作 中 问题。

然后 还有一个 是一个 A I 笔记本, 它 也是 类似的 逻辑。 它是 一个 特殊 的 一个 智能 的笔 和 一个 本子。 那个那个 本子 上 它 有 某种 特殊 的 墨水, 能够 实时 的 跟 那个 笔 配合, 就 能够 把 你的 所有的 字迹 就 给 记录下来 那样的。 所以 用 那个 笔记本 记下 的 所有 东西, 它 就会 自动 同步 到 那个 A P P 里面 去。 然后 也是 通过 这种 大 语言 模型 处理 之后, 我们 就可以 去 问答, 就是 个 自动 的 一个 助理。 他 就 相当于 把 你 记录 的 所有的 笔记 给你 做了 归类 整理, 然后 支持 到 一些 待办事项, 它 就 自动 的 给你 生成 清单, 然后 这些 硬件 都 其实 都是 深圳 的 团队 做 的, 他们 就 主要 把 这个 东西 卖到 海外 去就 卖 的 很好。

这 一类 产品 其实 也是 A I 换 的 蛮 成功 的。 它 就是 围绕 着 我们 现在 的 音频 和 写 文字 的 这个 信息 的 需求。 然后 他 做 这个 A I 智能化 就 赚钱, 我 觉得 赚 的 蛮 好的。

就 听起来 就是 一些 其实 本身 就是 在 一些 小的 细分 领域 里面, 做了 一些 比较 有 创意, 而且 有 能 解决 实际 问题 的 一些 小的 A I 硬件, 或者 小的 硬件 加入 一些 A I 的 能力 在 里面。

挺 务实 的。 我 觉得 宣传片 永远 不可能 像 刚才 提到 的 A I P 那样 全网 转发, 对 吧? 但是 事实上 你 用过 那个 产品 之后, 你 确实 会 觉得 说 解决 了 我们 所谓 的 刚 需。

除此之外, 其实 在 A I 这个 圈子 里面 就 没有 什么 实际上 真的 卖 起来 的 东西 了, 不管 是 硬件 的 还是 软件 的, 反而 卖课 的 倒是 赚 了 不少 钱。 对。

就说 的 委婉 一点, 叫做 AI 现在 还不 能够 很 好的 商业化, 对 吧?

对, A I 还 不能 商业化, 但是 教 你 学 A I 已经 商业化 的 很 彻底 了。 我 甚至 在在 极客 上 看到 有人 吐槽 说, 国内 A I 做 的 最好的 是 李一舟 和 张诗 彤。 这 两个人 其实我 也 不太 熟, 但是 他们 就是 在 抖 音 上 疯狂 房 卖 自己的 A I 课。

我自己 原来 为了 做 A I 相关 的 博客, 也 确实 是 花 过 几百块 钱 买 过 一些 所谓 的 知识 星球 之类 的 一些 东西。

对, 但是 我 觉得 其实 之前 我们 也 聊到 过, 就有 很多 免费 的 更 专业 的 内容。 大家 如果 真想 学, 其实 都是 free 的。

所以 你看 就是 一类 产品 特别的 飘 对 吧? A I P 哇塞 特别的 future 这种 概念。 但是 这些 东西 我们 认为 都是 失败, 真正 能 赚 到 钱 的 就是 个 A I 录音笔, 特别 简单 对 吧? 所以 我 就 想 起来 就是 像 A I P 的 那个 概念, 它是 一个 非常 久远 的 故事。

有 跟 乔布斯 时代 的 一个 计算机 泰斗 叫 Allen k 对 吧? 他 原来 就 折腾 过 这类 的 东西。 记得 前几年 索尼, 包括 那些 公司 才会 出 那种 互动 投影仪, 就是 那个 A I P 他 就是 把 那个 投影 投 在 你的 手上, 然后 你 就 跟 他 互动, 对 吧? 然后 通过 语音, 通过 交互 跟 他 互动。 所以 Allen k 这个人 他 可能 20年 前 他 就 开始 觉得 说, 未来 我们 就是 一个 A R 的 世界, 对 吧?

就像 AIP1样。 一个 投影 投 在 你 手上。 我自己 上 一份 岗位 的 时候, 当时 我在 做 教育 硬件, 然后 当时 看到 这个 东西 能够 在 孩子 的 书本上 给他 投影 一个, 比如说 你 让 孩子 解 一道 题, 他 解 不 出来, 你 就 把 那个 解题 的 上半 部分 的 步骤, 你 就 投影 给他, 提示 一下 他。 我们 觉得 这个 东西 对于 教育 太 厉害 了。 当时 看 了 直接 沸腾, 结果 实际 一 去 调研 之后 就 发现 说, 这个 东西 做出来 太贵 了, 这个 东西 做出来 可能 要 卖 三四千块 钱。 那 这个 东西 肯定 就 不是 现在 能够 去 民用化 的 一个 东西。 我 就 觉得 说 这个 A I P 其实 它 就 代表 了 硅谷 一派 的 这种 做 计算机科学 和 交互 的 人, 他们 二三十年 前 就 开始 有的 这个 想象。

但是 到了 今天, 我们 今天 去 看 这个 东西, 我们 认为 这个 产品 依然 不会 成功。 然后 历史上 这类 的 故事 真的 是 比比皆是。 就 Allen k 这个 老爷子, 他 70年代 的 时候 他 就在 施乐 上班。 反正 施乐 就是 乔布斯 去 所谓 的 去 偷 那个 图形界面, 那个 创意 的 实验室。

Alen k 他 当时 有一个 很很 好的 一个 设想, 就是说 每个人 他 都 应该 有一个 这种 大屏幕, 然后 有 键盘 有 笔 的 一个 笔记本。 他 把 那个 东西 叫做 dinner book。 这个 dina book 就 被 公认为 它是 ipad 的 原型。 所以 你就是 想 最早 的 概念, 它是 一九 大概 68年, 70年代 的 时候 它 就有 了 那个那个 圆形 图, 那个 论文 就 发出 来了。 乔布斯 在 201年 才 把 那个 东西 做出来。 然后 乔布斯 去 找 那个人 说 这个 是不是 你 当年 想要的 东西。 所以 这个 时间 真的 就 特别 长, 包括 刚才 提到 我 上 一份 工作 是 做 教育 的。

你知道 前几年 小学生 家长 流行 买 那个 词典 笔、 点读笔 或者 词典 笔, 就是你 就 扫 一下 纸 上 的 一个 不 认识 的 单词, 马上 就 给你 识别 出来 了。 30年 前 就有 这类 东西 存在 了, 国内 之前 有 那种 品牌 类似 汉王 之类 的 东西, 但是 事实上 一直 直到 18年 19年, 我们 才 找到 一个 能够 跑 在 那个那个 小 笔 上 的 一个 识别 精准 率 可能 能够 超过 95% 的 一个 模型, 然后 在 200毫秒 的 延时 之内 把 它 识别 出来。 过了 30年 这个 东西 才 被 做出来, 然后 才能够 真真正正 的 被 消费者 认为 是一个 很 有 价值 的 东西。

我的 观点 就是说 A I 这个 东西 其实 今天 就是 A I 这个 东西 今天 呈现 出来 的 一些 非常 好的 愿景, 未来 每个 人的 眼镜, 每个人 身上 都 有一个 可 穿戴 的 东西, 我 觉得 这些 东西 可能 都是 非常 早期 的 东西。 你 真正 要 看到 那个 世界 变化 的那 一天, 我 觉得 可能 是 非常 长 的 一个 周期。 我们 自己 在 做 博客, 为 大家 去 讲 最新 的 话题。 如果你 去 看 我们 半年前 讲 的 博客 的 话题 和 今天 的 话题, 确实 是 一轮 又 一轮 的。 包括 刚才 我 讲 我自己 在 X R 行业 可能 一两年 时间 经历 了 四个 话题, 对 吧? 但是 事实上 这些 话题 他 真真正正 距离 你的 生活 确实 是 有 一些 距离 的, 你的 生活 最终 会 变成 那样。 但是 它 完全 是一个 渐变 的 过程, 它 不是 一个 你 看到 一个 好的 demo, 你的 生活 就 跳 成 那个 样子。 然后 最早 做 的那 帮 人, 如果 他 做 的 产品 的 选择 不是 特别的 正确, 那 别人 现在 就 死 在 前面 了。

如果说 你 在 正确 的 时间点, 你 去 做了 那个 东西, 你 就 变成 先驱, 就 好像 前几年 我 做 的 智能 台灯, 对 吧? 然后 如果 这几年 碰上 大 模型, 我 就 觉得 这个 东西 完全 不一样。 因为 原来你 要 开发 一个 识别 孩子 桌子 上 有 哪些 孩子 都在 看 什么, 他是 在 做 什么样 的 学习 活动。 你 要 原来 要 开发 这样的 一个 模型 贼难 了。 现在 就是你 你 用 通用 的 这种 大 模型, 你 觉得 这个 事情 已经 触手可及 了。

尤其是 看到 谷歌 刚刚 发布 的 那个 他的 新的 那个 大 模型 叫 germany。 对他 就有 一个 视角 跟 智能 台灯 的 视角 是 一模一样 的 一个 下视 的 一个 视角。 对他 已经 做到 那样的 识别 度。 这个 如果 是 放在 一个 台灯 里面, 确实 是一个 很酷 的 想象。

所以 当时 那个 视频 出来 之后, 就有 同事 发 这个 视频 给 我们, 就是 生不逢时。 对对对, 这是 不 这 不就是 当年 你们 想 干 的 事儿。 我 我说 我 一看 我说 太 感慨 了。

对我 觉得 如果 大家 回去 听 我们 第一期 讲 ChatGPT 的 节目, 我们 当时 其实 就是 在 畅畅 想, 这么 厉害 的 一个 chatbot, A I 时代 开启 了, 我们 将 迎来 12345 这么 多个 应用, 我们的未来 将 变成 6 7 8 9 10, 吧? 我们 无数次 畅想 了 这些 东西。 现在 一年 过去了, 应该说 我们 90% 的 畅想 是 没有 实现 的, 99% 不过 分, 我们 今天 用到 的 ChatGPT A I 的 能力 跟 一年前 的 Chat GPT3.5, 应该说 他是 渐进 的。

像 刚才 尼克森 说 的, 他 变 好了, 但是 他 并没有 实现 我们 那些 梦想 里面 跨越式 的 成长。 确实 我们 要 想 真的 实现 我们 今天 很多 的 这种 想象, 它 需要 一个 更长 的 过程。 当然 我们 可以 有一个 美好的 预期, 就是 因为 科技 的 发展 是一个 加速 的 过程。 我们 今天 不需要 再 等 40年 看到 下一代 的 A I 应用, 但是 可能 大家 还是 要 给 这个 行业 多一些 耐心, 包括 X R 行业 也 经过 了 无数 轮 这种 波峰 波谷 的 这种 迭代, 可能 X R 行业 差不多 到了 这个 引爆点。 因为 我们 看到 了 vision pro 他 可能 从 1415年 到 现在, 也 已经 经历 了 差不多 七八年 一个 周期 的 这个 轮回。 A I 会 更晚, 但是 A I 的 速度 跟 关注度 更快。

我们 今天 的 好处 就是 可能 在 1968年 阿兰 K 提到 这个 模型 的 时候, 那个 时代 还没有 那么 强 的 社会 的 关注、 媒体 的 关注、 资本 的 关注 去 加速 催熟 这个 事情。 像 我们 刚才 提到 苹果 也 在 不断 的 摧 熟 一些 事情。 我们 讲到 催熟 的 时候, 其实我 个人 不是 持 负面 态度 的。 我 认为 催熟 是 催熟 是一个 正向 意义 的对 行业 是 有 促进 的 一件 事情。 虽然 可能 看起来 有点 拔苗助长, 但 我 觉得 在 科技 行业 不存在 这个 概念。 我们 就是 要 拔 苗 帮助 它 长 得 快一点。 我 美好的 期望。

虽然 我 觉得 隐隐 之中 也有 一种 可能性, 其实 有 很多人 也 在 说, 我们 今天 看到 的 A I 可能 就是 未来 20年 就 都是 这个 水平。 因为你 可能 transformer 这个 概念 下, A I 能 做到 的 就是 一个 无所不知 的 鹦鹉, 不能 指望 它 能够 掌握 更 高级 的 智能。 那 它 能够 实现 的 东西 可能 顶天 了, 也就是 跟 现在 相比 再 迭代 那么 一点点。 这个 是 悲观主义 的 论调, 但是 我 觉得 我 本身 还是 偏 乐观 的。 我相信 A I 加上 A R 我们 可能 在 未来 的 3年到5年 的 这个 范围内, 我们 就 看到 一个 我们 就有 机会 看到 一轮 接近 智能手机 这样的 规模 的 革命性 的 新 设备, 新的 应用 场景, 新的 互联网 时代。 下一个 互联网 时代 的 到来, 我们 又 在 2023 的 年末, 放了 一个 小小的 期许。

这个 时间点 聊 这个 还 挺 合适 的。 因为 A I 其实 我们 聊 的这 一年 下来, 其实 也是 好几个 话题 就 轮 动 了, 对 吧? 一开始 讲 的 是 ChatGPT 广 受欢迎, 然后 接下来 的 讲 的 这个 多 模态, 讲 这个 插件 和 G B T S。 然后 今天 讲 到了 这个 A I 可 穿戴, 它 也是 不同 的 话题 在 轮 动。 就 当 话题 轮 动 这个 事情 一定 有 它的 负面。 就是 很多 话题 其实 就像 泡沫 一样, 膨胀 过 一次 之后 它 就 破 掉了。 后面 泡沫 它 有 泡沫 的 作用, 它 能够 让 获得 资本 和 社会 的 关注, 本质 上 它是 能 滋养 创新? 因为 能 创新 的 人 他 得 花钱。

好的, 如果我们 没有 什么 意外 的话, 这 可能 是 我们 2023年 最后 一期 博客 了。 我们 也 跟 大家 回顾 了 一下 过去 一年 里面 A I X R 走过 的 这些 历程, 也 感谢 大家 的 一年 的 陪伴, 2024年 我们 也会 继续 陪伴 大家 提供 更多 的 在 泛 科技领域 有意思 的 话题, 希望 大家 可以 对 未来 充满信心。 我们是 一个 毕竟 是一个 正能量 大台, 在 这 里面 提前 祝 大家 新年快乐。 好好, 我们 本期 节目 就 到 这里。

感谢 收听 脑 放 电波, 欢迎 在 苹果 播客、 小宇宙、 喜马拉雅 等 播客 客户端 搜索 脑 放 电波, 找到 并 关注 我们。 如果你 觉得 这 期 内容 对你 有所 帮助, 欢迎 你 在 评论 区 留下 反馈, 这 对 我们 非常重要。