We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode S2E53|槽点不少,我们体验完扎克伯格的“元宇宙”却被圈粉了

S2E53|槽点不少,我们体验完扎克伯格的“元宇宙”却被圈粉了

2021/9/22
logo of podcast 硅谷101

硅谷101

AI Deep Dive AI Chapters Transcript
People
丁教
刘冰雁
杨俊睿
泓君
Topics
泓君:本期节目在Facebook的Horizon Workrooms VR应用中录制,旨在体验元宇宙会议,并探讨其用户体验和技术细节。节目中,我们详细讨论了Horizon Workrooms的加入流程、交互逻辑、音频体验、以及与其他虚拟会议应用的区别。我们还探讨了Oculus Quest 2的手势识别技术、空间音频技术以及未来发展方向。 丁教:Horizon Workrooms的加入流程复杂,耗时较长,用户体验有待改进。会议邀请方式与Zoom不同,网页版和VR版设计不一致,给用户带来困扰。此外,Quest 2的头盔佩戴舒适度有待提高,需要额外购买更舒适的带子。 杨俊睿:Horizon Workrooms存在很多bug,需要反复重启。其交互逻辑奇怪,切换工作空间需要重新登录所有设备。Oculus Quest 2的游戏购买速度很快,花钱速度也很快。Horizon Workrooms的屏幕清晰度在办公场景下尚可,但在游戏场景下略显不足。 刘冰雁:Oculus Quest 2的手势识别技术通过重叠区域的深度信息和手的大小来校准和判断手的位置。该技术难点在于如何提高精度并将其压缩到移动设备上运行。目前的手势识别技术在双手交叉时会失效,缺乏力学反馈,精度也低于控制器。更好的手势追踪是AR应用的关键,手势和语音识别是未来AR/VR交互的关键。 泓君:Horizon Workrooms旨在提供虚拟现实的办公环境,让用户以虚拟形象进行工作和会议。其空间音频技术可以帮助用户区分多人同时说话的声音,虚拟环境具有真实感,可以提高会议效率和互动性。面对面交流比线上会议更自然顺畅。Oculus Quest 2使用普通摄像头来追踪手势,通过用户头部移动来判断深度信息。 丁教:Horizon Workrooms的设置过程复杂,难以找到会议入口。用户体验像初级阶段,需要改进。购买Oculus Quest 2是为了使用Horizon Workrooms。 杨俊睿:Horizon Workrooms的Onboarding过程非常痛苦。Oculus Quest 2的头盔佩戴舒适度不如Oculus Quest,后面带子质量差,需要额外购买更舒适的带子。Oculus Quest 2硬件销售是亏本的,盈利模式是靠游戏销售。 刘冰雁:Oculus Quest 2的手势识别技术通过识别关键点和简单的深度计算来推测手部姿态。该技术使用黑白相机,不需要深度相机。目前的手势追踪技术在双手重叠或接触时存在问题,缺乏力学反馈。更好的手势追踪可以实现更复杂的虚拟交互,例如虚拟游戏。

Deep Dive

Chapters
The podcast hosts and guests discuss their initial struggles using Facebook's Horizon Workrooms, a VR application for Oculus Quest 2. Despite the frustrating initial setup and buggy interface, they found the overall experience engaging.
  • Initial setup and login process was extremely difficult and buggy.
  • The application's interaction logic is confusing.
  • User experience needs significant improvement.

Shownotes Transcript

我 刚刚 在 给你们 录 之前, 我的 头盔 电视 充满 的, 大概 用 手机 录 了 一会儿, 现在 电量 掉 到了 87%.

我 就 等于 重新加入 了 你的 workspace, 所以 我 等于 重新 申请 一遍 账号。 这 样子 我 现在 在 我的 账号 下面 有 我自己 的, 然后 有你 这个 可能 它 就是 像 slack 的 逻辑。

他 一个 号 只能 登 一个地方, 你 得 再 帮 我 email 一个 email。

好, 我看 一下 它的。

鼠标 没有 在 里面。

但 我 觉得 鼠标 不在 里面 用 起来 还是 挺 方便。

我 现在 可以 看到 我的 手 有点 像是 X 光 那种, 一半 是 游戏 里 的, 一半 是 我真的 手 的 黑黑 灰灰 的 样子 还 看 的 挺 清楚 的。

它是 真的 挺 方便 的, 我 这每 record 它 都 已经 只有 67了, 我 刚才 那么 一会儿 应该 已经 消耗 5%.

那 我们 赶紧 录。

欢迎 收听 硅谷 101, 我是 红军。 最近 元 宇宙 的 概念 非常 火, 我也是 在 做 一些 新的 尝试。 比如 我们 这 期 就是 一期 体验型 的 博客, 我们 现在 是在 facebook 的 新产品 和 workrooms 里面 录制 的 一期 播客。 我 现在 感觉 有点 艰难, 因为我 现在 是 头戴 着 V R 设备 在 跟 大家 说话, 同时 还在 写字桌 面前 摆 着 一套 话筒。 跟 我们一起 聊 这个 话题 的 嘉宾 是 生动活泼 的 联合 创始人, 他 也是 worth nex 科技 早知道 的 主播 dan, 相信 很多 听众 对他 已经 非常 熟悉 了。

Hello 丹 你好 hello 红军。 我们 其实 今天 怼 了 半天 了, 才 都 同时 拉进来, 好 辛苦。

是的, 我们 是从 昨天 一直 对 到 今天。 然后 还有 一位 是 斯坦福 计算机 机器 的 博士 杨 珺 睿。 Hello 俊 睿, 你好。 嗨 你好 俊 锐。 之前 在 我们的 节目 中讲 过, V R 也 非常 受 大家 的 欢迎。 我 跟 档案 从 昨天 弄到 今天 弄 了 好久, 最后 是 俊 睿 帮 我们 搞定 了 这个 设备 的 设定。

其实 就是 像你 打 客服 一样的 时候, 你 把 这个 重启 一遍, 这种 感觉 就是 需要 反反复复 的 重启, 因为 太 bugging 了, 还是 很多 bug。

主要 还是 它的 这个 交互 逻辑 比较 奇怪, 他 可能 想 模拟 一个 类似 flag 的 功能。 同时 它 在 一个 flag 又 不像 slack 一样, 你可以 很 容易 的 在 多 workroom 里 切换 它的 每一个 具体 的 workroom。 适合 你的 显示器 和 你的 电脑 绑定 的。 所以 你 每次 你 如果 想 从 一个 workroom 跳 到 另一个 workroom, 你 就 需要 重新 log in 你的 所有 设备, 然后 就 挺 麻烦 的。

对对对, 我 感觉 重新 建 了 一次 账号, 我 还 以为 我 又 搞错, 但 其实 后来 成功了。

他 不是 那种 平时 像 我们 用 zoom 会议, 用 习惯了 在 里面 发邮件 邀请, 邮件 完了 加入 就行了。 它的 交互 入口 在 屏幕 右上方 的 一个 小按钮 上, 可能 是 我们 先 要 加入到 一个 meeting 里面, 再发 这个 meeting 邀请 就 太 奇怪 了。

反反复复 成功 不了。 我不知道 他 实际 是 怎么做 的, 我 怎么 总 觉得 他 开发 的 team 是不是 有 两 波, 感觉 他 做 V R 这边 的 还是 就 比较 正常, 他 只是 和 某个 账号 绑定 一下, 它 这个 绑定 的 行为, 如果 当你 有一个 唯一 的 账号 的 时候 是 比较 合理 的。 但是 它 网页版 感觉 更 像是 slack 一样的 设计, 所以 就 导致 这 两个 设计 感觉 不是 很 符合。

对我 觉得 用户体验 还得 再 重新 再 顺 一顺。 因为 我们 最 开始 是的 时, 然后 我们是 自己的 avar 进入 不了 这个 workroom, 其实 就是 拿 电脑 端 直接 进去 的, 就像 普通 的 zoo m 1样的。 这样 在 开会 对他。

这个 电脑 加入 的 方法 和 zoom 是 一样的, 但是 开塞 加入 的 方式 是 和 slack 一样的。

整个 人 很 晕菜, 他 要 设置 好 多次, 我们 还没有 说 在 前面 里面 我们 要 设置 整个 的 aulus, 要 设置 一次 电脑, 要 设置 一次 键盘, 所有的 东西 都 搞定 了。 对 我们 来说 最 艰难 的 一步 就是 找不到 会 的 入口。 不知道 怎么样 让 我们 三个人 在 同一个 房间 里, 而是 各自 在 各自 的 房间 里。

我 觉得 昨天 大概 我们 花了 能有 一个半 小时, 然后 今天 又 花了 一个多 小时, 加起来 可能 3个小时。

我自己 用 这个 产品 的 感觉 是 爷爷奶奶 们 告诉 我们 说, 我们 知道 这个 怎么用, 但是 怎么 发邮件 就 来来回回 就是 不会 发 过去。 我 现在 就 我是 老年人 的 感觉。

但 也有 可能 是 他 用户体验 才 做 的 比较 初级 的。 我 觉得 他 可以 慢慢的 再 细化 一下。

对, 我们 刚刚 提到 了 horizon workroom, 就是 我们 这几天 的 一些 用户体验 的 尝试。 我 觉得 很多 听众 可能 还 不太 了解 这是 一款 怎样 的 应用, 不然 我们 先 给 大家 简单 介绍 一下 horizon workroom。 它 其实 是 facebook 发布 的 一款 在 oculus quest 上 的 V R 应用。

Oculus quest 2还必须 得 是 二代 才能 用。

对, oculus quest 2上的 一款 V R 应用。

你们 买 了 二 是因为 什么? 因为 你们 刚刚 两个 都讲 过, 你们 其实 是 有了 quest。

我 只有 一个 目的, 就是 为了 用 workroom。

我也是, 我想 体验 一下。

明白 了, 因为我 之前 没有, 所以 买 一个。 其实 本来 也 是因为 workroom, 然后 才会 进入 了 这个 坑, 但是 其他 有 很多 游戏 什么 之前 都 没玩 过, 感觉 还是 蛮 好的。 但是 workroom 本身 on boarding.

的 实在是 太 痛苦 了。 你看 我们 三个 都 是因为 被 这个 产品 horizon workroom 吸引 来 买 了 quest to。 我自己 的 一个 感觉。 因为我 之前 是 有一个 quest, 我 用 quest 比 用 quest 2体验 要 稍微 好 一点。 是因为 他的 头盔 的 设计 我 感觉 更 舒适 一点。 Quest 2我不知道 为啥 他的 头盔 我 现在 戴 着 就 觉得 他 老 往前 倾。

因为 它的 后面 这个 band, 我 管 它 叫 band.

或者 叫 松紧带。 它 后面 这个。

带子 其实 是 质量 更 差 的, 毕竟 quest 2其实 只要 300刀, 而 quest one 要 400刀。 所以 它 这个 bad 本来就 不好。 我 听说 所有 都在 抱怨 这个 band, 但 你可以 花 一百 刀 买 一个 它 叫 ellide strap 专业版 的 这个 袋子, 还有 专业版 的 袋子 可能 会 稍微 舒服 一点。

但 我 就 觉得 有点 划不来。 你说 这个 才 299 刀, 我 再 花 一百多 刀, 只是 买 个 袋子, 我 就会 觉得 心里 不 舒服。

更正 一下, 替换 版 的 袋子 是 49的袋子, 加 电池 是 129 的。

那 还好。

因为 那个 电池 它 设计 的 应该 是 它 和 显示器 差不多 重, 使得 你的 头 比较 平衡。 现在 不是 会 往前 滑, 就是 因为 前面 太重 了。

后面 太轻 了。 看 你是不是 资深 玩家 了。

就 看我 是不是 可能 玩 了 很久, 到 现在 买 了 quest 2。 我 已经 买 了 几个 游戏 了, 就 花钱 的 买 了 一个 B C 本, 大概是 29.9块。 我在 里面 买 了 一张 linking park 的 专辑, 然后 又 买 了 一个 解谜 的 叫做 润 V 2, 大概 也是 29.9块。 所以 我 就 觉得 我 还 买 了 不到 一个 星期, 已经 花了 不少 钱 了。 我 就 觉得 这个 肯定 是 这样的。

它是 主机 的 模式, 就是 他 卖 你 这个 头盔 是 亏 钱 的。

他 得靠 你。 对, 但是 我 就在 想, 如果 别的 平台 上面 我 买 一个 switch, 可能 一个游戏 我 可能 得 玩 个 蛮 久。 如果 买 个 塞尔达 的话, 得 玩 个 一个月 好几个 星期。 我 就 感觉 这个 速度 在 买 游戏, 我 还 觉得 很 烧钱。

再说 回来, 刚才 正因为 我们 这个 horizon workroom 是 什么样 的 东西, 大家 应该 也都 看 了 扎克伯格 他 发布 的 那个 视频。 基本上 它 就 像是 一个 虚拟世界 开会 的 一个 应用, 一个 软件, 让 大家 有 自己的 这个 人物形象 在 里面。 然后 可以 把 自己的 电脑 连到 虚拟世界 里面, 可以 不用 把 你的 黑色 脱下来, 你 就 可以在 里面 开会, 在 里面 工作。 这个 其实 是 吸引 我 来 尝试 的 一个 主要 的 原因。 并 不是说 可能 大家 就是 有 个 虚拟人 像 在 里面, 我们在 交流。 但 它 更多 的 是 它 可以 真实的 这样的 一个 虚拟环境, 我们 一起来 工作, 可以 分享 屏幕, 可以在 写 白板 这些 功能, 暂时 其他 的 tag 是 没有 的。

还有 一点, 一直 有人说 zoom 下 为什么 有一点 不好? 就是 所有人 是 一起 说话的 时候, 你是 没有 办法 听 清楚 每个人 说 的话。 但是 horizon workroom am 从 工程 来讲, 它 至少 它的 目标 应该 是 制造 一个 在 V R 里面 的, 就像 生活 中的 一个 可以 一起 工作 的 环境 这样的 一个 产品, 其实 这是 合理 的。

像 之前 的 一些 比如说 virtual s top 或者 之类 的, 它的 这些 竞 品 们 基本上 还是 比较 局限于 只是 为了 分享 屏幕 这个 里面。 就 比如说 我 觉得 一个 很大 的 区别 在于 不是 和 X 2可能 默认 情况下 就 会给 你 显示 一个 巨大 的 100寸的 屏幕。 在 你 面前 像 投影仪 一样, 很多人 在 看 同一个 屏幕。 Workroom 默认 情况下 是 每人 面前 一个 屏幕, 就像 我们在 开会, 或者 我们在 一个 办公室 里, 你 既 可以 做自己 的 事情, 同时 你 又 可以 跟 别人 说话。

我们 可以 测试 一下, 比如说 我们 三个人 如果 同时 在 说话的 时候 通过 空间, 我不知道 怎么 翻译 这个 词, 就是 special audio, 应该 指的 是 空间 音频 的 方式。 它 能不能 让 我 这 一个 正常 的 人 能够 处理 多 个人 同时 说话的 这种 情况。 因为 在 现实生活 中 你是 可以 的。 你 想 一个 屋里 如果 再 开 一个 party 可能 有 100个人。 那 100个人 里 我们 通过 本身 距离 的 差别 以及 声音 的 方向, 你是 可以 同时 知道 哪 一个人 说 了 什么的。

对, 我记得 他 应该 是 有一个 人数 的 限制, 他 应该 大概是 有 16个人, 就是你 能够 参与 到 里面。 但是 如果 是 这种 像是 普通 我们 叫 coin 的, 打电话 进来 的 大概是 34个 人 左右。 对, 我不知道 是不是 也 是因为 可能 有 special audio 的 这样的 一种 限制。

而且 他 还需要 把 你的 动作 放进来, 所以 它 可能 相对 需要 的 带宽 也要 比 你 从 这里 加起来 要 更大 一点。

因为 觉得 很 真实, 比如说 是 我在 说话, 你 俩 就会 看着我, 就 刚刚 jack 说话, 我们俩 都会 看着 他, 所以 就 这种 感觉 还是 蛮 好, 蛮 真实的。 如果 刚才 我在 投 的 屏 的话, 大家 其实 都会 完全 就 看到 这个 里面 的 虚拟 的 投影幕 和 白板。 这个 感觉 其实 是 这种 是 给 不了 的。

我在 进来 以后, 我 觉得 这个 产品 真的 是 有 一种 我们 就是 在线 下 坐在 一个 会议室 里面, 各自 看 各自 的 电脑, 同时 又 可以 聊天 的 感觉。 因为我 做 播客 以来 很快 就 疫情 了, 所以 我 播客 绝大部分 都是 在线 上 录制 的, 只有 极少数 的 期数 是 在线 下 录制 的。 但是 明显 感觉到 线上 录制 的 期数, 大家 之间 的 交流 跟 互动 是 很不 顺畅 的。 比如说 像 刚刚 我们 几个人 同时 都想 说话, 谁 想 插话 的 时候, 其实 不太好 插 的。 但是 在 现在 这样的 一个 场景 里。 我 能 看见 答案 在 看着我。 如果你 张 一下 嘴, 我 就 知道 你是不是 想说 一个 话题, 我 很快 就 停止 了。 但是 如果 在线 上 录制 的话, 他的 反馈 没有 那么 及时, 有的 时候 还有 一点点 小 延时。 所以 就会 感觉 中间 要把 一个 嘉宾 打断, 然后 来 插话 是 一件 很 尴尬 的 事情。 但 现在 我们的 交流 好像 就 很 自然。

因为你 刚刚 下来 的 时候, 他还在 点头, 我 都 可以 从 他的 F 里面 能 看出来。

你们 发现 这个 眼睛, 其实 因为 他不知道 你 眼睛 在 往 哪 看, 他 知道 我的 头 在 往 哪个 方向 看。 但 我的眼睛 在 往 哪个 方向 看, 应该 是 他 猜出来 的。 他 这个 猜 的 就 反正 还 挺 自然。

你 现在 在 看我 吗? 我 现在 在 看我 能 看到 你 在 看我 答案, 能 看到 他在 看 我们。

对他 现在 在 看 就说 如果我 不 看你。

他 可能 也会 显示 我在 看你。

对, 但 我 觉得 身体 的 转向 可能 有的 时候 也是 有 一部分 是猜 的。 他 手 能够 capture 得到。

的 转向 是真的, 因为 你的 身体 是 假的, 但是 你 头 是真的, 他 通过 你的手 将 你的 身体 拍 你的 身体。

的 剩下 是 算 出来 的。

对对对, 我 有一个 疑问 是 V R 设备 oculus 是 怎么 知道 我的 手 在哪儿 的? 它是 V R 上 有一个 摄像头 能够 捕捉 我的 手势 吗?

对它 前面 有 deaths camera.

不是 dbs camera, 就是 普通 的 camera。 他 就是 跟 用 track 这个 手柄 用 的 是 同一个 键盘?

那 他 怎么 知道 你的 周边 的, 比如 他 要 帮你 在 这 设定 你 一个 boundary 的 时候, 他 其实 是 应该 是 有一个 depth 的。

它 有 一些 dep 功能 方法 是 通过 你 在 设定 的 时候, 你的 头 不是 固定 的, 就 你的 头会 左右 稍微 动一动, 它 就 靠 你 动 的这 一点点 来 判断 它。 另外 这 两个 相机 你 得 有 四个 相机, 大概 这 有 两个 相机 下面 还有 两个 相机 上面 下面 的 这个 相机 中间 有 那么 一点点 交叉 的 地方, 所以 交叉 那个地方 是 有 dep 的, 别的 地方 它的 up 都 得靠 猜。 也 不一定, 我 我 这个 我说 不好, 又 不是 专业 的。 但 他 应该 一个 是 它 这个 overlap 这部分 有, 另一个 是因为 你的 头戴式 显示器, 你 戴 的 时候 不是 完全 静止, 通过 这个 叉 去。

判断 实际 的 位置。 OK depth 是什么? 给 大家 翻译 一下。

就是 深度 最早 的 时候 做手 的 追踪 是要 靠 深度 摄像机 的。 因为 如果你 有 深度 摄像机, 你 如果我 看到 这儿 有一个 手 的 形状, 我 就可以 通过 深度 相机 所 带 的 深度, 就可以 知道 这个 手 在 三维空间 中的 经 切 位置。 它 这个 相机 是 不 带 深度 的。 所以 我 听说 他的 方法, 他 有 一次 oculus 发 过 一个 blog 去 讲 它是 怎么 做手势 识别 的。 因为 它 中间 不是 有一个 重叠 的 区域, 它 最 开始 校准 的 时候 会 让 你 把手 拿到 这个 面前, 这个 时候 你的手 很有可能 会 在 这个 重叠 区域 内。 他 每次 在 重叠 的 区域 内 看到 你的手 的 时候, 他 会 根据 这个 时候 的 深度 信息 以及 位置 信息 去 校准 你的手 实际 的 大。 然后 他 一旦 知道 你的手 实际 大小 之后, 即使 你的手 在 一个 没有 深度 的 信息 的 位置, 它 可以 根据 你的手 的 大小 去 判断 你的 手机 大概是 这样 一个 他 这个 技术 应该 是 业界 比较 领先 的, 可能 很少 有 别人 可以 做到 这个 技。 如果 没 记错 的话, 我 感觉 两三年 前 的 时候, 我 几乎 认识 的 每一个 在 oculus 工作 的 人都 在 做。

这 是一个 技术。

难点 的对, 就是 可能 有人 在 做, 怎么 把 它 做 的 很 准, 需要 在 电脑 上 插 两块、 三块、 四块 G P U 去 检测 那个 人的 手 准 不准。 有的人 可能 在 做, 别人 已经 有一个 很 准的 模型 了, 他 怎么能 把 它 压缩 到 可以在 显示器 上 运行, 这 是一个 很难 的 问题, 尤其是 你是 在 一个 移动 设备 上 运行。

这个 真的 很 对。 因为 记得 最早 的 V R 全都 还得 把 一些 周边 的 趋势 也 布置 起来, 得 在空中 很高 的 地方 得 set up 好, 然后 你 中间 才能 玩。 这块 儿 已经 是 被 现在 的 菜 给 解决 了。

但 其实 这个 也 不是 特别 好, 比如说 他 到 现在 大部分 都是 这样的, 就算 连用 深度 相机 的 很多 都 解决不了。 就是 它 你 两个 手 交叉 在一起 的 时候, 它是 没法用 的, 它 只要 一 交叉 就 立马 停。

它是 可以 看到 我 两个 手 分开 的, 但是 我 稍微 有 一点点 交叉 位置 的 时候, 它 就 不行了, 它 就会 乱掉。

关于 oculus 到底 是 如何 知道 我们的 眼睛 在 看 哪, 又是 如何 追踪 我们的 手势 的, 我们 连线 了 咱们 硅谷 101的老朋友 刘 冰焰, 深度 监测 也是 他 之前 在 oculus 的 一个 研 方向。 Hello, 冰 燕, 大家好, 你 现在 是 还没有 来得及 体验 workrooms, 对 吧?

我 还没有 体验 那个 东西。

对对对, 其实 我们 本来 是 想 把 冰 燕 拉过来 跟 我们一起 录制 这 期 节目 的, 但是 因为 跟 她的 工作 时间 相冲突 了, 所以 我们 就 先 录 了。 然后 这个 是 我们 补录 的 一段, 我们 刚刚 是在 讨论 在 一个 房间 里。 因为 我们 发现 我们在 这个 V R 设备 里面 是 能 看到 谁 在 看我的, 我的 眼神 又是 在 看 哪个 人。

其实 他 就 跟 zoom 的 那种 平面 的 会议 是 非常 不一样的。 因为我 感觉 平面 的 会议 好像 没有 指向性, 大家 都 在一起 开会 就 很 累。 因为 你不知道 他是 对 所有人 说 的, 还是 对 那么 一两个 人 说 的。 但是 在 workrooms 里面, 比如说 我 就可以 看着 答案 的 方向, 那么 他 就 知道 我 现在 的 这个 问题是 针对 他的, 我 甚至 都 不需要 出 他的 名字, 我 只用 看着 他, 给他 一个 眼神 就行。 他 那个 虚拟 的 人物 头像 是 可以 知道 我的眼睛 是 在哪里 的。 我 很 好奇 这个 设备 他是 猜 的 我们的 眼睛 在哪儿, 还是 他 真的 知道。

我 理解 你们 现在 应该 用 的 是 quest 一 或者。

quest 2的, 只能 用 quest 2。 因为 workrooms 只在 quest .

2上有 OK 合理。 因为 这个 应该 是一个 比较 费 资源 的 一个 新的 东西。 如果 是 这 样子 的话, quest 2上应该 是 没有 i tripping 的。 所以说 它 只能 是 通过 一些 别的 手段, 比如说 它 通过 你 投 的 方向, 最 基本 的 所有的 这个 从 quest 开始 就有 的, 根据 头 的 六度 的 自由度 的 本身 投 的 方向 来确定 的。 就是说 你 大概 在 看 的 应该 是 这 样子 的, 我 觉得 目前 应该 是 没有 办法, 因为 它是 新一代 的 奥 克拉斯, 现在 网上 已经 传 出来 了, 奥 克拉斯 pro 应该 是 会有 face tracking, 原因 是 它 应该 是 会有 一个 内向 的 摄像头。 但是 现在 这个 版本 的话 应该 是 没有 的。

也就是说 现在 我们 这个 设备 在 硬件 上 就 没有 眼睛 追踪 的 摄像头。 对 我们的 眼睛 是在 往 哪 看 的? 还是 根据 像 V R 之前 的, 你 刚刚 提到 的 六度 追踪 的 这样的 一个, 比如说 我们 头 的 转动 方向 来 猜测 的。

对他 应该 就是 靠头 的 方向。

对, 也可以 猜测 身体 的 转向。

对, 应该说 他 只能 有 头 的 方向 这 一个 条件, 因为 身体 的 方向 他 应该 也是 没有 办法 检测 的。 但是 在 这 样子 一个 workroom 里边, 相当于 他 把 这个 预设 的 每个 人的 位置 都 已经 放进去 了。 而 这个人 现在 朝 一个 方向 转 了 后, 这个 实际上 还是 比较 容易 检测 的, 也就 比较 容易 找到 说 他 现在 在 对 着 谁 这个 东西, 然后 进行 正常 的, 应该 也是 很 合适 的对。

因为 它 现在 它 那个 workrooms 它的 布置 也 还 挺 有意思 的。 它 有 那种 一个 方形 的 桌子, 然后 比如说 我的 桌子 这边 坐 两个人, 那边 坐 两个人, 就像 我们 会议室 的 那个 方形 桌子。 还有 是 那种 有 转角 的 桌子, 但是 它 也就是 六个 转角 这 样子 我 就 不知道 如果 有一个 老师在 前面, 就是 一个人 在 对 着 那个 白板 讲, 下面 坐 着 两排 学生 的 时候, 他 看 谁 还能不能 做到 精准 识别, 这个 可能 后续 可以 测试 一下。

每一个人 的 投资 方向。 这 实际上 是一个 非常 小的 数据量, 也 不存在 什么 数据 上 的 问题。 然后 检测 的话, 这个 是一个 非常简单 并且 独立 的 检测, 也 不存在 复杂性。 就是 人 多 对他 不会 造成 什么 复杂性, 唯一 的 可能 就是 渲染 的 时候, 也就是 同时 渲染 十个 人 多少 个人。 这个 问题 我 觉得 实际上 应该 也 不存在。 因为 这个 游戏 里边 渲染 好几百个 人, 应该说 都 已经 没有 什么 问题 了。 渲染 几个 人的 头 的 方向 应该 也 不存在 任何 问题。

对, 然后 我们 刚刚 还在 讨论 一个 问题, 我们 进 到 workrooms 里面 发现 我们在 说话的 时候, 物 是 有一个 虚拟 的 手势 的。 但是 这个 手势 是 我们 真实的 一个 手势。 也就是说 现在 的 oculus 能 识别 到 我们 自己的 手, 还能 识别 到 我们 做了 什么样 的 手势。 这个 他是 怎么 做到 的?

这个 其实 很 有意思, 这个 其实 是 我们 之前 做 的 相关 的 一部分。 对我 现在已经 离职 有 一年 了, 所以说 应该 有 没有什么不能 说 的。 实际上 看 tracking 这套 技术, facebook 它 实际上 在 它的 官网 facebook A I 的 这个 页面 上, 实际上 是 会有 专门 介绍 这个 东西 就是 怎么 实现 的。

分 两步, 一方面 他 找到了, 因为 人的 手 实际上 复杂度 并不是 特别 高, 或者说 他 至少 用于 V R 里边 的 呈现 的 角度 来说, 它的 自由度 并不是 特别 高。 因为 可以 想象 每一个 手 的话 就是 一只手 1 2 3 4 5 6 7 8 9 10 11 12 13 14 指头 上 的话 14个关节。 每个 关节 你可以 说 它 最多 不 超过 两个 自由度, 手 能够 动 的 部位 不是 那么 多。 也就是说 这个 模型 它 实际上 是 可以 有一个 非常 健全 的 一个 物理 模型 的。

在 有 这个 物理 模型 的 基础上, 他 做了 这样 一个 事情。 就是说 他 对手 上 的 一些 关键点 进行 检测。 这是 运用 一个 类似 于 典型 的 图像识别 技术。 就是说 我 找 的 这个 手上 的 一些 关键点, 这个 关键点 可能 不会 这么 直接 的 一一对应, 但是 你可以 一定程度 理解。 比如说 找 大拇指 指甲、 小拇指 指甲, 就是 每一个 指的 指甲, 然后 每一个 关节 的 位置 类似 于 这 样子 的 这些 位置。 即使 它是 一个 找到 一个二维 平面 上 这个 位置。 因为 人的 手 他的 两个 关节 之间 的 距离 的 关系, 比如说 在 一根 指头 上 的话, 他 两个 关节 之间 的 距离 实际上 是一个 比较 确定 的。 或者说 单纯 你 看到 他在 二维 空间 中, 他的 相当于 一张照片 里边 他 拍 到 的 距离 的 时候, 你 就可以 猜 到 这个 手 离 我说 的 距离 是 多少 了。

他 近 大远 小, 手指头 一个 简单 的, 咱们 就说 食指 上 的 关节 看起来 好 大好大, 那 说明 你 这个 食指 关节 离 头盔 非常 近 了。 如果 这个 食指 关节 看起来 很小, 那就是说 那 食指 关节 就 可能 离 得 比较 远 了。 所以说 单纯 从这一点 上 来说, 它 已经 可以 得到 一定 的 深度 信息 了。 更何况 它 还是 有 多个 摄像头 的, 这个 信息 可以 再进一步 综合。 根据 对 这些 关键点 的 检测 和 基本 的 一个 深度 信息 的 检测。

深度 信息 计算 都 已经 不需要 复杂 的 深度 检测 了。 它 就是 简单 的 深度 的 一些 计算, 就可以 有一个 比较 好的 3D的 建模。 然后 把 它 放在 那个 手 的 那个 物理 模型 上举 个 例子, 人的 手 这个 关节 和 另一 关节, 他们 俩 距离 不会 离 得 太, 因为 人手 毕竟 是 有骨头 在那 连着 的。 所以说 在 有 这个 物理 模型 的 前提 下, 他 就可以 把 这个 东西 做到 一个 非常 不错 的 一个 推测。 这个 手 目前 是一个 什么样 的 一个 姿态?

那 他 对 摄像机 会有 要求 吗? 它是 普通 的 镜头 还是 需要 深度 摄像机?

它 实际上 是一个 清晰度 非常低, 我 印象 中 应该 不 超过 1024 或者 1200 这个 级别 在 一个 方向 上。 并且 它是 黑白 相机, 别说 深度, 连 彩色 都 没有, 是一个 非常简单 的 一个 东西。

还是 黑白 相机。

因为 黑白 相机 它 在 暗光 下 的 表现 会好 一些, 所以说 它 不需要 太多 的 光照, 就可以 比较 好 做出 这个 事情。 如果 是 彩色 相机 的话, 相对 在 弱光 条件下 会 弱 一些。 另一方面 这些 所有的 检测 你 也 不需要 彩色 信息, 就可以 做到 一个 比较 好的 对 手指 和 每个 点。 因为你 你 现在 仔细 看一下 自己的 手 的话, 那些 关键 的 关节, 各方面 的 点 实际上 是 有一个 非常 清晰 的 特征 的。 所以 从 这些年 的 深度 学习, 或者说 最 基本 的 深度 学习 的 图像处理, 举 个 例子, 基本 的 图像 检测, 非常简单 的 detection, 这些 东西 都 已经 可以 做得 非常 好了。 所以说 检测 关节 的 这些 关键点, 由 它 来 计算 一定程度 的 简单 的 深度 信息, 把 它 整个 的 这些 放入 三 弟 的 手 的 这个 物理 模型 中, 最终 推测 出手 的 姿态, 大概是 这样 一个 过程。

因为 我们 之前 在 节目 中 还 讨论 了 V R 的 一些 新型 的 交互方式, 未来 手势 交互 可能 也会 是一个 趋势。 那你 觉得 以 他 现在 对 手势 的 识别, 如果 要 用 手势 来做 一些 交互 的话。

会有 难度 吗? 本身 奥 克拉斯 应该 已经 支持 了 很多 他 自己的 界面, 已经 支持 手势 操作 了。 如果 对 这个 有 兴趣 的话, 你可以 有一个 非常 推荐 的 一个游戏, 叫做 hana physic lab。 就是 在 奥克斯 里边, 它 实际上 就是 在 展示 S 里头 的 手 的 tracking 能够 做到 多好。 你可以 在 里边 玩 很多很多 复杂 的 操作。 比如说 用 手指头 去 画画, 互相 触摸, 做 各种各样 的 一些 动作, 他 都 可以 做 的 相当 不错 了。 他 很早 的 时候 就 开放 了手 的 A P I 手 这 一套 读取 的 信息, 这个 手 的 模型 用 它 来进行 编程。 比如说 用来 在 奥克斯 里边 编程 的 实现, 拿手 去 抓 一个 球, 各方面 的 这些 东西 都 已经 有 相当 不错 的 了。 我 觉得 整体 来说, 这个 东西 现在 最大 的 问题是 没有 反馈。

什么 叫 没有 反馈?

对举 个 例子, 我 用 手指头 随便 的 画 个 圈, 这个 时候 我 手指头 是 会 触摸 到 桌面 这个 平面 的。 于是 我 这个 圈 一定 是在 这个 平面 上, 这 是一个 很 容易 画 出 一个圈 的。 但是 你 要在 一个 虚拟 的 白板 上 画 一个 圈儿 很难。 我 认为 绝大多数 人 或者说 百分之百 的 人都 没有 办法 做到 画的 真正 是 一个圈。 它 肯定 是 一个三维 中的 一个 环, 因为你 没有 办法 维持 在 一个 平面 上。

我明白。 对, 因为 它 不是 在 一个 平面 上, 对不对? 你说 到 这个 非常 有意思, 就是 workrooms 里面 有 这样 一个 功能, 它是 可以 支持 在 白板 上 写字 的。 它 会 先 检测 我们 桌子 的 高度, 就是 我们在 进去 的 时候 会有 一个 设定。 扫 一下 桌子, 它 会 检测 我的 键盘 跟 桌子 的 平面, 而且 它 不是 用手 画圈 的。 虽然 它 可以 监测 手势, 但 它 还是 没有 用手 画圈。 他是 用 我们的 那个 oculus 的 游戏 手柄 把 它 倒过来, 直接 画 一个圈, 然后 在 上面 写字。

是的, 我 有 印象 这个 东西 的 实现, 它 实际上 一定程度 在 解决 这个 问题, 实际上 是我 非常 喜欢 的 一个 做法。 大家 可以 做 的 一件 事情 就是 比如说 你可以 把 自己 家里的 客厅 和 奥 class 里边 的 那个 客厅, 比如说 沙发 和 沙发 对应, 茶几 和 茶几 对应, 在 它 里边 做出来。 这 样子 以后, 你 就 可以在 你的 这个 虚拟空间 内, 走到 你的 沙发 边上 坐下 来, 把 你的 电脑 放在 茶几 上, 一切 都 像 真实世界 里边 的 触感 反馈 都一样。 因为你 确实 是 坐在 了 自己 家 真正 的 沙发 上, 把 东西 放在 茶几 上。 因为 它 有一个 非常 好的 拆解 追踪 的 这个 系统, 能 知道 具体 的 你的 位置 或者 你的 任何 一个 移动。 所以说 它它 总是 可以 比较 好的 追踪 这一点。 于是 在 房子 里 走 一圈 回到 自己 沙发, 他 还是 知道 你 现在 就在 沙发 边上, 你 坐下 的 时候, 你 就 稳稳 的 坐在 了 沙发 上。 这一点 上 我 觉得 是一个 非常 好的 体验。

也就是说 用 这样的 方式, 我 觉得 是一个 非常 好的 尝试。 比如说 刚才 说 的 这个 白板 这个 问题, 如果 没有 一个 让你在 空气 中 去 画 一个 白板 真的 很难。 但是 如果 你家 里面 真的 有一个 白板, 而 它 能够 检测 这个 白板, 并且 在 这个 白板 上 基于 它 检测 到 的 这个, 因为 检测 一个 平面 说实话 在 V R 里边 不是 特别 难 的 事情 了。 根据 他 检测 到 这个 平面 在 上面 做 的 所有 交互, 他 都 知道 这就是 在 平面 上 的 一个 交互。 然后 把 它 照样 的 放在 另外一个 平面 上, 这里 确实 可以 做 很多很多 有意思 的 事情。

如果你 刚刚 提到 他 现在 识别 手 已经 没有 那么 难 了, 他 为什么 还是会 选择 用 控制器 跟 手柄 来 写字, 而 不是 直接 用手 来 画 一圈 呢? 我们 已经 是在 一个 平面 上了, 而 不是 在 一个 3D的 空间 里。

OK 我可以 大概 说 一下 这个 到底 是一个 什么样 的 过程。 手柄 的 追踪 比 手 的 追踪 还是 要 精细 不止 一个 量级 的。 你 只需要 把 手柄 从 桌面上 抬 离 大概 一两 毫米 或者 一两 厘米, 它 就可以 非常 明确 的 检测 出 你 现在 笔 已经 离开了 纸 面对, 但是 手 他 可能 还 做不到。 因为 实际上 你 仔细 去 看。

因为 手上 没有 传感器。

对手 上 没有 传感器, 你 这个 手 离 纸面 的 这个 距离, 或者说 离 这个 桌面 的 距离, 到底 它是 在 接触 还是 没有 在 接触, 它是 很难 真正 检测 的 非常 清楚 的。 在 刚才 说 的 所有 这些 技术 里边, 它 对 这个 深度 的 计算, 或者说 对 这个 深度 具体 到 这样的 层面 的 计算, 他 应该 是 做不到 的。 他的 这个 精度 肯定 是 达不到 的。

你 觉得 手势 追踪 如果 他 做 的 比较 好 以后, 它 可以 有 什么样 的 应用 呢?

OK 是 这 样子 的, 我 觉得 这个 东西 可以 稍微 我 回去 再说 一点, 首先 这个 手势 目前 的 这个 问题 就是说 这种 这 一套 做法 的话, 实际上 有 几个 点。 比如说 你 如果 做手势 的 时候, 你 试 着 把手 做成 那个 所谓 的 宝塔 状。 就是说 你 用 比如说 拇指 对 拇指, 食指 对 食指, 就是 两只手 这样 对 起来。 当你 对 起来 的 时候, 它的 检测 会 出 很大 的 问题。

我们 发现 了 在 重叠 区域 的 时候 是 看不见 自己的 手 的, 是 吧? 只要 双手 重叠 就 看不见 了。

不管 是 双手 重叠 还是 双手, 甚至 是 有 一些 奇怪 的 接触, 比如说 左手 食指 去 摸 右手 的 中指 之类 的 一些 动作 的 时候, 他 都 会对 它 检测 造成 很大 影响。 因为 这时候 就 突然 发现 他 两个 点, 他 可能 只 检测 到 一个, 或者说 检测 到了 他们 俩 之间 出现了 冲突。 而 本身 这个 手 的 物理 模型 之间 会有 一些 冲突, 造成 它 没有 办法 比较 好的 计算。 它 很有可能 这 只 指头 就 直接 按照 这个 指头 完全 没有 弯曲 或者 怎么样 形式 渲染 了。 它 一般 是 这样 做 的, 目前 的这 套 检测 还是 有 很多 问题 的。

但是 从 另一个 角度 来说, 这个 东西 如果 真的 做 的 特别 好 的话, 能 做什么? 我 觉得 还在 探索 这个 事情。 因为 整体 上 大家 对 在 三维空间 中, 但是 却 没有 反馈 的 这样的 一个 操作 到底 能 做什么, 实际上 大家 也都 还没有 搞清楚, 毕竟 人手 是 最 方便 的, 大家 可以 做 的 很多很多 有意思 的 事情, 用手 都 可以。 甚至 比如说 大家 互相 击掌, 通过 音效 的 形式 进行 一些 反馈, 这 都 可能 是一个 非常 好的 体验。

本身 用手 可以 做 很多 复杂 的, 你 用 手柄 的话 不可能 完成 的 一些 动作, 就 非常简单 的 做 一个 翻花绳 的 游戏。 我也不知道 大家 全国各地 把 它 叫 什么, 但是 就是 用 绳子 在 手上 玩 的 那个游戏 对 吧? 这个 东西 你 在 V R 里边 做, 现在 应该 是 没有 问题 的 了。 但是 这个 东西 在 手柄 上 怎么 都是 做 不 出来 的, 这里 边 可以 进行 的 交互 确实 想象 空间 很大 了。 比如说 直接 拿起 一个 虚拟 的 枪 去 在 这个 游戏 里面 玩, 比如说 拿起 一个 虚拟 的 魔杖 开始 真正 的 挥舞, 这个 感觉 和 你 拿起 一个 手柄 可能 还是 不太 一样的。

对, 手势 也是 之前 我们 聊过 的 问题, 就是 它 没有 一个 力学 反馈。

对, 没有 力学 反馈。 然后 另一方面 就是 它的 追踪, 毕竟 精度 现在 可能 是一个 很难 完成 的 一个 很长 一段时间 都会 存在 的 一个 问题。 就是 它的 精度 相对于 手柄 控制器 的 这个 精度 来说 还会 差 很多很多。 这 也会 很长 一段时间 内 限制 它的 发展, 因为 毕竟 人手 没有 一个 固定 的 标记 点的。

好的, 非常 精彩。 谢谢 冰焰。

好的, 谢谢。

我们 继续 回到 我们的 体验 现场。

早上 我 跟 答案 在 这个 workroom 里面 做 设置 完 的 时候, 你 当时 不是 正好 给我 回 微信 吗? 我 就 正好 在 这个 会议室 里面, 我 竟然 在 没有 切换 的 情况下, 我 就 直接 用 我 桌面上 的 键盘 跟 微信, 直接 在 这个 会议 里面 打 给你 了。 我 觉得 这个 事情 很 神奇, 它 可以 让 我 戴 着 头盔, 同时 看到 我的 显示屏, 跟 同事 打字, 这个 体验 还 蛮 好的。 唯一 有 一点点 的 就是 它的 键盘 在 开始 的 时候 需要 稍微 摸 一下 才能 摸 得 准。 他 每次 会 让 我们 去 输入 入 那个 enter 键盘。

因为我 没有 苹果 的 键盘, 我 也没有 它 某 一款 特殊 的 逻辑 键盘, 所以 我 直接 开 了 通透 模式, 所以 你可以 看到 你的 键盘。

那个 感觉 还 可以。 那你 觉得 horizon workroom, 因为你 之前 也 用 virtual desk top 这 款 应用, 这两款 应用 之间 的 区别 是什么?

也没有 用了 很 长时间。

我只是 试用 过。 你 觉得 那个 怎么样?

我 感觉 华润 的 warm 还是 我 之前 说 的 那样, 它 更 适合 感觉 像 一个 办公 场景 里面, 每个 人都 有一个 屏幕, 你 需要 分享 屏幕 的 时候 你 把 它 投上去, 你 不需要 的 时候 一直 不 投。 所以 它 需要 更 侧重于 办公 这样的 一个 应用。 他 比 别人 他的 这个 眼光 要 更 长远 一点, 他在 试图 去 替代 未来 的 办公室 这样 一个 目标。 我 比如说 da soft 就是 一个 纯 的 分享 屏幕 的 软件, 比较 适合。 比如说 有 好几个 人 要 一起 打游戏 会 更 适合, 但是 他 也没有 手 去 追踪 的 功能。

我 觉得 在 这个 里面 要 一起 打游戏 太 困难 了。 因为 虽然 我可以 去 看到 我的 电脑屏幕, 但是 他 其实 没有我 想象 中 那么 清晰, 虽然 还是 能 看得 清楚 字 的。

它 和 visual soft 的 水平 是 一样的, visual 大招 也 只能 做到 这个 级别。

你 之前 说 你 会 在 V R 里面 写 程序, 你是 用 哪个 软件 去 写, 还是 你 自己 设计 的 一套?

Virtual 到 soft O K 我 感觉 viral dassler 不如 这个 会好 一点。 而且 我 当时 visual s top 时候 用 的 是 第一代 的 oculus quest, 那个 分辨率 确实 不够。 网上 有人说 基本上 来讲, oculus quest 一代 它 如果 显示 一个 屏幕, 几乎 占满 你 整个 视野 的话, 大概 相当于 一个 720P 的 屏幕。 现在 这个 相当于 一个 1080P 的 屏幕, 那 我 觉得 基本 就 可用。

但 我 玩游戏 的 时候, 我 觉 两者 的 区别 不太 明显。

电脑游戏 还是 V R 游戏。

V R 游戏 就 比如说 像 b caber 这些。

V R 游戏 没关系, 我 就 V R 游戏 之前 也有 厂商 这么说 过, 很多 时候 V R 游戏 更 重要 的 是 市场 角, 而 不是 分辨率 或者说 像素 密度。 应该说 像素 密度 和 市场 角 可能 市场 角 会 更 重要 一点。 因为 V R 的 这种 沉浸 体验 主要 体现 在 你 要 感觉到 你 周围 各个 位置 都有 东西 在 过来。 然后 你 要 能有 非常 好的 感知, 就是说 每个 地方 都有 东西, 它们 都 是什么 这样 一种 感觉。 所以 它的 市场 角 可能 更 重要 一点, 然后 他 分辨率 可能 没 那么 重要, 因为我 在 快速 的 移动, 它是 一个 需要 我 更 注意 运动, 而 不是 那么 注意 细节。 就是 游戏 是 这样 一个 情况。 但是 如果你 想 写 代码 或者 你 想 玩 一个 普通 的 平面 游戏, 那 平面 游戏 上 会有 很多 字 D R 你可以 把 这个 字 离 你 很 近, 它 就 变得 很大。 但是 平面 有 一些 那些 字 都 比较 小平面 里面 的 文档 字儿 都 比较 小, 所以 需要 一个 高分辨率。

这些 我们 三个人 都 是因为 horizon workroom 这 款 应用 来 买的 这个 V R 设备。 为什么 它 会 吸引 你们 再买 一个 设备 呢?

就是 想 纯粹 为了 试 这个 东西。 就像 我 最早 刚刚 讲 的, 它是 可以 把 虚拟 和 现实 结合起来, 完全 是 很 简单 了。 它 直接 把 你的 this tub 连接 到 虚拟世界 里面, 其实 是一个 很 简单 的 应用, 但是 它 带给 你的 体验 是 史无前例 的。

你 也 纯粹 想 体验 一下 而已。

对我 买 oculus s 2是完全 为了 这个 应用。 我是 觉得 比如说 尤其是 美国 现在 一个 状态, 大家 都想 回到 工作 的 状态, 但是 总会 有 疫情, 对 吧? 所以 我 觉得 像 oculus workroom 这样 一种 虚拟 的 工作 环境, 可能 是一个 挺好的 选择。 我 特别 想 就能 用 这个 和 我的 实习生 开会。 我 感觉 它 这个 workroom 特别 需要 一个 可以 分享 3弟的 东西 的 功能。 因为我 觉得 这 可能 是 它的 一个 hiller, 因为你 在 现实生活 中 你 没法 去 分享 一个 虚拟 的 3D的 物体, 但是 你 在 workroom 里 就可以。 所以 我 觉得 他们 应该做 一些 这种 类似 分享 3D物体 的 这样 一个 功能。 但是 就算 我不能 分享 3D的 物体, 我 跟 别人 交流 的话, 我 觉得 在 这样 一个 面对面 的 环境 里, 可能 也是 一个 更好 的 体验。

我 发现 在 zoom 上 进行 交流, 还是 能够 非常明显 的 感知 到 跟 现实 的 一些 区别 的。 比如说 有些 时候 你 可能 会 发现 大家 他 没有 在 注意 你 在 聊 的 这个 事情。 因为 可能 在 zoom 里 它 只是 个 小 窗口, 他 给你的 注意力 和 你 面对面 是 完全 不一样的。 可能 是 这 一个 本来 半个 小时 的 会 就要 开 1个小时, 然后 开 的 越长 大家 就 越 不 注意, 然后 这个 效率 越来越低, 尤其是 人 一 多 就是 这个 样。 我不知道 workroom 里 能不能 缓解 这个 情况。

首先 这个 房间 真的 是 很漂亮, 有 很大 的 窗户, 然后 有 天窗, 外面 是 有 湖, 有 树、 有 山, 还有 远远 的 一些 小房子, 还有 袅袅 的 青烟, 反正 真的 是 蛮 漂亮 的, 挺 赏心悦目 的。 在 这 里面 开会。

这个 屋 是不是 没有 门?

是的, 这个 屋 是 没有 门 的。 你 刚刚 提到 了, 如果 能把 3D的 物品 带到 这个 会议 中 来会 更 有意思。 你 有没有 跟 实习生 开会 的 时候, 有 哪些 实际 的 场景 跟 情况, 想 让 你 把 3D的 东西 带进来。 你可以 举 一个 具体 的 你 想要 实现 的 例子。

比如说 我们 有一个 项目, 可能 是 如果你 能够 扫描 一个 屋里 的 3D状态, 拿 这个 3D状态 去做 一些 事情。 我们 数据集 里 有 一些 3D的 图像, 我们 现在 的 方法 把 它 在 电脑屏幕 上 显示 出来。 然后 你可以 在 电脑屏幕 用 鼠标 去 拖动 它, 去 旋转 它, 去 移动 它 之类 的。 但是 如果你 已经 在 这个 V R 里 了, 那 其实 你 把 3D扫描 出来 的 这个 模型, 你 直接 放在 手上, 你 就可以 很 明白 的 看出来, 你 都 不需要。 有些 时候 你 在 二 上 显示 3D就会, 你 必须 得 反复 的 拖动, 你 才能 感觉到 这个 3D的 效果。 你 如果 在 3D里 显示 3D我 只要 看 一眼, 我 就可以 知道 这个 地方 有问题, 那个地方 有问题, 我们 需要 怎么 改, 我们 还 可以 互相 指, 你 在 2D分享 的 时候 就 很 困难。

这个 如果 从技术上 要 实现 的话, 他 还需要 什么 呢?

没什么 技术难度 的。 比如说 现在 它 只 支持 图片, 对 吧? 它 可能 需要 支持 一种 新的 格式, 这 可能 是个 问题。 我也 不能 百分之百 确定, 因为 好像 现在没有 一个 行业标准。 我 跟 你说 我要 分享 图像, 那 基本上 只有 两种 可能。 我 要么 给你 分享 一个 j pack, 要么 我给你 分享 一个 P N G 格式。 但是 你说 我给你 分享 一个 3D的 东西, 我应该 用 什么 格式 呢? 苹果 特别 喜欢 U S D Z, 但是 并不是 所有的 公司 都 支持 这个。 其实 到 目前为止 没有 一个 像 j pack 这样的 标准, 就是 所有人 都在 用, 所有人 都 然后 它 还 比较 OK, 大家 都 认为 它的 显示 效果 还 可以, 这样的 一个 东西 是 不太 存在 的。

你说的 这个 问题 还有 一个点 是 我们 这个 2D的。 像 戴恩 刚刚 分享 了 一张 图片, 投 到了 我们 公共 的 屏幕 上。 这 张 图片 它 是从 他的 电脑系统 里面 直接 投上去 的。 我不知道 你的 模型 是 虚拟 的 还是 现实 的, 就是 有 那种 在 电脑 里面 的 3D模型, 你可以 直接 把 它 拿上来。 还有 一种 3D模型, 就是 一个 实实在在 的 建筑 的 3D模型 或者 怎么样, 我可以 拿在手上, 它 是不是 摄像机 照着 就可以 看到。

你说的 是 哪 一种 呢? 我说 的 就是 像 这种 插入 3D指的 是 插入 外部 的 3D文件。 就 有点像 现在 它 已经 支持 了 插入 图片 这样 插入, 我 觉得 这种 是 完全 可行 的。

你说的 插入 3D就是 插入 电脑 里面 的 3D文件, 而 不是说 我们 现实生活 中的 物品。

这个 August quest 是 做不到 扫描 现实生活 中 物体 的, 就是 应该 是 别的 设备 去 扫描 了, 然后 再 放着。 当然 如果 未来 有 真的 A R 的 headset, 比如说 未来 google 或者 facebook, 或者 apple 要 出的 这种 air asset, 那 我 一定 相信 他们 肯定 是 可以 做 这件 事情 的。 现在 很多人都 可以 用 iphone 去 扫描 一个 物体 的 三 弟 建模。 如果 未来 有 真的 A R 还在, 然后 它 稍微 贵 一点, 它 可以 加 一些 彩色 相机 的话, 我 觉得 作为 一个 三 弟 建模 应该 是 很 可能 可以 的这 也 挺 有意思。 你 怎么能 把 你 现实生活 中的 一个 物体 把 它 放到 A R 里面。

对, 如果 这个 可以 做到 的话, 相当于 我们 隔 空 3D用 那种 全息 影像 投影 去 参加 一个 婚礼, 或者 参加 一个 什么, 也会 变得 简单 很多。

对对对, 这样 就可以 有 一些 更加 不同 的 场景。 现在 我们 只有 一个 办公室, 可以 有一个 就像 你说的 婚礼 一样 场景。

觉得 真的 像是 钢铁侠 里 javis 那种感觉 了, 可以 把 它 拉大 缩小, 是 另外 一种 交互 的 体验 了。 但 我 现在 snapshot 新 出的 那个 应该 是 第四代 spiracle, 它 应该 是 有 depth camera 的。 所以 未来 这样的 A R 眼镜 也 会越来越 越多。

对, 而且 我看见 就有 一场 婚礼 中用 全息 影像 做了 一个 投影。 如果 它 未来 可以 跟 V R 设备 相结合 的话, 也是 可以 想象 的 一个 方向。

这方面 应该 也是 一直 有人 在 做, 他 更多 的 是 把 你的 就有 很多 camera, 然后 把 你 全部 都 先 在 虚拟世界 里面 成 个 像。 帮你 做 更加 真实的 阿弗 塔尔, 不是 像 我们 自己 随便 捏 的 这种, 或者 是 运用 在 做 电影 里面。 这样的 技术 其实 已经 有, 只不过 是 没有 办法 能够 那么 快, 那么 低成本 的 运用 在 我们 日常 的 生活, 像 这样的 开会 里面。

我看 之前 扎克伯格 他 自己 在 演示 workrooms 的 时候 是 掉线 了, 中断 了 好 几次。 比如说 现在 会 是 一些 什么样 的 技术 原因, 可能 会 让 这个 软件 的 运行 还 不稳定?

我们 自己 好像 早上 也 掉线 了 几次, 是 为什么 来着? 你 退出 了, 然后 就 逼 着 我 退出 了 还是 怎么样? 可能 类似 这 样子。

的 印象 中 我 早上 没有 掉线 的 经历, 难道 是因为 我 退出 了?

有可能 我 感觉 软件 稳定性 应该 主要 取决于 他们 想 多 快 发布, 就是 没有 什么 必须 的 原因, 它 软件 一定 不稳定, 它 可能 发布 的 比较 快。 这个 软件 不稳定 我 也可以 理解 对 吧? 如果我 是 飞速, 我 肯定 也 想 发布 的 特别 快。 因为 晚 了 之后 大家 都 回 办公室 里面 了, 就 没有人 用 他 这个 程序 了。

对, 他们 一向 就是 叫 什么 move fast, 他们的 企业文化。 对, 先 做 再说。 所以 你 觉得 现在 我们在 这个 V R 里面 开会, 它的 软件 不稳定 已经 不是 一个 技术 问题 了, 而 只是 一个 软件 还没有 做 的 很 成熟 的 问题。

其实 现在 是 有的 应用 做 的 太好了, 比如说 zoom 他 特别 聪明。 我不知道 有没有 注意 过, zoom 说话的 人 会 比 别人 更 清楚, 说话的 人 他的 音频 带宽 会 更高。 当 网络 差 的 时候, zoom 会 非常 聪明 的 把 不重要 的 包 丢掉。 他 可能 知道 就是 一个人 说话 哪 部分 频谱 比较 关键, 就是 没了 他们 你 听不懂 别人 说话 了当 他 网络带宽 不够, 他 会 优先 丢掉 那些 不重要 的 频谱。 所以 你 会 听到 一个人 网络带宽 不够 的 时候, 他的 声音 会 很 扭曲。 但是 他 还是会 试图 尽量 保证 在 他 声音 扭曲 的 情况下, 你 还 能听懂 他在 说什。

觉得 带宽 越 低 它 越 扭曲。 你 其实 一个 比较简单 的 比较 傻 的 算法, 你 实现 出来 肯定 变成 你 要么 听得见, 要么 听不见, 那就 很差 了。 它 就能 做到 带宽 越 低, 它 就 越 不清楚, 越 扭曲, 这就 已经 很 不容易 的。

像是 菲斯 泰 我不知道, 因为 可能 我在 国内 经常 会 跟 我 老公 打电话。 有的 时候 其实 他 会有 几个 level。 一开始 如果 是 带宽 不行了, 他 就 先 把 自己的 视频 就 关掉, 或者 是 先 把 视频 先 变 模糊 一点, 不行 再 把 视频 关掉。 不行 这个 再 怎么样, 他 其实 有 几个 level 的 让 你的 体验, 反正 最后 还是 要 能够 听到 对方, 这是 他的 核心 的 这个 目的。

对, club house 也有 这个 功能, 他们 之前 用了 声 网 的 技术, agora 他们 在 实时 的 传输 这 一块, 就 你 刚刚 说 的 也是 做 的 比较 好。

我 就能 明显 感觉到 zoom 比 face time 做得好。 每次 我 face time 感觉 带宽 不 太行, 特别 模糊 的 时候, 我 用 zoom 就可以 听起来 更 清楚, 视频 起来 更 流畅 这样 而且 不知道为什么 face time 在 我的 手机 上 特别 卡, 但是 zoom 就 还好。

你们 觉得 horizon workroom 如果 跟 zoom 来 相比, 它的 竞争力 会 怎么样?

我 觉得 如果 大家 都有 黑色 的话, 我 觉得 这样的 一个 体验 还是 蛮 不错 的这 取决于 硬件。 对, 但是 他 现在 的 入门 的 门槛 是 稍微 有点 高了。 你 首先 得 每个 人都 有一个 have set, 然后 你 还得 设 半天 入门 的 门槛, 会 阻止 了 很多人。 如果你 不是 很 紧密 的 自己的 公司 团队 的话, 你 在 外面 邀请 开会 的 嘉宾, 然后 开会 的 客户 的话, 我 觉得 是 还得 再 过 个 三五年, 我 觉得 才能 普及 开来。

他 可能 规模化 应用 的 一个 场景 会 比较高。 但是 比如说 像 jacky 这样 用了 以后 马上 就 想 跟 自己的 实习生, 以后 都在 horizon workroom 里面。 它 其实 是 帮你 转化 了 一个 用户。

他们 也有 设备。 对他 没 设备 肯定 搞 不了。 但是 如果 你看 像 我, 我 刚刚 买 了 不到 一周, 然后 我们 这 不就 玩起来, 你们 也 才 买 了 没多久, 但是 我 觉得 你们 还是会 想要 继续 这个 环境 里面 开会 的。

我 还 看见 朋友圈 有人 发 个 视频, 他 这个 留学 中介 还是 啥 的, 然后 他在 介绍 签证 的 新的 政策, 他 这个 视频 居然 是用 活儿 在 workroom 做 的, 我 感觉 非常 surprise。 有人说 他在 好像 在 workroom 里 把 自己的 屏幕 投 到了 后面, 然后 他 就 开始 对 着 那个 屏幕 讲, 我 觉得 还 挺 有意思 的。 他们说 他 是不是 有点像 直播, 有人 会有 一个 虚拟 的 搭配。

他 挺 聪明 的。

捏 了 一个 自己的 虚拟 的 形象, 你 做 个 视频, 做 个 动画 还得 花 好多钱。 这个 直接 录 出来 就 好了。

拿 我 来说, 因为 我们 不是 做 音频, 就是 会有 很多人 找 过来 说 你们 要不要 做 视频。 但 我自己 有一个 很大 的 需求, 就是我 其实 是 不想 露脸 的。 我 就 觉得 每次 要 化妆, 我 还要 去 布置 现场 的 灯光, 我 还要 去 布置 一个 会场, 这 对我来说 是一个 非常 麻烦 的 事情。 今天 我们在 录 这 期 音频 节目 的 时候, 我 就在 想要 不要 把 它 直接 录成 一个 视频。 我 就 发现 这个 房间 就是 一个 很 完美的 场景。 我 现在 应该 是 可以 走动 的, 我可以 直接 站在 白板 前面 去 录 模板 黑板, 我 只需要 投 一个 背景 的 画 上去, 哪怕 我 就 投 一个 纳斯达克 的 实时 滚动 屏 上去, 就可以 成为 一个 非常 专业 的 类似 于 财经 播报 的 视频 场景。

这 其实 挺 有意思, 就是 能不能 以后 在 V R 里面 拍 一个 视频, 我不知道 自媒体 是不是 合适 的 词, 就是 比如说 你 B 站上 看到 大部分 视频, 应该 有 一部分 是 可以 完全 在 虚拟世界 里 拍 的。 比如说 如果你 拍 一个 小短剧, 像 朱 一旦 那种 短剧, 你是 完全 可以 全都 在 V R 里 拍 的。

人都 不用 露脸, 就 直接 是一个 卡通 形象。 我们 捏 一个 比较 符合 主题 的 卡通 形象 就可以 了。

对他 这个 剧本 是 他 主要 想 展现 的 点。 你 在 V R 里 演戏, 可能 在 现实 世界 中 演戏 还要 简单, 就像 你说的 不用 拍 灯光, 不用 化妆, 省 很多 时间。

说到 这个, 最近 元 宇宙 的 概念 也很 火, 我 很 好奇 你 怎么 理解 元 宇宙?

我 不太懂, 其实 没有 太 关注 这。

好 实诚 的 回答。

感觉 这 是一个 概念 上 的 东西。

这 是一个 概念。

它 不太 影响 实际 的 技术, 所以 我 也没有 太 关注 这件 事。

因为我 是 好久 没有 在 玩 过 V R 你们 两位 可能 还是 有 这个 oculus one 对 吧? 我是 一下 就 从 很 原始 的, 可能 当时 还是 H T C vive 这些 一下 跨 到了 oculus to, 我 就 自己 觉得 还是 蛮 惊讶 的。 然后 现在 技术 已经 挺 成熟 了, 然后 包括 游戏 整个 体验 我 都 觉得 非常 的 让 我 惊讶。

我 年初 的 时候 是 录过 几期 关于 元 宇宙 的, 当时 其实 完全 就 觉得 元 宇宙 就是 一个 box word, 从 robo x 开始, 然后 大家 又 创造出 这样的 词 过来 吸引 一波 股民 的 钱, 是 这 样子 的 一种 感觉。 但是 自从 我 用了 oculus quest 2之后, 我 就 觉得 泰克 已经 是从 上 一个 时代 的 节点, 像是 什么 1516年, 然后 跨越 到 现在。 我 觉得 底层 其实 还是 有 很多 真正 的 做 产品 的, 真正 的 在 做 技术 的 人, 不断 在 配 这个 role。 元 宇宙 我们 做 商业 的 或者 是 我们 要 管理 市值 的, 我们 把 它 讲 成 一个故事, 让 更 多人 了解。 有一个 好的 概念, 让 大家 知道 有 什么样 的 东西 来 了解, 其实 是 并行 的。 如果你 光光 只是 看到 元 宇宙 这个 词, 你 确实 是 觉得 大家 又是 在 花里胡哨 的 来 给 我们 创造 新的 词汇。

很多 时候 你 一个 东西 火, 你 得 带 这个 概念。 之前 V R 已经 用过 一波 这个 概念, 但 当时 的 V R 不太 成熟。 现在 如果你 想说 V R 在 火, 可能 大家 不能 接受。 你 只要 说 可能 换 一个 词 说 元 宇宙 要 火。

可能 大家 不 jacky, 我们 上次 聊 之后, 你 有 玩 哪些 新的 游戏, 或者 有 哪些 新的 思考 吗? 我们 上次 主要 聊 的 是 V R 的 交互, 包括 解决 中间 的 眩晕 问题。 因为 几个 月也 过去了, 现在 V R 的 概念 其实 比 我们 上次 聊 的 那个 时候 还要 火。 上次 其实 是 没有 一个 特别的 切入点 的, 只是 说 我们 来 系统性 的 聊 一下 威尔。 但 最近 又 发生 了 很多 事情, 我不知道 你 有 哪些 新的 体验 跟 新的 思考。

也 说不好 有什么 新的 体验。 如果 只是 生活 中 的话, 我 最近 在 玩 一个 叫 thread 的 游戏, 它是 一个 跑酷 类型 的 游戏, 挺 有意思, 很少 有 这 可能 有的人 来讲 他 会 比较 晕, 我 感觉 我 还行, 因为 就像 我 上次 跟 你说 那样, 感觉 眩晕 是 可以 锻炼 出来 的。

这个 我也 听到 别的 朋友 讲 过, 就是你 可能 这一次 玩 很 晕, 下一次 玩 就 少 晕 一点, 再 下次 玩 就 好了。

我 感觉 大概 那么 七八次 就 特别 晕。

那么 七八次 晕 的 就 习惯了。

那 游戏 还 挺好玩, 因为 它 和 b server 截然不同, 它是 一个 你 需要 到处跑 的 游戏。 然后 它 跟 b ver 也 比较 像, 就是你 会 感觉 自己 很酷。 但是 如果 有个人 在 旁边 看着你, 可能 觉得 你 很傻, 在那 原地 跳跳跳, 反正 还 挺好玩。 然后 他 也有 一些 小技巧, 就像 我 上次 说 的 一样, 他 那个游戏 大部分 情况 下都 是 让 你 一个 恒定 的 速度 在 往 某个 方向 走 的。 这样 你 相对 来讲 会 不 那么 均匀 一点。 就算 你 在 跳, 它 也是 猛 的 让 你的 速度 起来 或者 猛地 停止。 它 不会 说 像 现实生活 中 还有 个 加速度 这样的 感觉, 因为 加速度 会 让人 自重 不明, 如果你 保持 一个 恒定 速度 向前走 的话, 反而 会 没 那么 远。 他 做了 一些 这样的 调整, 但是 他 最后的 结果 是一个 调整 意思。

一个游戏 那个游戏 需要 多大 的 空间?

不太 需要 空间, 因为 你是 原地 在 跳 的, 所以 可能 2米乘2米 大概 这样 就可以。 但 你 可能 比如说 他在 虚拟世界 中 是 向前 跳 的。 虽然 你是 本地 跳, 你 可能 一不留神 会 往前 跳 一点。 所以 大 一点 可能 会 更 安全 一点。

除此之外 我 现在 是在 想 一些 就是 怎么能 做 更好 的 手 的 追踪 的 这样 一个 问题, 但 具体 解决方案 还没有 特别 做好。 这个 纯 光学 的 还是 有 很多 问题 的, 比如说 交叉 在一起 就 不能用 了。 然后 现在 我 家里 很亮, 如果 家里 再 暗 一点 或者 我在 户外, 它是 没法 做手势 的。

就 用 更 亮。 对, 更 两个人 都 不行。

所以 它是 有一个 光线 要求 的对。

而且 比如说 如果 手里 拿 个 东西 它 也 不用, 比如说 我 现在 手里 拿 个 鼠标。

它 就 看不见 我的 手。 但是 如果你 要 去 深度 追踪 手, 你是 想要 解决 什么 问题 呢?

解决问题 就是 A R 里面 需要 更加 准确 的 手 的 追踪。

方式 可以 做什么?

A R 的 一切 基于 你 有 很 好的 手部 追踪, 从而 成为 我 认为 手 和 你 说话 是 两个 最 重要 的 交互方式。 我 跟 你 说话 我 就 主要 靠手 和 书, 我会 用 我的 手 去 指 一些 东西, 我 用 我的 手 去 拿 一些 东西, 我的 手 去 给你 演示 这个 东西 是 这么 用 的。 所以 手 是 非常重要 的 一部分, 另 一部分 就是 嘴。 你 要 说出 这个 很 复杂 的 表述 方式, 怎么能 让 计算机 去 理解 你的 这个 表述 方式, 说 其实 是一个 很 magical 的 事情。 因为你 在 交互 界面 上 点点点, 你 点 很多 下 儿 可能 都 不如 你说 一句话。 所以 这也是 为什么 很多 比较 专业 的 写 代码 的 工具, 现在 都 会有 一个。

比如说 一是 过去 大家 很喜欢 使用 命令行, 现在 一些 新的 图形界面 的 程序, 我 个人 认为 图形界面 程序 是 有 在 输出 信息 上 是 有 天生 的 优势 的。 因为你 不光 可以 一行 一行 输入 数据, 你可以 横 着 输出, 你可以 竖 着 输出, 你可以 表现 物体 之间 的 关系。 它 输出 给 你是 很 方便 的, 但是 它 接受 你的 输入 会 更 麻烦 一点。 因为你 只能 通过 点的 方式。 所以 新的 一些 写 代码 程序, 包括 一些 甚至 写 代码 之外 的 同学, 都在 试图 加入 你可以 输入 一些 命令 的 方式。 比如说 V S code、 sub m text、 jack Green, 所有 I D, 他们 都 有一个 快捷键, 可以 换出 一个 可以 让 你 输 命令 的 这样 一个 box, 包括 word。 如果 在 windows 上 右上角 有一个 小 框 mac 的话, 它 就是 应该 在 help 的。 就是 在 帮助 菜单 里面 有一个 搜索框, 你可以 搜索 一些 命令。

从 模式 上 体现 了 语言 的 好处。 因为 语言 你 只要 把 你 想说 的 功能 说 出来, 它 就可以 找到 这个 相对 应 的 功能。 而 不是你 需要 在 一个 很 复杂 的 文件夹 里 去 找。 我们 V R 里面 这个 概念 应该 会 更加 发扬, 毕竟 你 没有 一个 键盘, 你 主要 跟 计算机 交互 的 方式 就是 靠手 加 纸。 你 可能 会 想说, 我要 复制 这个 东西, 我说 我想 把 这个 东西 粘贴 在 这 一块, 我想 给他 发 email。 像 这种 问题, 我 觉得 如果 有 很 好的 手势 识别, 有 很 好的 语音识别, 那么 就会 有一个 跟 之前 完全不同, 非常 好用 的 这样 一个 交互 方案。

就是 V R 里面 的 手势 识别。

A R A R V R 和 整个 对。

因为 大家 A R V R 主要 想 解决 的 就是 一个 交互。 其实 刚刚 在 workroom 里 教 我的 这种 交互, 就 比如说 是 我们 现在 其实 你 要 换 到 不同 的 这些 type 上面, 你 都是 需要 手 来 跟着 做手势 的。 它 其实 并不是 特别 的准, 然后 包括 我 到 现在 还没有 特别的 掌握 好。 除了 是 确定 这个 键, 然后 我 食指 和 拇指 捏 一下 之外, 左 滑、 右 滑、 上 滑、 下滑 我 整天 搞 不准。 但 没有 很 好的 能够 来 识别。 如果我们 要 谈论到 A 2的话, 那 这个 就 更 困难 了。 然后 你 又是 在 室外 光线, 然后 更难 识别 你的 手势, 然后 你到底 手 在哪儿?

原来 其实 有 很多 这种 硬件 的 厂商, 它 为了 解决 交互 的 问题, 给你 同时 搭配 一个戒指。 然后 戒指 有 上下 的 按钮, 或者 给你 一个 手环。 你可以 通过 按 手环 上 的 一些 什么 按钮 来 形成 这样的 一个 交互。 基本上 纯 手势 交互 的话, 现在 大家 好像 还没有 特别 好的 一个 解决方案。

如果你 能 解决 的 很好 的话, 你 甚至 可以 你 用 V R 你 都 不需要 控制器。 你可以 B D C 给你 发 两个 小玩意儿, 甚至 可以 3D打印 的。 它是 两个 棒, bat ver 里头 这个 把儿 更 合适。

你 如果 玩 一个 别的 游戏, 你 比如说 玩 个 枪 的 游戏, 它 可以 给你 一个 枪 的 控制。 然后 你 就可以 拿着 一个 像 真枪 一样的 东西, 上面 有 很多 按键, 你 就可以 直接去 按 了。 手势 识别 如果 做 的 好 的话, 可以 替代 很多 别的 东西。

虽然 现在 这个 控制器 上 也 没 几个 键, 但 我 觉得 很多 玩 V R 游戏 的 人, 可能 之前 也是 玩 主机 游戏 的。 但是 对我来说, 我是 之前 完全 不 玩 主机 游戏 的, 得 适应 一段时间。 对对对。

我也是 对 那个 剑 非常 的 迷惑。

我是 觉得 如果 有了 新的 交互方式, 对 以前 不 玩 这种 主机 游戏 的 人, 他 其实 完全 是 可以 做到 更 简单 的。

让 00后拿 一个 什么 比较 过去 的 电脑, 然后 00后猛击 那个 屏幕。

就 跟 现在 小朋友 他 看到 屏幕 的 时候 都想 按。

是的, jacky, 你 之前 在 我的 节目 中说 过, 你 觉得 A R 比 V R 至少 它的 研发 上 落后 了 5到10年。 为什么 会 这么说 呢?

其实 主要是 光学 上 我 觉得 比较 难, 多方面。 一方面 是 它的 显示屏 会 难 一点, 现在 这个 级别 的 V R 显示屏 已经 很多 应用 都 可以 开始 用了。 但是 A R 的话 你 又 需要 能 透过 现实 世界, 又 得 能 显示 虚拟 的 内容, 它 就会 比较 难, 它的 体验 也 比较 难 做 的 好。 大家 脑子里 想 的 A R 是 那种 就是 你可以 放 一个 物体, 你 都 分辨 不 出来 这个 虚拟 物体 和 真实 物体 有什么 区别。 那种 A R 就 非常 难。 因为 这个 时候 你 不光 需要 显示 物体, 你 还需要 把 现实 世界 中的 东西 挡掉, 这个 遮挡 就是 一个 更 困难 的 问题。 到 目前为止 都 没有 一个 很 成熟 的 技术方案 可以 遮挡 现实 世界 中的 物体。

另一方面 是你 需要 手势 的 精度 需要 比 现在 高 很多。 我不知道 你 现在 可以 看到 这个 oculus quest, 它 现在 的 这个 手势 追踪 虽然 在 V R 里 还算 可以 用, 但 比如说 如果你 打开 这个 通透 模式, 你可以 看到 现实 世界 中 的话, 你 会 看到 这个 延迟 至少 有 那么 一两 毫秒。 你 能 明显 看到 你 这里 看到 的 图像 和 你的 虚拟世界 中手, 它是 有一个 差距 的。

那 应该 不止 一两 毫秒。

如果说 是 A R 的话, 那么 这样 一个 差距 将 很 明显 的 可以 被 人 感知 到, 那 就是 一个 很大 的 问题 了。

A R 就是 现实 世界 跟 虚拟世界, 它是 在 同一个 世界 里。

它 首先 显示 要求 非常 高, 同时 它 对 所有的 东西 的 档次 都要 提升 一个 级别。 它是 物理 世界 追踪 的 快, 追踪 你的手 追踪 的 快, 然后 你 还 不能 手里 握 一个 控制器。 现在 只有 少数 的 APP 可以 不用 控制器 用。 但是 你 如果 想 用 air 的话, 那 所有的 APP 都 不能用 控制器。 因为你 拿着 控制器 你 就 不能 和 现实 世界 交互。

它 就 不 这样。 所以 必须 有一个 新的 交互方式, 既 不能 是 按 屏幕。

对他 就是 需要 很多 技术 问题 需要解决, 所以 他 晚 几年 也是 正常。

我 还 蛮 期待 说 苹果 会 发 的 那个 A R 设备 的。

可能 现在 大家 的 体验 还 不多, 分享 出来 的 不是 facebook 跟 ribon 发 的 那款 A R 眼镜, 还 不知道 怎么样。

那个 也 只有 摄像头, 它 不是 一个 真的 A R 设备。

我 之前 在 google I O 的 时候 用过 google 的 A R 地图。

google 已经 推送 了。 你说的 是 走路 可以 A R 地图。

对, 走路 可以 A R 导航 几乎。

所有 地方 都 可以 用了。 现在 苹果 的 那个 也有 了。

它 就是 对 很多 路痴 来说, 分不清楚 二维 导航 中的 左 跟 右、 南 跟 北 是 哪里。 它 其实 是 可以在 现实 世界 中 直接 告诉你 这边 的 地点 是 哪里, 那边 的 地点 是 哪里。 但是 这个 应用 有一个 很大 的 问题, 因为我 出去 参加 活动, 我是 一般 都会 把 手机 电量 充满 的。 然后 我 用 完 这个 设备 以后, 大概 就 用了 几分钟, 我的 手机 电量 马上 就 红了, 然后 手机 就 开始 发烫。 电池 也是 一个 问题。

刚才 我说 的 5到10年 指的 是 A R 眼镜。 5到10年 当然 就是你 手机 上 有 一些 小 范围 的 A R 应用, 它 当然 是 可以 更 早 的 了。 但是 你说 有的 就是 总体上 来讲, A R 对 设备 的 要求 都 很难。

还有 电池 的 要求, 它 会对 电池 的 要求 更高 吗?

对, 因为 它 对 处理 的 要求 高, 它 对 显示的 要求 高, 那就 必然 它 对 它的 能耗 会 很高, 所以 对 延迟 要求 也会 高。 说到 这里, 我的 头戴式 显示器 只有 6% 的 电。

好的, 我要 看一下 我的 设备 还有 多少 的 电量, 在哪里 看 电量?

就在 你看 你的 horizon workroom 里面 中间 有 六个 icon 然后 再 往右边 就是 电量。

我 还有 27%.

你 怎么 看到 是 百分之 多少? 我 只能 看到 它 剩 了 一点点。

你 把 手指 出来, 然后 它 会 显示 一个 小线, 然后 那个 线 如果 对准 电池 的话, 它 就会 显示 电量 百分比。

我 还有 23%.

我是 用 之前 是 充满 的, 所以 我们 开 了 一场 一个半 小时 的 会。 然后 我们 现在 的 电量 我是 剩 了 27%点 N 是 剩 了 23%, jacky 是 剩 了 6%。

我 可能 本来 不是 买的。

所以 我 只剩 6%。 OK. 好, 谢谢 大家 收听 我们 这 期 的 节目, 也 算是 我们的 一个 新 尝试, 这就是 我们 今天 的 节目。 如果 大家 喜欢 我们的 节目, 欢迎 给 我们 写 评论 或者 写 留言。 感谢 大家 的 收听。 谢谢 两位。

谢谢 红军。