We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode S5E23|马斯克要造人型机器人,是炒作还是真有黑科技?

S5E23|马斯克要造人型机器人,是炒作还是真有黑科技?

2021/9/1
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
丁教
任化龙
Topics
丁教:特斯拉AI日发布的Tesla Bot机器人概念引发争议,其真实性和技术可行性受到质疑。 任化龙:Tesla Bot参数信息有限,可能采用电动推杆方案,牺牲速度换取力矩。电机是人形机器人发展的重要制约因素,电动推杆方案可以部分解决电机尺寸与力量输出之间的矛盾。特斯拉在动力电池、传感器、驱动器等方面拥有经验,但将这些技术完全平移到人形机器人领域仍存在距离,2022年推出原型产品的目标过于激进。如果Tesla Bot不追求复杂的行走或服务功能,只追求基本的外形和运动能力,那么在明年推出原型产品是可行的。但要实现像科幻电影中那样的功能,例如自主购物,目前还不可行。 任化龙:人形机器人研发的难点主要在于双足行走、灵巧手、智能和驱动器四个方面,以及能源问题。灵巧手研发已超过30年,其自由度数量是关键,至少需要9个以上才能被称为灵巧手。人手拥有32-34个自由度,而传统的机械手通常只有6个自由度左右,这限制了其完成复杂操作的能力。目前机器人智能主要依赖深度学习,但深度学习存在泛化性问题,需要预先训练才能识别物品。电机功率输出受限,限制了机器人手部和足部的运动能力;电池能量密度有限,限制了机器人续航能力。六自由度灵巧手主要用于抓取,而九自由度以上灵巧手可以完成更复杂的操作,例如拧瓶盖、敲鸡蛋等。灵巧手商业化公司较少,主要应用于解决生产操作中对人工依赖的问题,以应对人力成本上升和劳动力短缺。灵巧手可以解决传统自动化设备无法应对的复杂操作,并能适应产品规格和生产流程的变化,降低硬件投入的重复浪费。公司采用类脑计算路线,而非深度学习,以解决灵巧手控制的复杂度问题。类脑计算与深度学习的区别在于:类脑计算更深入地借鉴了生物大脑的工作原理,采用模拟生物神经可塑性的方式学习,解决的是认知问题,而非深度学习的识别和分类问题。类脑计算可以实现更高级的认知功能,例如思考、复杂的感官感知、情景记忆、程序性记忆、情感模拟、复杂决策、常识性语言语义和复杂的知识系统。类脑计算与深度学习在技术路径和基础理论上存在根本区别,类脑计算更注重对神经科学的理解,并利用多种神经机制实现学习。类脑计算的学习速度比深度学习快,不存在性能瓶颈和灾难性遗忘问题,能够持续终身学习。真正的类脑计算抛弃了复杂的数学机制,利用简单的加减乘除实现高性能。未来机器人将在工业生产中解放所有生产线上的人力。灵巧手应用场景广泛,可以用于各种垂直领域,不一定需要人形机器人或行走功能。人形机器人研发的主要难点在于智能部分,需要提升机器人的感知、认知和自主决策能力。灵巧手可以替代实验室中对人有危险性的重复性劳动,例如在化学、医药、病毒和核能实验室中的操作。灵巧手在抓取和摆放物体方面比传统的机械臂具有优势,尤其是在处理复杂曲面物体时。灵巧手由于自由度多,具有冗余度,可以从不同方位抓取物体,对机械臂定位精度要求低。改变思维方式,采用类脑计算方法,可以加快技术进步。公司专注于关键技术研发,并与集成商合作,未来两年内类脑计算将有望形成商业应用前景。类脑计算可以应用于需要复杂认知的领域,例如自动驾驶中的全自动驾驶功能。类脑计算适用于需要复杂认知的领域,但不一定适用于数据挖掘或生成网络等以数据为主的领域。一两年内,机器人将在工厂中开始试用,但最初的任务会比较简单。机器人首先会替代生产线上一些危险性高、操作对象为刚体或介于刚体和柔体之间的任务。技术发展应借鉴人体结构和工作原理,重视基础科学研究,特别是神经科学。

Deep Dive

Chapters
特斯拉AI日发布的Tesla Bot机器人概念引发热议,其功能、参数及可行性受到广泛质疑。嘉宾任化龙分析了Tesla Bot的技术构成,并探讨了其与自动驾驶技术之间的关联与差异。
  • Tesla Bot旨在完成重复、危险、枯燥的工作,例如杂货购物、家务整理等。
  • 马斯克称特斯拉已掌握制造Tesla Bot所需大部分零部件,但其可行性仍存疑。
  • 业界普遍认为,Tesla Bot的研发及量产面临诸多挑战,短期内难以实现其宣传的功能。

Shownotes Transcript

本 节目 由 生动活泼 制作 播出。

Hello 大家好, 我是 丁 叫, 欢迎 收听 全 新一集 what next 科技 早知道。 马上 就要 中秋 了, 为了 感谢 生动活泼 的 听众 对 我们 一直以来 的 支持, 我们 准备 了 100份手写 的 明信片, 并在 这 张 明信片 里 夹带 了 我们 想对你说 的 悄悄话。 我们 希望 在 这个 快节奏 的 社会 里, 和你一起 重温 书信 时代 的 温度, 送上 一份 特殊 的 祝福。 参与 方式 是在 微博 或者 微信 公众 号 关注 生动活泼, 查看 今天 的 活动 推 文, 填写 报名 问卷, 告诉 我们 想 听到 生动活泼 旗下 哪 档 节目 的 主播 的 悄悄话。 我们会 在 所有 参与 活动 的 听众 中 抽取 100位幸运 观众, 送上 我们的 中秋 祝福。

上周 在 这个 特斯拉 A I 日 的 活动 上面, 公布 了 特别 我 觉得 有点 魔幻 的 一个 项目, 就是 这个 特斯拉 机器人 tesla bot。 因为他 就是 拿了 一个 同事 在 上面 穿着 机器人 的 整个 的 服装, 然后 跳 了 一段 舞, 就让 人 感觉 是 非常 的 搞笑。 Real, the tesler bot will be real. Tesla, arguably the worlds biggest robotics company, because our cars are semi santin robots on whales.

然后 他说 这 一款 机器人 其实 是 能够 完成 人们 不 喜欢 做 的 危险 的、 重复性 的 或者 枯燥 的 一些 工作。 比如说 是 像 去 杂货店 取 一些 杂货, 然后 收拾 家里 等等 这 样子 的 一些 工作。 他 也 开始 在 自己的 网站 上 公布 了 要 招聘 的 这个 领域 的 人才, 然后 宣布 明年 其实 就 能够 有 demo 的 机器人 出来, 不少 媒体 和 评论 觉得 就是 这个 马斯克 的 一次 作秀, 然后 也有 很多人 说 把 这个 hyper loop 的 老张 翻出来, 然后 说 这个 还 per loop 在哪里 呢? 那 到底 特斯拉 这一次 是不是 在 作秀? 那 人形 机器人 的 领域 又有 什么样 的 玩家? 制造 人形 机器人 的 难点 又 在哪里? 今天 和 我们 来 聊 这个 话题 的 是 任 华龙, 深圳 益海 原石 科技 有限公司 创始人, J N C E O 哈尔滨工程大学 自动化 专业 斯坦福 A I 方向 硕士。 Hello 华龙 你好。

Hello, 丁 教授 你好。

因为 我知道你 一直 是在 这个 机器人 的 领域 哈那 我 觉得 首先 可能 得 帮 我们 先 科普 一下 这个 tesla。 它 到底 是 能够 实现 一些 什么样 的 功能, 它的 参数 是 怎么样 的?

其实我 了解 的 也 有限, 主要是 通过 各种 科技 媒体 对于 特斯拉 boss 的 发布会 很 了解 的。 它的 这个 人形 机器人 基本上 是 跟 正常人 差不多 高。 它的 自由度 数量 大概 也可以 根据 它 发布 的 驱动器 的 数量 来 判断。 看上去 它 主要 用 的 是 电动 推杆, 它 可能 牺牲 了 一些 运动 的 速度, 但是 换来 了 一些 稍微 中规中矩 一点 的 力矩。

因为 众所周知, 现在 电机 是 制约 机器人, 尤其是 人形 机器人 发展 的 一个 很 重要 的 关键 元件。 电动机 它的 转矩 或者说 它 发出 的 这个 力量 一般来说 还是 比较 小的。 现在 电机 主要是 可以 做到 高速, 它 如果 用 电动 推杆 的话, 可以 把 转速 转换成 直线运动。 直线运动, 它 可能 它的 力量 稍微 大 一点点。 他 其他 方面 的 参数, 现在 在 他的 公布 报道 里 是 看不出来 的, 可能 需要 有 业内人士 来 评价。

因为你 刚刚 讲 的 这个 电机, 然后 这个 电机 因为 特斯拉 它的 这个 机器人 就 特别 像 我们 这个 科幻小说 里面 的 这个 irobot 电影 里面 的 这个 机器人。 它 其实 又 像是 波士顿 动力 Alice 这个 机器人, 它是 能够 行走 的, 然后 他 又 能够 有 这个 灵巧 手, 然后 能够 做 日常 的 一些 这种 抓取 物体, 然后 也会 有 这种 计算机 识别, 然后 能够 这个 电 人 物体。 所以 其实 这 是一个 比较复杂 的 一个 系统 的 集合。 所以 你 刚刚 讲 的 这个 电机, 你是 讲 的 它是 在 这个 灵巧 手 的这 一方面, 还是 讲 它的 行走 的这 一方面?

是 他的 全身, 他的 身体 上 应该 会有 多 关节。 他 应该 主要 使用 的 都是 电机 的 方案, 或者 我们 叫 纯 电 的 方案。 这一点, 是 跟 以前 的 一些 尝试, 就是 包括 学校 里 的, 还有 包括 企业 里 的, 多少 有 一些 不一样的 地方。 因为 刚才 我们 讲 了 电机 它的 一个 很 重要 的 问题 就是 没有 办法 在 很小 的 尺寸 上 还 能够 做出 一个 很大 的 力量 或者 力矩。 它 采用 了 电动 推杆 这样 一个 方案, 可以 解决 其中 一部分 问题。

尤其是 灵巧 手 这个 手部。 灵巧 手 它 其实 是 有一个 比较 规范 的 学术 定义 的。 根据 北航大学 的 一位 老师 的 定义, 它是 至少 要有 三根 手指, 并且 自由度 数量 至少 要 达到 9个才 可以 叫做 灵巧 手。 市场上 有 一些 做成 的 五指 型 手, 它 不一定 可以 叫做 灵巧 手, 因为 它的 自由度 可能 没有 那么 多。 那么 马斯克 的 这个 tsl box, 他的 手部 最终 会有 多少 个 自由度, 现在 还不 能够 完全 确认, 但是 我 认为 可以 达到 6个以上。

灵巧 手, 但 凡是 达到 6个以上 的话, 那么 它的 电机 的 布置 问题 就会 成为 一个 问题。 因为你 大家 都 知道 手部 的 空间 其实 非常 小, 那么 这些 电机 是 很难 全都 放在 手部 的, 自由度 数量 越多, 一般 会 需要 更多 的 电机。 所以说 你可以 看一下 他的 胳膊, 也就是 那个 小臂 它 里面 电机 的 数量, 从而 可以 进一步 推测 它 可能 手部 就有 多少 个 自由度。

对, 因为 马斯克 说 他们的 汽车 就是 带 轮子 的 半 智能机器人。 然后 他们 已经 比如说 是在 这个 传感器, 电池 和 驱动器 这 一块儿, 已经 有 非常 多 的 经验 了。 但是 我 觉得 2022年 这样的 一个 时间, 我 觉得 还是 比较 太 aggressive 了。 你 怎么 看待 这 一块儿?

对于 他们的 这个 厂子, 我 觉得 有 一些 可以 作为 人形 机器人 集成 的 一个 基础 技术, 尤其是 像 动力电池。 因为 自动驾驶 汽车 其实 催生 了 动力电池 的 发展, 电池 的 能量 密度 一直 也是 个 问题。 你看 以前 大家 都 跟踪 的 日本 的 本田 阿西莫 机器人, 它是 属于 最早 一代 的 人形 机器人, 而且 做 的 比较 成功 的, 可以 实现 双 足 行走, 可以 去 拿 一个 水杯 或者 端 个 盘子, 走 的 速度 比较慢, 个头 不大, 好像 只有 一个 小男孩 那么 大。 那么 它的 电池 是 放在 哪 呢? 像 个 背包 一样 背 在 背上, 而且 它 有的 实验 型号 还需要 拖 一个 很长 的 电缆, 连到 那个 墙上 提供 动力 电。 如果 要是 特斯拉 它 有 很 好的 动力电池 的话, 它 有可能 能够 把 这个 电池 的 部分 做小, 能够 塞 在 机器人 的 身体 里面。 但 即使 是 这样的, 我 认为 它的 电能 储量 可能 还是 较小, 可能 还是 需要 经常 的 要 回去 充 充电。 除此以外, 我 认为 他的 技术 要是 完全 平移 到 人形 机器人, 可能 还有 一定 的 距离 要 走。

因为 自动驾驶 和 人形 机器人 的 技术 中间 的 差距 还是 蛮 大 的。 但是 好在 是什么 呢? 现在 学术界 还有 包括 工业界, 其实 已经 有 很多 节 机器人 的 方案。 它 可以 像 这些 公司 进行 采购, 进行 整合, 关注 最 关键 的那 一块。

所以说 明年 特斯拉 能够 攒 出 一个 比较 基础 的 能够 demo 的 这样的 机器人, 其实 是 可以 实现 的。

我 认为 如果 不 关注 太 复杂 的 行为, 比如说 像 复杂 的 双 足 行走, 或者 像 给 人 能够 提供 非常 周到 的 服务, 你 不要 关注 这种 功能 上 的 这种 完全 实现。 如果 只是 做 一个 外形, 然后 让 他 能够 基本 动起来, 我 觉得 是 没问题 的。

但 我们 其实 也 知道 在 过去 几年 当中, 也有 像是 那个 Sophia 就是 索菲亚 这样的 一些 机器人。 它 其实 并没有 太多 的 这个 技术 在 后面, 它 可能 更多 的 就是 它 program 出来, 然后 让 大家 能够 来 跟 它 对话, 然后 这些 对话 都是 进行 设计 过 的 这样的 一个 demo。 你 觉得 特斯拉 会 变成 这样的。

一个 机器人 吗? 我 觉得 有可能 是的。 OK.

对, 因为 我们 刚才 讲到 其实 像是 这个 波士顿 动力, 他们 其实 在 Alice 这个 机器人 上面, 他们 已经 实践 了 可能 有 将近 30年 了, 对 吧? 就是 他们 这种 动力 的 这个 机器人, 然后 包括 可能 灵巧 手 这样的 一个 细分 的 领域。 在 这个 行业 可能 因为 你们 其实 是 主要是 在 工 这 一方面, 我不知道 这个 技术 积累 了 多少 年 了, 但 其实 都是 非常复杂, 需要 非常 多年 的 这样的 一个 技术 积累 的 这个 领域。 然后 他 把 这 几个 全都 攒 在一起 的话, 我 觉得 就是 更加 复杂 一个 系统 了。 那你 觉得 能够 明年 实现, 比如说 是一个 特斯拉 机器人, 开 着 特斯拉 去 商店 里面 买 一些 日常 的 这种 菜, 买 这个 然后 回来。 比如说 是 可能 做 一些 重复性 的 工作, 搞 个 垃圾 这 样子 的, 你 觉得 这个 可行 吗?

我 觉得 实现 不了。 人形 机器人 其实 难 的 地方 比较 多。 目前 来讲 我 认为是 有 四大块 到 五 大块。 双 足 行走 这个 问题 刚才 讲 到了, 就是 波士顿 动力 还有 一些 其他 的 公司, 其实 一直都在 尝试 像 阿西莫夫 双 足 行走 目前 来讲, 现在 还没有 办法 做到 稳定 行走, 而且 速度 还 比较 快。 而且 目前 所有的 测试 大部分 是在 平地上, 实验室 环境 下 评测。 一旦 要是 进入 到 开放 环境, 稍微 有点 坡, 有 个 门槛 他 可能 就 过 不了。

第二个 问题是 手部, 因为 机器人 如果 想要 进行 复杂 的 作业, 尤其是 我们 叫 操作, 那么 就 需要 一个 好的 手部 灵巧 手 就是 为了 解决 复杂 操作 而 生的。 这个 学科 可以 追溯到 上个世纪, 现在 从 学术界 发展到 现在, 其实 也 已经 有 三十多年 到 40多年 的 历史。 我们 团队 在 这个 领域 里面 扎根 也 已经 有 快 14年 的 历史 了。 我们 从 07年 就 开始 做 这个 东西。

灵巧 手 它 跟 普通 的 五指 形 手 还 不完全 一样。 如果 把手 做成 五指 形 手, 其实 只要 至少 六个月, 有的 可能 就能 实现。 但是 他 还没有 办法 完整 浮现 人手 的 所有 动作。 如果 想要 人 浮现 人手 的话, 比如说 一个 手 单手 可能 就有 32到34个 自由度。 这是 我们 人类 生理学 上 的 特点, 包括 了 腕部 的 关节 上 的 自由度。

现在 传统 的 机械手 就是 我们 说 这种 五指 型 手, 它 一般来说 是 做成 六个 自由度 左右。 你看 这个 特斯拉 的 那个 发布会, 他说 手部 的 电机 有 12个。 如果我们 要是 认为 一个 电机 驱动 一个 自由度 的 情况下, 那么 两个 手 一共 12个电机, 相当于 一个 手 是 六个 电机。 很有可能 它 也是 做成 了 一个 六 自由度 的 五指 形 手。 所以说 它 不能 叫 灵巧 手。 因为 灵巧 手 的 定义 我们 前面 讲 到了, 它 至少 要 达到 9个自由度 以上 才能 叫做 灵巧 手。

第三个 部分 难 的 是 它的 智能 部分。 因为 机器人 的 硬件 就算 再 好, 它的 智能 水平 达不到。 也没有 办法 实现 我们 身边 这么 复杂 的 日常任务, 甚至 连 视觉 纯粹 的 感知 我们 生活 的 这些 物品 都 感知 不了。 因为 现在 目前 来讲 主流 用 的 技术 叫 深度 学习。 深度 学习 还 存在 泛化 问题, 它的 所有的 物品 你 想 识别 也 需要 进行 预先 的 训练。

第四 大块 前面 我们 也 讲 到了, 就是 这个 驱动器, 也就是 这个 电机 的 问题。 他 现在 主要问题 也是 功率 输出 受限, 没有 办法 在 一个 很小 的 尺寸 上 做到 一个 能够 输出 很大 的 力量 或者 力矩。 这就 限制 了 这个 手部, 还有 说 这个 足部 双 足 行走, 它的 行走 的 功率 上不去, 那 他 就 没有 办法 快速 的 跑。 最后 一块 就是 关于 它的 这个 能源 问题, 即使 是 现在 的 动力电池, 它的 能量 密度 相对来说 也 还是 有限。

能不能 举 个 例子, 刚刚 说 比如说 是 这个 六个 关节 和 9个关节 的 灵巧 手, 他们 在 实际 的 这个 应用 上面 有 什么样 的 区别, 和 他们 能够 达到 什么样 的 功能 呢?

如果 要是 一个 五指 型 手, 然后 只有 六个 自由度, 那么 它所 能够 实现 的 动作 主要是 抓取。 那么 操作 的 型 任务 可能 还 做不了。 操作 一般来说 是 比 抓取 更 高级 的 动作。 你 比如说 我们 拧 一个 水 瓶盖, 敲 个 鸡蛋, 拆 一个 包裹, 叠 一个 毛巾, 这种 都 属于 相对来说 比较复杂 的 手上 动作。 还有 更 高级 的, 比如说 我 单手 就可以 解 魔方, 在手 里面 盘 核桃, 对不对? 这些 都是 属于 复杂 的 操作。 传统 的 机械手 从 两指 的 两指 夹, 我们 叫 平行 夹 机械手。 还有 像 三指 的 爪, 到了 四 指, 五指 可以 叫做 手。 六个 自由度 的话, 可能 更多 还是 完成 一个 把 东西 拿 起来 再 放下 这样 一个 抓取 动作。 但是 对于 复杂 的 操作 还是 需要 用 零 巧手 来 实现。

因为 现在 好像 在 做 灵巧 手 的 公司 也 不是说 是 特别 多。 因为 他在 这个 商业 应用 落地 这 一块, 好像 没有 这种 传统 的。 比如说 是 像 什么 A P P 这些 大厂, 然后 他们 比如说 是 两个 的 夹起来 的, 然后 可能 会有 一些 吸盘式 这样 在 工业 领域 应用 的 更加 来 的 方便。 所以 我不知道 这 一块儿 我 是不是 了解 的 正确, 我不知道 灵巧 手 还在 哪些方面 有 应用。

灵巧 手 真正 做 商业化 的 公司 非常少, 我 只 知道 英国 有 一家 公司 叫 shadow robotics, 中文名 也 叫 阴影 机器人公司。 他是 世界上 第一个 把 零 销售 进行 商业化 的, 也是 目前 来讲 唯一 一个 除了 我们 以外, 零 销售 现在 应该 是在 市场上 刚刚开始 兴起。 那 它 主要 面临 的 问题 是什么? 是 解决 生产 操作 这个 环节, 现在 还 大量 依赖于 人工。 但是 人力 成本 最近 这几年 现在 在 快速 的 高 起。 而且 这个人 成本 升高 的 这个 趋势, 还会 随着 人口 的 结构 的 老龄化, 然后 年轻 劳动力 壮丽 的 不足, 使得 这个 市场需求 变得 越来越 迫切。 而且 现在 大家 受 教育 的 水平 普遍 的 还是 在 提高, 有 更多 的 大众呢 有 机会 参与 到 教育 中, 那么 就 不会 再 有人 去做 这种 危险 的、 枯燥 的 这种 生产线 的, 还有 包括 像 矿山, 甚至 对人 生命 有 危险 的 这种 环境, 慢慢 就会 需要 用 机器人 去 替代。

这些 环境 里面 的 一个 特点, 就是 它的 操作 相对 复杂。 传统 的 自动化 设备 工装 不 能够 去 解决 它的 问题。 而且 如果 他的 这个 产品规格、 生产流程 一旦 发生变化, 所有的 专用 自动化 设备 可能 就会 需要 重新 设计。 就会 造成 硬件 投入 的 重复 浪费。 如果 用 灵巧 手 的话, 就可以 很 好的 解决 所有 这种 人 还在 用人 手 来 操作 的 一些 环节。 而且 如果 要是 工装 或者 是 这个 产品规格 流程、 生产流程 发生变化, 那 我 只需要 改变 软件 升级 就可以 了。

这个 就 又 涉及 到了 人工智能 和 深度 学习 这 一块 了, 对 吧? 所以 它是 两个 灵巧 手 和 人工智能 学习 的 两者 的 结合, 所以 又是 把 这个 难度 提高 了 一个 level。

是的, 因为 灵 小手 它的 自由度 数量 非常 多。 像 我们 的话 我们 可以 做到 32个 自由度 单手, 这就 意味着 它的 这个 控制 的 复杂度 也 上来 了。 传统 的 基于 机器人学, 运动 规划 的 这种 办法 可能 不 适用, 深度 学习 的 办法 也 未必 就是 最好的。 我们 其实 走 的 是 类 脑 计算 的 路线。

我想说 能不 帮 我们 科普 一下 类 脑 计算 跟 深度 学习 它的 区别 是什么?

好的, 其实 深度 学习 它 发展 也有 个 至少 20年 以上 的 历史 了, 可以 追溯到 上世纪。 它 虽然 说 是一种 神经网络, 但是 它 对 神经系统 的 借鉴 还是 有限。 它的 主要 的 原理 还是 数学 优化 的 思想。 它的 训练 的 规则, 它 主要是 采用 了 误差 反 传 和 梯度 下降 这种 原理。 那么 类 脑 计算 它 其实 是 更 深度 的 借鉴 了 生物学 的 大脑 它的 所有的 工作 原理, 借鉴 的 程度 是 非常 多 的。 它的 主要 的 这个 学习 方式, 它 已经 抛弃 了 数学 优化 的 思想, 它 采用 的 是 模拟 生物 脑 里面 的 这种 神经 可塑性 的 办法 来 学习。 而且 它的 解决 的 问题 的 面 也 不一样。

相比 于 深度 学习 的, 深度 学习 可能 主要 解决 的 还是 一个 识别 和 分类 问题。 但是 类 脑 计算 它 可以 面向 认知 问题。 比如说 它 可以 实现 像 人 一样的 思考, 复杂 的 感官 感知, 像 视觉 听觉, 然后 能够 形成 像 人 一样的 情景记忆、 程序性 记忆, 能够 形成 模拟 的 情感 情绪, 能够 实现 复杂 的 决策, 甚至 包括 可以 形成 真正 具有 知识 的, 或者说 我们 说 具有 常识性 的 语言 语义, 以及 这种 复杂 的 知识 系统。

那 类 脑 这个 计算 他们 现在 的 一个 研究 的 水平 现在 到 哪儿 了? 他 离 我们的 如果 是 能够 用上, 然后 能够 商业化 还有 多长时间?

我 认为 应该 很快 了。 那么 在 未来 的 两年 内内 脑 计算 应该 会 成为 一个 非常重要 的 主流 研究 方向。 这个 其实 你看 咱们 国家 十四五 计划, 电脑 智能 也是 其中 一个 重点。 我们 团队 其实 是在 这个 领域 里面 做 的 比较 快 的, 比较 早 的。 我们 其实 很多年 前 就在 储备 这个 技术。 类 脑 的 智能 的 视觉, 还有 类 脑 智能 的 运动 的 控制, 这些 应该 是 会 率先 落地 的。 我 认为 这。

一方面 是不是 还是 比较 跟 这个 深度 学习 还是 类似的, 还是 他 从 最 基础 的 技术 路径 和 这个 方向 不太 一样的。

他 应该 是 彻底 抛弃 了 深度 学习 的 思想, 他 从 基础 的 理论 就 不一样。 电脑 计算 发展 的 一个 前提 是要 把 神经科学 吃透, 就是说 要 非常 充分 的 理解 人脑 的 工作 原理。 人脑 的 工作 原理 它 其实 非常 的 复杂, 以前 在 深度 学习 时代, 有 一些 学者 在 追求 这种 大一统 理论, 就是 希望 用 这种 非常 具有 美感 的 理论 能够 去 解释 所有的 现象。 但 实际上 从 神经科学 的 角度 上 来讲, 实际 不是 这样的。

实际上 人脑 里面 存在 非常 多 上百种 甚至 几百种 运算 的 机制。 这些 机制 可以 天然 的 实现 向 无 监督 学习、 自 监督 学习, 小 样本 等等 这些 特性。 它的 这个 特性 是 靠 神经 环路, 还有 神经 环路 上 发生 的 复杂 的 突出 可塑性, 神经 可塑性 等等 来 实现 的。 这些 过程 是 需要 深度 被 挖掘 的, 需要 通过 所有的 这些 机制 配合 在一起, 才能够 实现 像 人 一样的 非常丰富 的 感知 能力。 这个 是 需要 先 从 理论 开始 着手, 大量 的 理论 的 基础 的 推导 之后, 再 进行 工程化。 它 可能 不需要 也 不可能 从 深度 学习 直接 迈 过来。

所以 它是 两条 不同 的 技术 流派 的 技术 线路, 然后 从 底子 就 不一样 了。 是的, 然后 他 其实 是不是 也是 跟 这个 深度 学习 是 一样, 也是 要 积累 大量 的 实验 的 数据, 然后 慢慢的 才能 把 这个 模型 建造 起来。

它的 前期 会 需要 训练 数据 进行 支撑, 到了 发展到 中后期 的 时候, 你 会 发现 它的 学习 速度 会 比 深度 学习 要 快 非常 多。 深度 学习 它 存在 一个 性能 瓶颈, 就是 如果你 画 一个 坐标系, 它的 横轴 是 它的 训练 数据 的 数量, 还有 包括 训练 次数, 纵轴 是 它的 性能 的 提升。 那么 你 会 发现 它的 这个 曲线 一开始 比较 抖, 随着 数据 的 增多, 还有 训练 的 次数 的 增多, 它的 这个 曲线 慢慢 就 放缓 了。 甚至 如果如果 要是 说 你 数据 再 多 的话, 有可能 会 造成 灾难性 遗忘。 就是 把 你 最早 之前 训练 的 一些 数据 就 慢慢 就 忘掉, 甚至 有可能 会 出现 这种 我们 叫 over fitting, 就是 过 拟合。

类 脑 计算 不存在 这个 问题。 类 脑 计算 算 他 就是 天生 天然 的, 适合 在 环境 中 连续 的 终身学习, 它 可以 不断 学习。 他的 学习 的 过程中, 一开始 他 也会 需要 大量 的 数据 来 作为 辅导。 他 一旦 形成了 表征 基础 以后, 他 后面 再 开始 学习 新的 东西, 它的 性能 会 不断 的 继续 往 上 提升, 甚至 有可能 是一个 弯曲 向上 的 一个 曲线, 它的 学习 速度 越来越快, 举 一 传送 的 能力 越来越快。 比如说 我 可能 看到 一个 杯子 或者 看到 一个 水平, 看到 一次 两次 之后, 我 就 知道 其他 的 杯子 水平 也 还是 水平。

那 现在 除了 你们 之外, 还有 哪 一些 其他 的 公司 在 这个 行业 里面 也是 在 深挖 这 一块 的。

目前 我们 还没有 看到 其他 走 严格 的 领导 计算 的 范式 的 公司, 有 一些 声称 是 做 领导 计算。 但是 主要 可能 还是 围绕 了 深度 学习 作为 基础, 或者 是在 深度 学习 基础上, 向 科学 稍微 慢 了 一点点, 这样的 路线 是 有的。

就是 没有 把 它 跟 机器人 结合起来 的 这样的 公司。

举 个 例子, 比如说 像 deep mind, 这是 大家 都 耳熟能详 的。 他 声称 也是 在 深度 学习 和 神经科学 上去 做 结合。 他 我看 了 他的 技术路线, 其实 主要 还是 以 数学 优化 为主。 他们 没有 放弃 数学 优化 的 思想, 对于 神经科学 的 借鉴 力度 相对来说 还是 少 一些。

真正意义 上 的 类 脑 计算 是 彻底 放弃 了 所有 复杂 的 数学。 你 会 发现 人脑 里面 的 工作 机制 非常 的 奇妙, 非常简单 的 加减乘除 就可以 实现。 它 里面 并没有 复杂 的 数学 机制, 但 它的 性能 真的 非常 好。

所以 现在 这个 人形 机器人 的 这样的 一个 市场 上面, 其实 没有 几个 是 能够 真正 的 商业化 的。 我 可能 唯一 想象 的 就是 可能 14年 的 pepper 它 只是 外形 是 人的 这样的 一个 形象。 但 他 跟 我们 刚刚 讲 的 像是 可能 特斯拉, 然后 预想 中的 这 样子 的 机器人 其实 还差 得 很远。 对, 我不知道 刚刚 我们 讲 了 有 阿西莫 O 本田 的对 吧? 然后 还有 像是 Alice, 现在已经 是 现代 的 了, 除了 这 几个 之外, 还有 哪 一些 是在 这个 市场 上面 竞争 的 这个 人形 机器人公司 呢?

目前 机器人 落地 其实 还是 围绕 娱乐, 比如说 做成 玩具 或者 是 这种 跟人 陪伴。 还有 就是 国内 有 一些 公司, 它 可以 做 这种 迎宾 型 机器人, 他 可以 不 追求 双 足 行走。

就是 这个 pepper 一样的 迎宾 型 机器人。

对的, 从 这个 角度看 的话, 其实 公司 非常 的 多, 因为 他的 难度 其实 不算 太大。 但是 如果你 要是 上升到 波士顿 动力 这种 级别 的那 可能 也就 只有 他 能 玩好。

所以 如果 是 我们在 看 在 制造 领域, 因为我 知道 像是 你们 其实 也是 准备 是 往 这个 方向 发力 的对 吧?

对, 其实 工业生产 是一个 大头, 而且 它的 市场 体量 非常 的 巨大。 它 可以 大 到 什么 程度? 可以 毫不 夸张 的 说, 机器人 未来 会 解放 掉 所有的。 现在 还在 生产线 上 的 人力。

然后 这个 市场 规模 大概是 有 多少 呢?

这个 市场 规模 没法 算。 你可以 想 一下 人类 的 所有 生产 环节, 所有 现在 还有 工人 在 现场 要 靠手 来 操作 的 环节, 都是 未来 的 市场。

我们 其实 在 这个 竞争 领域 的话, 就 不是 一个 人形 机器人 cover 得 了的。 它 可能 更多 的 是因为 在 工业 机器人 上面, 其实 又是 更大 的 一个 范畴 了, 对 吧? 但是 我们 现在 比如说 是 像 你们 其实 研究 的 这个 方向, 是 怎么样 通过 灵巧 手, 然后 做 一些 传统 的 工业 机器人 它 做不了 的 事情。 所以 这个 市场上 是不是 又是 算是 一个 细分 的 市场 呢?

它是 一个 新兴 的 市场, 它 是否 细分 呢? 我 认为 它 也有 很多 的 垂直 场景。 如果你 深挖 下去, 很多 具体 的 应用 场景, 它 可以 做成 一个 固定式 的 静态 的。 配合 机械臂 就可以 实现 代替 人工 的 这种 操作。 它 不一定 非得 做成 人形 机器人, 它 甚至 不需要 行走。

对他 只是 需要 有一个 视觉 的 模块, 有 一双手 就 O K 了。 是的, 所以 这 样子 其实 研发 难度 就 把 它 砍 了 一半 了。

对 吧? 对, 其实 我们 认为 机器人 如果 从 应用 角度 上 讲, 其实 更 重要 的 点 其实 就是 机器人 你的手 和 脑 只要 围绕 这两块 做好, 其实 很多 应用 场景 就 全都 解锁 了。 那么 把 它们 做好 以后, 可以 慢慢的 过渡 成 具有 全身 特点 的 这种 总 成型 机器人。

如果 是 这 一块 手 和 脑 的话, 那 他 现在 的 研发 的 难点 和 量产 的 这个 难点 在 哪一块 呢?

其实我 认为 主要 的 难点 可能 还是 在 智能 这 一部分, 让 他的 感知 能力 更好, 甚至 要 出现 一定 的 认知 能力, 还要 让 机器人 能够 进行 自主 决策, 这些 是 最难 的 部分。

所以 像是 你们 或者 是 其他 的 一些 在 这个 领域 攻克 的 公关 的 这样的 公司, 他们 其实 是 跟 制造 工厂 会 比较 走 得 近 吗? 还是 需要 做 一些 什么样 的 一些 task 再来 训练 这样的 机器人。

可以在 工厂 的 这种 具体 的 场景 里面 去做 一些 早期 的 部署 来 实验。 除此以外, 还 可以 因为 它是 灵巧 手, 灵巧 手 还有 包括 类 脑 智能 这种 比较 通用 的 技术。 他 本来 就可以 去 在 实验室 里面 就可以 先 学习 一些 基础 的 技能。 这样 它 可以 自动 的 再 泛化 到 它是 在 具体 的 场景 里面 需要 执行 的 任务。

就 比如说 是 可能 替代 最简单 的 把 A 流水线 拿到 B 流水线, 那 这个 只是 一个 抓取。 然后 比如说 还有 一些 什么 动作, 其实 是 可以 很快 的 被 灵巧 手 来解决 的。

其实 如果我们 看 生产线 上 的话, 有 很多 任务 都是 手上 的 活, 包括 像 实验室, 自动化 实验室。 我们 看到 像 这种 化学 的、 医药 类 的, 像 病毒实验室, 还有 像 这种 核能 的, 对人 有 危险 的 这些 操作, 它 不光是 危险, 它 还有 可能 是 比较 冗余 的。 就是你 科研人员 很多, 他 其实 都是 高学历 的, 他 主要 的 精力 应该 放在 写 论文 这种 读 文献, 这种 脑力 工作 上, 而 不是 在 实验室 里面 去做 这种 大量 的 体力 的 重复 的 劳动。

这些 也都 可以 用 人工 机器人 来 代替。 它 机器人 代替, 它 要 解决 的 问题 也很 复杂。 就是 你看 它 试剂瓶、 反应釜, 它的 形状 非常 的 复杂 不规则。 还有 一些 自动化 的 机箱 上面 要 进行 操作。 他们 其实 无一例外 都是 为了 人手 设计 而来 的。 最简单 的 让 机器人 来 适应 它 办法 就是 用 灵巧 手。 因为 灵巧 手 天生 他 就可以 适应 所有人 手 操作 的 环节。

我也 看过, 像是 应该 是 可能 有 三五年 前 了, 应该 是 斯坦福 A I 实验室 跟 google 做 的 这个。 怎么样 让 这些 传统 的 机械手臂, 然后 抓取 一个 物件 慢慢 选 会, 然后 把 它 放过来 放 过去, 然后 放到 正确 地方。 就 跟 一个 小的 婴儿 他 学习 认知 或者 抓取 一个 物件 是 一样的。 所以 现在 可能 在 灵巧 手, 现在 大家 是 能够 达到 就 我 刚刚 说 的 这个 google 前 两年 公布 的 这样的 一个 水平 吗?

我 觉得 是 应该 是 超过 他。 像 刚才 您 讲到 的 这个 是 简单 的 抓取 和 摆放 这样 一个 任务。 那么 用 灵巧 手 的话, 可以 实现 相对来说 更 复杂 的 动作。 像 拧 瓶盖 这种 就 不用说 了, 甚至 包括 在 抓取 一些 复杂 的 曲面 物体。

其实 灵巧 手 有 更多 的 优势, 为什么呢? 因为 灵巧 手 它的 自由度 数量 多, 那么 它 就 产生 了 一个 冗余度。 冗余度 的 好处 就是我 不管 我的 手 胳膊 从 哪一个 方位 我 靠近 物体, 那么 我 只要 手指头 搭上去, 形成 一个 闭合 曲面, 我 就 能够 把 物体 牢牢 的 抓住。

如果你 要是 用 像 谷歌 以前 的 那种, 他 实验 的 时候 用 的 是一个 两指 夹。 那么 两 指甲 的 一个 问题, 就是 他 对 这个 胳膊 的 这个 机械臂 定位 的 精度 要求 比较高。 我 必须 得 是 刚刚 好好 在 那个 位置 上。 比如说 我 抓 个 鸡蛋, 我在 两 指甲 能够 同时 的 碰到 那个 鸡蛋 的 两个 对称点 上才 能够 把 它 抓住。 如果 要是 稍微 偏 一点, 可能 鸡蛋 要么 就是 掉了, 要么 就是 碎 了。 但是 灵巧 手 就 不需要 这个 问题, 他 可能 机械臂 我 只要 差不多 移动 到 附近, 那么 我 手指 因为 自由度 数量 多, 它 要 闭合 上去 就能 把 这个 复杂 物体 抓住。

所以 现在 其实 已经 在 这个 技术 上面, 已经 比 我们 前些年 看 的 google 要 进步 了 不少 了。

其实 主要 的 原因 还是 思维 范式 的 变化。 谷歌 他 之前 做 的 这个 办法, 它 其实 跟 伯克利 使用 的 技术路线 其实 是 差不多 的, 应该说 是 起源于 伯克利 的 它 有一个 是 基于 深度 学习 做 的 叫 x man。 他的 一个 问题 就是 过度 的 追求 精度。 其实 如果我们 放开 了 这个 思维 的 束缚, 我们 采用 了 类 脑 的 办法, 真正 像 人 一样的 操作方法。 你 会 发现 其实 很多 问题 的 解决 就 变得 非常 的 简单。

就是 在 这个 思维 的 这个 方向 上面, 其实 改变 了 之后, 整个 技术 就会 进展 的 更快 一些。 是的, 好的, 能不能 帮 我们 介绍 一下 你们 公司 这个 叫做 neural ocean 是 吧? 说 英文 的话, 对的 对。 然后 你们是 大概是 往 哪个 方面 做 这个 商业化 应用 的 呢? 这个 技术 实现 起来 还需要 多久? 然后 我们 能 看到 你们的 demo.

我们 其实 是 专门 解决 关键技术。 我们 也会 跟 下游 的 集成商 一起 合作。 其实 在 国内 很多 的 机器人公司 其实 都 具有 很强 的 集成 能力。 像 核心 元 部件 的话, 我们 可以 作为 一个 标准 平台 出售。 类 脑 计算, 我们 也可以 把 它 作为 一个 平台, 由 客户 下游 的 客户 他们 来 进一步 集成, 去 打 一些 具体 的 垂直 场景。 所以说 我们 自己 其实 不会 把 自己 限制 在 具体 一个 垂直 场景 上, 我们是 一个 基础 技术 公司。

电脑 计算 可能 发展 的 是 其实 也 比较 快 的。 我们 认为 在 未来 两年 内, 可能 会 形成 一个 很强 的 一个 商业 应用 的 一个 前景。 甚至 有可能 会 成为 一个 新的 一个 学术 的 一个 风向标。 很多 原来 做 深度 学习 的 人 可能 会 发现, 一个 完全 不一样的 思维 体系 能够 带来 更多 的 解锁, 更多 的 潜力。 可能 会 发生 这样 一个 转变。 我们 未来 应该说 很快 也会 有 一些 发布 关于 内 脑 计算。 之后 也会 把 零 销售 相关 的 demo 发布 出来。

就说 他们 把 这 几个 拆出来, 都 是一个 能够 自成 一个 体系 的 产品 和 技术 方向。 所以 在 最终 的 我们 能 看到 机器人 在 产 线上 能够 真正 的 代替 人 之前, 其实 这 一些 就 已经 能够 商业化 了。

是的, 你 比如说 像 自动驾驶 汽车, 现在 大家 想做 全自动 驾驶, 就是 这个 F S D。 他 主要 还是 在 使用 老 路线, 像 这个 路径 规划, 还有 包括 深度 学习。 其实 如果 当 大家 发现, 如果 要是 转变 到 类 脑 视觉, 类 脑 的 决策 这样 一个 方法 上, 那 发现 有可能 原先 解决不了 这些 问题, 现在 可能 突然 就 解决 掉了。 所以说 类 脑 计算 其实 是 有 非常 广 的 应用。

其实 它 就是 在 人工智能 能够 替代 领域, 它 应该 都 能够 涉及 是 吧?

它的 特点 主要是 解决 需要 复杂 认知 的 环节。 那么 在 算法 的 这个 精确性 上, 可能 他 还 不一定 能够 替代 掉 一些 这种 以 数据 为主 的。 比如说 像 数据挖掘, 还有 比如说 像 这种 生成 网络, 就是 干 这种 可能 还不 适合 替代。 但是 对于 这种 需要 复杂 的 认知 的, 比如说 要 能够 对 所 看到 的 场景 能够 进行 深度 理解, 要 能够 形成 语言, 甚至 要 形成 像 情景记忆 那种 都是 属于 是 类 脑 计算 的 范畴。

其实 如果我们 要 再 回到 生产 替代 人工 人力 这样的 一个 领域 的话, 你 估计 什么时候 我们 能 看到 这样的 一个 真正 的 有 机器人 开始 在 工厂 里面 开始 试用?

可能 也就是 在 最近 的 一两年 内。

他 做 的 这个 task 基本上 是 还是 比较简单 的, 还是 能够 处理 一些 稍微 复杂 一点 的。 因为我 知道 可能 有 一些 实验室 里面 的, 然后 可能 是 一些 偏向 化学 的, 或者 是 一些 辐射 的, 就 这些 比较 对人 有 危险性 的那 比如说 是我 了解到 的, 比如 像是 一个 比较简单 的 task, 就是 在 包装 上面 贴 贴纸。 有的 时候 这 一个 任务 确实 是 看起来 简单, 但是 需要 人 把 它 来完成。 因为你 贴 的 歪 了 或者 是 贴 的 不 正确, 其实 是 会 造成 整个 产品 的 它的 被 打 回来。 对, 我不知道 这个 最早 的 能够 实现 的 是 什么样 的 一些 工种 呢?

一方面 是从 技术 的 实现 度 来看, 另外一个 是从 客户 的 痛点 上 来看。 我们 发现 这 两个 问题 都 结合 的 特别 好的。 一般来说 还是 在 生产线 上 的 一些 比较 危险 的 操作。 而且 这些 操作 操作 对象 往往 是 刚体, 还有 一些 介于 缸体 和 纯 柔 体 之间 这样的 物品。 像 这个 贴标签 这种, 虽然 说 它 也是 个 难点, 但是 从 客户 的 痛点 角度 上 讲, 它 不够 痛。

就 刚 说 的 这个 缸体 和 这个 软体 是 怎么说 的? 就是 比较 硬 的 物件 和 比较 柔。 柔软 的 物件 是吗?

可以 这么 理解, 他们 因为 柔软 就是 用 灵巧 手 来做 可能 更好 一些。 还有 包括 一些 这种 形状 不规则 的 复杂 曲面 的 物体, 比如说 像 开 个 门 这种 门把手, 还有 像 这种 自动化 实验室 里面 的 这种 各种 不同 形状 的 仪器, 都是 属于 是 联 销售 来解决 的。 非常 好的 对象。

好的, 那 我 觉得 我 这边 问题 差不多, 你 有什么 需要 可能 再加 一下, 我没有 问 到 的。

其实我 想 跟 大家 分享 一些 我的 一些 心得 和 收获。 在 发展 技术 的这 条 路线 上, 其实 有 很 多种 可能。 其实我 从小 就在 了解 人体, 学习 人体解剖, 然后 从 骨骼 到 肌肉, 到 后面 开始 学习 的 神经系统, 发现 其实 它 里面 可以 借鉴 的 部分 真的 非常 多。 未来 很有可能 还有 很多 的 技术, 实际上 是 通过 我们 对 人体 的 内在 观察 来 解锁 的。 另外 一点 是我 认为 要 重视 基础科学, 像 神经科学 这 一种。 咱们 国家 其实 在 基础科学 上 其实 发展 的 起步 稍微 晚 一些, 在 神经科学 方面 尤其 如此。 欧美 可能 还是 目前 走 的 最快 的, 其实 应该 借助 基础科学 的 发展, 再 滋补 工程学 的 发展。 然后 我们 会有 更 越来越多 的 可以 产业化 落地 的 技术, 还有 新兴 的 更 上层 的 商业模式。

就是 我们 要 改变 我们的 这个 技术 研发 的 思路, 就 是从 不管 是 类 脑 还是 从 人体 的 这样的 构造, 我们 来 发现 一个 新的 思维方式。 说不定 可能 比 我们 现在 已有 的 现存 的 这样的 技术 研发 路线 要 更 加快 更加 好。 是的, 好的, 非常感谢 华龙 今天 做客 我们的 节目, 帮 我们 科普 了 这个 人形 机器人, 包括 类 脑 计算, 然后 包括 灵巧 手 这 一方面 的 最前沿 的 这样的 一些 技术。

非常感谢 华龙, 谢谢 丁 教主。

这 期 what nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G 艾特 声 点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现, 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。

如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是在 公众 号 文章 中 扫 码 添加, 或者 是 公众 号 后台 回复 科技 早知道, 即可 获取 邀请码。 期待 你的 加入, 我们 下期 见。