接下来咱们来聊个特别前沿特别有意思的话题人工智能里的读心术你可能会说陈老师你这是标题党吧 AI 怎么会读心术呢别着急听我给你掰扯掰扯咱们今天就借着一篇刚刚出炉的论文意图条件流占用模型来看看 AI 领域的高手是怎么思考问题的以及这事对我们普通人有啥启发
想象一下你想训练一个 AI 让他成为全世界最牛的司机你手上有什么呢有海量的来自互联网的行车记录仪视频这数据够大了吧好最直观的想法是什么呢很简单 AI 跟着学呗视频里的人往左打方向盘 AI 就学着往左打视频里的人
视频里的人踩刹车 AI 就学着踩刹车这在机器学习里有个朴素的名字叫模仿学习或者行为克隆听起来挺靠谱对吧但问题马上就来了你想想这些视频里的司机他们的心思是一样的吗张三着急上班一路见缝插针那是赶路模式李四带着家人周末郊游慢悠悠的开那是观光模式
王武呢是个新手战战兢兢那是紧张模式如果呀你的 AI 把这些行为呼伦吞枣的全学了会发生什么他会变成一个精神分裂的司机一会猛如虎一会慢如龟你敢坐他的车吗你看问题的关键就浮现出来了同样的行为背后可能隐藏着完全不同的意图
只模仿表面动作不理解背后的动机永远只能是学徒成不了大师这篇论文的作者们就抓住了这个痛点他们说要想训练出真正聪明的 AI 也就是强化学习里的智能体光看动作不够必须同时干两件大事第一要猜透意图
从杂乱无争的数据里反推出行为背后的那个隐藏的心思第二要预见未来基于这个心思预测出接下来可能会发生的所有情况这篇论文的核心贡献就是打造了一个叫 inform 的系统把这两件事都给漂亮的解决了第一招叫做猜意图那怎么猜呢
Inform 的科学家们想到了个绝妙的办法他们假设一个司机在连续的一小段时间里他的意图是不会变的比如你决定要超车那接下来的几秒钟内你的操作都会围绕这个意图来
于是 AI 就看一小段连续的驾驶片段比如从 A 点到 B 点再到 C 点他利用从 B 到 C 的这段行为来反推司机的意图是什么这个过程在论文里叫变分意图推断说白了就是通过一个人的后续行为来理解他之前的动机这像不像一个侦探通过你后面的脚印来判断你一开始想去哪儿
第二招叫预见未来怎么预见呢猜到了意图之后就好比给 AI 开了天眼它不再是简单的预测下一秒方向盘该打多少度而是干一件更高级的事儿
他会动用一个叫流匹配的超酷的数学工具来描绘一幅未来可能性热力图什么意思呢就是说在赶路模式这个意图下接下来的一分钟车辆可能会出现在哪些位置形成一片概率云他预测的不是一个点而是未来的可能性空间也就是论文里说的占用模型
这一下格局就打开了从预测下一步升级到了描绘整个未来有了这两招 Inform 这个系统就厉害了
当他面对一个全新的任务比如请把车开到三公里外的超市他会怎么做呢他不会傻乎乎的从零开始学他会调动自己运训练时学到的无数种意图在脑子里快速的盘算如果我用赶路模式会怎么样如果我用稳健模式又会怎么样哪些意图组合能让我得到的奖励最高比如更快更安全的到达
那更绝的是他不是简单的从学到的意图里挑一个最好的来用而是像一位几百家之常的大宗师他会把几种最优意图的精髓融合起来创造出一个全新的更适合当前任务的超级策略这在论文里叫隐世广义策略改进这个过程更稳定也更强大
实验证明它比那些硬挑一个最好的方法性能提升了 44%而且稳定性提高了 8 倍
最终结果是什么呢在 36 个模拟机器人任务和 4 个基于图像的复杂任务上 InfoM 的表现非常惊人相比之前的方法它的任务成功率中位数提升了 1.8 倍成功率直接提高了 36%特别是在一些需要长远规划的复杂任务上比如让机械臂完成一系列精细操作
之前的方法基本都抓瞎了而 inform 却能取得重大突破好技术部分说完了那这事到底能给我们带来什么样的启发呢第一我们可以重新理解学习的深度我们常常说要向优秀的人学习怎么学是仅仅模仿他们的言行举止吗今天这篇论文告诉我们这是最浅层的
高手学习是穿透行为的表象去理解对方做这件事背后的意图和心法你看如果有一个销售冠军你学他怎么说话怎么递名片可能收效甚微但是如果你能琢磨出他是怎么跟客户沟通时内心真正的意图是建立信任还是展示专业还是创造紧迫感那你才算学到了精髓
第二是从单点预测到空间感知普通人做决策往往是线性的我做了 A 就会有 B 但 Inform 告诉我们高手思考是空间性的
当我带着某个意图去做 A 的时候未来不是一个确定的 B 而是一片包含了 B、C、D 各种可能性的概率云这启发我们在做重要决策的时候不要只盯着那个最想要的结果而是要问自己我做这件事会把我带入一个怎么样的可能性空间
这个空间里最好的情况是什么最差的呢平均来看这个空间对我有利吗拥有这种空间思维你的决策质量才会大大提升第三真正的成长是融合创新而不是择优复制
当我们面对众多选择的时候下意识的反应是 pick the best 选那个最好的但 Inform 的影视广义策略改进给了我们一个更高级的思路也就是融合 synthesize 一个好的管理者不是全盘复制另一家成功公司的模式而是吸收多家公司模式的优点结合自身情况创造出自己独特的打法
一个优秀的学生不是只学一个老师的风格而是博彩众长形成自己的知识体系所以今天咱们通过一篇 AI 论文其实探讨了成为一个高手的三个核心要素洞察意图预见空间融合创新
这篇名叫 Inform 的论文不仅为人工智能的发展提供了强大的新工具也为我们每个追求成长的人点亮了一盏思维的探灯记住不要只做一个动作的模仿者要做一个意图的洞察者和未来的创造者