我介绍了当前AI发展的一个根本性问题:AI究竟是真正理解了我们教给它的东西,还是仅仅在进行高级的模仿和统计猜谜。AI的能力有时强大到不可思议,有时又显得笨拙,这背后反映了AI是否真正理解所学内容,还是仅在模仿和统计猜谜。AI需要能够从海量数据中领悟到最底层、最根本的规则和结构,从而实现举一反三。
我引用了一篇论文,该论文从全新的角度解释了神经网络如何通过梯度训练发现符号结构。训练AI模型类似于蒙眼人在山坡上下山,目标是到达最低点。论文提供了一个更高级的视角,关注的是大量个体在山坡上的整体分布和流动趋势,而非单个个体的具体路径。AI模型的参数不再是孤立的点,而是一个概率分布,训练过程是这群人整体寻找最低点的过程。论文发现,几何约束是AI模型在训练过程中自动排好队形并领悟隐藏规则的关键。在具有对称性的几何约束下,群体会朝着碗底滑动,行动路线变得简单一致。论文的核心洞察在于,给AI模型的训练过程加上特定的几何约束,能将复杂问题分解为简单的子问题。在几何约束下,个体只需解决一个从高到低的一维问题,最终完成复杂的总体任务,AI在此过程中发现解决问题的符号结构。
我阐述了几何约束引导下产生的两个副产品:代数结构的浮现和维度的降低。模型参数的最终分布之间存在代数规则,可以像乐高积木一样进行拼接组合。通过组合不同的AI模块,可以构建更强大的可组合的AI能力。在训练过程中,系统会自动甩掉不必要的复杂性,收缩到一个更简单、更低维的有效状态。这篇论文描绘了一幅全新的图景,解释了AI如何可能实现顿悟。
我总结了该论文的三点重要启发:AI的智能源于精心设计的约束,引入正确的几何结构和对称性至关重要;未来的AI可能是可组合的,可以通过模块化构建AI;设计新的AI架构时,可以有意识地考虑如何嵌入几何和代数原理。机器的学习过程可以涌现出秩序结构和规律,类似于人类掌握事物背后的规律和结构。
Deep Dive