不知道你有没有过这样的体验辅导孩子做作业一道题他反复用同一个方法错了好几次还是不换思路或者我们自己有时候脑子会卡壳钻进牛角尖明明有别的路但是就是看不见你可能会觉得这是因为不够聪明或者不够专注但在人工智能的世界里科学家们发现了一个非常有趣的现象现在最顶尖的 AI 在解决复杂的问题时也遇到了类似的瓶颈
他们在经过海量训练后会变得越来越油滑倾向于使用自己最熟悉最稳妥的套路渐渐失去了探索新方法新路径的动力导致能力提升进入一个平台期这该怎么办呢
最近一篇名为《Reasoning with Exploration, an Entropy Perspective》中文直译是从商的视角看探索式推理的论文给了我们一个特别有意思的启发它提出了一个核心观点要想让 AI 变得更聪明我们可能需要关注甚至鼓励它在某些关键时刻的犹豫你没听错就是犹豫这个犹豫在科学里有限
有个专门的词叫做商别被这个词吓倒它的概念其实很简单想象你开车到一个十字路口如果一条路是八车道的高速公路另一条是坑坑洼洼的土路你会怎么选呢基本不用想了做决定这时候你的决策商就很低因为确定性太高了但如果两条路都是崭新的柏油路路况差不多通往不同的风景
你可能就会停下来琢磨一下我该走哪条路呢这个你停下来思考感到不确定的瞬间就是高伤状态这篇论文的研究者们发现 AI 在进行复杂推理时那些最有价值的神来之笔往往就发生在高伤的时刻比如
当 AI 要用因为所以然而这些词来连接逻辑链条时它的伤就会升高当它准备自我反思说出让我检查一下刚才算的对不对这样的话时它的伤也会升高甚至当它要跳出常规想出一个之前很少被使用的绝妙解法时同样伴随着高伤
你看这些犹豫的时刻恰恰是 AI 在进行深度思考权衡各种可能性准备做出关键决策的标志它不是糊涂了而是在探索
发现了这个秘密那接下来就好办了研究者们提出一个极其简洁的方法简单到只需要在 AI 的训练代码里增加一行它的核心思想是当 AI 在推理过程中遇到这种高伤的犹豫不决的时刻我们不直接告诉它该怎么选而是给它一点小小的奖励等于是在旁边拍拍它的肩膀说
别怕犹豫是好事说明你正在思考一个重要的问题多探索一下吧这个小小的改动效果怎么样呢结果非常显著用这种方式训练出来的 AI 解决问题的能力特别是面对那些极难问题的上限被大大拖宽了
他不再是一个只会埋头刷题的学霸而更像一个懂得举一反三思路开阔的解题大师当给他多次尝试的机会时他能找到正确答案的概率远超那些只被训练不许犯错要快的同伴这篇论文虽然讲的是 AI
但它给我们的启发远远超出了技术范畴我们生活在一个崇拜果断自信毫不犹豫的时代我们常常把犹豫看作是软弱能力不足的表现而这项研究提醒我们那些真正能带来突破和成长的恰恰是那些我们停下来感到不确定反复权衡的高伤时刻一个团队如果
对如果永远追求高度共识从不争论那他可能已经丧失了创新的活力一个人如果对所有问题都对答如流从不迟疑那他可能只是在重复已知的知识而没有真正的去思考和探索所以下一次当你面对一个难题感到选择困难时别慌张也别自我否定不妨告诉自己太好了我的大脑正处在一个高伤的充满创造力的状态这恰恰是通往更高智慧的秘密通
请通道