朋友你有没有发现一个特别有意思的现象今天的人工智能你让他写一首唐诗他文采飞扬你让他写个商业计划书他头头是道但是你给他一个稍微复杂点的数学题比如算个鸡兔铜笼他可能就算的乱七八糟了这不是很奇怪吗一个能理解人类语言微妙之处的文科高手怎么在铁面无私的数字面前反而成了一个数学学渣呢我们总觉得 AI 应该越来越好
越来越聪明无所不能才对但现实是它在某些地方表现得又强又笨这个矛盾就是今天所有顶尖 AI 面临的一个巨大挑战而我们今天要聊的这篇论文 CORTCode Integrated Reasoning Within Thinking 就为我们提供了一个极其巧妙的解法它的思路可能会颠覆你对智能的看法首先
首先我们得理解 AI 是怎么思考的现在厉害的 AI 特别擅长一种叫思维链也就是 chain of thought 的东西说白了它是像人一样一步一步地把思考过程写出来通过逻辑推理来解决问题这就像是一个文科生逻辑清晰能把道理讲得明明白白但问题来了你让这个文科生去算一个复杂的微积分
他算得再努力也可能因为某个计算小错误导致整个结果都错了这不仅慢而且不准怎么办最直接的想法是逼着这个文科生去疯狂补习数学让他自己变成一个理科状元但这条路太难了成本极高效果还未必好
而这篇论文的作者们换了个思路为什么非要逼着文科生自己算呢我们能不能给他配一个计算器再教他怎么用这个计算器呢这个计算器在 AI 的世界里叫做代码解释器 Code in
他就是一个绝对精确指哪打哪的理科高手 AI 负责思考和规划把复杂的计算任务外包给代码解释器然后拿着结果继续推理你看这个思路一变问题就从如何让 AI 自身更擅长计算变成了如何教会 AI 更聪明的使用工具好了思路有了但新的挑战又来了
你怎么教一个 AI 聪明的使用工具呢研究人员一开始尝试了一个简单的方法就是在问题开始之前给 AI 一个笼统的指令嘿 你可以用代码来解决问题哟结果怎么样 AI 确实开始用代码了但用的特别笨拙它最常见的行为模式是什么呢是事后诸葛亮它会先自己吭哧吭哧用文字推理算半天
得出个答案然后不放心地调用代码工具说你帮我验算一下看我算的对不对这效率多低啊就像我们自己用笔算了半天常处法最后再按一下计算器确认纯属浪费感情浪费时间对不对这时候这篇论文最精华的部分就登场了他们提出一个概念叫暗示工程 Hint Engineering 什么叫暗示工程呢就是不在一开始就给一个笼统的命令
而是在 AI 的思考过程中在最关键的节点给它一个恰到好处的暗示举个例子当 AI 思考到一步开始自己列数式准备硬算了研究人员就插入一个暗示这个计算看起来很繁琐咱们用 Python 代码来简化推理吧 AI 一听对哦就悄悄地去调用代码了当代码给出了精确的结果 AI 又开始犯嘀咕
想自己再验算一遍的时候研究人员又插入一个暗示咱们没必要怀疑 Python 计算的准确性 AI 一听有道理哦又信心满满的拿着结果往下走了这个过程像不像一个顶级的围棋教练在指导一个天才棋手他不是替棋手下棋也不是在赛前长篇大论而是在菜手最犹豫最可能犯错的那个瞬间轻轻点拨一下更是在
更觉得是什么他们实现了这个点拨和暗示只用了 30 个由人类专家精心制作的高质量样本在这个动不动就谈论海量数据的时代这简直是一股清流他告诉我们对于训练 AI 有时候少即是多高质量的巧数据远胜于低质量的大数据这个研究的结果非常惊人经过这种暗示工程训练的 AI 不仅解题的准确率大幅提升更重要的是
他的思考成本也就是消耗的计算资源 Tokens 降低了 30%到 50%这意味着什么呢这意味着 AI 学会了真正的聪明他不再是一个埋头苦干的笨学生而是一个懂得协同合作善用工具的项目经理
他学会了在自己不擅长的地方聪明地偷懒把专业的事交给专业的工具去做这给我们普通人有什么启发呢我觉得至少有三点第一管理的智慧在于暗示而非命令无论你是管理一个团队还是教育一个孩子生硬的命令往往效果不佳学学暗示工程在关键节点上给予你一个很好的教育
给予精准的点拨和提醒激发对方自己找到最优路径这才是更高明的管理艺术第二学习的真谛在于框架而非细节在这个知识爆炸的时代妄想掌握所有细节是不可能的我们真正的竞争力
在于建立一个强大的认知框架知道在什么时候什么地方去调用什么工具来解决问题你不需要亲自下场搬砖但你必须知道最好的砖在哪里以及如何使用起重机第三
真正的智能是集成智能这篇论文叫 CORTCode Integrated Reasoning Within Thinking 直译过来就是在思考中集成代码推理未来的强者无论是人还是 AI 都不是孤立的个体而是一个懂得如何将自身能力与外部工具外部智慧高效集成的超级节点所以
朋友们下次当你再为自己某些方面不如别人而焦虑的时候不妨想一想这个故事提升自己的方式未必是疯狂的补短版也可以是聪明的找外援学会如何思考远比知道所有答案更重要这或许就是通往更高智慧的必经之路