We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 你以为AI是学霸,其实它只是个“刷题匠”

你以为AI是学霸,其实它只是个“刷题匠”

2025/7/1
logo of podcast AI可可AI生活

AI可可AI生活

AI Deep Dive AI Chapters Transcript
Topics
我认为当前人们对人工智能的焦虑源于它在某些领域的卓越表现,例如解奥数题。然而,关键问题在于,人工智能究竟是在真正地思考,还是仅仅在执行计算。 最近的一篇论文深入探讨了大型语言模型在数学推理方面的能力,将解决问题的能力分为探索式、组合式和转换式三个层次。在探索式能力方面,人工智能尚可,但在问题复杂性增加时,正确率会急剧下降。这就像做菜一样,量大了就容易出错。即使一开始思路正确,人工智能也可能因为过度检查而导致错误。 在组合式能力方面,人工智能表现不佳,难以将独立技能组合起来解决新问题。这表明人工智能所学的技能是孤立的,无法融会贯通。最难的是转换式能力,即创造性思维。面对需要创新方法的问题,人工智能几乎完全失败,只会死磕常规方法。 因此,我认为现在的人工智能更像一个知识渊博、计算能力超强的刷题匠,而不是一个能灵活思考的数学家。这意味着我们不必过度焦虑,因为人类真正的价值在于人工智能无法企及的融会贯通和创造性思维。我们的核心竞争力在于连接不同领域的知识,形成新的洞见,并在绝境中找到创新解决方案。这也提醒我们,教育应注重培养孩子的跨界整合和创新思维,而非刷题。与其担心被机器取代,不如磨练我们身上那些机器味最少的能力。会刷题的是匠,而能跳出盒子思考的才是真正的大师。

Deep Dive

Shownotes Transcript

咱们现在都生活在一个被 AI 包围的时代很多人包括我有时候都会有点焦虑你看那些 AI 下棋能赢世界冠军画画能拿奖写代码比程序员还快尤其是在做数学题上有些 AI 已经能解答那些非常难的奥数题了这不得了啊感觉人类最引以为傲的理性思维马上就要被超越了于是就有人问 AI 这么厉害它到底是真的在思考还是只是在计算

他是个能举一反三的学霸还是一个只会埋头刷题套用公式的刷题匠你别说这还真是个好问题最近就有一篇名为《Omega 大型语言模型能在数学中进行跳出盒子的推理吗?对探索式、组合式和转换式泛化的评估》Omega-Kannelmas Reason Outside the Box in MathEvaluating Exploratory, Compositional, and Transformative Generalization 的论文专门研究了这件事这篇论文干了件什么事呢?

它设计了一个 AI 能力大闯关游戏把 AI 解决问题的能力漂亮地分成了三个层次我们可以用学做菜来打个比方这样更好理解第一关叫探索式能力这是什么意思呢就好比你学会了做番茄炒蛋一次能做一盘现在我让你做十盘给一个宴会用菜谱没变方法没变只是规模变大了计算量变复杂了 AI 在这一关表现怎么样论文发现还行但随着问题越来越复杂它的正确率会急剧下降

甚至归零这就像你做石盘菜总有那么一两盘会炒糊了或者盐放多了 AI 也会犯错而且问题越复杂它犯错的概率就越大有时候它明明一开始想对了但想得太多反复检查结果把自己给绕进去了最后反而改成了错误答案第二关叫组合式能力这个难度就上来了好比你不仅学会了番茄炒蛋还学会了烤面包片现在我让你做一份番茄鸡蛋三明治

这下你得动脑筋了怎么把两样完全不同的手艺有机地结合在一起什么时候放鸡蛋面包要不要烤酱料怎么配这考验的是融会贯通的能力论发现 AI 在这一关就有点力不从心了尽管研究人员分别训练 AI 学会了两种独立的技能但当遇到一个需要把这两种技能结合起来才能解决的新问题时 AI 就懵了表现得很差这说明什么它学会的技能是孤立的就像一个个独立的工具

但他不知道怎么把这些工具组合起来去完成一个全新的任务第三关也是最难的一关叫转换式能力这是什么境界呢就是创造性思维海纳做菜打比方你准备做番茄炒蛋结果发现没鸡蛋了怎么办一般人可能就放弃了但一个真正的大厨可能会集中生智说没关系我用豆腐来代替鸡蛋创造一道新菜叫番茄烧豆腐他完全跳出了原来的思维框架用一种全新的甚至有点离经叛道的方法解决了问题这

这篇论文发现 AI 在这一关基本上是完败当面对一个用常规方法算起来特别麻烦但只要换个思路就能迎刃而解的问题时 AI 几乎完全无法发现那个聪明的捷径它只会沿着老路死磕最后把自己累死在半路上好说到这儿这篇论文的结论就很清晰了第一现在的 AI 处理更复杂的老问题能力有限第二它很难将学到的不同知识融会贯通第三它几乎不具备跳出固有框架进行创造性思考的能力所以你看

AI 现在更像一个知识渊博计算能力超强的顶级刷题匠而不是一个能灵活思考充满创造力的数学家那这个发现对我们普通人有什么启发呢我觉得至少有两点第一我们不用过度焦虑了 AI 很强大但它强大的地方在于执行和计算而我们人类真正的价值恰恰在于那些 AI 目前还无法企及的地方组合式的融会贯通和转换式的创造性思维你的核心竞争力不是看你记住多少知识也不是看你算得多快

而是看你能不能把不同领域的知识连接起来形成新的洞见看你能不能在遇到绝境时跳出条条框框找到那个别人都想不到的解决方案第二这也给我们的学习和教育提了个醒如果我们还是在用刷题的方式去培养下一代那我们其实是在把他们培养成人型 AI 而这恰恰是未来最容易被替代的我们应该更注重培养孩子那种跨界的整合的创新的思维能力总而言之 AI 是一面镜子它照见了机器的能力边界也反过来让我们

让我们更清楚地看到了人类智慧的独特光芒与其担心被机器取代不如好好磨练我们身上那些机器味最少的能力毕竟会刷题的是匠而能跳出盒子思考的才是真正的大师