“某种意义上讲,人就是活在幻觉中,只要自恰就可以。”
DeepSeek R1的横空出世,让“长思维链”这个技术圈的专业术语走进了公众视野。但在这场技术革命的背后,一个更深层的问题正在浮现:AI真的学会思考了吗?
从OpenAI的O1到DeepSeek的R1,从快思考到慢思考,从预训练到推理时代——这不仅是技术路径的演进,更像是人工智能向着真正的“智能”迈出的关键一步。当模型开始展现出类似人类的“深思熟虑”,当它们能够通过长达数万字的推理过程解决复杂问题时,我们是否正在见证通用人工智能(AGI)的曙光?
下一代推理新范式是什么?系统一和系统二的融合为何如此困难?
本期《会友镖局》,我们邀请到武威,这位从北大数学系走出、历经微软亚洲研究院和微软小冰的AI科学家,一位既有深厚数学功底又富有哲学思辨的技术人,将为我们深度解析推理范式革命的本质。
让我们跟随武威的视角,一起探索这场正在发生的AI思维革命。
👩 本期人物
主持人: 蚂蚁集团 友红 嘉宾: 蚂蚁技术研究院自然语言处理负责人 武威
⏱️** 本期时间轴**
**02:27 R1的历史意义,开启长推理链时代 **从技术圈视角评价R1的两大贡献:一是以极低成本快速复现了OpenAI O1的效果,二是公开技术细节推动了整个行业发展。在O1发布后,由于OpenAI未公布任何技术细节,整个行业都在猜测其实现方式。直到R1公布了通过强化学习实现长思维链的方法,大模型领域才真正进入了“长推理链时代”。
**08:47 从Scaling Law到Test Time Scaling **面对“Scaling Law是否见顶”的质疑,武威提出了新视角:当训练数据接近枯竭时,“Test Time Scaling”成为新的突破口。用建造宫殿来做比喻:预训练像收集材料,而推理时计算则是如何组合这些材料。即使材料有限,通过不同的组合方式仍能创造出无限可能。
14:58 推理的本质,是用逻辑组合出新的知识
追溯到2011年Bottou的论文和明斯基的《思维社会》,推理就是“代数组合已有知识去解决新问题”,包含三个关键要素:代数结构、知识组合、新问题求解。人脑中有许多小的Agent,在复杂问题来临时被激活并组合,形成解决方案。
**21:18 幻觉与认知,人类也活在“幻觉”中 **用数学家伽罗瓦的故事说明,我们可能因为没有见过或理解某些事物而认为它是幻觉。“某种意义上讲,人就是活在幻觉中,只要自恰就可以。”这引发了对AI“幻觉”问题的深层思考:关键不在于消除幻觉,而在于构建自恰的认知体系。
**29:25 当前范式的困境——用语言模型做推理的无奈 **“为什么大家还是去接受这样的一个范式?因为目前来看最有效的就是这么一个范式。”,我们知道用语言模型做推理不是最优解,但找不到更好的方法。现在的做法本质上还是“Token by Token”的概率生成,缺乏专门的推理数学模型。
36:34 从“做题家”变成“产品经理”,才是推理模型的未来
当前的推理模型主要在解决数学、编程等结构化问题,像是“做题家”。但未来的推理应该能够泛化到更广泛的领域:成为优秀的产品经理、销售人员等。这需要模型不仅能够逻辑推理,还要理解人类需求、进行创造性思考。
**45:36“ 多”、“快”、“好”、“省”,推理模型的发展路径 **短期来看,推理发展有两条清晰路线:一是提升效率,解决R1等模型太慢、成本太高的问题;二是扩大应用范围,从数学编程扩展到理解人类偏好、情绪等更多领域。长期目标是找到推理的正确数学模型,实现真正的快慢思考融合。
**50:02 什么是真正的智能? **引用明斯基的观点,真正的智能是当问题来临时,系统能够找到最优的Agent组合,并以最优方式串联解决问题。这涉及两个最优选择恰当的能力单元,以及用最低能耗的方式组合它们。从处理到理解到生成到推理,这是AI从单点发展到组合的必然过程。
🎯 核心观点
· **DeepSeek R1的历史意义:**不在于技术本身,而在于通过开源推动整个行业进入长推理链时代
· **Test Time Scaling是新方向:**当训练数据枯竭,如何在推理时更好地组合知识成为关键
● **推理即是组合:**用逻辑(代数结构)组合已有知识解决新问题
· **当前范式的局限:**用语言模型做推理是"用锤子当螺丝刀",需要专门的推理架构
· **从专才到通才:**未来推理需要从解题泛化到更广泛的创造性工作
· **认知的自恰性:**关键不在于消除幻觉,而在于构建自恰的认知体系
· **智能的本质:**找到最优的能力单元组合,以最低能耗解决复杂问题
🏢** 关于蚂蚁技术研究院**
蚂蚁技术研究院是蚂蚁集团的前言技术研发机构,在自然语言处理、机器学习、安全计算等前沿领域持续投入,致力于推动人工智能技术的创新与应用。
运营:狐狸 更多节目信息,欢迎关注小红书:会友播客 添加小助手微信:huiyouhz,可以加入听友群喔