大家好,我是小爱,很高兴在泰快报我们又见面了。大家好,我是小 T,本期我们聚焦五项泰前言研究,每一项都充满了惊喜和启发。第一项研究是关于访可梦对战的 AI 叫 PokeChamp,AI 还能玩游戏,这听起来很酷,它是怎么?
确实很酷,PokeChamp 的核心是用了一种叫 mini max 的经典算法简单说就是料敌先机,在每一步都假设对手会做出对自己最不利的选择然后找出最佳应对,这个算法很早就用于下棋但宝可梦对战更复杂,因为信息不全比如你不知道对手的下一只宝可梦是什么研究者在这里加入了大型语言模型让 AI
不仅能计算还能猜心思预测对手的行动甚至估算每一步的价值哇 这就像一个忌讳算又会读心的游戏大师那他有多厉害呢非常厉害他在宝可梦对战平台上拿到了 1300 到 1500 的爱洛平分相当于人类玩家前 10%到 30%的水平更惊人的是他用了一个只有 80 亿参数的小模型居然打败了更强大的 GPT-4O 驱动的对手
勝率高達 64%這說明不是模型越大越好而是方法對了更重要這讓我想到一句老話四兩撥千斤那他是怎麼用小模型做到這麼強的好比喻他靠的是語言模型提供的聰明直覺比如在對戰中他能根據已有信息快速篩選出最可能的行動
而不是像传统 AI 那样算遍所有可能,这就像一个经验丰富的玩家,凭感觉就知道下一步该出什么招。而且研究者还建了一个超大的宝可梦对战数据库,超过 300 多万场真实比赛,AI 从中学习人类玩家的策略。
太厉害了 我感觉 AI 从游戏里学到的东西可能不只是玩游戏吧你说的太对了 PokeChamp 的框架可以推广到其他需要决策的领域比如自动驾驶或者商业博弈想象一下 AI 能在不确定的环境中快速做出聪明选择这对未来的影响会很大不过它也有短板比如对对手的预测还不够灵活遇到狡猾的策略可能会吃亏
看来 AI 也有需要进步的地方但能在游戏里这么聪明未来肯定更值得期待接下来是图神经网络小 T 这是什么东西听起来有点高深别担心我用个简单的比喻想象图神经网络是一个社交侦探它的工作是分析人与人之间的关系网比如在社交媒体上它能看出谁是朋友谁是关键人物
图神经网络特别擅长处理这种关系数据不像传统 AI 只看单独的点它能看整个网络哦 像是找出朋友圈里的隐藏大 V 那这项研究有什么新发现研究者用物理学的方法分析了图神经网络发现它有个问题叫过平滑
就好比偵探查案時線索太多反而混在一起 分不清誰是誰他們證明加深網絡層數比如從一層到兩層能讓偵探更敏銳 看到更遠的聯繫但如果層數太多 不加調整 線索又會模糊所以他們加了殘差連接就像給偵探配了個助手幫他記住重要細節那連續圖神經網絡又是怎麼回事
这是个很酷的概念他们发现如果层数无限多同时调整好连接强度图神经网络会变成一个连续版性能接近理论上的最优状态就像侦探的推理能力达到巅峰能完美破解关系网
这不仅提升了理论理解还给实际设计提供了指导听起来像是给 AI 侦探开了挂它能用到哪里呢应用可多了比如推荐系统能更精准的猜你喜欢什么金融领域能更快发现欺诈网络未来它可能帮我们分析更复杂的系统比如生态网络或者城市交通
不过它现在还局限在特定数据类型上真实世界的复杂性是个挑战真没想到 AI 还能当社交侦探太有意思了第三个话题是扩散模型这是什么跟画画有关吗你猜得挺准扩散模型是现在很火的生成技术比如生成逼真图片的 AI 就常用
想像一个艺术家先画个模糊的草稿然后一点点添细节最后变成精美画作扩散模型也是这样从一堆噪声开始逐步擦掉杂乱部分深层清晰的内容那秘密普遍是什么听起来好专业我来解释研究发现扩散模型学东西有个顺序先学会大的明显的特征比如画人时先勾了脸的轮廓
然后才慢慢填细节像眼睛的纹路这个顺序跟特征的大小有关大的快小的慢时间差呈现密率规律就像艺术家先搭框架再精雕细琢那这对生成图片有什么影响影响很大如果训练时间不够模型可能只学会大框架
框架细节就模糊比如生成的人脸可能眼睛怪怪的研究者建议可以通过调整数据或模型让他更快抓住细节提升画质原来 AI 画画也有先大后小的习惯未来他能干嘛未来他可能生成更逼真的电影画面甚至帮设计师快速出草图
不过现在他对复杂结构的细节处理还不够完美比如用卷积网络食谱片的解释还需深入研究 AI 艺术家听着就让人期待第四个研究是 START 这是个什么 AI 他会自己学习吗没错 START 就像一个自学成才的学生他的特别之处在于能自己学会用工具比如 Python 编程来解决复杂问题
这也太聪明了吧
解决什么问题他在博士级科学问答竞赛级数学题和编程任务上都表现惊艳比如在数学题中他的准确率比基础模型高了 15%以上甚至跟顶尖模型不相上下他把思考链和工具结合
解决了 AI 容易想错的问题那工具对他有多重要非常关键工具就像学生的笔记本和计算器能帮他验证想法避免出错比如解数学题时他可以用 Python 算出精确结果而不是凭空猜未来这种能力可能让 AI 在科研或工程中大放异彩自学成才的 AI 真是不可思议
有什么需要改进的吗?有,比如他现在主要用 Python,工具种类还不够多,提示设计也得靠人自动化是个方向,不过他已经展示了 AI 自学的潜力。最后一个话题,语言模型如何超越人类语言网络,这是什么意思?这是一个关于 AI 和人脑的对比研究。
他们发现语言模型的脑区对齐也就是模仿人类语言处理的方式主要靠语法和句法这些形式能力而不是世界知识或推理这些功能能力而且这种对齐在训练早期就稳定了之后模型能力还在提升但跟人脑的相似度没太大变化那它怎么超越人类了超越是指它的语言能力超出人类比如生成复杂文本或翻译超快
但研究发现这种超越可能不是模仿人脑而是走了一条不同的路比如人脑靠语法和语义并重而 AI 可能更依赖模式识别这说明 AI 的思考跟我们不一样这会不会影响我们的生活肯定会比如在教育里它能生成个性化教材在医疗里能快速分析病例对话不过我们的小心因为它跟人脑的差异可能导致误解
未来设计 AI 时的考虑这一点 AI 的路跟人类不一样真让人深思未来会怎样呢未来 AI 可能会进一步模拟人脑也可能发展出独特的智能我们需要更多研究找到两者的平衡点今天的五项研究真是让人大开眼界小 T 你觉得这些突破有什么共同点
他们都展现了 AI 的多样性和进化能力从游戏到图像从自学到语言 AI 在不同领域都找到了突破口他们告诉我们 AI 不只是工具更像一个不断长长的伙伴未来可能改变我们的生活方式说得太好了感谢小 T 的精彩讲解也谢谢大家收听本期《太快报》我们下期再见下期见拜拜