欢迎来到太快报我是小爱大家好我是小 T 闲话不多说咱们这就开聊先从一个贴近生活的话题开始吧想象一下你在写文章时卡壳了 AI 能不能跳出来帮你润色句子甚至提出新思路有一篇论文就研究了这个标题是 writing as a testbed for
人单来说,这篇论文把写作当成一个试验场,用来测试 AI 的开放性能力所谓开放性就是 AI 面对没明确答案的任务时能不能灵活应对写作是个绝佳例子,因为它既需要创意又得符合逻辑,还得讨读者喜欢研究者找了三个顶尖 AI 模型 Gemini 1.5 Pro Cloud 3.5
Sonic 和 GPT-4O 让他们当写作助手看看他们能做什么那结果怎么样 AI 真能当我的写作小帮手吗可以 但也有短板他们发现这些 AI 很擅长添置家业比如丰富细节或扩展段落但不太会删减或批判就好比你写了一堆 AI 只会说再加点这那啊
不太会说这个删掉吧太啰嗦这跟人类编辑习惯差别挺大我们改稿时常会大刀阔斧精简内容有点像只会做加法的助手不会做减法那他写出来的东西质量如何质量因模型而异 Gemini 1.5 Pro 表现最好改出来的文章最受人类喜欢但所有模型都有个问题他们有时分不清哪些改动是锦上添花
哪些只是话舌天足而且如果让 AI 反复改稿文章可能会慢慢跑偏偏离你原本想表达的意思这叫语意飘移听起来 AI 写作助手还得进化内论文有什么建议吗对他们提了几点很实际的方向
比如让 AI 学会减法思维不仅会加内容还会删冗余再比如提升 AI 的自我判断让它能挑出真正有用的建议还有结合人类反馈让 AI 更懂我们的喜好未来 AI 可能不只是助手而是能跟你深度合作的写作搭档那我很期待写作时有个聪明搭档灵感枯竭也能救急接下来换个场景
如果 AI 不止帮你写作,还能帮你查资料,算数字,甚至解决复杂问题会不会很酷?第二篇论文 Chain of Tools:Utilizing Massive Unseen Tools in the COT Reasoning of Frozen Language Models 就聊了这个,能不能通俗点解释一下?
当然这篇论文的核心是让 AI 变成一个超级工具箱想象你有个助手不仅会聊天还能随时掏出计算器搜索引擎甚至一些你没见过的工具来帮你比如你问 2025 年全球人口会是多少他能自己找数据做计算再推理出答案这叫工具链推理英文是 Chain of Tools 简称 CO2 听起来像把 AI 升级成了万能助手它是怎么做到的
研究者用了一种巧妙办法他们没去改动 AI 的核心而是给他加了几个小插件一个判断要不要用工具一个挑出合适的工具一个执行工具操作 AI 本身是冻结的就是不调整他原本的能力只靠这些插件让他学会用工具而且这些工具可以是 AI 以前没见过的比如一个新开发的计算公式或数据库那他能用多少工具不会挑花眼吧
实验里他们准备了上千个工具 AI 居然还能挑得准用得好比如数学题它能调用计算器问知识它能翻数据库相比传统的 AI 要么只能用训练实践过的工具要么得靠人类手把手教 CO2s
灵活多了,关键是效率高,不用每次都重新训练大模型这不就是未来的全能 AI 吗?我在家问他菜谱,他还能帮我算热量没错,论文还做了个新数据集,里面有 1836 个工具专门测试 AI 能不能应付没见过的工具结果证明这种方法不仅实用,还能扩展到更多场景未来你可能真能有个 AI 助手随手解决生活里的大小问题
这么聪明会不会自己进化出新本领第三篇论文 self-organizing graph reasoningevolves into a critical statefor continuous discoveryso structural semantic dynamics 标题有点长但听起来很有意思这是什么
这篇论文研究 AI 如何通过图推理自己进化图推理就像一张知识网点式概念显示它们的关系研究者发现 AI 在构建这张网时会自然进入一种临界状态有点像大脑在灵感迸发和冷静思考之间的平衡点在这状态下 AI 能不断发现新东西临界状态听起来像物理学里的概念怎么用在 AI 上
对灵感就来自物理学和生物学他们用两个指标衡量这张网结构商看连接有多复杂语意商看内容有多丰富结果发现语意商总是稍微压过结构商
这让 AI 倾向于探索新奇的想法,而不是指优化已有结构。比如它可能会突然连起两个看似无关的概念,产生惊奇边缘。惊奇边缘是什么惊喜?就是那些乍看不相关但连起来很有意思的发现。比如音乐和数学看似远,但 AI 可能会发现它们在节奏和模式上有联系,这种边缘占了 12%左右,是创新的源泉。
论文说这就像自然界里的进化 AI 也在自发寻找新突破那它能一直惊喜下去吗?理论上可以他们还设计了一个强化学习方法让 AI 主动追求这种状态未来这种自我进化的 AI 可能在科研艺术等领域帮我们找到意想不到的灵感 AI 这么厉害训练它是不是很费劲?第四篇论文 Trajectory Balance with Asynchronous Decoupling Extremities
L1 post 定好像有新招能讲吗?当然训练 AI 通常很慢因为传统方法是边探索边学习像一个人边走边记录这篇论文提出个新框架叫 TBAE 意思是把探索和学习分开干探索部分像侦察兵跑出去找新路学习部分像参谋坐下来分析路线这样分工后训练速度能快四倍以上分开干
那他不想做的事是他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己做的事,他自己
比老方法强在哪 除了快还更聪明传统方法容易钻牛角尖 只优化眼前的东西 TDA 因为数据多样 能找到更广的解法尤其在奖励少的任务里比如测试 AI 安全性时 它能挖出更多潜在问题未来这种方法可能让 AI 训练又快又全面最后一个话题很吸引人第五篇论文 Probabilistic Functional Neural Networks 说 AI 能预测未来趋势最靠谱的
靠谱而且很实用这篇论文提出了 Profinet 一种能预测高维函数时间序列的神经网络简单说就是预测一堆复杂数据随时间的变化比如日本的死亡率曲线它不仅告诉你未来可能是啥还能说这预测有几分把握比天气预报还高级怎么做到的
他用一种潜溃神经网络加上概率建模传统方法像循环神经网络得一步步推过去算起来慢又容易出错 ProFastNet 直接看全局能一次预测多个时间点和区域还能告诉你每个预测的可信度比如在死亡率预测里他比老方法准还能看出哪些地区可能互相影响那他能用在哪些地方? 潜力很大
比如公共卫生可以预测疾病趋势金融里能估算市场波动甚至城市规划能分析人口变化关键是它速度快数据量大也能应付未来可能是大数据预测的利器今天的五篇论文真是脑洞大开从写作助手到超级工具箱再到自我进化快速训练和预测未来 AI 的潜力让我目瞪口呆咱们今天的太快报就到这里谢谢大家的收听下期再见下期见拜拜