小爱和小T介绍了五项AI前沿研究。首先,Google DeepMind利用多动作值模型(MVAV)使大型语言模型在国际象棋等棋类游戏中达到人类特级大师水平,无需依赖外部棋类引擎。该模型能够理解棋盘状态并评估每一步棋的价值和策略,结合蒙特卡洛树搜索,在有限时间内做出高质量决策。
其次,MIT的研究探讨了大型语言模型在上下文学习中如何形成和使用内部概念,提出了概念编码解码机制,将复杂概念分解成可分离的表示来进行决策,这有助于理解AI的思考过程。
第三,上海大学和慕尼黑大学开发了一种新的神经网络架构,能够从数据中发现物理概念和控制方程,成功重建了从哥白尼的日心说到量子力学的多个经典物理理论,使AI能够像科学家一样从实验数据中发现自然规律,为理论物理研究和未知领域探索提供了新的工具。
第四,约翰·霍普金斯大学的研究提出了压缩思维链框架,通过压缩token来提高推理效率和准确性,减少推理延迟并保持高质量的结果,这对于实时应用如智能助理和及时翻译尤为重要。
最后,特伦托大学和布鲁诺凯斯勒基金会提出了Smooth方法,一种系数混合专家架构,用于连续控制任务中的可解释强化学习,提高了决策透明度和可解释性,同时保持了高性能,这对于需要高透明度的应用场景如医疗诊断和自动驾驶特别重要。
Deep Dive