We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.05.26 | TabSTAR提升表格数据分类性能;QwenLong-L1优化长文本推理
11:01
Share
2025/5/26
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
TabSTAR:具有语义目标感知表征的表格基础模型?
QwenLong-L1:基于强化学习的长文本大型推理模型?
推理模型是顽固的:诊断推理模型中的指令覆盖问题?
Quartet:原生FP4训练对于大型语言模型是最优的?
万法归一:视觉三元统一强化学习?
利用检索和代码工具将大型语言模型Agent提炼到小型模型中?
PhyX:你的模型具备物理推理的“智慧”吗?
QwenLong-CPRS:通过动态上下文优化迈向无限长的语言模型?
基于测试时演化搜索的图像和视频生成扩展?
模型早已知晓最佳噪声:视频扩散模型中基于注意力的贝叶斯主动噪声选择?
VeriThinker:通过学习验证来提高推理模型的效率?
MOOSE-Chem3:通过模拟实验反馈实现实验指导下的假设排序?
AudioTrust:音频大语言模型多方面可信度基准测试?
FullFront:跨越完整前端工程工作流程的多模态大语言模型基准测试?
谎言教学:基于合成负样本的课程DPO用于幻觉检测?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.