We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.06.05 | 紧凑强大视觉模型;多阶段训练提升推理能力
11:34
Share
2025/6/6
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
MiMo-VL 技术报告
多模态推理进阶:从优化冷启动到分阶段强化学习
AmbiK:厨房环境中歧义性任务数据集
CASS:基于数据、模型和基准的Nvidia到AMD的转译
长文本语言模型的可控评测
SuperWriter:基于反思机制的LLM长文本生成
MMR-V:未尽之言?视频中多模态深度推理的基准测试
基于捷径神经元分析建立可信赖的大语言模型评估体系
航行者:用于可探索3D场景生成的长程和世界一致的视频扩散
IllumiCraft:用于可控视频生成的统一几何与光照扩散
扩散模型驱动的图像编辑程序化
Ψ-采样器:基于SMC的评分模型中用于推理时奖励对齐的初始粒子采样
VisCoder:微调大型语言模型以生成可执行的Python可视化代码
通过在单一问题上进行评价微调来释放预训练大型语言模型的推理潜力
LayerFlow:一种用于分层感知视频生成的统一模型
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.