We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.04.03 | MergeVQ高效生成高质量图像,类R1-Zero提升视觉空间推理。
10:53
Share
2025/4/3
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
MergeVQ:一种用于视觉生成和表示的高效框架?
类R1-Zero训练如何提升视觉空间推理?
动漫玩家:基于下一代游戏状态预测的无限动漫人生模拟?
VideoScene:提炼视频扩散模型以一步生成3D场景?
DreamActor-M1:基于混合引导的整体、富有表现力且鲁棒的人体图像动画?
理解类R1-Zero训练:一个批判性的视角?
基于视觉语言模型规划的物理合理视频生成?
PaperBench:评估人工智能复现人工智能研究的能力?
ScholarCopilot:训练用于学术写作并提供精确引用的大型语言模型?
ILLUME+:通过双重视觉Token化和扩散细化照亮统一的多模态大语言模型?
基于视频扩散模型的铰接运动学提炼?
保障视觉-语言模型安全:缓解基于扰动攻击中高斯噪声的脆弱性?
DASH:视觉语言模型系统性幻觉的检测与评估?
通过直接偏好优化提升人体图像生成模型?
LSNet:观其大,聚焦小
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.