We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.06.30 | 3D视觉编辑;视频令牌压缩
10:47
Share
2025/7/1
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
BlenderFusion:基于3D的视觉编辑和生成式合成?
LLaVA-Scissor:基于语义连通分量的视频LLM令牌压缩?
XVerse:通过DiT调制实现对身份和语义属性的多主体一致性控制?
ShotBench:视觉-语言模型中专家级电影理解?
从理想到现实:面向真实场景的统一且数据高效的密集预测?
MiCo:用于增强视觉推理的多图像对比学习?
Pangu Pro MoE:用于高效稀疏性的分组专家混合模型?
细粒度偏好优化如何提升视觉语言模型中的空间推理能力?
Ark:一个用于机器人学习的开源Python框架?
噪声一致性训练:一种在学习额外控制时用于单步生成器的原生方法?
自动化LLM竞速基准:复现NanoGPT的改进?
Gazal-R1:通过参数高效的两阶段训练实现最先进的医学推理?
Confucius3-Math:一个用于中国K-12数学学习的轻量级高性能推理大语言模型?
RetFiner:用于视网膜基础模型的视觉-语言精炼方案?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.