We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2024.12.06 每日AI论文 | 视觉压缩提升效率,代码监控增强机器人可靠性。
15:43
Share
2024/12/6
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
视觉压缩:视觉语言模型中长度并非必要优势?
代码即监控:约束感知的视觉编程用于反应性和前瞻性机器人故障检测?
Aguvis:统一纯视觉自主GUI交互代理?
噪声值得扩散引导?
评估语言模型作为合成数据生成器?
结构化3D潜在表示在可扩展和多功能3D生成中的应用?
MV-Adapter:多视角一致图像生成变得简单?
负向标记合并:基于图像的对抗特征引导?
佛罗伦萨-VL:通过生成视觉编码器和深度-广度融合增强视觉语言模型?
大语言模型的密度定律?
无限:高分辨率图像合成中的比特位自回归建模?
面向通用足球视频理解?
HumanEdit:一个高质量的人类奖励数据集,用于基于指令的图像编辑?
任意服装虚拟试穿:基于潜在扩散模型的可定制多服装生成?
全球MMLU:理解和解决多语言评估中的文化和语言偏见?
个性化多模态大语言模型:综述?
ZipAR:通过空间局部性加速自回归图像生成?
MRGen:基于扩散的可控数据引擎用于无标注模态的MRI分割?
判别性微调的大视觉语言模型?
Monet:Transformer的单语义专家混合模型?
全流:多模态校正流的任意到任意生成?
KV移位注意力增强语言建模?
Marco-LLM:通过大规模多语言训练实现跨语言增强?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.