We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2024.12.05 每日AI论文 | 提升文本到图像扩散模型,生成沉浸式360度视频。
10:44
Share
2024/12/5
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
SNOOPI:超强一步扩散蒸馏与适当引导?
Imagine360:从透视锚点生成沉浸式360度视频?
扩散模型在高效3D LiDAR场景补全中的蒸馏方法?
PaliGemma 2:多功能视觉语言模型的迁移研究?
TokenFlow:多模态理解和生成的统一图像分词器?
VARCO-VISION:拓展韩国视觉语言模型的前沿?
NVComposer:通过多张稀疏和未定位图像提升生成新视角合成?
视频-3D大语言模型:学习位置感知视频表示用于3D场景理解?
CleanDIFT:无噪声扩散特征?
MIDI:单张图像生成多实例3D场景的新方法?
一图一语:从单张图像生成全身说话虚拟形象?
米米尔:提升视频扩散模型在精确文本理解中的应用?
硝基融合:通过动态对抗训练实现高保真单步扩散?
加权奖励偏好优化用于隐式模型融合?
Inst-IT:通过显式视觉提示指令调优提升多模态实例理解?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.