We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2024.12.12 每日AI论文 | 多视角视频生成突破,复杂场景模型提升
11:09
Share
2024/12/12
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
SynCamMaster:同步多视角视频生成
LAION-SG:用于训练复杂图像-文本模型的增强型大规模数据集与结构化注释
POINTS1.5:构建面向实际应用的视觉语言模型
在注意力中学习流场用于可控人物图像生成
风格大师:艺术生成与转换的视频风格化
生成密集化:学习在高保真泛化三维重建中密集化高斯分布
流媒体聊天:与流媒体视频互动
3DSRBench:一个综合的3D空间推理基准
Mogo:用于高质量3D人体运动生成的RQ分层因果Transformer
KaSA:知识感知奇异值适应大型语言模型
FlowEdit:基于预训练流模型的无逆向文本编辑
StyleStudio:基于文本的风格迁移与风格元素选择性控制
MIT-10M:大规模多语言图像翻译并行语料库
自引导数据飞轮的语言引导导航学习
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.