We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2024.12.16 每日AI论文 | 视频理解新突破,AI探索3D环境。
11:21
Share
2024/12/16
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
阿波罗:大型多模态模型中的视频理解探索
GenEx:生成可探索的世界
协同生成-VL:基于视觉专家和令牌折叠的图像理解与生成
BiMediX2:多模态生物医学专家大模型
大规模动作模型:从构想到实现
实例感知结构化字幕:通过实例感知结构化字幕提升文本到视频生成
FreeScale:通过无调谐尺度融合释放扩散模型的分辨率
ObjectMate:面向对象插入与主体驱动生成任务的循环先验方法
FireFlow:图像语义编辑的快速校正流反演
基于显式桥梁和检索增强的多模态音乐生成
FluxSpace:在修正流变换器中解耦语义编辑
SCBench:以KV缓存为中心的长上下文方法分析
SmolTulu:更高的学习率与批量大小的比率可以提升SLMs的推理能力
Prompt2Perturb (P2P): 基于文本引导扩散的乳腺超声图像对抗攻击
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.