We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.07.01 | 多模态生成领先;视频扩散效率提升
11:05
Share
2025/7/1
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
Ovis-U1 技术报告能带来哪些创新?
VMoBA:视频扩散模型的混合块注意力机制如何提升效率?
书法家:自由风格的文本图像定制有何独特之处?
图像偏好:视觉语言模型中基于监听者奖励的思考有何意义?
SPIRAL:多智能体多轮强化学习如何激励推理?
基于图结构几何注意力机制的稳定ToF深度图像去噪有何优势?
上下文演化提示:一种开放式、自复制的视角?
视觉语言模型能否在推理时扩展中实现真正的自我验证?
MEMFOF:面向内存高效多帧光流估计的高分辨率训练?
SparseLoRA:通过上下文稀疏性加速LLM微调?
UrbanLLaVA:具备空间推理与理解能力的多模态大型语言模型?
MARBLE:多模态空间推理与规划的硬基准?
教语言模型说工具的语言有何挑战?
VOCABTRIM:用于LLM高效推测解码的词汇表剪枝?
RoboScape:物理信息驱动的具身世界模型?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.