We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.04.28 | 视频相机运动理解提升;多模态推理模型优化
08:00
Share
2025/4/28
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
迈向理解任意视频中的相机运动?
Skywork R1V2:用于推理的多模态混合强化学习?
BitNet v2:用于1-bit LLM的具有哈达玛变换的原生4-bit激活?
360°视野——弥合视频理解中的文化、语言和领域差异?
大型语言模型能否助力多模态语言分析?MMLA:一个综合性的基准?
稀疏前沿:Transformer LLM 中的稀疏注意力权衡?
基于解耦身份与运动的主体驱动视频生成?
DianJin-R1:评估并提升大型语言模型中的金融推理能力?
DC-SAM:通过双重一致性实现图像和视频中的上下文分割?
Kimi-Audio技术报告?
优化意大利语大型语言模型:通过词汇调整减少Token冗余并提高效率?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.