We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.03.12 | 东南亚数据集创新构建,大模态模型推理能力显著提升
11:01
Share
2025/3/12
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
众包、爬取还是生成?创建东南亚视觉语言数据集SEA-VL
LMM-R1:通过两阶段基于规则的强化学习赋予3B参数大模态模型强大的推理能力
YuE:扩展开放基础模型用于长篇音乐生成
UniF²ace:基于统一多模态模型的细粒度人脸理解和生成
MagicInfinite:用你的文字和声音生成无限对话视频
SegAgent:通过模仿人类标注者轨迹探索多模态大模型的像素理解能力
Seedream 2.0:一种中英双语图像生成基础模型
双子座嵌入:从双子座模型中获得可泛化的嵌入
Transformer中的隐式推理是通过捷径实现的
LightGen:通过知识蒸馏和直接偏好优化实现高效图像生成
无需调参的多事件长视频生成通过同步耦合采样
通过元强化微调优化测试时计算
OmniMamba:基于线性架构的高效统一多模态理解和生成模型
CineBrain:自然视听叙事处理中的大规模多模态脑数据集
视频动作差异分析
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.