We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.06.09 | 常青问题分类提升问答系统;多模态融合优化音频描述。
11:00
Share
2025/6/10
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
明日依旧为真吗?多语种常青问题分类以提升可信赖的问答系统
FusionAudio-1.2M:通过多模态上下文融合实现细粒度音频描述
扩展模态是通向全模态的正确路径吗?
音频感知大语言模型作为语音风格的评判者
利用自注意力机制实现LLM中输入依赖的软提示
STARFlow:用于高分辨率图像合成的可扩展隐式归一化流
MORSE-500:一个程序化可控的视频基准,用于压力测试多模态推理
PartCrafter: 基于组合潜在扩散Transformer的结构化3D网格生成
桥接视角:关于以自我中心和以外部视角进行跨视角协同智能的调查
3DFlowAction:从3D流动世界模型中学习跨具身操作
前缀分组器:通过共享前缀前向传播实现高效的GRPO训练
CodeContests+: 针对竞争性编程的高质量测试用例生成
物理场景的点云重建:从不完美的机器人数据实现端到端的真实到仿真
HASHIRU:用于混合智能资源利用的分层代理系统
少量真知:用于高效多模态推理的高价值数据选择
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.