We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.07.02 | 多模态推理提升;双向嵌入优化
08:49
Share
2025/7/2
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
GLM-4.1V-Thinking:基于可扩展强化学习的通用多模态推理能带来哪些变革?
MoCa:模态感知持续预训练如何提升双向多模态嵌入效果?
SciArena:科学文献任务中基础模型的开放评估平台有何意义?
数学推理能力是否能提升通用大语言模型的能力?
径向注意力:用于长视频生成的具有能量衰减的O(n log n)稀疏注意力机制有什么优势?
DiffuCoder:理解并改进用于代码生成的掩码扩散模型
HumanOmniV2:基于上下文理解到全模态推理的飞跃
超越Token:从脑启发智能到通用人工智能的认知基础及其社会影响
语言模型训练中的数据效能如何评估?
FreeLong++:通过多频段频谱融合实现免训练长视频生成
IR3D-Bench:评估视觉-语言模型作为智能体进行逆向渲染的场景理解能力
Peccavi:一种针对AI生成图像的视觉释义攻击安全且无失真的图像水印技术
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.