We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.03.17 | 新相机轨迹生成,稀疏性提升图像质量
11:08
Share
2025/3/17
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
ReCamMaster:基于单视频的相机控制生成式渲染
PLADIS:通过利用稀疏性,在扩散模型推理时突破注意力机制的限制
对抗性数据收集:用于高效和鲁棒机器人模仿学习的人机协作扰动
关于有效性和效率的技术:状态空间模型综述
API智能体与GUI智能体:差异与融合
联邦学习的脆弱性探索:梯度反演攻击深度解析
面向视频内容理解的大规模预训练
FlowTok:在文本和图像Token之间无缝流动
TxAgent:一个用于跨工具领域进行治疗推理的AI Agent
Kolmogorov-Arnold注意力机制:可学习的注意力机制更适合视觉Transformer吗?
VGGT:基于视觉几何的Transformer
Cockatiel:集成合成数据与人类偏好训练,实现细致的视频描述
相邻自回归建模:用于高效视觉生成
ProJudge:一个基于多模态大语言模型的过程评估器的多模态多学科基准和指令微调数据集
ARMOR v0.1:通过非对称协同的交错多模态生成增强自回归多模态理解模型
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.