We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.04.04 | 智能体自主提升,视觉编辑推理重要。
11:06
Share
2025/4/4
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
具身智能体的进展与挑战:从脑启发智能到进化、协作与安全系统?
超越像素的展望:推理驱动的视觉编辑基准测试?
GPT-ImgEval:一个用于诊断 GPT4o 在图像生成中表现的综合性基准
重新思考视觉语言模型的强化学习扩展:一个透明的、从零开始的框架和综合评估方案?
交错语音-文本语言模型的规模化分析?
SkyReels-A2:视频扩散Transformer中的任意元素组合?
ShortV:通过冻结无效层中的视觉 tokens 实现高效多模态大型语言模型?
ZClip:用于LLM预训练的自适应尖峰缓解?
通用奖励建模的推理时扩展?
基于掩码选择性状态空间建模的音视频控制视频扩散,用于自然对话头部的生成?
基于大型语言模型的时间序列预测高效模型选择?
人工智能与机器人科学家在科学发现中的规模法则?
指令引导的自回归神经网络参数生成?
GenPRM:通过生成式推理扩展过程奖励模型的测试时计算?
解读免模型强化学习中涌现的规划能力?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.