We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.04.01 | 多文本渲染新方法,电影级对话角色合成
11:40
Share
2025/4/1
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
TextCrafter:复杂视觉场景中准确渲染多个文本?
MoCha:面向电影级对话角色合成?
大型语言模型中测试时扩展的调查?
Open-Reasoner-Zero:一种基于基础模型扩展强化学习的开源方法?
RIG:端到端通用策略中推理与想象的协同?
通过思维干预有效控制推理模型?
查询与征服:执行引导的SQL生成?
SketchVideo:基于草图的视频生成与编辑?
用于电信诈骗检测的音频-文本慢思考数据集?
大型推理模型高效推理综述?
基于LLM生成启发式的经典规划:用Python代码挑战最先进水平?
利用可验证奖励扩展强化学习至多样化领域?
渐进式渲染蒸馏:无需3D数据即可调整Stable Diffusion用于即时文本到网格生成?
TokenHSI:通过任务Token化统一合成物理人-场景交互?
KOFFVQA:一个针对大型视觉-语言模型在韩语中进行客观评估的自由形式VQA基准?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.