We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.05.29 | 熵机制提升模型性能;令牌路由优化推理效率。
11:29
Share
2025/5/29
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
用于推理语言模型的强化学习的熵机制如何提升模型性能?
R2R:通过大小模型令牌路由高效导航不同的推理路径
Skywork开放推理器1技术报告
夏洛克:视觉-语言模型中的自我纠正推理
基于GRPO的无监督后训练如何提升多模态LLM推理能力?
SWE-rebench:一个用于软件工程代理任务收集和去污染评估的自动化流程
SageAttention2++:一种更高效的SageAttention2实现
通过强化学习与冷启动如何推进多模态推理?
通过预测下一事件如何促进视频推理?
RenderFormer:基于Transformer的三角形网格全局光照神经渲染
DeepResearchGym:一个免费、透明且可复现的深度研究评估沙盒
链式缩放:通过尺度自回归和偏好对齐实现极限超分辨率
通用推理器:一个用于冻结LLM的单一、可组合的即插即用推理器
SVRPBench:一个面向随机车辆路径问题的真实基准
跨语言质量评估:一种基于语言模型的多语种预训练数据过滤方法
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.