We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.01.29 | RL泛化优,SFT稳定输出;FP4量化降成本,精度保持。
06:45
Share
2025/1/29
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
监督微调记忆,强化学习泛化:基础模型后训练的比较研究?
优化使用FP4量化的超大语言模型训练?
过度分词的Transformer:词汇量通常值得扩展?
机制解释性中的开放问题?
DiffSplat:利用图像扩散模型进行可扩展的3D高斯喷洒生成?
低秩适配器与神经架构搜索在大语言模型压缩中的应用?
IndicMMLU-Pro:在多任务语言理解上评估印度语言大型语言模型?
道德故事:评估道德一致性的法语数据集?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.