本期的 5 篇论文如下:
[00:35] TOP1(🔥83) | 🧠 HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs(华佗GPT-o1:迈向医学复杂推理的大语言模型)
[02:49] TOP2(🔥65) | 🤖 OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis(OS-Genesis:通过逆向任务合成自动化GUI代理轨迹构建)
[04:50] TOP3(🔥63) | 🎨 1.58-bit FLUX(1.58位FLUX:首个成功量化最先进文本生成图像模型的方法)
[07:00] TOP4(🔥60) | 🔍 Explanatory Instructions: Towards Unified Vision Tasks Understanding and Zero-shot Generalization(解释性指令:迈向统一视觉任务理解与零样本泛化)
[09:02] TOP5(🔥53) | 📚 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining(2.5年课堂:用于视觉-语言预训练的多模态教科书)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递