本期的 5 篇论文如下:
[00:42] TOP1(🔥107) | 🧲 Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights(拖拽式大语言模型:零样本提示到权重)
[02:39] TOP2(🔥80) | 💡 Light of Normals: Unified Feature Representation for Universal Photometric Stereo(法线光照:用于通用光度立体的统一特征表示)
[04:59] TOP3(🔥79) | 🖼 Vision-Guided Chunking Is All You Need: Enhancing RAG with Multimodal Document Understanding(视觉引导分块:增强RAG的多模态文档理解方案)
[07:07] TOP4(🔥66) | 🎨 OmniGen2: Exploration to Advanced Multimodal Generation(OmniGen2:迈向高级多模态生成的探索)
[09:18] TOP5(🔥59) | 🖼 ShareGPT-4o-Image: Aligning Multimodal Models with GPT-4o-Level Image Generation(ShareGPT-4o-Image:通过GPT-4o级别的图像生成能力对齐多模态模型)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递