We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
back
2025.02.19 | 数据高效语音处理,嵌入空间压缩创新。
14:35
Share
2025/2/19
HuggingFace 每日AI论文速递
AI Chapters
Transcribe
Chapters
声波:减少数据需求,优化语音与文本对齐在LLMs中的应用?
将1568个Token压缩到一个向量并再次解压:探索嵌入空间容量的极限?
连续扩散模型用于语言建模?
幻影:通过跨模态对齐实现主体一致性视频生成?
重新思考通过主成分分析进行多样化人类偏好学习?
SoFar:语言引导的方向桥接空间推理与对象操作?
SafeRoute:大型语言模型中高效且准确的安全防护栏的自适应模型选择?
多模态Mamba:通过二次到线性蒸馏的解码器多模态状态空间模型?
你没有充分利用Transformer的表示能力?
熔岩:多模态AI代理的基础模型?
FLAG-Trader:融合LLM与基于梯度的强化学习用于金融交易?
RealSyn:一种有效且可扩展的多模态交错文档转换范式?
PAFT:与提示无关的微调?
OctoTools:一个具有扩展工具的复杂推理代理框架?
重新审视o1类模型的测试时缩放能力:它们是否真正具备测试时缩放能力?
MUDDFormer:通过多路动态密集连接打破Transformer中的残差瓶颈?
HealthGPT:通过异构知识适应实现医疗大视觉语言模型的统一理解与生成?
HeadInfer:通过分头卸载实现高效的LLM推理?
文本到世界:大语言模型符号世界模型生成的基准测试?
用于马尔可夫LLM测试时扩展的原子思维?
Shownotes
Transcript
No transcript made for this episode yet, you may request it for free.