cover of episode WTR | 最像人的语音助手;DeepSeek开源周;GPT-4.5发布;小米双Ultra发布会

WTR | 最像人的语音助手;DeepSeek开源周;GPT-4.5发布;小米双Ultra发布会

2025/3/2
logo of podcast 一周科技回顾 | WTR

一周科技回顾 | WTR

AI Deep Dive AI Chapters Transcript
Topics
招招: 我认为DeepSeek开源的工具虽然对大规模集群训练有用,但对大多数人来说用处不大,因为它们需要Hopper架构的GPU和大量的集群。这更像是DeepSeek展示自身技术实力的一种方式。不过,DeepSeek开源的工具对Hagenweiss的OpenRE项目是有用的,因为它能用于大规模训练模型,这对于他们下一步用DeepSeq RE训练千文和Llama等模型至关重要。 关于亚马逊的Alexa Plus,我认为它将LLM集成到语音助手是一个非常有意义的举动,它实现了复杂问答和智能家居控制的结合,这在业界是领先的。许多厂商未能将大模型集成到语音助手,亚马逊的Alexa Plus领先一步。 Claude 3.7 Sonnet在代码生成方面表现出色,设计出的网页美观且功能完善,这弥补了此前Anthropic未及时推出竞争产品的不足。InceptionLabs推出的Mercury模型推理速度很快,但性能不如领先的Transformer模型。 GPT-4.5预览版虽然在人类偏好测试中胜率较高,但性能不如一些推理模型,而且价格昂贵,这让我对OpenAI的策略产生质疑。Sesame实时语音交互AI助手延迟低,拟人化程度高,这与OpenAI的高级语音模式相比有显著优势。Sesame的低延迟源于其较小的模型规模。 AMD发布的RX 9070和9070XT显卡价格合理,供货量充足,这与NVIDIA形成了对比。AMD还发布了基于深度学习的FSR4超分辨率模型,性能与NVIDIA的DLSS相当,但目前支持的游戏较少。 小米发布的小米15 Ultra是常规升级,而小米CyberOne赛车性能强劲但质感一般。 飙飙: 我同意招招的观点,DeepSeek开源的工具对于大多数开发者来说实用性不高,因为其应用场景局限于大规模集群训练。Alexa Plus的出现确实领先于其他厂商,将LLM与语音助手结合,实现了更智能的交互体验。 Claude 3.7 Sonnet的代码生成能力令人印象深刻,其生成的网页设计精美且功能完善。Mercury模型的高速推理能力值得关注,但其性能与现有领先模型仍存在差距。 GPT-4.5的发布时机和定价策略确实令人费解,其性能并没有显著提升,反而不如一些推理模型,高昂的价格也限制了其应用范围。Sesame的实时语音交互体验非常出色,其低延迟和拟人化程度都远超OpenAI的Advanced Voice Mode。 AMD新发布的显卡性价比很高,供货也比NVIDIA充足,这对于消费者来说是个好消息。FSR4超分辨率技术的性能与DLSS相当,但游戏支持数量有限,这需要进一步改进。 小米15 Ultra的升级相对常规,而CyberOne赛车则更具吸引力,其强大的动力系统是其主要卖点,但整体质感有待提升。

Deep Dive

Chapters

Shownotes Transcript

科技新闻

  • 00:25 DeepSeek 开源周
  • 11:19 亚马逊推出LLM驱动的 Alexa Plus
  • 08:55 Claude 3.7 Sonnet
  • 11:19 Inceptionlabs 推出扩散大语言模型 Mercury
  • 13:57 OpenAI 发布 GPT-4.5预览版
  • 17:01 Sesame 实时对话
  • 19:39 AMD发布RX 9070 和 9070XT
  • 25:12 小米发布小米15 Ultra和SU 7 Ultra

----------本期剪辑:钊钊