凯迪: 我报道了中国新创公司深度求索研发的DeepSeek大型语言模型,它在多项测试中表现与OpenAI的模型相当,但成本却低得多。然而,美国方面质疑DeepSeek可能使用了蒸馏技术,从OpenAI模型中提取知识,涉嫌窃取知识产权。白宫人工智能沙皇萨克斯也表示这可能是真的,OpenAI正在调查此事。一些分析师认为DeepSeek的成功更多依赖于蒸馏技术而非创新,而DeepSeek公布低成本数据的目的可能是为了打击美国公司。美国国防科技公司创始人拉奇也指出,媒体报道中存在炒作成分,DeepSeek并未完全公开其开发成本。
萨克斯: 我认为DeepSeek可能窃取了美国的知识产权。有充分证据表明,DeepSeek从OpenAI的模型中提取了知识。美国人工智能公司将采取措施保护他们的模型不被蒸馏,这将减缓山寨模型的发展速度。
克克·乌爵: 深度求索是否能够使用现有的大型语言模型来提炼他们的结果是一个问题,这似乎在讨论中出现了很多次。人们说,我不知道这其中有多少是真正前沿的。
霍丹·奥马尔: DeepSeek的确取得了一些值得认可的创新成就。其效率和性能源自多项创新的结合,关键策略之一是混合专家,通过允许模型的不同部分专注于特定任务来降低训练成本。他们还应用数据量化来显著缩小AI参数,同时保持准确性。
拉奇: 媒体铺天盖地地引述DeepSeek的说法,但这些消息的炒作成分居多。外界不必过度相信,也不要上了中共宣传的当。DeepSeek并未完整公布它们开发两种模型的成本,媒体也忽略了DeepSeek仍有很大一部分的基础设施成本不为人知。它们公布这个数字的目的,是为了重挫美国公司。
Deep Dive