我認為DeepSeek的出現確實改變了美中AI競爭的格局。過去,大型語言模型領域主要由美國主導,但DeepSeek通過模仿OpenAI的推理模型,並開源模型權重,縮短了與美國的差距,使得中國AI發展速度逼近美國。DeepSeek並非完全的從零到一創新,而是將現有技術(混合精度訓練、多專家模型、模型蒸餾等)結合,使其性能逼近OpenAI的模型,但尚未超越。DeepSeek可能存在利用ChatGPT數據訓練模型或模型蒸餾的問題,這在業界是常規操作,但可能違反OpenAI的使用守則,是否構成剽竊或侵犯知識產權尚無定論。DeepSeek的『幻覺』概率高於ChatGPT,原因可能是其訓練數據(Common Crawl)和模型調整方面存在不足。DeepSeek的模型偏見體現在其訓練數據主要為中文簡體,並帶有強烈的中國官方媒體論述,這導致其回答會傾向於維護國家主權和黨的領導。DeepSeek的R1模型訓練過程中,雖然號稱無需人類反饋的強化學習,但在實際操作中,仍然存在人為干預,導致模型偏見和自我審查。DeepSeek強化了思維鏈(Chain of Thought),使其在解決數學題和編程問題方面表現出色,但在人文社科領域容易過度發揮,導致回答更不準確。中國AI發展環境的特殊性(例如審查制度)並不一定阻礙其發展,甚至可能促進其在特定領域發展出獨特的優勢。開源模型的普及使得小型公司也能參與AI發展,這改變了以往只有大型科技公司才能參與AI的局面,類似於個人電腦的普及對計算機產業的影響。全球AI發展趨勢都是利用開源模型,中國只是更積極地利用這一趨勢。好的算法可以提高效率,從而部分彌補算力不足,但算力仍然是AI發展的重要因素。AI發展最終取決於應用場景,開源模型的普及促進了AI應用的百花齊放,但算力競爭不會結束,軟體工程和應用落地將成為新的競爭焦點。美國對中國的晶片出口管制雖然不能阻止中國研發先進模型,但會減緩其商業化和應用速度,開源模型和軟體工程的進步反而會增加算力需求。DeepSeek雖然號稱開源,但其開源程度不足,但其公開的模型權重已足夠大部分用戶使用。DeepSeek通過模仿OpenAI的方法,實現了與O1相近的性能,但其真正開源供用戶使用的基礎模型並非R1,而是參數更少的Llama和千問。DeepSeek號稱便宜,是因為其使用的基礎模型參數較少,成本較低,但这並不意味着其技術能力就比其他模型更節省成本。開源模型的普及增加了對GPU的需求,因為更多小型公司和機構開始投資建設內部AI基礎設施,這將創造一個全新的AI落地市場。在中国境內運行的AI服務都存在數據安全風險,DeepSeek也不例外,其數據洩露案例已有所體現,這與中國相關法律法規有關。美國AI界應吸取DeepSeek的教訓,重視開源和開放合作,避免閉源策略導致的生態系統受限。美國副總統在巴黎AI峰會上的講話,旨在警告歐洲不要與中國在AI領域過度合作,但歐洲更注重以人為本的AI發展,並不會輕易放棄自身的法規和價值觀。监管和创新并不一定相互违背,合理的监管甚至可以促进创新。