如果我跟你说有一个 AI 模型它不仅免费开源而且还用了这个 OpenAI1%的预算就做出了 GBD4
级别的性能你会不会觉得这是一场 AI 界的革命呢老实说我觉得听起来就是太美好了我觉得一开始就是觉得不可能然后我后来就去看了一下论文才发现这好像是真的然后所以我后来上去用了之后才发现真的还蛮好用的没错这是真的那这款 AI 呢叫做 DeepSick R1 是 V3 之后的算是一个思考版本
有点像是在 Find2 一下 Find2 一下对对对那最近呢是 AI 界的超级话题那这个来自中国的开源 AI 模型呢不只让全球的开发者非常兴奋现在连
NVIDIA 微軟 Amazon 這些科技巨頭也都開始採用你去說採用不如說他們把這些模型放到他們的雲端裡面讓你可以快速的去使用不管是企業或是個人就是可以在雲端比如說 Collab 那些地方都可以直接部署那其實還有另外一件事情是大概是年初三之後吧很多國家開始禁止使用 Deep-Seek
没错像是澳洲啊意大利啊台湾啊还有美国军方啊现在都明确禁止使用 DeepSick R1 那这让人很好奇所以这到底是一场技术革命还是新的地缘政治冲突呢
今天我们要聊的不只是 DeepSick R1 它本身的技术还包括了它对全球 AI 产业甚至是国际局势的影响 DeepSick R1 到底有多强呢它的开源策略对 OpenAI 还有 Google 这些巨头会带来什么样的挑战呢为什么很多的国家对它又爱又怕呢不过说起来
你刚刚提到开源这个词它其实也没完全开源真的吗我们待会就要来谈论讨论一下这个事情那当然最重要的问题是这次 AI 战争的胜负会不会就此改变我要先来说吗我们就接着看下去我们看下去吧首先呢第一个部分我们要先跟大家聊一下 DeepSick R1 到底是什么那 DeepSick R1 这个 AI 模型厉害的地方在哪里呢盛伟你觉得我觉得有一件事情是
你們會不會好奇說就是我們明明已經有 ChargePT 了我們明明有 Cloud 了我們還有那個雖然現在不常用的 Gemini 但之後我覺得他大有可為因為之前有一些功能釋出那還有很多嘛
比如說 Mistral 或者是 LamaLama 就真的開源了你剛剛說開源這件事情那為什麼已經有這麼多模型了還要有人跳出來做這些模型而且還可以殺出重圍然後讓大家震驚 驚艷這樣子那這個問題呢其實簡單來說就是 DeepSick R1 會被那麼多人關注大概是三個原因第一個它很便宜第二個
他开源对开源要打一下我们待会再讨论他到底开到什么程度第三个就是他用了很多很聪明的技术来提升他的效能那首先我们要聊一下他的成本那 DeepSick R1 根据他的论文自己说他的训练成本大约就是 600 万美元这个要说明一下但是你认为是真样的吗
不是这个不是 R1 的训练车 R1 更便宜是 V3 的是 V3 的训练车我这边说明一下 V3 是 R1 是他们 Deep Seek V3 的一个你可以把它讲说是什么子类嘛就是 V3 下面有一个叫 R1 它是特别强化了推理模型这个概念所以它有点是在已有的 V3 的基础上面我在用一些资料让它可以练出具有推理能力的模型然后它的练法非常的令人惊艳大概是这样子
所以 R1 本身的训练成本不是这个 600 万美元 R1 是 V3 的所以相较之下如果我们要对比的话就是 OpenAI 它训练 TripGT4O 它的成本可能是几十亿美元对
或者几亿美元到底有没有到几十亿我不知道应该没那么高但是这个真的是不同量级的东西所以说很像是 DeepSeek 用 1%的预算就做出了可以跟 ChurchG4 一拼的 AI 而且 V3 的 Technology Report 里面也直接说明了就是他们在储存资料的算法是用伏点数只有 8 位数
平常都会用到 16 位数就等于是说它精准度非常低然后它就可以用那种很烂的显卡练然后同时还具有同样的效果所以它是一个很神奇的事情就是你看那篇论文你会觉得它很神奇但是猫腻也是在这边就是它神奇就是为什么等一下后面我们继续讲对
我们看到这个消息都会觉得说这个像是 OpenAI 和 Google 他们都是用航母在打仗而这个 DeepSeek 就造了一支性价比非常高的无人机舰队就打得有来有往这有点像是
实际上的确现在在台海战争很有可能就是操作这样就是不对称战争对不对称的那这个打来由来又往呢就让大家很害怕了所以这个它成本很低但是它表现真的好吗在以 R1 来说的话它在多个测试当中呢
表現都非常好例如說數學推理呢都甚至超越了 OpenAI 的這些最厲害的模型應該說跟 O1 跟 O1 比起來現在最厲害可能是 O3 啦但跟 O1 比起來的話已經這個不分軒輊對那再來呢就是它的
这个技术突破技术突破到底是怎样才有办法在那么少的钱然后做到那么好的品质呢目前看起来有几个关键字第一个叫做 Self-Reinforcement Learning 就是自监督强化学习这个其实已经蛮多在做这件事了对自监督学习其实就是
我講白一點 我講白一點就是假設我要做這件事情我會怎麼做我會我知道 Charge GPT 就是比如說現在 GPT 的 O1 是一個非常跑的模型好 那我現在有我練出來我自己的一個叫勝威一號的模型
这个盛惠一号是个白痴那该怎么办呢我可不可以就是盛惠一号在要回答我的问题之前先给 GBT-01 读一下然后给他来个评分说我真的觉得你这个盛惠一号说的真是有个狗屁不通的那我就把这个讯息再丢回盛惠一号然后跟他讲说你这个做的不好你重写然后就这样不断的自己这样重复之后那最后他吐出来的答案就是我要的东西
所以這就是所謂自制中其實就這個概念啦我就有一個目標的你也可以說它叫做 actor critic 模式就是我有一個行動者然後我同時有一個 critic 可以去監督我的行動者他的行動到底是不是正確的
那這一個技術在 R1 裡面有什麼厲害的地方是他沒有 critic 他是把 actor 跟 critic 都做在他自己的模型裡面他練的時候是只有一個步驟他沒有說我剛還要再傳給 ChargePT 說他是傳球有個師徒的概念他沒有 他就是自己是師徒
自己是詩 自己又是圖這樣子所以你這邊有提到他是 AlphaGo 的這個感覺是沒有錯的因為他在那邊用了所謂的就是那個打敗棋王的這個 DeepMind 的 AIAI 下棋 AI 他後面的那個版本 Zero 版 AlphaZero 他是 ZeroShot 去學會他不需要人告訴他棋譜了自己在那邊下給他規則他就可以了
那他怎么做到这件事我们之前在刚的那一个圣威一号的智障在传输的过程中其实是这样的圣威一号他有他自己的思考链他有他自己思考的过程我把这个过程给了 Church LGBT 请他评估他再回来
但你有沒有想過一件事如果他是一台電腦聖文一號是一台電腦他是不是可以一開始的時候就給我很多的可能性了那接下來就是只要去面對到我的人有一個回饋說這個答案是對的他其實可以去挑有點像下象像那個圍棋一樣去挑勝率最高的那個選擇點就好
所以他可以自己就在一些小小的资料规范之下可能只有几千笔的资料规范之下就有一个比较好的辨识他有没有办法得胜的模式所以他就可以用很小的资源然后也不需要去外面去对接而是所谓的自己就训练自己说对我应该要这样回答才是对的
真是一个好学生自己监督自己强化学习所以这边的你最希望的学生就是这样子都不用老师教这样所以这边 self-reinforced 不只是训练自己不只是有一个 tutor 可以就是一个 AI 的 tutor 在那边教他而是他自己本身就有学习能力
那剛剛說的這個東西他已經跳脫所謂的思維鏈就是所謂的 Train of thought 他是 Tree of thought 他是叫做思維術那這個概念也大概是去年年初的時候有開始在討論但老實講我那時候用不出來我不知道這是什麼東西但現在看到他這樣用的時候你一切都覺得合理了所以我覺得
某种程度上它在给我一些技术上的一些指引带来一些不错的方向对有时候比如说 DeepSync 出来之后我们当然就试用了嘛包括我还有安装本机的版本在电脑上面 7B 的版本在测试它然后就会看它自己在那边好像我们就看到好像看到一个人他在自己思考对然后在那边想那我接下来要怎么做呢我这样做好了可是我这样做好吗
就是说在那边自我对话自言自语在那个论文里面他写到那个啊哈 moment 所以他会有很多啊哈你知道吗对就是我觉得好像不是这样我从头再来一遍对很有趣因为其实我看的时候会觉得说他到底是在表演还是说他真的是我们还是看得很透明的看到他的想法就一样刚刚那个树状图我们想一件事他就是走到那个节点的时候突然发现这个所有的胜率都低于平均值了
所以应该要有一个新的方式可以提高胜率吧就是假设就 50-50 就是这种最 normal 的这种状态已经变 40%了我现在的这个节点上面所有的选择到最后的结果都是 40%以下那你是不是应该要回头想所以他的 Aha moment 你是可以想象说
是可以解構的但是在過往的一些思維上面我們可能會覺得說這東西在 AI 上面是不會產生的就是這啊哈 moment 所以這的確是個亮點他用完了這個技術之後有了這件事情那另外還有一個其實我們之前就有聊過的叫做 MOE
Mixer of Expert 就是這個技術中文要叫什麼混合專家模式混合專家模式那些技術可以讓 AI 變得更精準而且降低它的運算資源消耗那這個概念大概像什麼呢我們要怎麼描述這個如果是我現在來描述的話會說我們今天如果現在丟一個問題到 ChargeBD 這樣的模型裡面我是會所有的神經元全部啟動但
很明顯的我今天如果是問一個 F=MA 是什麼意思我沒有必要把文學相關的神經元啟動吧一層兩層三層墊起來卻越墊越沒自信每每穿衣服為了將身材呈現最好的比例總是絞盡腦汁懷疑人生
从今以后别烦恼空空如也地走进来一家形象美学诊所让你饱满自信地走出诊间人生高光时刻就是现在
我没有必要把文学相关的神经元启动吧对吧所以为什么我们不一开始做一个类似分类器的东西在这前面先用一个很简单的方式去区分现在的工作类别是什么那我就只要驱动那一块神经元就好了而不用去驱动文学我就是在我在我的物理的解释里面放入了文学的神经元到底有什么意义它还是权重是零啊
但是在現在的方式就是一個大的模型上面就會是我全部的權重都要啟動第一個我的效率會變慢第二件事情它耗能所以 MOE 的好處大概在這邊了解所以其實這跟我們的大腦有點像就是說我們
只需要啟動必要的那個神經元那條鏈這樣對對對然後同一個時間就是那這樣的話我是不是就可以分成這是一個物理神經元這是一個化學神經元抱歉我就科目來累你對對對所以它就可以是分開訓練的幾個東西再拼裝一起所以你會聽到像 MISTRAL 的混合模式的話它會是寫成 8 cross 7B 有 8 個 7B 模型在後面所以這就是它的 MOE 的意思對對對對
所以大家看到这个模式的名称有时候就可以知道说它的规格到底是什么那这有点像是一个大学教授团队我们今天问一个问题 F 的 MA 或者说 E 的 MC 平方那这时候会让物理学教授来回答不需要这个原液系教授也来回答大家就不要
在那邊跨修不在其位不謀其職我們今天有原液的問題我們再請原液系教授出來就好所以這樣能讓 AI 在處理問題的時候更有效率也是為什麼 DeepSeq 能夠用比較少的 GPU 訓練而且維持高效能的原因但是 DeepSeq R1 或 DeepSeq V3 它真的是一個開源的 AI 模型
這就要提到什麼叫做開源就是
目前 AI 模型的開源應該有三個層級第一個層級是我開 API 給你用用看這樣也算開源這應該也可以算是一個開源第二個東西是我放到可能 Hugging Face 上面然後我有提供權重然後這也是一種開源它就相對在更廣一點但是你沒辦法直接去修改到模型的本身或是你頂多只是用它的方法
來驗證會有這個效果那最後最後那個真正的開源是什麼我把我的資料都給你看我把我背後練的方式所有的東西都開給你你是可以整包用那個 Git 直接下載下來到你的電腦然後就開始跑跑完之後你理解了你可以改中間的數據你可以自己寫 code 再修成你要的樣子我認為所謂的開源應該是我說的最後這個階段是包含了
你原始訓練的資料跟你怎麼做的那些東西全部都包下譬如說 DeepSick 訓練的時候可能塞了很多什麼武俠小說啊有很多
中國的文學作品啊比如說他中文的表現特別好嘛然後很多可能中共的一些文宣資料啊這個我們都知道這也沒問題就像我們台灣在訓練自己的 Tide 大模型也一樣必須要有很多台灣梵理中文的資料嘛但是如果要真的開源的話就得把這些也都開出來這樣子才有辦法
应该说开源的意思真正的开源的意思应该是我身为一个 geek 或是有程式能力的人他是拿到那份东西之后可以修改成自己要的样子是可以完全复制这件事情对只要还没有达到这个东西我觉得都不能够称作开源他只能够说我有开放一些权限让你能够验证能够使用而已
那目前我们看到的情况是 DeepSick R1 它开放的是模型的权重但是训练数据跟完整的训练程式码并没有开放出来那这也是为什么在 Hugging Face 这个 AI 模型的托管平台上面现在有一个 Open R1 的计划
这个目标就是要重建 DeepSick R1 的完整训练过程让它真正变成完全开源的模型那之所以我们当然对这件事情可以有批评也可以有赞赏的角度批评的角度就是说因为它不够真正开源所以我们现在失败才会有这个计划但要赞赏一点就是有蛮多论文都不会去做到它做到的这一步对 起码连这点都做不到对 更何况还有很多必然的
我們說 GPT OpenAI 他們雖然叫 OpenAI 但是大部分是 Crow3AI 所以說其實它刺激了也刺激了很多的開發者他現在想要來創造 OpenR1 這樣的計畫就是因為他稍微打開了這個縫大家想要鑽進去所以大家對這事情是真的很有興趣的所以 OpenR1 的計畫我覺得之後我們再看情況再來跟大家介紹它是否能夠真的讓 DeepSeek
復原 完全提供一個開源的替代方案那這個計畫就包含了三個關鍵步驟就是知識蒸餾其實我們看到 Distillation 蒸餾這個詞在最近討論 DeepSick 的時候很多人拿出來討論那國威你就是理解蒸餾是什麼樣的意思我只有從 OpenAI 它的網站上看到
這個蒸餾因為 OpenAI 它後面有這個 Blackground 然後它也會告訴你說他們蒸餾到底要做什麼這樣這邊我想要說我忘記是 Mistro 還是 Lama 在去年 8 月還是 7 月 7、8 月那時候它做了一個 700B 的模型太大超大的模型然後大家都不知道要幹嘛然後那個時候就有風聲說他們要做訓練下一代 AI 的合成資料的生產器
合成資料就是這個概念就是說我可不可以讓 AI 土資料來訓練下一代的 AI 那那個時候就有一些論文是講說就是你不能這樣做因為資料會一直衰減會崩潰對最後會 crush 掉就是吐出來都是垃圾對那所以後來就說一件事那這個合成資料是需要篩選過的
就是要有一特徵是具有你需要的特徵而且是能夠被人類辨識出來然後電腦讀得懂的東西所以真 6 的概念就大概跑出來你必須要找到一些
是對於你現在要練的 AI 是有意義的資料有它的鑑別度的資料接著把它組合成一個資料包再餵進去它才會有意義有點像是我們在寫 PROMPT 的時候我們都會給它一些參考就是我覺得寫得好的東西那同樣的你如果要用這種合成資料的方式去做資料的篩選也會是同樣重要那蒸餾的過程就是去從這些海量從可能
有人在說是 CharGBD 的資料嗎我不知道就是在那邊篩選出我覺得這個比較好那個比較好然後把它組合起來就很像我們人的一生當中長到現在有這顆腦那邊看了很多亂七八糟的東西我們當然也看了很多相對比較優質的東西但是你這輩子不會只看那些優質的東西嘛那我們現在就是那我們現在重新
好 转世一次你在训练下一个小小的自己的时候训练下一个小国威小胜威的时候你只让他看那些优质的东西对或许他就不需要吸收那么一大堆垃圾对比如说周柱回战比如说我推来浪费我的生存不用看那么多浪费人生的东西你就看经典就好就以上是个人见解好 anyway 其实
我們簡單來科普一下這個概念再來就是強化學習就是 reinforcement learning 就是要建立完整的數學推理跟程式碼的強化學習數據局我們現在在講的是 Open R1 要怎麼做到這件事情再來就是多階段訓練就是要重現 Deep-Seq R1 的多階段訓練方式來確保效能能夠匹敵原版
所以 DeepSync R1 呢虽然比 OpenAI 更开放但也的确还不是完全开源的 AI 那当然我们也很鼓励这样子的一个越来越多这样的模型去出现让大家来使用好
所以如果 Open R1 计划成功的话那代表说未来团队呢都可以从零开始训练自己的 Deep Seek 那这当然会让整个 AI 的 Democratization 就是 AI 的民主化呢更进一步所以总结一下 Deep Seek R1 呢之所以让大家关注呢就是第一个就从 V3 开始延续下来的这个 R1 呢它的训练成本很低第二个它的技术真的很聪明效能也真的很强那第三个它比 Open AI 更开放
虽然说没有完全开放他没有完全开放啦可是他比他对标的这个 OpenAI 更开放而且我很好奇他就算 Open Source 了之后到底有多少人会拿出来玩对我觉得可能很多因为其实连我自己都下载到电脑里面来玩看用欧拉玛来开对对对我当然只能玩一点但是我觉得因为他可以调的东西很多嘛所以我觉得这个大概会刺激很多的企业他们自己建立自己内部的这个
所以問題來了接下來我們看到很多科技巨頭都開始用 Deep-Seek 有些是提供 Deep-Seek 讓使用者可以居用有些是直接把它結合到自己的服務裡面像是 Proplacity 像是 PoE 這些他們已經開始提供 Deep-Seek 模型讓你可以用了
所以代表什么呢这个开源 AI 的革命会不会真的让 OpenAI 跟 Google 感受到压力而且事实上感受到压力的也不只是其他这些 AI 模型公司还包括了提供硬体的公司那我们现在知道这个全球的科技巨头虽然一方面
正哲于 DeepSync 的威力那一方面也开始采用可能有一些批评但是其实嘴巴上说一套实际上说做另外一套所以 DeepSync R1 它已经不是一个技术社群的小圈圈话题了现在像是 NVIDIA 它已经把 DeepSync R1 纳入的它的 NIM 为服务其实这个有点像是
就是你可以在這個 NVIDIA 上面安裝一些自己的模型透過他的這個很方便的這個流程那所以看起來好像 NVIDIA 也很看好這款 AI 模型的應用潛力但我必須說就是那個時候就是 NVIDIA 股價下跌我直接想到一件事超級股災對我直接想到一件事就是對看完之後才發現到如果我要做個人化的服務其實根本不需要那麼大的算力
對阿 因為 DeepSeek 這一個論文出來之後他其實對我來講最直接的概念就是只要我有程式能力我用足夠的只要有一台 Mac 然後可能稍微加裝一下加到頂這樣對 加到頂好像就可以練了阿好像沒有那麼難耶那你 NVIDIA 去年在那邊喊說什麼我們要有更好的模型就要有更多的晶片你就要有更多的 NVIDIA
好像不是這麼一回事所以我覺得華爾街在反撲的應該是這件事就是你的宏大敘事好像並不是你說的那麼回事我們看見的真的有辦法幫助到人類的有辦法直接作為商業一個服務型的產品輸出的東西好像不是你的這個宏大敘事下面的東西對 但是其實剛才這個說法也有人說這個
其实我们看到辉达或是说相关的这些产业它的股价下跌因为大家可能认为说那 DeepSick 如果可以用相对那么便宜的价格甚至是比较低的低配备的这个显卡就训练出来那这就代表最新的这些显卡可能没人买了嘛就太贵了嘛之类的那可是也有人认为说其实训练是一个成本但是你要提供
这个数以亿计的数以十亿计的使用者去使用它又是另外一个成本而 DeepSeek 它说的这个 600 万美金的成本只是它 V3 的训练成本那你今天如果要开始提供数十亿计的消费者来使用你的成本还是很高的你还是得买你要 Inference 你要不断的去接受这个需求对这是一个点然后还有一个点就是 DeepSeek 它必须架在已经有成功的模型在前面它才可以这么便宜
沒錯 所以就有點我們當然是站在巨人的肩膀上所以你今天要說他是從無到有也不能這樣講但是他的確是被逼出來一個相對
應該說非常非常便宜的一個做法對 所以我才會說作為個人化的服務這篇論文是有價值但對於整個 AI 的發展來講這篇論文就只是一篇論文真的 這篇論文就真的只是一篇論文而已它不會讓 AI 什麼就是往 AGL 往通用性人工智慧邁進或是我找到一個什麼非常厲害的方式可以讓 AI 往前進 沒有它簡單來講就是
我个人想要来偷工减料想要玩点东西的时候有个方法可以用了对而且表现是相对好很多的比其他的这些小模型好很多所以后来 NVIDIA 股价又开始回来又回来了那当然长期来说我们都认为这个需求还是会不断增加因为当你这个东西便宜了
反而会刺激需求对不对就像我们车子如果变便宜了大家就更想开车了就有更多的使用的情境并不是说车子便宜了大家不想买车了所以车厂就倒闭了其实也不是这样是所以其实包括 NVIDIA 包括微软等等也都是现在开发者也可以在 Azure 的 AI Foundry 还有 GitHub 上面使用 DeepSync R1 所以微软虽然是 OpenAI 的大投资者
大股东但是他也没有停下手他也是马上把 Deep Seek 接上来那 Amazon 也没有闲着虽然说他是 Anthropic 的大股东不断的 10 亿 10 亿美金在投但是他也马上把他接到自己的 AWSSedgeMaker 或是 Bedrock 的服务里面所以说其实现在大家也可以用 AWS 包括 Azure 这些云端服务来部署
那限制连美国的 AI 公司 Perplexity 就是我们常用的这个 AI 搜寻引擎他们也把 DeepSync R1 列为一个跟 GPT-4 还有 Cloud 3.5 并列的一个选择因为其实它相对起来整个成本都比较低所以其实我想这对 OpenAI 来说
應該是有點壓力的吧 OpenAI 壓力超大的他現在都是 close AI 了那我們也知道說 OpenAI 在接受到這個刺激之後馬上又推出一些東西這個我們之後再來聊這樣子包括他的現在為人很驚豔的 DeepResearch 功能還有 O3 mini 之類的 DeepSync R1 的出現就有點像是 Costco 某天就開始
卖超高级的 AI 而且价格是比市场低很多的而且不限购所以大家就冲去抢你现在用 O1 可能你没有花钱的话你还有限制使用次数对不对那接下来你自己在这个本机上或者说现在要怎样用 DeepSync 你都用到饱所以也没有什么限制所以大家就会冲去抢这样子但问题来了就是说 DeepSync R1 是如何打动这些科技巨头的让他们马上愿意采用的呢
這個問題其實怎麼講它開放了權重所以你其實是可以直接複製下來就用它的整個模型所以你不需要再附 API 了就是 Olama 你國外也用了直接這樣子做就好了這我覺得就是一個最大最方便的我覺得用 Olama 然後用 Web UI 然後就在自己的本機上跑其實那個速度我用 7B 的模型而已雖然它資料量有點差但是那個思維鏈還是很清楚
那其實非常品質如果是中文的話其實品質還是不錯其實很難想像就是說現在一個可以完全對標 GPT-4 的一個模型它就在我的本機上跑而已其實這個是很驚人的那自己都覺得說哇 這個
进步的实在太快了有没有感觉到 EdgeEdge 的对这个终端 AI 的力量对那这个当然 NVIDIA 或各家也都在部署这个也是大家可以持续关注的那所以对于企业来说它就不用再付这些昂贵的 API 费了所以可以大幅的降低成本有些企业它可能本来就有伺服器它就直接这样安装上去直接自己透过云端部署就好了
但是未来就不需要再花这些像是租军火的成本这样子自己拥有这个便宜的军火那如果本来每一年要花几百万美金买 OpenAI 的这些 API 授权或是各个方案的话的这些企业呢会突然发现我有一个免费而且又强的 DeepSync R1 那当然你就会用 DeepSync 了对那而且你自己在本机端部署的话可以避免掉一些可能
資安啊 或者說一些它的關鍵字或者說它的記彙嘛它有很多記彙就像每個模型都有些記彙但是你自己下載還是自己 Tune 那些問題就可以解決但必須說 OpenAI 的 API 也沒多貴啦就如果按照我現在的我們自己有在用我自己在讀一些文章然後整理資料然後就是有寫一個自動化程式在讀
這樣一個月下來其實好像也不到 10 美但如果說今天是大型企業的話他可能直接用 OpenAI 的比如說各模型在做多模態的辨識之類的比如說他可能是利用譬如說 Perplacity 他可能就需要付很多錢
这我觉得就是 Propensity 我也有用 Propensity 的 API 我一天就要用十枚对因为他就先跟人家租嘛然后他当二房东嘛所以说其实这个就价格不低所以这就是为什么微软啊 Amazon 啊这些科技公司知道这个有市场马上把
DeepSync R1 呢纳入自己的 AI 服务当中因为他也不想被 OpenAI 或等等这些大企业事实上这些公司他们自己也有推一些免费的开源的这个 AI 模型只是说表现的确没有 DeepSync 那么好这样子那所以 DeepSync 给 OpenAI 呢的确带来很大的压力那我们现在可以想象 OpenAI 面对三个很现实的压力第一个就是
这个开源的竞争加剧因为 DeepSeek R1 说从 V3 开始的这个开放策略让 OpenAI 它这个 CloseAI 的现况面临更大的挑战第二个就是它商业模式会受冲击如果越来越多企业就不用了这个 OpenAI 的 API 那改用 DeepSeek 那 OpenAI 的 API 收入将来就会下降那包括 Cloud 他们主要是透过 API 赚钱的这个也
也會下降那再來就是技術透明度問題事實上 Deep-Seek 我們雖然說是來自中國的模型但是反而大家更容易去理解這個大模型的運作因為它起碼權重是開放的那 OpenAI 仍然就相對來說就還是
很神秘的所以对于某些更在乎它的透明度可解释性的企业来说 DeepSeek 反而就变成一个相对比较好的选择当然也不是只有 DeepSeek 你还是有 Lama 你还是有 Mistron 你还是有其他开源的选择只是 DeepSeek 的确给大家很惊艳的一些表现所以这样看来 OpenAI 可能也会开始考虑开源部分的技术来保持它的市场地位我
我不覺得你懷疑是不是我不覺得我真的不覺得耶對啊所以這就是現在有這個棋子下在棋盤上那 OpenAI 要怎麼接招呢我們就要持續看下去因為 API 這一個路徑應該說它又是另外一個議題我覺得改天可以來講講現在那個很紅的 agent 是什麼東西對這個我們之後要再講因為其實 Deep Research 被認為是 OpenAI 現在推出的一個最強大的 agent 對好
那这个我们之后再来谈那但是在这次 Deep Seek 的凭空出世的这个事件当中呢我们就发现 AI 产业的战场呢除了有美国跟中国这个除了汉界之外其实还有开源跟封闭这样的一个对决这个一开始就有啦这个从那个 Meta 的那个 Lama 出来的时候就已经是在玩这个游戏了没错那
Meta 或者说 Facebook 母公司他们透过 Lama 这个战术呢让自己好重新的算是回春啊本来一直卡在那个元宇宙啊做不起来啊那个 Lama 一推出来之后其实现在大家都是用 Lama 来改因为其实它是真正能够改的一个模型那 DeepSeek 呢现在又跳出来那大家就觉得说哇可能甚至我连
修改或是我连运作的成本都会少很多那大家就更有兴趣了就开源这个阵营现在的军火越来越强了那当然中间有开源有这个闭源但是又有美国中国或者说这个你现在是在画那个阵营九宫格是不是可以分成九宫格看要分成四项线还是九宫格所以这有点像是
IOS vs Android 這樣的戰爭你要選擇一個封閉但是高效的系統嗎還是要選擇一個開放但是彈性更大的系統呢或者說 Microsoft vs Linux 但這件事情的下面其實是 Meta 在下一盤大的棋但這個大的棋可以我們在下一期講我覺得現在講這個有點太多了因為其實你要思考的事情是開源會讓先鋒使用者有體驗感
然后先锋使用者可以依照你这个原本的模型再做出他的服务所以他其实是等于是我可以我开源模型我等于是这个模型成为基底有 1000 个网路上的爱好者工程师会不断的去服务这个模型去修改或者去创造新的可能性对你的开发者变成全世界人而不是只有自己的公司那这个东西我们会称说叫做应该叫生态系生态系啊
就是某一种生态系对对对但是开源 AI 真的会赢吗还是最后是 OpenAI 或 Google 这些科技巨头他们如果没有选择开源的话还是说他们会挟着既有的优势垄断性胜出呢我觉得那个就是也是跟 agent 有点关系那我们接下来就要聊一下为什么有些国家开始封锁 DeepSeek 那这到底是 AI 竞争还是国际政治角力呢
那我们刚才有聊到 DeepSick R1 或者说 V3 这个开源模式吸引到微软啊 Amazon 啊等等的科技巨头开始提供服务但是不是每个人都对 DeepSick 保持欢迎的态度有些国家开始封锁它了那包括台湾在内台湾在 DeepSick 出来之后呢马上就下令我们的公务机关不能用 DeepSick 那当然如果你自己下载在本机上可能是你也管不着
但是不能在公務的環境當中去使用 DeepSeq 不能夠用它的網頁版的 DeepSeq 對那其實這個很有趣因為其實我們當然認為技術更先進但是大家越想用但 DeepSeq R1 一推出很多政府都跳出來那包括澳洲 義大利 美國軍方等等都已經禁止或限制 DeepSeq R1 在特定領域的使用了這怎麼那麼多國家這些國家
感觉他们也不像我们有一些必要性很敏感这样对对对为什么他们要去进这个东西没有没有现在全世界都很敏感对于中国的议题所以问题来了那这些国家到底在担心什么呢到底是技术问题还是政治层面的问题呢
那其实这个大致上我们可以拆成三个层面来看第一个就是安全疑虑就是说这些 AI 的资料来源不透明那他可能比如说你问他六四天安门发生什么事情你问他台湾是不是一个国家那可能会很多其他的就像大家为什么会去禁抖音一样很多国家会去把 TikTok 想要把它禁掉其实某方面也是因为这个问题那所以这个安全的疑虑那甚至是使用者在使用他的时候会不会有些治安的风险
这个治安风险有很多层啦如果你下来在本基你认为就完全没有治安风险嘛也很难讲所以其实大家就是宁可就是错杀
100 不可以漏放一人其實這個是大家抓間諜是吧大家很擔心的那第二個當然是地緣政治如果說你一直去使用 DeepSeek 甚至是鼓勵他的成長的話這可能就你就在科技陣營上就選邊站了那我們現在到底要選哪邊站呢你要站在哪一邊其實這也是一個
到这个时候已经不能忽视的事情了所以我们不能说很单纯的就是说中国的核能技术现在很好那我们就来用中国的核电厂吧就是说你很难那么天真的去思考这件事情对不对包括一带一路也是这样中国高铁建得很好那我们就用中国高铁吧其实这后面都有很多的不管是贷款或者是这个
那个维修怎么办维修啊你的技术典范啊等等就是整个都绑在一起的嘛所以说你很难很天真的去选说我就是要用一个最好最便宜最快的一个技术所以这是一个很复杂的问题那另外呢就是
监管的问题就是开源 AI 本身那包括 DeepSeek 那么强大的开源 AI 它可能会带来更难控制的内容因为当我们现在都知道其实要复科一个人的
臉啊 然後他講出他的聲音啊其實已經非常越來越簡單了真的非常簡單那 Deep-Seek 或是類似的模型其實我們如果他更多模態的話我們可以想像他的能力是很強的那這時候會造成什麼問題我們我想大家可以想像出來不管是假新聞 或者說假照明人假帳號真的是問題所以
我想首先我们来看第一个就是资安的疑虑好了因为很多政府封锁他的第一个重要的理由就是因为认为他这个其实还是不够透明第一个他的训练数据并没有公开对就我们前面已经有讲到他不是完全开源只是很开放的对所以说如果说我们把在这样模型用在政府设备上的话他可能产出的内容都受中国官方
的中共內容所影響我懂了 這個資安 我剛才想說這到底哪裡有資安問題就是說你的資訊本身就有一個偏向或者說因為你被訓練的內容都是往這邊被誤導了對 你在乎的價值不一樣你輸出的價值不一樣所以這可能會有一些問題 譬如說我們
包括台灣很多人都會當中國用語檢查我們說中國用語之語檢查嘛對不對因為我們都認為說這只是流行用語啊這個接地氣啊牛逼啊這些事情好大家就嘴巴用可是很多人會擔心說這個用久了你就是認同了這個意識形態好那我覺得這個是很多人會擔心的那當然語言的輸出也是這樣子事實上
我覺得這都是會觸動一些敏感的神經我不能說這個到底是百分百正確或是不正確但是它的確是敏感的議題特別在地緣政治
很显著的一个情况之下那再来就是又有点像 TikTok 就是担心政府监管比如说它现在的模型这样如果它又更新呢那你会不会持续下载呢或者说会不会一些新的条款是让你答应的那你不知不觉中就答应了对对对不管是晚夜版或是它开源的版本开源版本可能有一些对啦还是有可能就是说它免费让你下载但是它会不会有些条款是你你不知不觉就
就答應了這個其實大家會有點擔心那就是一樣啊寧可錯殺 100 不可能重放一人這樣子對那所以美國軍方也禁止在政府內部來使用 Deep-Seek 這樣子怕擔心會有機密資訊的外洩或者說被用來進行網路攻擊
那 DepthSight 官方当然都认为说我们 AI 并没有内建后门也不会进行各种形式的监控但是就是有些信有些不信就这样子这种话听听就好我们都一定会说我们绝对不会进行任何形式的监控的对那我们大家都知道事实上是怎么一回事那因为 AI 这种东西本质上就是一个黑盒子我们不可能百分之百确认它的运作方式所以大家永远会有疑虑那也永远会有这个
可被减去的空间这样可经商榷的余地这样子那第二个问题其实就是国际竞争因为现在 AI 产业已经是美中科技战的核心战场从 AI 往下连的是整个晶片那晶片又连到所有的所有的东西基本上所有的东西它是一个核心所以
像是美国禁止晶片出口到中国某些太先进的晶片出口到中国也禁止中国制造能够自己制造先进的晶片但是现在逆反攻逆攻回来还是让美方非常的震惊所以如何让美国能够保持领先这件事情
其实是现在很担忧的那很多人都说这就像是呃 Spotnik 时刻就是当初美美苏在冷战的时期那个火箭先上去那个卫星卫星对就是美国苏俄优先的发射了一颗卫星啊
Spanic 在天空上然後大家都在那邊哇 這個天上從此有一顆蘇俄的衛星在監督著我們多恐怖啊那美國竟然發射不上去所以那時候美國才說那我們一定要趕快超越我們要直接把人送到月球上嘛這樣子所以像這樣的競爭其實都會讓大家很擔心又很像當初的像奧本海默那部電影演的一樣就是說 欸 聽到
德國 納粹德國優先的做出了什麼什麼什麼所以核反應絕對不能讓核分裂這件事情優先被核心國給取得所以同盟國就要加速這樣子所以像這種就是會刺激大家很多緊張的神經那像義大利的數據保護局也馬上發出聲明表示要調查 DeepSeek 的
數據隱私問題那當然實際會不會有這個先公布去做我們還不知道但他們先聲明了就代表他們在意這件事情對對對先喊出聲一樣所以說這個本質有點像是華為 5G 那我們大家知道華為 5G 那時候也是遇到了類似的問題那中國的科技開始有這個超越美國的苗頭的時候呢這個封鎖就會來了因為畢竟
中國的態勢也是明顯因為他就是要從各方各面取代或是能夠稱霸所以說嘴巴上不說稱霸實際上要做的事情這樣這邊也補充一下就是 5G 這個就是應該說通訊系統有一個很重要的東西核心網路其實美國現在好像已經沒有自己的核心網路的製作能力了大部分都是
之前华为嘛然后西门子摩托罗拉嘛对对对那基本上摩托罗拉我们不是说手机的那一部分是核心网络的那一部分西门子我们也不是说手机的那一部分他们手机的部分早就都卖掉了对那核心网络的部分现在这个是在欧洲嘛对都在欧洲那美国现在就要开始推开放核心网络对
但是他们也要用开源的方式来重新打这一场我真的突然觉得他们好多产业链都断光了就觉得美国实在是有点惨好那最后一个问题就是监管的问题就是开源 AI 会不会带来更多的风险其实就像很多人会很担心我们把某些比如说像生物研究有些人会去研究如何制作出更
传染性更强的禽流感或传染性更强的 SARS 没有 GRB 是绝对不是反正人体试验委员会就会不会过这个东西有时候会去研究因为有些科学家想要研究某些东西的改变会不会往这个方向走如果往这个方向走的话如果先研究出来它会不会变得更毒或传染性更强我就可以先研发解药所以有些说法是这样子所以这时候你就会先研发那些更毒的东西可是
你研发更多的东西你这个论文要不要公开呢这其实就是现在 AI 一直不断进步其实现在让很多 AI 大神们都站出来担心的一件事情不是说担心他有意识这件事情不是说担心他像骇客人物一样而是说他就是越来越强了现在就像小孩子可以玩核弹是一样的问题是对所以说其实这会让很多人开始担心而且当他开源的时候其实大家可以想象其实可以玩的方式更多了
我覺得這個就是那個之前有講到矽谷分兩派樂觀派跟悲觀派的來源這個永遠啦永恆就是這樣子同樣的大家也會擔心說那這樣的技術現在伊朗也有了北韓也有了 Deep-seek 對不對開放了嘛好大家都有了那接下來會不會怎麼用呢
又是一场冷战的局势又是一场冷战的局势所以总结一下 DeepSeek R1 或者说整个 DeepSeek 被封锁有三个原因第一个是资安风险因为它的数据不透明可能会有安全问题这个安全问题包括它输出内容的安全问题包括它使用上的安全问题再来就是地缘政治这就不只是技术问题而是我们整个美中选边站的问题第三个就是监管问题这本身它是一个开源而且非常强大的 AI 会带来一些不可控的风险所以政府会开始审
那这样看来 DeepSeek 不只是一个技术创新也是一个 AI 产业跟贸易战还有是国际监管共同一个交叉的战场战火非常的猛烈被你这样讲完感觉全世界都被他洗礼了一遍虽然近期的新闻的确也是对啊因为其实战场好像是壕沟战突然两边的壕沟突然有一个人
跳进来然后枪火开始往对对对开始狂射这样子其实是蛮恐怖的进入火线了对对对那接下来呢我们就来讨论一下这个这个 DeepSeek 它到底是一个机会还是一个灾难那我们刚才聊到 DeepSeek 因为开源呢得到了很多科技公司的支持但也被某些国家封锁了那这就带出一个更大的问题就是
开源 AI 本身它到底是不是一个科技的未来还是它是一个即将爆发的灾难我们刚才就聊到如果我们以生物工程来对比的话就是说我能不能开源合成生物学我能不能开源一些比如说我们现在可以用包括 Alpha4 或者说 Rosetta4 一些折叠蛋白质的预测程式去制造出某些
奇妙的蛋白質但你會好奇說就是你現在可以搜尋一下怎麼做出可以殺人的牆用玩具牆它真的不太難對也的確有人這樣做然後也的確有人這樣做然後的確網路上你找得到資料那你為什麼不禁止這些東西呢因為的確啊因為比如說像 OpenAI 或者說 Google 它都會開始它都會禁止
所以说很多资料都会到暗网或者说很多人就想要用透过某些方式骗那个 ChangeGPT 早期的时候骗 GPT 怎么做炸弹怎么做危险的东西那现在显然就是 DeepSeek 就是他完全开源了那现在训练资料里面还真的有这些东西然后你也真的可以把它骗出来那所以这个就是一个有心人
只要你是有心人终会事成的你就会去玩他他现在就是一个开放的
保物箱在那邊你要撈什麼東西就自己去撈這樣子所以你要認為說開源它就絕對是一個好事嗎其實很多人不一定這樣覺得有些人是認為說他必須要有一定的審查可是這個有一個問題就是那其實這些知識原本也被裝在可能圖書館裡面的某一本書可是它沒有那麼易得沒有那麼簡單就是說它 accessibility 就像
去 GPT 或說搜尋引擎它在我們的手機上面它會比圖書館一本書好取得
圖物館這個書可能在禁書好像魔法書一樣有些書會被封起來但是現在就是他很容易取得我覺得這個可取得性就像我們說核彈一樣就是說他就創造了不一樣的環境我要說的就是說這是某些人的意見我不知道盛輝怎麼看我自己的話
我會是擁抱開源這一塊因為我覺得這是沒辦法限制就是我剛剛提那個書或者是知識我覺得它就是不同的載體有心人就一定可以找得到就是想要做炸彈的人我相信你給他一個禮拜去圖書館找書他真的可以找得到方法做出來但他這也就像是很多人在談美國要不要禁槍是一樣的問題對啊好就是說如果我們認為某些那就是一個工具比如說菜刀
或者說槍但是因為就是美國有很多槍嘛所以大家想要傷害自己或傷害別人的時候優先就會去選槍那你不會選菜刀那你菜刀沒有辦法一次殺死三五十個人嘛那當然但是你有槍的話你就可以一次殺死三五十個人是 那當然如果他是跟我是以個人的觀念來講我覺得就是開源才是對的但如果以剛剛國威講的那種狀況是整體人類的發展或前景我覺得這兩個是需要權衡的因為
我举个例子如果有一个人的天赋是杀人那我难道就要因为我们现在不是都讲了我们要能够引出学生的真正的潜能然后要视性发展所以我就应该要视性发展他成为一个杀人犯吗你说他是勇者就对
就是猜他如果在战场上他就是一个杀手他就是一个勇者对对对可以杀很多魔族之类的对你可以这样定义可是如果他退休了然后他血液当中隐含的那个杀意还是很强的或者是现在社会你需要这样的一个特征你需要这样的特质的人变出来吗所以这个问题我觉得需要权衡再权衡的对
所以其实当然我们用的所有比喻它都有不精确的地方但它的确就像我们自己我们叫饲养实验室我们就必须要去做很多这样的比喻跟讨论那开源它的确加速了很多很多的产业的发展不管说是包括这些大企业他们也不是他们很多都是
享受开源也贡献开源即使说一开始 Microsoft 很多人都批评他其实他现在是最积极于做开源的公司那 Google 呢也做了他整个就是受益于开源而成长的公司那他也贡献了很多在开源社群所以说其实开源是我们过去这几十年来
不管是 AI 产业或是整个电脑科学能够快速增长的原因其实开源也不只是软体还有开放硬体包括硬体的设计等等包括像 Tesla 它也把它的专利开放出来等等这些其实都会是能够加速开发者能够降低他们进入门槛的关键如果说这些技术都被锁在少数大公司的手里其实也是蛮恐怖的
我覺得那又是另外一種反烏托邦那個就會是真的進入 Cyberpunk 的世界那也是 Cyberpunk 技術都被這些大企業所掌控那這個 AI 發展方向是很糟糕但是如果這個開源 AI 被用來做壞事呢我覺得大家就會很擔心那如果說 AI 是封閉的話呢
我們知道運用投債有主嘛那就有些要負責但是如果說每個人都可以搞比如說今天核電廠如果出問題那一定是電力公司的問題那如果今天你自己家裡面後院搞了一個小型核電廠 SMR 那出問題是你的問題啊那就是每個人的問題所以說其實這個就是
自由跟责任之间如何找到一个那个社会最能接受的一个状态那开源有时候就是一直不断在尝试这个线到底在哪里我到底可不可以把枪交给每个人每个人都可以用枪我到底可不可以让每个人都拥有那么强大的 AI 那这就是
一個需要思考的事情而且他又反過來會說這會不會造成某一種階級的就因為能用 AI 或不能用反正非常多你可以想的事情而且有人那也有人會認為說我這開源這樣子外界更好去監督啊就我更能就知道說你這個開源包括權重啊訓練資料啊什麼都開源那這樣子其實包括我們現在用很多開源軟體我們之所以相信他安全就是因為他有很多雙眼睛在看嗯
而不是只有一些公司的一小组人在负责而这小组人可能会因为他的业绩因为他的他的主管要他做什么而就做了一些这个不安全的事情而且我们又监督不到所以说其实这有很多的辩论但是现在问题又是 DeepSick 它又是一家中国公司
這又為這個複雜的問題增加了一個很複雜的維度就再多一個維度了對所以中國的開源 AI 這個真讓人尷尬對不對對今天魔族推出了一個新的這個魔族拿出一個聖劍你要不要拿呢對不對可以啊拿得好像蠻不錯的對可以打贏魔王但是可是魔族出的可是魔族出的
糟糕啊好難選啊對不對這是一個很大的問題那所以我想這個都有很多的討論啦所以那包括假資訊的問題也是一樣就是說開源 AI 的確可能會讓假資訊的問題變得更嚴重因為包括它可以
就是让更有心人士我们刚才说他现在北韩也可以用了伊朗也可以用所有人都可以用那就没有什么好没有办法限制大家都有那么强大的 AI 了我们也可以预期等到 ChangeGPT 等到 OpenAI 的 O3 出来 DeepSync 可能也 R2 了对 有可能如果说顶多就是晚半年顶多晚半年那个已经接近 AGI 了
那你开源一个接近 AGI 的东西不是很恐怖吗
很難講所以我覺得最後我們就要來思考一下這個 Deep-Seek 到底是開源進步的象徵還是一個契機讓我們去思考未來 AI 技術該如何發展因為其實我們現在就是所有人在共同決定這件事情我們要一起我們的每一個觀測每一個使用都在決定這個路徑所以也要問各位思想實驗室的朋友們一個問題你覺得 AI
應該完全開源嘛有一派是覺得這樣喔的確喔 很多人是覺得這樣因為覺得很多優點還是覺得應該要保持部分的封閉包括全眾可能可以開可是訓練資料可能不能或者說訓練資料可能可以開全眾不能開然後我再提一個觀點就是如果完全開源的話我會很老實的跟各位講就是有八成的人是沒有辦法跟得上世界的
你要想想看就是我們剛剛講的什麼 API 為什麼它避援然後做那些 UI 介面那是為了不會寫程式的人在做的好用啊對不對對我們就直接複製一下如果沒有這些公司沒有這些避援公司在努力在開發服務上面實際上是不可能有現在這個成果更好的把這個服務或這些 AI 的工具推到一般人的手裡對那我覺得這個就是
這個我就是要故意製造一個難題你們不要想著都只是好事避緣就是壞壞對因為畢竟大家要收這過路費對那就是為了要收這過路費他得提供更好的服務更好的介面之類的好 anyway 呢這場 AI 戰爭呢未來走向還不是很明朗但可以確定的是這只是剛開始那謝謝大家今天的收聽我們思想實驗室記得訂閱按讚開啟小鈴鐺我們下期再見拜拜