We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 【下班經濟學_商戰】中國DeepSeek逆襲全球AI市場?能取代ChatGPT?川普被逼急了?ft. 曲博

【下班經濟學_商戰】中國DeepSeek逆襲全球AI市場?能取代ChatGPT?川普被逼急了?ft. 曲博

2025/2/24
logo of podcast 下班經濟學

下班經濟學

AI Deep Dive AI Chapters Transcript
People
曲博
Topics
曲博:DeepSeek的出现令人惊讶,其低成本和开源特性对AI市场格局产生了重大影响。虽然DeepSeek在某些方面,例如中文诗歌创作,表现优于ChatGPT,但其核心问题,即‘一本正经地胡说八道’,尚未解决。DeepSeek主要通过低成本策略、开源策略和市场细分策略来挑战ChatGPT。低成本主要体现在训练成本远低于ChatGPT,这与DeepSeek在算法改进和数据整理上的创新有关。开源策略则有助于技术细节的公开审查和改进,并可能催生新的商业模式。市场细分则体现在DeepSeek更侧重中文数据,而ChatGPT更侧重欧美数据。DeepSeek的崛起可能会促使其他大型云端供应商重新评估其在AI领域的资本支出,对英伟达等公司产生一定影响。但长期来看,AI产业的百花齐放仍然受限于AI模型的准确性问题。解决AI模型的错误率,并最终实现像钢铁侠中的贾维斯一样的人工智能助手,是AI未来发展的方向之一。此外,将推理计算从云端转移到终端设备也是AI产业的未来趋势之一。

Deep Dive

Chapters
本段落比較DeepSeek和ChatGPT的特性,探討DeepSeek以中文為主的訓練資料使其更適合華人使用者,但ChatGPT在歐美相關資訊和跨國語言能力上仍佔優勢。兩者各有優勢,取決於使用者的需求和使用情境。
  • DeepSeek和ChatGPT在訓練資料和語言能力上的差異
  • DeepSeek更適合華人使用者,ChatGPT更適合歐美使用者
  • 兩者各有優勢,取決於使用者的需求和使用情境

Shownotes Transcript

一般能看到 DeepSick 做出來的東西會覺得很驚訝就是使用 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

那這種技術呢其實坦白說只要是業內的人都知道比較驚訝的還是它的人工智慧目前最大的問題 Deep-seek 並沒有解決今天邀請到電機博士曲博要告訴大家中國 AI Deep-seek 如何掀起全球的 AI 風暴而 OpenAI 地位真的不保了嗎 AI 發展的未來趨勢到底是什麼樣呢一起來聽聽專家的說法

上華我們下班經驗 2025 年是不是有全新的計畫呢沒錯我們的全新系列簡密商戰系列第一集一定要讓你知道的就是中國大陸的

中國大陸的 AI DeepSeek 真的取代 Chad G.P.T 了嗎以及 DeepSeek 到底是靠哪三週全面洗牌 AI 市場而身為台灣人的我們到底為什麼要了解 DeepSeek 所以今天呢除了流量女神之外我們也請到了流量的男神對 電機博士曲博嗨 曲博你好陳你好 上文好今年 2025 年國際書展每一個攤位都在討論它 DeepSeek 真的是黑天鵝嗎

因為它是中國大陸開發的模型因為我們習慣用中文的環境你如果是用 ChadGBT 那是用英文相關的資料去訓練出來比較多所以整個行為跟表現當然就比較偏向是歐美來使用 DeepSeq 因為是中國大陸開發的模型所以我相信他們在訓練的時候一定是用更多的

中文資料還有中文相關的資訊是這個一定就讓這個模型訓練出來比較適合我們的生活習慣所以我想這個是因為大家

平常用的時候覺得特別好像親切一點的關係畢竟是用中文來開發所以是不是在華人區是有機會可以看到 DeepSix 取代 ChangePT 呢我個人不喜歡用取代這個字因為大家在使用上還是會有自己的習慣而且商務上的使用我們還是需要很多歐美相關的資訊

所以我覺得應該是說各有所長舉一個簡單的例子就有一些使用者嘗試讓這個語言模型去做詩你就會發現你用 Deep-seek 一定會做得比 Jet-GPT 更好歐美的這個詩人做的詩跟中國傳統的這些詩人做的詩這其實是不太一樣對所以我覺得將來大家使用上就會照自己的需要跟我的使用情境跟習慣來決定

你看 Deep Secret 作詩你這種作家就要擔心了我真的是很擔心而且現在有 AI 文學獎你知道嗎就是一半的作品要 AI 來寫然後另外一半是人寫的那真的是蠻有意思那我們來比較一下現在的兩大的 AI 的模型還有沒有一些差異跟特色是大家可以特別去關注的我們知道人工智慧分兩個階段第一個階段是訓練第二個階段叫做推理推理

訓練的階段就是把資料輸入電腦找出規則建立模型所以大家常聽什麼大型語言模型或者 ChatterGBD 模型其實模型指的就是資料的規則

簡單的說語言模型就是把人類講過的話輸入電腦找出規則建立模型那就變聊天機器人所以接下來就進到第二個階段就是推理那推理就是利用訓練好的模型來預測譬如說我今天對著這個聊天機器人講話那他就會

把我的話根據剛剛訓練過的人類講過的話排列組合把它認為最可能正確的答案丟出來最向人回答的話 對不對那這個就是所謂的推理

但是剛剛你問到的就是這兩個模型的特性比較那我覺得最大的差別還是在於 DeepSeq 它訓練的資料大部分有中文所以它建立的模型規則就比較傾向於中文所以剛剛講到這個做師當然用 DeepSeq 可能就做得會更好那 Chad GPT 畢竟是歐美

的資料居多所以呢英文的能力一定比較強跨國語言一定也會比較強是發現一件事情就是 OpenAI 他們在開發 ChapGC 的時候他使用的大概是 1 億美元可是呢 DeepSeek 他的成本很低只有 600 萬這有可能嗎首先呢就要先談這個 600 萬其實是 DeepSeek 公司他們自己宣稱的

當然也有人質疑事實上就有一家科技公司的創辦人出來說其實 DeepSeq 有買了很多輝達的這個圖形處理器當然他是說有 6 萬顆啦我認為這個數字應該也誇大了另外一個重點就是確實有

這個 OpenAI 的執行長出來說其實這個 DeepSync 可以這麼便宜的原因是因為他們偷偷用了 OpenAI 的資料庫去做所謂的資料蒸餾但是我也要強調就是說 OpenAI 雖然這樣子指控但是 DeepSync

並沒有承認第二個重點就是說這樣的行為就是資料蒸餾它事實上有違反 OpenAI 的使用規定但是並沒有違法臉書的技術長有公開表示

他們看過這個 DeepSeek 的程式之後我要強調因為它是開源的所以基本上它是打開來給大家看的他們研究完認為確實他使用了一些創新的方法在比較低的運算力的狀況下就可以達到想要的這個水準到底在 AI 的部分會把成本花在哪一些的項目可以帶大家深入來了解一下第一個最花錢的一定是訓練訓練就是我把

影像 圖片 文字 聲音轉換成伏點數 A1 A2 A3 輸入這個類神經網路反覆地去計算那 4000 億個權重 W 是多少這個過程叫訓練幾萬顆處理器要訓練一個月 兩個月基本上就是在做這件事

訓練完之後你就會得到 4000 億個權重 W 這個我們稱為訓練好的參數 OK 接下來就要進到推論所謂的推論同樣把我們要推論的問題不管是影像 文字 圖片 聲音全部轉換成伏點數 A1 A2 A3 輸入這個類神經網路那麼經由

剛剛 4000 億個訓練好的權眾就可以算出事件發生的機率簡單地說就是你問確實的 GPT 問題你那個問題就會被轉成伏點數輸入這個類神經網路它就會算出回答你什麼句子正確的機率最高所以簡單的結論就是類神經網路就是一個計算機率的模型

他推論一樣要靠電腦去計算機率所以他也要花錢所以各位可以想像一下以前我們的 Google 搜尋引擎你在問問題的時候他是丟到雲端資料庫找資料再丟回來對不對相對而言他的耗電量沒有那麼多

但是如果你用 Chad GPT 問問題的時候它是丟到雲端的伺服器推論運算而這個推論運算要經過 4000 億個參數計算雖然沒有訓練那麼耗電但是它也會比原來的搜尋引擎還要耗電是所以推論耗電也是其中一個成本

除此之外數據的處理要燒錢譬如說你要先蒐集這些數據你要做標注標注就是用人工的方式告訴電腦這個是貓 那個是狗這個就叫標注儲存這些資料也是成本再來就是開發過程你要設計新的模型要有新的演算法像這一次 Deep-Seek 就是屬於新的演算法或者演算法改良

人才本身是最貴的所以大部分都花在這裡再來就是基礎設施像數據中心或者是一些使用的服務基本上都要付費

那其實看完這個 AI 的五大成本以後大家會更好奇的一點是你看 DeepSick 它的成立時間又比較短然後同時它的成本又比較低人力用的又比較少那到底為什麼它可以做到完全媲美到 OpenAI 這樣的一個等級其實一般能看到 DeepSick 做出來的東西會覺得很驚訝很驚艷但是因為我跟朋友創立一個新的公司也是做人工智慧

他們用的那個方法我們其實也在用就是使用強化式學習再配合監督式微調那這種技術其實坦白說只要是業內的人都知道只是說我個人還是認為以業內的人來看

比較驚訝的還是它的成本因為以往都會覺得需要很多的伺服器才能做到那它現在看起來可以降低成本所以很多人會講說那這樣子 D-SIG 是不是低配版的 open AI 呢當然要這樣形容是可以事實上演算法的改良其實對於這個人工智慧的影響是最明顯的

事實上能工智慧的影響關鍵因素主要三個一個就是演算法的改良第二個就是資料的整理資料有沒有代表性整理得好不好最後才是運算力

在過去歐美的人工智慧公司都是以運算力切入反正我的錢很多我不怕燒錢所以就拼命不停地買這個圖形處理器那中國大陸不一樣因為美國封鎖它所以對它來說這個成本必須考量它這個運算力可能沒有那麼多他們就會動腦筋從演算法跟資料整理下手所以很明顯這一次 DeepSeek 就是朝這個方向發展

事实也证明它确实有效而且他刚刚讲到的是另外一个名词对不对对 知识真六对我利用一个教师模型把他的知识已经整理过了转移到一个学生模型用这样的方式学生模型就可以在比较少训练的状况下就可以得到

接近的效果那這樣子是不是在這個領域就比較不會有先行者優勢就變成說我在別人的這個既有基礎上面再去做精進不是就更省時省力嗎我覺得應該這樣說這些開發教師模型的這個大型的公司我認為他還是會繼續做因為他還是先行者

不管怎麼說老師懂得還是比學生多學生模型變得很容易訓練的結果就會造成將來的這種人工智慧公司會越來越多模型會越來越多甚至會氾濫成災都有可能但是我也很好奇的是像 DeepSick 他們到底是用哪三個關鍵的策略才能夠達到洗牌 AI 市場第一個就是便宜

大家可能對於這個 Chad GPT 的費用沒有什麼概念事實上 Chad GPT 如果你是呼叫它的那個應用程式介面 API 的話那個其實帳單是滿驚人的第二個就是開源很多人會問我為什麼要開源

為什麼你一家公司要把你辛苦開發的知識商業經驗公開給大家看那你要賺什麼所以回頭過來我們就要去想其實在歐美的這些人工智慧公司也有開源的臉書也是開源的那 OpenAI 它的獲利有一部分確實來自於使用者付費那 OpenAI 後來就決定它先不開源但是 DeepSeek 確實開源的而且它初期

也提供跟 OpenAI 类似的服务所以我想他敢这样做代表他后面应该还有新的商业模式会出来代表他并不完全是靠这个最后就是市场区隔因为 DeepSeek 我刚刚说比较偏重中文类的资料 OpenAI 可能是偏向欧美的这些资料我想市场上有区隔所以因为这三个原因

造成它可能有一定的市場佔有率因為其實我覺得 2025 年對於整個中國的市場來講它其實有兩個地方很震撼第一個是春晚你們看到機器人出來了大家覺得說機器人出現了第二個就是 DeepSick 出現的時候他說銀麻了用這樣子的字然後寫說改用中國產的晶片但是這樣子會對現在全世界尤其對輝達會有產生影響嗎

我覺得最大的影響還是在於到底輝達有沒有如預期的會有這麼大的市場過去這幾年幾乎每一家大型的雲端供應商就是我們講的 Google Amazon 臉書 微軟這些公司他們在投資人工智慧似乎都不太擔心要燒多少錢反正你輝達有什麼我就買什麼而且一次買到滿

尤其是像特斯拉马斯克也是曾经喊话说你要出多少万颗全部给我但是 DeepSeek 出来之后我想他们开始内部就会检讨是不是真的要花这么多运算资源今年我觉得影响不大但是明年后年这些厂商就会开始重新检视

是不是要那麼大的資本支出其實我認為還是會成長只是說不如想像的大那就是不如預期通常股票市場只要聽到不如預期大家反應就會很激烈這樣的一個狀況對於我們台灣的 GPU 供應鏈會不會產生一些什麼樣的影響我們又該怎麼樣去持續保持這樣的一個競爭力第一波去年前年就是因為人工智慧伺服器的需求硬體的需求所以台灣就是第一波受惠

到了明後年因為整體的資本持續可能就會受到限制所以大家就會預期可能他們的業績就沒有當初想得這麼好但是我覺得還是要回到源頭因為有人說 Deep-Seek 模型變得更精簡 更容易執行那是不是意味著將來 AI 的應用會百花齊放聽起來是沒有錯但是關鍵還是在於人工智慧目前最大的問題是一本正經胡說八道

這個問題 DeepSeek 並沒有解決所以這個問題沒有解決的狀況下你要人工智慧產業百花齊放我覺得會有困難我們幫大家做了一個測試用了這些的 AI 軟體來做了一些詢問他好像會出現一些 AI 幻覺比如我們就問他說

謝哲青他除了主持我們下班精英學這些節目還有哪一些驚人的經歷呢結果你知道 AI 說你有什麼經歷嗎我自己都不知道的他說謝哲青不僅是一個旅行家他還在美國 NASA

NASA 喔 你要在那邊擔任太空歷史顧問怎麼會有這種東西他說你負責研究外星文耶 NASA 現在根本沒有這職位目前的演算法在計算機率的時候它是計算這個句子回答你你會覺得它是人類的機率最高所以一本正經所以跟正確沒有關係而不是計算這一句話的內容正確的機率所以胡說八道

怎麼解決這個問題所以科學家想出各種方法目前最常用的方法就是所謂的 RAG 檢索增強生成簡單的概念就是先用資料庫去搜尋這些資料假設我資料庫搜尋出來的內容是正確的然後再用這個搜尋之後的結果來排列組合

湊出答案給你但是你說這樣就一定正確嗎不是 也不是主要還是在類深間網路在排列組合的階段還是可能會出錯一方面是你搜出來的資料也沒辦法百分之百確定是正確的所以這兩步因為都還是有錯誤的可能最後還是會無所罷倒但是已經把這個

錯誤降到比較低川普現在已經放生晶片產業沒有去美國他們會很不開心這個對台積電應該會有影響嗎我認為台積電現在可能的應對方式第一個因為總要給川普一個面子所以擴大在美國的投資讓美國尤其是川普總統覺得說可以達到他美國製造的目標接下來這個新廠落成一定會有剪彩典禮這個要請川普來讓美國再次偉大了那種

那種感覺很重要因為政治人物要的是這個嘛那我覺得投其所好那接下來的問題應該是要回到就是川普總統會因為這樣就滿足嗎

不確定站在台積電的立場因為川普總統用關稅來做武器台積電能夠用的方法大概也只有這一些所以像 AI 的未來下一步的發展除了我們一直去精進那些它的錯誤率之外還會有哪一些我常舉的例子就是人工智慧對一般人的影響

終極目標就是要做到鋼鐵人裡面的人工智慧 Javis 大家可以想像一下將來你把你的電腦打開裡面就有個 Javis 跳出來主人你好有什麼可以幫你服務的是你就跟他說剛才老闆給我三份資料叫我交一份報告你幫我把三份資料看完然後整理一份報告給我各位想像一下如果 Javis 整理出來的資料真的十分鐘整理完而且內容都是正確的

你是不是立刻就會把你手上的電腦丟掉換一台新的我認為三到五年的時間三到五年這需要一段時間其實還滿快的還有哪一些我們在面對 AI 的未來要注意的呢產業目前在推的一個趨勢就是把推論運算從雲端的人工智慧伺服器搬到終端裝置

所以各位可以想像一下剛剛那個類神經網路一堆圈圈跟箭頭的模型可以放進你的電腦手機裡面的處理器所以將來我們手機晶片或者電腦的處理器裡面處理人工智慧的加速運算會越來越多這種加速運算我們就稱為特定應用機體電路就是所謂的 ASIC

科學家又取了另外一個名字針對人工智慧把它叫做神經處理器 NPU 我想這個應用將來就會越來越多對 先感謝曲博為我們分享這麼多重要的資訊謝謝你