Yes!我的高股息國際巨星來了!蛤?國際級的高股息?哪一檔這麼給力啊?00963 中信全球高股息嚴選海外優息企業掌握全球收益機會 3 月首次除息囉!哇!這麼神!我也要跟上除息行列打開券商 APP 輸入 009633 月 17 號前買進即可參與趕緊下單去!
投资一定有风险基金投资有赚有赔申购前应讲阅公开说明书
聊一下就是你一開始看到佐克伯突然變成了開源世界的領航者你覺得他經歷了什麼事然後待會我們再聊這個 Sam Altman 的轉變所以我覺得這好有趣好的我們回到 23 年的第一季度當時就是 ChatGPT 時刻到來其實是 23 年 1 月開始爆發
當時所有全球的主要公司都在想怎麼辦 Google 當時有一個項目叫做 BARD 現在這個名字不記得了先不講名字當時 BARD 也出來但是那時候就有一篇報導在講什麼呢他覺得 Google 內部分析是有可能他們真正的對手不是 OpenSource
他真正的對手是未來的某一個開源的東西他那時候就這樣分析了是的最早那時候我都還在兩年前兩年前的現在 23 月的時候我當時為什麼在關注因為我那時候還在華為工作其實也才兩年科技創新娛樂各種新奇有趣都在寶國朋友說嘿你聽寶國朋友說了嗎
哈囉 歡迎來到寶博朋友說我是葛禄君寶博士今天這集是我們最接近開源 AI 大模型的一刻了隨著最近 AI 模型不斷開發演進其實有一個問題也開始引發討論其實也不是問題而是說一個過去很宅的專有名詞現在人人朗朗上口而且掛在嘴邊但是到底大家是不是足夠了解它的未來又會是什麼樣我們一定要來了解一下就是開源與避源
到底什麼是開源 什麼是閉源到底開源好還是閉源好一個開就開放的開閉就關閉的閉那源就是那個源頭的源三連水源不同的選擇又有什麼樣的影響就如今天標題所說歷史巨輪到底多高
多一邊馬上一起來歡迎今天的大來賓 Richard 強哥大家好我是 Richard 林旅強強哥不管有沒有聽過我的節目其實我們各種 podcast 還是要介紹一下來賓你自己是不是也有 podcast
曾經想做過一兩期但後來都是上別人我有看你其實直接上 VcastVideo podcast 你就直接有錄影然後就是聽的也有看的也有的那種都有我也上過那個就是天下這邊的一個聽天下
也上过那个就是肖上龙这边的老朋友老朋友太好了所以今天真的是超级超级难得因为我们今天的来宾 Richard 林吕强强哥其实是周游全世界所以大家如果听到他的口音怎么好像有一些各式各样的特色我们其实就讨论技术所以不管是什么样的一个状态我们都来了解现在的科技的发展
那強哥是早期 Costco 台灣非常知名的一個開源開源人年會開源人年會的志工那 09 年加入了中原院這真的是超級早期的是自由軟體鑄造廠對英文叫 OSSFOpen Source Software Foundry 那個時候我應該是在那個年代才開始逐漸認識什麼叫 Blog
就是你们就是在推广一些知识的开源技术的开源所以部落格在这个从中央医院这边有很多的社群就开始推广当时也是我们早期的这个参与者翻译部落格没错嘛对不对那时候还用什么 movable type
知道这个组合单字真的是老了投身开源的工作真的非常长的时间 14 年登陆左岸当年联合创办了开源社到现在其实好像还有很多的活动我看到你们还有演讲每年都办中国开源年会在左岸对 然后曾经在华为做了快 8 年的开源和开发者生态的工作这个其实是这个算 developer
就是跟 developer relationship 就不一样它其实更重视社群包含它包含 DevRel 就 developer relationship 在内哇
然後前陣子大家都覺得非常震撼的就是我們的強哥算是早期就加入了李開復老師成立的一個 AI 公司而且這 AI 公司的網址超酷的他就叫 01.AI 對不對叫 01 萬物擔任開源暨開發者關係的負責人翻譯過兩本書開發者關係之方法
還有在 23 年出版的開源項目超越代碼預計今年 10 月會出版現在我們錄音的時間出了還沒 正在醞釀因為當時預計是這樣但應該是今年的 3 月份 OK 這個今年是去年總而言之大家敬請期待我們為什麼要做這麼長的介紹是因為強哥在過去幾年其實我自己走跳江湖
这个遇过很多阿宅其实讲到阿宅大家一谈到开源其实 Richard 的名字很经常跳出来强哥的名字也经常跳出来然后我们还有另外一个强哥就林强也是很支持他很支持开源的就是这个 CC 授权的音乐所以真的是强这个都强
那我覺得這一次大家要想要來跟強哥來討論我想大家都知道了就是在農曆年的時候因為這個 DeepSeek 做了一個很震撼的這個開源的算是權重開放的一個 AI 的專案那號稱這個用了比別人便宜的成本然後訓練出了不比別人笨
所以大家就對於開源這兩個字就變得特別好奇了後來好像還引發了很多的聯誼到現在也還沒有結束包含 DeepSeek 自己現在有開源週好像就是每隔一段時間要開源一些東西就連續五天一天開一個項目然後大家就是聽說說那一天開源大家都不用睡了因為所有的公司就會投入進去研究它開放出來的這些東西我們就來看一下就是說到底
这个开源好还是闭源好这个问题我觉得待会大家再来回答但是想要先请真正懂开源的强哥让千万粉丝可能可以大概知道一下到底什么是开源什么是闭源
我先从这个软体的角度先不讲大模型软体的角度就是我们写软体其实是用人类可以阅读的不管是 C 语言或者现在很流行的 Python 对吧去写这个软体写完之后呢我们要经过一个编译的过程然后让这个机器可以读
就有点像大家知道什么 0101 这样的一个排列这样比喻所以说其实原始码也就是说开源的这个源它其实是一个可被阅读也可以被分享甚至大家可以共建比如说我今天把我的原始码放在这个 GitHub 就是全球最大的开源平台上那你今天看到了你可以直接把这份抄过去去使用你也可以说你哪里写的我觉得不够好我把它修改之后呢
送一份我修改的版本给你你觉得我修的好再把它合并到原来的专案里面去所以其实开源世界当中是一个我把它开放出来先造福大家去用大家看到你开了再去修改再造福大家去用是一个就是
彼此是彼此的肩膀让大家一起成为巨人对 一起站在真的真的我觉得这个想法很好这是原来开源软体这样的一个逻辑而开源大模型其实跟开源软体有一点不一样因为大模型的训练过程并不像我刚刚讲的只要软体把它编译后机器就可跑它其实是需要有数据
也台湾叫资料就要很多的资料而且这些资料是要经过各种标注各种处理它不是一些 raw data 就能直接用你今天要花大量的时间金钱去处理这些资料让它变成是符合训练大模型的这样的一个要求接着你还要去了解训练大模型的一个算法再来你要有庞大的算力比如说我们今天可能知道因为大家
对 回答有一些像是比如说这个 H 对吧 H800H 表这一些卡对 训练大模型所使用的这些卡非常的昂贵它跟我们软体就是你直接就编译其实你电脑现在随便会开个云主机去做那个成本完全不一样所以现在
坊间所谓的开源模型其实是经过刚刚把数据做好把这个算法做好经过他自己的这个训练完之后的成果我们称之为 weight 也就叫权重
所以那个权重对不起我也算是半个外行所以这个权重它是一个档案吗还是它是一个就是说很大堆的数字很大的 Excel 档还是它是一个什么我们要怎么去理解它你可以理解它是一个非常大的 Binary
那這個 Binary 是可讀的嗎它是一個向量空間然後它是一個數學還是它就是一個 Binary 它已經變成一個巨大的檔案它是一個黑盒子所以你是無法去反編譯它的就是你像軟體的話我們所謂的反編譯就是說即使你拿到一個 Binary 那你或許可以用一些反就是逆向工程的方式去反編譯它但因為大模型太大了以現在的技術來講不太容易
去进行反变因为你也要同样那么大的算力所以你可以理解它是一个黑盒子你可以拿它来用但是呢它比起一些这种所谓的闭元软体来讲它有个好处是你可以基于它来去进行再去做微调再去做对齐的工作什么 qualify 就是什么几 Q 几 Q 还可以压缩可以压缩
比如说量化压缩是一种方式然后你可以基于它像现在不是也有人想要拿 DeepSeek 来做台湾版本的一个大模型其实它就是因为它做好了预训练它这个模型你的后训练你的对齐你可以再加上你自己的要求去把它做成一个新版本的模型所以它又不像是闭元软体说你不能动它其实你是可以动它
它虽然不是 readable 但是它可以被 reconsume 就是它可以被重新组合或消化对因为它是可用的
所以你可以用它来做衍生作品所以假设我们说 DeepSeek R1 是 671B 是它最大的版本所以它就是一个 671 不对 671B 是它的参数量所以它的档案可能就 maybe 几十个我是没有真正下来那个版本总之就是一个很大的一个档案
我想問一下因為我們早期一聽到開源的大語言模型我們想到的是 Meta 推出的這個 Lama 我想問這個我自己好奇 Lama 所謂的開源
跟 DeepSeek 所謂的開源他們兩個人口中講的開源也不一樣我先講我知道 Lama 的開源是有條件開源所以有很多人在批評他因為他好像說什麼賺超過 100 萬美金以上要給他錢之類的所以從你的專業我相信你應該有研究過這個問題所以我們嘴巴上講開源兩個字可是事實上它會不會背後有不同的意義從 Meta 的 Lama 跟這個所謂的換方量化的這個 DeepSeek
它两者讲的开源有一样或不一样的地方吗好我们从技术的角度来讲它都是把它的 weight 它的权重给 open 出来让 open 可以就是 public access 就是大家可以可得所以从这个角度来讲他们 release 的东西
是同一类的东西他并没有把它更早的比如说他的训练的数据给开放出来但是他的 license 是不一样的 license 我举个例子什么叫 license 就是我允许你怎么用我的方式以拉玛来讲早期他的开源的条款
我有研究过最新版本的我不确定有没有改但是它早期刚 release 的时候它有两个条件被 OSI 批评为它不是开源 OSI 是谁它叫做 Open Source Initiative 它是个全球最权威的开源组织全部的开源 license 都会经过它的 review 跟 approved
所以说他会去审核那他当时就写了一个博客写了一个 blog 说为什么 Lama 的开源不是真开源是因为呢第一点他有限制说呢如果你今天的用户数量达到 700 万以上的月活你就不能用这一条是针对字节跳动
针对特定公司因为要 700 万不少越活 700 万越活越用户数所以这是他的第一个要求我记得他还有其他的一些要求都跟原来 OSI 所定义的 OSD 是不一样 OSD 就是 Open Source Definition 可是当时我们开源圈的人就说你凭什么拿一个开源软体的定义去套大模型呢
它是不同的東西所以 OSI 最近其實也就是前陣子出了一個叫 OSAID
Open Source AI Definition 的 1.0 版本已经出来了而且也是我有参与到里面因为开源社也是有参与到它是 OSI 的正式组织成员组织开源社作为成员组织加入并且有在 OSAID 的讨论当中有提供一些意见所以其实说白一点就是现在它并不符合 OSAID
DeepSync 也不符合也不符合就现在坊间所有不符合 1.0 也许未来就符合了但是没人说因为现在 OSAID 虽然是 OSI 出的可是它现在还不是行业通用它只是出了所以 Meta 自己搞一个大模型的 Open Source 的标准对而且 Linux Foundation 也有另外一个标准对
所以其实现在的行业还在很早期并不知道所以我并不能责骂别人说你把这个称之为开源模型但我可以理解你的开源跟我的开源可能是一个开源各自表述
因為不太一樣的東西時代也改變我覺得這裡我回來科普一下我覺得大家可能聽還是會有一點聽不懂因為我們千萬粉絲因為強哥真的太專業了我又很宅不好意思我覺得是說我換個就是說大家可能會覺得到底開源什麼叫做權重什麼東西
我自己印象中 DeepSync R1 出來的時候我自己有下載到我的電腦然後我是下載 70B 的版本 70B 就是它的參數量是 700 億個參數檔案大小我如果沒記錯可能 40 幾 GB 之類就總之它大概乘一個正比所以你可能如果是 670 幾 B 的參數量它有可能就是幾百 GB 這樣子
那它是一個超肥的檔案所以你可能要分段下載那下載完以後你就會用一些機制你可以裝到你的電腦好那到底這是什麼好我先講因為那一天趙少鋼趙大哥問我說那什麼是算力我就說算力呢就很像我們的大腦就是我們有很多的腦細胞我們的腦細胞越多我們能夠處理事情的這個同步處理的速度就愈快
如果演算的我就這個比喻就腦細胞數量越多 圖數越多我們的想事情就越快就像 GPU 越多張像 GROG 3 就是說用 20 萬張對不對 20 萬個 GPU 可能就會越快我們的大腦其實在思考是你就是電流在那邊竄所以你看 NVIDIA 為什麼說它的頻寬 GPU 跟 GPU 之間的頻寬也很快
要很大就是表示他的计算的速度越快所以你可以把算力想像成一个电脑或 AI 在思考的时候的这个脑细胞数量或者它的复杂度或者它的速度那到底开源是开什么我在想有没有一个比较抽象的比喻当然通常比喻是会失准的但我们就接受这个失准我刚才想说那个权重他会不会有一点像是
我們把腦的那個星圖就是星星假設我們說腦的腦細胞分布圖
公開因為就是說我製作一顆 AI 大腦然後這個 AI 大腦我們有 670B 就是說 6700 億參數的大腦你就把它想像抽象類比就是說它可以思考 6700 億個維度的一個大腦的結構的一個不管是地圖還是一個組合的一個很大的矩陣
那你把它公開了這樣那所以大家拿到這個東西以後他很可能還可以重新排列這個腦細胞的位置或者稍微做一點微調他可以基於他本來的這個智慧然後呢再怎麼樣就是把他洗腦套這個布丁的時候把他洗腦有沒有這種相近的類比可以讓比較難理解電腦運作的人他也知道說到底開放原始碼或開放權重的大模型
是什么意思首先第一个好处是什么呢它有点像是一个免费软体就是说呢免费的软体就是说你今天不需要去购买它你只要把它下载到你的电脑上就能直接使用我先讲这一点它其实不是但是我要好类比第二点是呢免费软体你其实改不了
你只能选择接受他或不接受他但如果你今天知道怎么去调教他的话你今天可以拿了这个大模型再加入一些你希望他在针对某些问题针对某些知识你可以再喂东西进去去做后训练这个不叫预训练这个
他已經預訓練好了預先訓練嘛後訓練就是我在加料我在想辦法調他所以說呢之前就有人說他拿了 Deep-Seek 本來可能問他一些某些問題特定問題他回答是
这个价值观但是呢我希望他回答那个价值观所以呢我就通过一些资料的去输入去喂然后再经过一些后训练的工作这时候也需要三立的介入那我训练出来的版本他就同时具备原来他的智慧以及呢他在某一些事情上的观点会偏向是我要的所以呢这个就叫这个后训练会叫对齐的一个工作我有一个
類比這類比可能不是太精準我覺得有點像這個冷戰時期美國跟蘇聯在搞特務戰那這個 CIA 這個找了一個 KGB 來那 KGB 好像這個很厲害我把他這個吸收過來
我就說其實他的智慧我們是可以調用然後我們是也可以去調整或對齊他的價值觀的所以其實之前 Proplexity 這家公司也就在前幾天就是重新洗腦了或重新對齊了或重新調整了這個 DeepSeek R1 推出了一個 R1-1776 的版本那他就基本上
他宣稱了他宣稱了就沒有特別多的問題的限制那當然還是有人去測他覺得洗腦洗得不夠完整他可能在問他一些喜歡吃什麼食物他可能會聯想到一些其他的問題所以我想要回來問就是說現在的這個開源這個議題浮現出來
你自己身邊有沒有很多人就是我自己是阿宅我就覺得很有趣我連去餐廳吃飯都會聽到有人在講那個 Deep Sik 怎麼樣怎樣那個開源很厲害
你自己的感受你有沒有覺得你作為一個在開源世界深耕十幾年的人你在 Deep Seek 跟 Post Deep Seek 這個你有沒有感覺到這個差異就是說大家突然好像對於開源有了更多的討論可是這個討論會不會其實有點誤會或什麼你自己的親身感受我目前的感受來自於一些
我网上看到的资讯包含了我在我自己的微信的圈子在中国的圈子以及我在台湾的 Facebook 或者是 Threads 这些或者是 Twitter 的美国圈子我个别都看到了一些点但是这些圈子其实没那么贴近民众但是我确实有在坐公车的时候听到公车上的大概 70 岁的老人在讲 Deep Seek 我真的有听到
所以你讲这个我也是有一点感觉的那我从不同的圈层都能感受到什么尤其是一些以前看不明白开源的人也都开始在比如说以中国的资本圈为例 Deep Seek 出来之后所有中国资本圈的那些资本都在反省说为什么当时我们没有办法投 Deep Seek 包含百度投资部就在
DeepSeek 楼上他们都看不懂所以他们没有投而现在 DeepSeek 其实是别人捧着钱要来投他们还要让他排队一个月去看所以其实是因为开源本身的商业模式跟投资圈原来理解的商业模式有巨大的差异我不能说原来投资圈的想的不对
所以其实它会冲击到某些即便资本圈是专业人士也都冲击到了一般民众的话说白了更多是人云亦云就是大家对它有一个简单的想象因为你知道很多人把开源想象成什么就是 Deep Seeker
他把这个东西无偿的送给大家去用就是为了要去颠覆美国的产业为了让华尔街这个 NVIDIA 的股价狂跌这是事实就是说他是有因果关系在的但是这是不是 DeepSeek 的目的以及他未来到底
怎么促进产业我觉得大家的理解都还比较片面我想到一个新的比喻就是我们在看科幻电影的时候有一些复制人按一个扭然后就会有一个全身光溜溜的从某个膜里面掉出来你就想象我觉得这个所谓的模型党
其實就有點像這個複製人他也很聰明你只要稍微讓他喝口水可能按個按鈕還是敲他兩下他突然就會算數學了只是他是一個原生的狀態我覺得這種開源的大模型有點像把那個
从模调出一个有智商的复制人的这个功能交给你可是你是可以给他看新的课本你可以再给他重新训练那我觉得有几个点还是第一补充不是只有软体是开源的
硬體也有開源 open hardware 這真的很厲害大家有興趣去研究接下來台灣應該要開始研究機器人或人性機器人的產業其實這個產業現在也有很多開源的這個醞釀所以說不定下一個所謂的硬體開源的 deep-seek 時刻也會出現只是說這個項目是什麼我們還不知道可是我講到開源的時候我就要回來為什麼我們今天的題目叫歷史的巨輪
是因為有兩個我非常不能講憧憬而是說我覺得他們很厲害然後他們都針對這個開源做了一些讓我很訝異的
决策第一个就是 Mark Zuckerberg 就是 Meta 的 Facebook 的创办人他是我觉得是这个世代可能最聪明的人之一拜托搞一个 Facebook 活到现在全世界几十亿人每天还黏在上面而且他是闪电式的去并购了一个叫 Instagram 的服务十亿美金当时大家还觉得他疯了现在所有人都知道没并购 Meta 可能就挂了
可是他其實在早期是非常封閉的甚至有人搞一個什麼劍橋門說他喜歡自己偷看東西對不對他希望說所有的數據都在我手上然後我要去看我還甚至還可以去 manipulate 他可是這種人突然有一天跳出來突然說我的 AI 要開源這個 moment 其實讓我對這個決策產出的過程很有興趣
這是第一個點是我覺得很特別第二個是這個 OpenAI 的創辦人 Sam Altman 在 DeepSeek 開源以後他有一篇訪談我不知道是真的是假我覺得是真的就是說他正式認錯你要知道這種人認錯是不得了的大事他們這種都是
就是很聰明他沒有必要認錯的他說是歷史的巨輪他站在了錯誤的一邊是的然後他說他意思是說他覺得他當初跟馬斯克就是吵架馬斯克覺得要 open 然後他雖然一邊嗆馬斯克的 open 不是真的 open 這是另外一個故事那最後他選擇了避援就是說他的 open 他就笑他說你的 open AI 是在做 close AI
你可不可以從你開源專業的背景跟我們聊一下就是你一開始看到佐克伯突然變成了開源世界的領航者你覺得他經歷了什麼事然後待會我們再聊這個 Sam Altman 的轉變所以我覺得這好有趣好的我們回到 23 年的第一季度當時就是 ChatGPT 時刻到來其實是 23 年 1 月開始爆發
当时所有全球的主要公司都在想怎么办 Google 当时有一个项目叫做 BARD 现在这个名字都不记得了太烂了先不讲名字当时 BARD 也出来但是那时候就有一篇报道在讲什么呢他觉得 Google 内部的分析是有可能他们真正的对手不是 BARD
他真正的对手是未来的某一个开源的东西他那时候就这样分析了是的最早那时候我都还在两年前两年前的现在二三月的时候我当时为什么在关注因为我那时候还在华为工作其实也才两年
我在華為內也負責了盤古大模型的一些生態工作所以我一直在看整個行業的情況那麼我就在想對有沒有人可能會開源來去彎道超車
結果 Lama 出來的讓我覺得說果然有人這樣做而他這樣做是什麼原因呢?幣源的模型你只能夠以服務的方式去調用他的能力就調 API 我們從阿宅的角度來講如果是一般的聽眾你就可以理解是我只能賣有點像是它是個自來水我只能開水管就那個膜掉出來的人不屬於你你只能隔著一個沙去問他問題對吧但是我沒有辦法決定就是自己去造這個水
那開源的模型是你只要自己家裡有夠多的蒜泥你就可以去部署你甚至可以做後訓練你可以針對你的自己的場景去做各種各樣的你可以加一些維他命在水裡面然後你可以拿它免費的去賣給其他人所以它開源會造成各種的場景被滿足因為避源你只能滿足最主要我想提供給你什麼
你无法做成琳琅满目的饮料或者是对所以我当时看到 Meta 这样做我就在思考他为什么这样做他不是第一次做开源在他之前的 Open Infra 他也是有一些 Infrastructure 也去把它开源了他希望的就是通过我开源让大家都用我这个东西形成了产业的一个事实标准一旦产业形成事实标准了那我就是这个标准的领头人我就决定了产业格局
他覺得邏輯是這樣子只是現在這個市值標準被 DeepSick 拿走了而已就說白天是當時跟現在還是有所不同但是 Lama 現在也做得不錯聽說他 4 月要出 Lama4 所以大家還在競爭的這個階段但是開源有什麼好處就是一旦你出來之後你的測評你的能力比開源弱的所有模型
你就已經沒有機會了你就 OUT 了比如說百度為什麼現在又攀然醒悟說他想開源因為百度文心一言最早的時候曾經百度創始人李彥宏還在去年的互聯網大會上講說開源是智商稅你可以查查看這是事實他就抨擊的開源很爛那是因為他自己是避源的
而且他相信走币源路线是对的因为当时所有人对标的是 OpenAIOpenAI 从开源转币源就代表开源没有钱赚只有币源只有搞头当时很多产业的人都这样想所以他曾经说过这话当然今天被打脸了所以百度也幡然醒悟说我 6 月 30 号要把我的东西都开出来是因为开源决定了大模型的地板不是决定天花板你开出来之后比你弱的所有模型就全灭
所以它是一種自損 800 傷敵 1000 的一種玩法但是把市場搞大對的他不一定把市場搞大他就是把競爭者給幹了
对所以开源是一种把你的竞争者变少的一种方式而且是用杠杆的力量就是等于是好多工程师在优化这个东西但是不是全部都是你的工程师对吧某种程度你这个理解是开源软体的理解开源大模型不存在你讲的这个情况也就是它是
獨家的你作為別的工程師你無法回頭優化這個大模型但是你可以基於這個大模型去做符合你場景的大模型你無法對上優化你只能對你自己的特定場景那我再回來補一個小白的問題就是說 DeepSeek 就我的理解他不只公開權重他還有寫論文就是他論文也公開了一些優化或者是演算法他最近還推出了一個什麼
什么 attention 的一个机制模糊什么就是那它是不是某种程度又等于是把这个是不是又公开的更多了就是这个变成说大家也有可能就像那个 Hugging Face 不是就说它在重造这个 Open R1 它是不是就是等于是说我不直接拿你这个膜掉出来的人来重新洗脑我做那个可以按按钮掉出人的那个系统
这个是怎么样去理解我平心而论这件事情可能是因为 DeepSeek 出来之后大家才回头来看看到这件事但是每一家开源的大模型它都会公开它的论文目前是行业标准对就这件事情你 release 一个 open model
你必然会附带 release 一个论文因为呢这些做 model 的人他都是一些博士他希望在学术上有建树所以这是他的标准配备指示我要讲的指示你今天 release 多少这是问题有的人他讲的有点模糊你无法附现我们写过论文就知道写过论文写过专利很多专利是你按着他做就做不出来好
了解了解我回來還有一個我們剛剛提到的這個我理解了就 Meta 這個所以佐科博還是聰明他知道這種這個力量我覺得因為我見過 Sam Altman 直接跟他就是面對面他真的是一個氣場很強的人
然後你如果讓他不感興趣他正眼不瞧你一下他如果讓你感興趣他覺得你是他這世界上最好的 body 他這種性格很強的人你要叫他在媒體面前說我站在歷史巨輪錯誤的一邊 Oh my god 你有看到這個新聞嗎你覺得發生了什麼事他怎麼會突然批辯就是
坦白說我第一次看到這個新聞是在微信公眾號裡面然後我也知道微信公眾號不能全信的所以我一開始覺得是不是假的我後來看了一些之後我發覺我跟你的態度一樣我傾向認為是真的
但是呢嗯这件事真的假的我后来发觉我不用太在意了因为呢后来的结论是他真的会已经在考虑了嘛要去 open 他什么东西所以从他的动作可以回头来看这件事情他这个思考的变化对那你觉得他的思考的变化也一样是竞争的问题是不是就是
對你看剛剛你講的很有趣你說因為競爭很激烈大家都砸錢我為了有一個很有效率的做法把大家都幹倒然後而且是傷敵 800 傷敵 1000 自損 800 這是在有一個開源大模型的情況之下可是現在出來兩個甚至三個
不知道从开源社开源人的角度你觉得会发生什么事大家都开源吗还是开源的竞争力量就变少了呢因为对不对我先说一个产业的格局可能现在大家讨论的比较少就是西方就以拉玛作为开源的代表
还有另外一家公司叫做那个 MistralMistral 是法国的对那他们当时也是做很多开源的模型包含 MOE 就是所谓的多重专家混合模型其实是 Mistral 首先先把这个论文给实践出来今天的 DeepSeek 说 MOE 做得好其实也是借鉴于 Mistral 的这个可能很多人是不了解再来呢今天在中国
因为我们就讲中美我们把 Mistro 当成美中国的模型很难说现在欧盟跟美国感情也不太好这就另外一回事我是说从产业的逻辑中国的大模型其实第一家做开源企业我不要说第一家在做开源的梯队当中我最敬佩的其实不是 DeepSeek 是阿里的同意签文
為什麼這樣說呢就是那個 QWEN 對為什麼叫 QWEN 是因為 Q 就是鉛的這個漢語拼音的第一個字鉛就是 QIAN 那 WEN 就是 WEN 所以他把它寫成 QWEN 就是 QWEN 這個大模型其實他們從一開始就是開源的而且從小尺寸的模型到大尺寸的模型全家桶全部開所以當時我的理解是阿里
同意前問他想要通過開源的方式讓它成為行業的標準就是他在想的事情可能跟 Meta 很像而且 Meta 是大公司阿里巴巴也是大公司所以這樣做我覺得 make sense 所以比較讓我驚訝的是 DeepSeek 作為這樣的一個公司當然它的異軍突起有很多
各種層面有很多不同的原因但是總之中國在做開源模型的時候我覺得千問一直是我覺得做得很好的然後 DeepSeek 也是一個所以只是因為 DeepSeek 的被重視大家回頭來看坦白說我覺得千問有點冤就是他們沒被真的報導但是現在在中國落地最深的企業內用的大模型都是用千問為主沒有產業內的現在都知道千問了因為 Apple
在 Apple Intelligence 因為我真的是要真的是這個 2 月 19 號這個最新款的 iPhone 發表會上又發表了另外一個重磅消息就是本來 Apple 的 AI 叫 Apple Intelligence 只提供英文的版本那他還甚至因為他自己可能做得慢所以他還直接去跟 OpenAI 合作去整合了這個 ChatGPT
正當大家在敲碗說怎麼沒有其他的語言的時候這次釋出了說 4 月份要上了簡體中文的版本
傳出來 Apple 千挑萬選選了千問你知道這件事嗎當然知道對呀原來你這樣一講我就知道因為我不理解為什麼是千問為什麼是因為他沒有看到 Deep Seek 嗎還是可是因為他選擇的時候又是 After 這個 Post Deep Seek 所以千問其實也是一個蠻早期的一個開源的大模型的項目
所以有可能就是千万才是千万才是引领的中国开源模型发展的领头羊不是 DeepSeek 只是 DeepSeek 异军突起而且成为一个 icon 所以
Deep Seek 已经 icon 化了就是举国上下乃至于全世界都在谈论它那我想问那闭元模型怎么办像不过这个已经有答案了因为 Sale Holder 们部分认错了是不是对李彦宏也认错了所以闭元模型接下来
沒什麼搞頭了我覺得這是一個鐘擺效應的某一百而已就是說因為現在真的太難了需要更多機制來加速大家有點像是我舉個例子在 Deep Seek 開之後誰開了有個叫 Minimax 我不知道你曉不曉得是六小虎之一 Minimax 也把他的某個模型開源了並且宣稱說他比 Deep Seek 更強然後再來前兩天的新聞 Moonshot
就是那個 Kimi 也開源了 Kimi 我知道所以以前這些絕對必源的公司現在再開源了所以現在必源的最大堡壘剩下 Grok 會不會因為他現在排名第一現在評測他好像第一他是評測第一對 LM6 這個榜單其實也是一個所以他現在剩下
他是必援的這個灘頭堡他沒鬆口啊我的感覺 Grok 好像沒有沒有特別去提開源的這件事 Grok 最新版本是開源的
Grok 对 Grok 的最新版本有开源并且上了 LMC 的榜单然后目前是站在第一名的哇我落后了没事没事 OK 他早期的时候确实没开啦然后前几周有人访问 Elon Musk 问说 Deep Seek 的时候他就说对这是我有关注到其实很好他说我们之后也会有动作所以最近的一个版本他上来就是开的好那接下来呢我就想要问了因为时代的巨轮在走好
这个有大国家小地方大语言小语言像日本它是小语种它就一亿多人在用日文那我是很好奇从你看到这个历史巨轮的转动这些小语种的或者小地方资源没有那么丰厚可是我自己的观点我那天跟 Lucy 聊我就说这个我觉得接下来就会是有 AI 的企业对上没 AI 的企业
导入有导入深度导入有深度导入 AI 的政府对上有深没深度导入 AI 的政府这其实就是一个关键字效率
就是一個所以大家不要聽馬斯克在那邊吹什麼 doge 你以為他 efficiency 的這個 e 是在開玩笑我告訴你這是關鍵因為 AI 時代就是效率人類的發展就是效率工業革命就是效率火就是效率你把肉放在那裡也會熟成你用個火就是效率 AI 就是效率我想要問的就是對於小魚種的
對於小的沒有那麼多資源的社群組織也好啦地方也好你覺得我們要怎麼跟上這個 trend 我們看著這個巨輪在滾了
我是要攀上去好呢?還是我跟著他跑呢?我是要就是說我們就不搞一個自己的開...我要搞一個自己的開源模型呢?還是我不搞我就追那可是我追我可能追錯啊我若一追我追了千問我追了 DeepSeek 我追了 Grok
結果又跑出一個什麼歐盟大模型哇 又更強追不完我那個人好不容易把他洗腦完了譬如說像現在布丁要 based on deep seek 要去 retrain 要去弄一個台灣價值台灣的 post trend 對 post trend 所以你覺得從開源的你的觀察你的技術的 background 你覺得有什麼 tipsfor 這些不管是日本
还是说社群组织其实日本的话我下个月刚好有朋友在那边他们说下个月其实是要发一个日语版的大模型那他是去
全部自己搞吗不是它是基于拉玛来去做的基于拉玛对所以也就是说它也是 post-trend 就是所谓的后训练跟对齐下来的一个模型所以我认为今天不在牌桌上的说白了现在牌桌就只剩中美顶多一个法国对能做独立的大模型的我看到是这样子那你在牌桌以外的人你要去 follow 其实你是可以拿坊间的不管哪一国的开源大模型去改
这件事情我觉得也就是说它是一个衍生作品基于某一个大模型的衍生像你说布丁要基于 Deep Seeker 我非常支持这件事情而且大部分大模型从功能上的角度来讲是不涉及到意识形态的所以如果有些意识形态上的出入我们通过 Post-trend 的方式把它给本地化
对本地化当然很重要像早期的时候我就认为最终大模型会变成是什么一国一模型或者是一个文化比如说你伊斯兰的跟基督的他们的文化认知就不一样你不能说谁对谁错但是对吧那这个不同地区可以有不同的大模型去支撑那这个不同大模型源头它的所谓的 base 基座模型不可能每个国家自己去寻一个太贵了所以基座模型可能就只剩下中美
那我們要怎麼去選擇那個基礎模型來做的問題那我問幾個小小基礎人就是說所以我們在選擇開源大模型上
我們要依據什麼來選就是說現在也有人跟我講說他覺得布丁不應該選 Deep-Seek 他應該要選 Lama 你就等 Lama4 大家要怎麼評估是評估他改版的速度嗎因為這就有點像這不牽涉意識形態這只是說我們如何評估去選擇一個開源的架構或者如何評估去選擇一個開源的大模型好 第一點就是你會不會被開源斷供
這是很重要的你選擇一個開源模型你要確保或者是說你要相信這個企業它是永遠會走開源路的
對 這件事非常重要我不是針對哪一家公司就是說今天 Lama 在 Lacoon 在的一天他就會開源對吧 因為帶隊的是 LacoonLacoon 在的一天他就會繼續開源 Lama 4 Lama 5DeepSeek 目前他給人的整體感受是他大概不會走回必然的這條路然後阿里同意簽問
我从公开的信息跟自己私人的关系都知道他们不会走回避援路所以这几个第一点不会被断供因为如果你一个开源走到一半忽然说开谁国避援了那何必呢对吧所以你要去 follow 一个长期的战略是不会避援的
第二点就是要去看到底你今天选择这个模型去做你的场景你的诉求在哪里每个模型有不同的点比如说我们说 DeepSeek 很强但是它强在推理
如果说今天是所谓的内容创作型的千万某一些系列的模型就会比 DeepSeek 更强如果你今天选择 Lama 很可能是它在某一些语料因为不同的模型是有不同的语料特性所以其实我都会建议是没有标准答案你先看你的目的是什么你从目的反推你需要哪些 feature 你从这 feature 再去做测评
所有的開源模型你都可以公正的去做測評測出來最終你選擇這個版本你下個版本如果不選這個模型其實也沒關係因為去做後訓練去做對齊這件事情的技術上不那麼依託於說你前面用誰你下個版本就不能換誰
不是這樣子的太好我們就另外一個問題我補充就是說你剛剛也提到了就是說我可以用我依據我的需求假設日本韓國台大清大不管是誰大家要訓練一個 post trend 一個模型我要準備什麼東西這個蠻重要的我是要準備錢我準備人準備伺服器準備算力我要準備資料
你如果是你你你怎麼跟大家分享現在說不定在聽節目有很多大學校長說不定有很多組織社群有很多的是這個要訓練文化的台語文化等等我們能不能讓他們知道說好你現在選一個那接下來他要做什麼收集資料還是什麼
我觉得最关键的其实是钱跟人为什么我这样说是这样子什么叫钱就是你做一件事情你要一定的预算因为这件事情就算是以所谓的开源协作的方式来做他算力要不要钱很多再来他的数据就资料的取得要不要钱很有可能因为你不能期待一些拥有数据的人直接免费的奉送给你对啊
别人可以跟他采购为什么我们就要求他因为爱台湾就免费这个其实是不健康的所以我觉得钱这件事情是很重要的再来是人人的话是这样非常多的企业他拥有很多的数据比如说一些媒体或者一些出版商可是他自己并不知道
他这一些数据要怎么样变成是标注后的数据而今天要做 post-trend 你今天一样要把这些数据拿来之后去进行一些标注使得他符合就是后训练的一些就懂得人不是 pdf 加速到汇进去 import 不是那么简单的对
对就是所以说你一定要有懂后训练或是懂整个训练这件事情的人他也就是大模型的从业人员他必须要了解其实台湾不是没有这样的人有的甚至在美国比如说我们刚讲那个榜单 LMSIS 那个榜单的维护者其中一个就是台大志工毕业出来现在在美国的对吧然后有一家公司是不是专门在做这个资料叫 Alexander One 一个我忘记名字了就反正总之这其实这也是一个工作就对了啦
对你说 scale AI 吗对对对他是不是就在提供这些他在做数据标注对嘛是这个意思吗对他在做数据标注不过他是以他公司的方式他直接付钱让就让有些人为他做数据因为这个人我不认识但这家公司跟这个人我知道对所以而且他们的标注业务是泛起全球的包含在中国大陆也有人在帮他做数据标注对
所以其實我剛講的就是要懂的人他知道這些事情的功法這些事情應該怎麼做要花多少錢然後去評估譬如說像是布丁為例好了他就屬於懂這件事情的人他也能夠 Leverage 到一些懂大模型的還有這方面的資源所以
说白一点有人可能说批评他说你为什么不选其他的那我只能说开源的好处就是你不要批评你就自己去立一个项你做得起来你就做你做不起来你骂他干啥不要说什么没有人你就是那个没有人这句名言又回来了对因为你可以不认可他你可以不参加他但你说他你算啥你有捐钱给他吗如果你捐的我有捐我的意思说如果你捐的主要的钱比如捐了五千万捐了一亿给他他当然得
跟你协商嘛那如果你啥都没有其实大家不会太在意的好我想我们进入今天大概因为我有很多朋友也是可能做投资啊做商业啊我觉得大家很关心因为你知道我觉得这就是很有趣的冲撞不是冲撞就是一个 blending 就是说我从来没想过开源这两个字会进入到投资圈你知道因为
我也沒想過 Deep City 跑出來你知道最近很多投資機構跑來問我開源的事對 然後就 Deep City 跑出來哇 這個一下子把 NVIDIA 搞跌 17%現在又回來了大家就說 哇 這是開源的力量嗎所以我想要問所以你怎麼看待現在這個世界的趨勢這個
這個所謂的開源跟避源的未來變化所以開源就會因為這次的契機變成主流嗎這個我不知道家電硬體也開源人型機器人也開源還是我就覺得有可能這個 Humanoid 會不會這個人型機器人會不會大家看到這樣我如果不開源我會不會沒有辦法帶來這個新的突破你怎麼看就是說這些投資機構來問你
你觉得开源这一次放下了这个重磅的这个炸弹突然炸到了一个不太熟悉这个东西的地方你怎么看未来的商业会因为这件事情而有所变化吗首先我觉得开源这件事情你先站在客户的角度就比如说我要卖一个东西给到客户那客户为什么要相信我
如果我把原始码就全部开给对方假设是定向开源那么客户会不会更相信我如果我把原始码不仅是给到客户我还告诉他 GitHub 上面全部都有客户会不会又更相信我因为有更多的眼睛帮忙一起看这个开源有没有藏后门有没有安全问题有没有 bug 所以开源逻辑上它是一个我裸奔你全部都看得清楚所以你信任我
建立商业信任的一个点甚至很多因为开源在中国有句话叫白嫖白嫖意思就是不要钱可以直接用那么很多人不要钱了直接去用了它能形成什么形成一个广大的 user base 有了 user base 就会形成 community 有了 community 它就会形成一股你的
忠實的力量幫你再把這個東西往商業推廣也就是說你把這個東西開源且免費的出去之後你就會帶來用戶用戶你再想辦法把這些流量變成錢也就是中國互聯網經常講的羊毛出在豬身上
只要封口上來了所以 DeepSeek 現在當然沒辦法從賣他的 license 來去賺到錢可他有沒有辦法以後從別的路徑找到一個能變現的方式 Google 我就舉個例子當時出來的時候他有像 Google search 如果每次 Google search 一次你要付一塊台幣你還會用嗎你要去想這個事現在掉 APIOpenAI 就是你用一次就得付一次錢
对他说我免费给你用 Gmail 也是我免费用当时好像是一开始 1G1G 当时我觉得很爆炸因为当时的台湾国内的这个 Email 只有 100M 对吧在当时这个时候所以他通过一种你意想不到的方式把这个市场给占了把这个标准给拉了所以让很多的
就消失了所以今天我看开源其实是有占领市场的一个逻辑它能不能变现得看它占领完之后它如何变现所以我不认为开源直接能直达商业但是开源是先把场子清一清
跑馬圈地的方法對那 player 變少了之後大家再去想怎麼賺錢所以他其實有別於過去投資人想的事情尤其現在投資人還蠻現實的就是我投你你就得財報怎麼樣幹嘛的你看現在 DBC 的財報根本不會 insert 起來他沒有收入他怎麼起來呢對吧所以很多的邏輯跟 valuation 估值的方法
方式会因此而转变而 DeepSick 是唯一一家小公司做了示范你看其他都是一些大玩家我刚讲 Meta 对吧阿里巴巴对那 Mistro 虽然是小公司也做了初期的示范但它没有爆炸因为真正爆炸是 DeepSick
哇今天真的是腦洞大開喔回去要聽個八遍因為真的很細緻因為我覺得這真的不只是 AI 帶來了人類的一個所謂時代的轉變我覺得也因為 AI 的難度複雜度它的突破性突然讓我們做事思考事情的方法又有一個新的維度開源以前只是一個圈子
可是到现在突然变成商业的人也在关注我再举个小例子可能如果观众是台湾的硬体产业的听了会比较有感觉其实开源硬体之前你刚也提到了最早有个叫 Arduino 对吧再来有个叫 Raspberry Pi 树莓派我其实上我这个月月初就在英国建桥我去看了树莓派的全球唯一的线下实体店对我就看到你有 po 对的也就是说刚好我人在英国所以去建桥
那从伦敦去剑桥没那么远但是我也顺便就是跟 ResperiPi 这边的就是也有一些交流其实我早期就看到了 ResperiPi 通过把硬体的一个他们的设计图给开源然后再通过
把品牌跟社群建立起来之后他能够就卖这个 Raspberry Pi 的硬体来赚钱所以这个模式早就有人跑通了那么我们某些比如说物联网的智能家具的智能设备的或者说
我们有很多台湾做硬体的东西有没有可能去把我们自己跳脱供应链我们来牵头做一些事因为台湾的产业最大的一个 feature 就是我们是供应链的一环苹果拉起来 NVIDIA 拉起来我们在里面能赚钱我们唯一能做的是把泵表拆拆拆把 cost down down down 对吧是这样子来赚钱
可是我就看到了人家英国也好或者是一些其他的地方他可以跳脱出供应链去独立开一个产品说我们就通过开源的方式来赚钱我一直觉得台湾的厂商可能这个思路这样的认知还比较没有但是我们台湾的硬体制造是非常的厉害对吧我们现在蛮有钱的我是说公司里其实为什么不去做一些新的尝试在新的时代之下不管结合 AI 的结合开源的
来去玩呢因为我自己这个也是有点肺腑之言我了解开源这么多但是我只能服务于中国的或者是海外的厂商台湾的厂商似乎我很难报效我回我们自己台湾对所以我也会觉得说如果有这样的一个机会有台厂他想要做这样的尝试其实我很乐意去聊一聊对
太好了剛好就是我想要做的 Ending 就是千萬粉絲聽到這不管你是學生教授大學或者是企業主
大家如果有興趣的話真的歡迎大家多了解開源所以最後讓 Richard 講一下如果我們要追蹤開源社我們是要去哪裡是看你的 Blog 還是你的臉書然後台灣有沒有什麼因為你雲遊四海台灣有沒有一些其他的開源的組織社群值得大家去多追蹤多了解跟聯繫的
好的,我先從台灣本地來說吧,就是我們有一個叫 Costco 開源人年會,這樣的一個每年會有一度都在夏天舉辦的會議,它基本上是把台灣本地的開源社群的成員每年就大家大拜拜聚在一起一次,大家關注的可能是不同的技術點,有人可能關注前端,有人關注區塊鏈,有人關注 AI 的不同,有人關注 infra,
云的一些东西但是大家都会聚在一起今年的时间是在 8 月的 9 号到 10 号在台科大去举办且他不用报名你人去了就行赞助商现在应该还来得及赞助欢迎各位大老板赞助一下开源社群所以如果大家有兴趣的话就可以联系 Costco 或者联系宝宝或我
我觉得都是因为我一直都是我们也很开远对我觉得这是第一个然后第二个就是说如果你对 AI 这个方面是想关注比较多的话其实
我也有好朋友在做台湾的 Gen AI ConferenceGAI Conf 它其实也是一个小剧它在五月份会办一年一度的年会今年五月份以及它平常会办一些 Gen AI 的小剧所以说大家也可以参加在 KTX 上也可以找到 Gen AI 小剧的一些报名的方式
这是第二个部分第三个部分其实是我在中国大陆做的开源社如果您有微信账号的话其实可以关注我们的微信公众号我们基本上会把乃至于中国乃至于全球的一些开源最新的一些资讯新闻还有一些进展都会放到开源社的微信公众
所以我觉得这也是一个可以了解的点当然是简体中文的最终就是我们也会就我个人也会关注很多不管是开源的 AI 的甚至资本圈的一些事情我虽然没有自己做一个像宝宝这样的 IP 但是如果可以有兴趣关注我个人的 Facebook 账号 Richard 林旅强我觉得这也是一个可能的方式然后也很欢迎大家就是
就譬如說私信跟我聯繫只要有一些合作的可能性我也是很歡迎的太棒了作為公僕我也自己私自的來幫速發部給他們一點鼓勵因為最近速發部有一個專案叫數位皮夾
那他们这次也会选择所谓的全部公开原始码虽然我好像还要了解一下他是不是要选择 license 就是说这个公开原始码跟开源之间的差别是什么我了解一下我就想一分钟公开原始码叫做你看得到原始码但没说你能用
開源是指說我附的一個 license 例如說 MIT license 像這一次 DeepSeeker 就是用 MIT license 去 release 它的這個模型就可以賺錢你可以拿來賺錢當然也有一些 open source 的 project 它可能用的是 GPL 不同的 license 但是公開原始碼不等於你能拿來用
太好了 幫速發部澄清一下他目前是公開原始碼但他就是講說可以讓駭客因為有記者就會問這個會不會更危險他的意思就是說也會讓大家一起來檢查他是不是有隱私的疑慮會不會被攻擊當然因為是花納稅人的錢大概一億多所以當然應該是不能讓大家亂用的
但是我覺得這樣的精神我是給予鼓勵先要開放透明對 我們也會希望能夠有更多的政府的專案是以開放透明的方式我們作為公僕也會持續的來監督跟協作就是說真的有沒有開放確定
不要藏一手同時也希望有更多的政府的這些服務或者是有更多的城市碼的計劃都能夠公開我覺得更高的透明度更好的效率的社會我相信也很可能是我們非常有興趣探索的一個方向今天真的非常感謝大家收聽我們寶寶朋友說我是葛魯君寶博士也非常感謝 Risha 來我們的節目謝謝如果你喜歡我們的節目歡迎點選訂閱
現在是自動送上給你不論你是在 Apple PodcastSpotify 上 YouTube 或其他平台聽到我們節目歡迎給我們五星評價按喜歡留言或按小鈴鐺追蹤訂閱我其實也在考慮開源我的聲音是不是不知道有沒有這個計畫的合作機會我們下次公共見囉掰掰