We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

亂‌‌‌gad‌‌‌ ‌‌‌‌‌第749集 - Deepseek 震撼全球/Elon Musk 被提名諾貝爾和平奬/OpenAI 發佈新推理模型 o3-mini/ nVidia RTX 5080 賣斷市

2025/2/2

亂gad | randgad podcast

AI Deep Dive Transcript

People

Patrick

Topics

Patrick: 我认为DeepSeek使用了英伟达的芯片，如果它使用了华为芯片，那对英伟达来说将是巨大的打击。关于DeepSeek的训练成本，虽然很多人认为它很低廉，但我认为这可能是大盘下跌或其他因素导致的股票操纵，而非DeepSeek本身的低成本。DeepSeek的低廉训练成本源于其优化的训练方法，这使得其训练成本远低于其他模型，这使得小型投资人也能参与AI模型的训练。DeepSeek解决了Apple在中国AI发展方面的问题，并使其能够在本地运行AI模型。DeepSeek的兴起使得对NVIDIA GPU的需求增加，而非减少。DeepSeek是一个开放模型，其低廉的成本开创了新的机会，并非所有用户都使用其API。DeepSeek模型可以在个人电脑上运行，但速度较慢。使用蒸馏模型（distilled model）可以将大型语言模型压缩到个人设备上运行，但其能力会下降。DeepSeek的训练成本并非只有600万，还包含硬件和研发费用等。DeepSeek具有链式思维（chain of thought）能力，能够展现其推理过程。DeepSeek使用FP8来进行训练，这是一种节省内存和资源的优化技术。DeepSeek可以使用不干净的数据进行训练，这是一个重要的突破。DeepSeek开放模型的发布可能存在中国政府的战略考量。一些国家和地区已经或计划禁止DeepSeek应用。Elon Musk使用大量H100芯片，这与DeepSeek低训练成本形成对比，可能暗示DeepSeek的低成本并非完全由技术实现。DeepSeek的成功与其创始人的远见和中国政府的支持有关。DeepSeek的成功也与一位年轻的女性工程师有关，但其具体贡献和身份存在争议。DeepSeek使用OpenAI的API来改进其模型，但这可能违反了OpenAI的服务条款。DeepSeek使用OpenAI API的行为可能构成违规，但OpenAI目前尚未采取行动。嘉嘉: 我同意Patrick的观点，DeepSeek使用华为芯片的说法是错误的，目前报道多称其使用英伟达芯片。虽然DeepSeek的具体芯片信息不确定，但目前公开信息显示其主要使用英伟达芯片，华为芯片的参与程度尚不明确。Apple能够在小型模型上本地运行，这与DeepSeek低训练成本导致的廉价AI芯片无关。DeepSeek的出现使得Apple AI的成功并非完全依赖于DeepSeek，其成功原因更复杂。 Ed: 我补充一点，关于DeepSeek的训练成本，我个人认为其低廉的成本主要源于其优化的训练方法，这使得其训练成本远低于其他模型。DeepSeek可以处理不干净的数据，这是一个重要的突破。DeepSeek的创始人梁文峰并非计算机背景出身，其公司并非DeepSeek的唯一公司。DeepSeek使用OpenAI的API来改进其模型，但这可能违反了OpenAI的服务条款。

Deep Dive

Shownotes Transcript

科技变得这么快,你怎么能跟得上?一个星期一次,听联结主持 RANDGET Professional Podcast 欢迎大家收听联结第 749 集,我是 Patrick 我是嘉嘉我是 Ed

好啦梁粉刑仍然是...去了香港沒錯如果看到他可以受害你看看你們有機會碰到他立刻拿利是吧好大家新年大樂恭喜發財

很快就介紹一下我們的方法可以到 Spotify, Apple iTunes, YouTube Podcast 和 KKBOX 找到我們的節目另外我們 YouTube 也有直播頻道通常會在星期六中午或星期日中午訂閱就可以收到通知說什麼時候有直播

另外可以聽到我們其他東西的可以有 Patreon 支持我們

Patreon 的地址是 patreon.com/reandgad 訂閱可以達到 10 美元另外如果不想用課金的方式支持我們也可以到我們的 facebook page 找我們我們的 facebook page 就是 facebook.com/reandgad

我们 Facebook 也有一个科技吹水台的 Facebook Group 联结科技吹水台叫 Ranget Chat 可以一起进来聊天 Telegram 我们有个 Channel t.me/rangetX 或者 Twitter 我们也是叫 Ranget 的现在 Ad 都很努力地 post 了所有旧节目也可以去 Ranget.com 搜索今集

想不到會有留言有一個是直接電郵我們另一個竟然是 X 找到我們

第一个留言是 LS Call 给我们的 Hello 主持人好我之前在 YouTube 的留言在你们那里留言了几个但是都见你们说没有留言所以现在用 email 和你们沟通希望比较容易让你们看到是的我们是不会看 YouTube 的留言因为 YouTube 的 account 是属于联结的我们平时只有做直播的时候才会 switch 过去平时是完全不会看 YouTube 的留言

所以如果你们想我们读一些留言就不要 YouTube Comment 给我们了可以 Facebook PM 或者用其他方法联络我们好了他想问我们如何看华为的晶片呢昨天就有报道 Deep Seek 其实是用

NVIDIA 的晶片 X10 改用华为支持 R1 发展而在香港《零一》也出了一个报道支持这个说法你们怎样看呢?如果是真的话,NVIDIA 就很大镬了因为以中国的公司速度

有產能的問題因為他說 20%優質有產能不確定性但是從經驗去看通常中國公司都可以用一年或者少於一年的時間去改善這種問題 What do you think?然後他就 post 了一個香港 01 的 link 給我們

他就说,Thanks for reading,我每个礼拜都追踪你们的节目,我是海外听众,在柏林多谢你们,我觉得德国很落后,如果你们有任何欧洲科技发展的消息,我也想听到,不过我希望真的有消息,我意思是因为我觉得这里很落后,我也不是太乐观,多谢。

說回香港 01 條連結,其實香港 01 條連結我按了下去是一個投稿,或者他們應該是專欄作家之類的,不是一個新聞報導所以要糾正你的說法,它不是一個報導,它是一個專欄或者一個投稿而那個作者自稱是嶺南大學的客席

我便不斷地 Google 了他他沒有說他是哪一個學系的因為我找了很多都找不到他是哪一個學系的客席教授反而我找到他原來家裡的家族生意是買保險的

它有多少都是在 01 的投稿有一些其他的投稿就不是講 Deep Seek 的這一篇 01 的都是註明這個是個人的投稿不是代表 01 的立場所以他給我的這一篇報導我就覺得這個純粹只是在社會上某一個人他自己的觀點就好像我們聯機節目我們發表自己的觀點而已就不是為香港 01 出了一個報導去支持

是用華為晶片開發的這個說法你的是錯誤的要先糾正一下

或者是有很多东西华为在做也不知道所以我不敢说就算是有华为也要做 Inference 就是在 run time 的时候你用 Deep Seed 的 API 或者你用 Deep Seed 用来 chat 的时候打打打就用譬如如果是的话就用华为因为训练一个模特出来的部分

我看了很多報道都是說應該理論上是用 NVIDIA 的所以我其實華為那邊我是完全不知道華為做了什麼出來是不是它的晶片這麼厲害因為我在美國這邊就算是 NVIDIA 第二個最出名的就會是 AMD 你沒有聽過有人用 AMD 的東西來做訓練或者用它來做影響的有些吧但是完全是

很細微如果大嶼 AMD 還未搶到市場突然間華為立了市場也不奇怪

有禁運不讓中國運送最頂級的 GPU 可能可以拿到華為或者不是只能持一手可能是頂級的但我在美國得知華為的資料就比較少我真的不知道去到什麼程度但我覺得比較問

我覺得比較問如果現在已經做到頂級的而 AMD 都做不到的只有 NVIDIA 然後有得選擇的就是華為我覺得比較問我在香港看到其他報道說是用 H800 我都沒有看到說是用華為的 chips 去做

H800 Hopper Trip 我看到的資料是說它是幾年前買的不是剛剛買的是四年前買的是在武漢肺炎那段時間買的那時候的禁運是說那時候禁運沒有禁得那麼嚴的就是說你只要減少記憶體範圍 H100 就變成 H800 就買得了但是接著的禁制是更加苛刻的所以

現在買的 H20 是差很多但他們還是買 H20

而且很多年存在的資料有些人說 H100 是有 6 萬張 Media GPU 而有 1 萬張 H100 那些資料是在新加坡運送過去但我沒有說他還有一堆華為 chips 我又沒有看過這個報導

我也沒有看過可能純粹投稿人投稿去香港 01 的作者他自己不知道在哪裡看了其他報道或者是他自己想法可以這樣可串連的中國公司有沒有其他方法拿到 AI 晶片這是一個問號

另外一個答案是中國有哪間 AI 晶片公司華為做了一條連線可以這樣寫一篇報道出來很多時候是猜完寫了一篇報道就狂看有沒有人回覆可能是回覆真的有此事或者完全沒有這件事我見過無數的報道只是拼一拼可能是拼一拼的報道

我看到香港主流報都不是說是華為都是說是 H8

就是用一個差一點的 GPU 都可以開發到接著下一個問題就是問為什麼現在這麼多大公司要訂 H100 H200 會不會是訂多了會不會買多了這個就是很多這個禮拜最主要的問題就是 NVIDIA 突然間插 20%就是說會不會每個人訂多了是不是將來需求減低

嗯

消息但是完全不合理的消息但是股票是這樣的他想跌的時候有機會是大市想跌那些大玩家想跌的時候你就會發現有些不合理的消息飄出來我覺得真的是他們不是不明白這個不是直接關聯但是這個就是那個要他

炒下去的消息來的可能他們放了很多選項可能他們覺得 150 是頂級我還不用這個機會來搞到它插水然後全部新聞給我預約了一些面試就是說這個就是很大問題很大問題就是很大問題那是不是都比較但如果你是懂技術的你不會覺得

平民化了這件事即是說 Deep SeedDeep Seed 是將影響價值平了即是你每次問問題答案都是平了出來即是每個 Token 是平了理論上一件事平了是大眾化了是需求更加多而不是說那件事平了

就不用背後的硬件了所以買多了完全不合理但很多時候當那件事不合理那一刻就不關那件事了是背後有另一個原因這是我的陰謀論主要是 NVIDIA 不值 150 元就想炒下去

但第二天都大反彈如果各位有留底就應該賺了一鍋都很少例如你 120 元賺了 130 元單日 10%很和味

你這個鬧底是一個賭博你知道嗎你當然要彈回來才買的你知不知道它會繼續再跌多一天鬧底的人要看到第二天有綠色才鬧底不會看到紅色就鬧底那個可以買到你破產就可以

你一定要看到綠色但看到綠色的時候都只是 130 元你說綠色是沒用的香港綠色是會跌的對綠色是會跌的我們要看收市是反上去的那底 10 元頂 20 元那個賭博不是很和味

如果有亂機的聽眾有信我們講的東西其實我們早在上個星期已經講了這個話題其實那時候我已經有問 Ed 我說 Deep Sea 出來的訓練成本這麼便宜其他公司就不用買那麼貴 Ed 那時候是說

應該想現在有一個比較好的方法去做訓練有一個更強的心理學會不會再訓練一個更強的模式呢那時候 Ed 是這麼說的其實我是其實現在 Deep Seat 在做的事等於我們寫計劃

一個 optimization 的 stage 就是它節省了成本那你就寫多一點寫一些強一點的東西只是它的 optimization 是去到不知道你當 50%或者 100%我們平時的 optimization 可能說的 20%已經是很厲害的了它做了一個 20 倍的那你又可以這樣說就是說現在 openAI

應該說這麼多做 AI 的東西,現在全部都是沒有 optimization 的東西有有有,其實 openAI 有的,譬如 GPT-4,然後 GPT-4-O,你可能當作 O 是 optimized 它不是去到那種你去這麼高的 resource constraint 的方式去 optimize

他当然有的他有 optimize 而且他收便宜你他不会说我 optimize 了我照收你一样价钱他便宜了给你 optimize 每个 token 是便宜一点的他有少许的 optimize 他的 optimize 的比例一定没有那么多别人做这个 model 的时候他的心态就是我要怎样才可以做到这个

這個水平的模式用這些黑客人去做有些人說是迫出潛能出來的你說禁運是否可以呢如果沒有禁運就會變成像美國一樣因為有龐大的資金我有龐大的 GPU 當你一個計畫師有龐大的資源去做一些事的時候

我不會想太多為什麼要 optimize 為什麼我不用錢去解決問題我 scale 核什麼就算了那些投資人又沒有了期地投資下來那不如多買些 hardware 這個 cycle 多開心多過癮今個星期真的變了現在 entropic 走出來其實我們的聰明 per cost

智慧智慧是比投资的价值便宜点因为现在开始说 Deep Seek 为什么这么便宜都可以训练出模特现在每个人都在说其实你不是花了很多钱因为其实 GPT-01 是贵到离谱的它又慢又贵

我還叫了 01 香港 01 我突然想到 01 這個字 GPD01 是貴到離譜比起 4O 貴百多倍來用

04 是 4O 是 4O 嗎?我已經忘記了 4O、01、0303 又是一個 optimization03 比 01 聰明但便宜很多

如果没有 optimization 也有点但不是 20 倍的 optimizationDeepSeek 大约做到 10-20 倍的 optimization 有 O1 的智慧但 Token 的价钱便宜 20 倍

那一刻是很離譜的不如讀完聽眾會我們有一大題我想順著次序地說今個星期太多東西要說我放棄了我們還有一個留言我們還有一個聽眾留言在 Twitter 想問你在 Chrome 有一個 extension

是可以讀廣東話的叫 Read Aloud 這個我也有用但我應該有裝的間不自用好像是沒有 IOS Support 的這些免費的 App 或者是 Extension 是我不知道你可不可以讀這個訊息但這個是我的第一個在 Twitter 的第一個訊息 Happy New Year 其實可以打中文的 Excel

是不是怕 Ed 不會看你的中文?不會啊我們這裡

可能因為我的帳戶我自己用的不是 Ranggat 的帳戶我就是用英文的可能是禮貌上的問題看到我平時...OK 加你的帳戶 Personal 嗎?他加我的 Personal 不是加 Ranggat 的所以他用英文也合理的但是 iOS 不是根據有 Native Support 讀廣東話的嗎?只要你選擇語音是廣東話你就可以

可以讀就讀出來應該是有的不過用起來非常不方便如果你又要讀英文又要讀中文就會很煩我覺得應該是他 transcribe 整個 screen 而已他還有課理應該盲人用

所以每一次都是由屏幕最頂開始讀起不是說你有一個文字例如有一個電郵或是一個訊息不只是讀那一段東西來用是的你可以 highlight 然後做這件事很煩的要一段特別長的就很難 highlight 再讀是很煩的事其實我一向覺得語音讀出來 iOS 上都是做得一般般

但我沒有必要來開車時讀出來有時候我想做但做不到就算了可以不做了你說這件事令我很神奇 iOS 這期 18 年來的更新

那個翻譯差了很多很多很多我不知道為什麼會倒退那個翻譯是不是用了他的 AIApple Internets 來翻譯我真的不知道所以有時候轉接期還沒發生夠膽說這些東西翻譯到

暖了一籠沒有 context 的 translation 但是你這樣說我們已經讀完留言我解決不了這位人講廣東話的問題但是你試一下 accessibility 你可以試的應該那個都是一個 text to speech 的一件事那個還不需要 restricted to 你的 chrome 或者 safari 所有 app 都可以

整个屏幕都可以读但是接着你想说的东西就是这个星期一 NVIDIA 股票大跌但是反而有人说那 Apple 行啊因为 Apple 有它的 chips 原来小型的 model 它也可以 run local 所以 Apple 行啊我是完全不明白这个道理的

找一些東西拿出來你明白嗎你放 Lamedia 的時候你就要買一些東西的嘛但是你可以保持住你不用搞 MAC-7 的嘛你在這個時候先淡定一點 Meta 星的故事就是因為有 Lama Model 現在是 open

不是的外面的投资者一定是你不要这只股你就要投放另外一只这样做的你不会留现金的你可以买其他的你可以买 Fintech 因为之前插到很低所以水就到处买你可以买 Fintech 可以买 Biotech 那些全部都是不起过的你知道那天的成交是百多个 Mill

你想想有多少钱出来要去买其他东西我完全不明白可能是故事在哪里阿普你还有什么故事呢阿普的 AI 是没有特别的收入的现在是暂时没有

那是以前的 revenue 因為加了 Apple IntelligenceiPhone 賣好一點而現實反應是 iPhone 沒有賣到多一點不停在衝刺可以多買 iPhone 不是要多買 iPhone 讓我可以用 Apple Intelligence 也不合理所以我說故事在哪裡但現在它剛剛出了業績大陸的 sales 很差但有 Apple Intelligence 的地方就升了

哇这真的很强硬我知道 Apple 两年的 revenue 增长了 0.X%但 inflation 增加了 10%Apple 理论上是在缩水

在 Twitter 或 TwitX 裡面的人說的就是究竟 Apple 在投資什麼我不想說投資那一部分但就是想那一部分為什麼因為有 Deep Seed 所以 Apple 成功我真的完全不明白

這個香港真的有比較多的報導因為第一就是香港一直都說什麼 AI 都沒有我們睡覺現在 Deep Seat 就有我們睡覺香港表示興奮這個不是現在 Gemini 可能香港用得到

不用怕等一會因為有 open source 就沒有死亡這已經越來越是 commodity 你不可能要香港沒有應該說根本

我都說了我到現在都是一個沒有付錢用 AI 的人我經常都說差不多了我快可以用到一些比較厲害的東西因為 Deep Seek 令到其他公司又要去

他要再降低他的...放多些东西出来给免费用家去用而且 Deep Seek 是告诉大家训练基础模式

或者有些人叫 frontier model 就是最前線的我們叫 foundation 應該是比較多人用的有些人叫 foundation model 有些人叫 frontier 有些叫 state of the art model 或者 pre-trained model

是還有機的你不需要說上星期才做了一個星際機說要 500 個 billion 不是一兩個 billion 都還可以玩的投資人是可以投資一兩個 billion 的是 ok 的

但一去到幾十或幾百就很難搞了因為回報要十倍想想多難才由十 billion 到一百 billion 的機會是很低的但你說一 billion 到十 billion 是一個很有機會的

突然間小型投資人士好像都翻山了覺得不是沒得玩的是還有得玩的你要這樣想而那些人要做什麼首先要起碼買夠有 Deep Seat 的數字

NVIDIA GPU 先吧 STAR 機也不需要用那麼多資金 500V 我們上次解釋了根本不合理的數字是吹出來的 500V 是半 T 半 T 是一個天文數字來的不合理在任何一個單身的組織來說不合理在投資期已經是一間超大公司不合理

但回到為什麼 Deep Seek 可以解決 Apple 的問題香港有比較多報導講這一點第一 Deep Seek 是一個有言論審查的模式但它又拍得著 CheckGPT 的模式所以 Apple Intelligence 就可以用 Deep Seek

這個就是解決了 iPhone 在中國的問題其實 Apple 可以用 Lama 的它沒有用而已其實 Apple 絕對可以混入 3B 的 Lama 如果它想的話但它有些東西要在 Cloud 做的 Apple Intelligence 不需要在 Local 做 Lama 可以就這樣自己做在 Local 3B 很小的它的意思就是蘋果要在中國發展 AI 的話基本上

就是要用碟石用碟石的用作它可以用之前的那個什麼之前沒有的八道雲不夠厲害那個很差現在出了那個 Crane 那個 Crane 那個就是阿里雲之前那個八道那個叫什麼文心一言文心一言很差的已經接在一起了

文生怡不要再提了現在是 queen 和 dipsit 變了角質了文生怡變了角質你等他多玩一會兒可能又會出現的但現在我們說的應該是 queen 和 dipsit 中國的

其實那個 queen 我有特意去找她的意思原來她的中文名字叫做 Tong-Yi Chin-Wen 而 Chin 的拼音就是 Q 字頭文是 Wen 其實是千文不是 queenTong-Yi Chin-Wen 就跟之前文森一年是不同公司的 Tong-Yi Chin-Wen 是阿里雲的

之前那個是百度這是阿里的明白明白今個星期我都 re-pied 到原來大家不斷說

都没有理解的有些人继续说你能回答多少个第一个就是刚才这么说就是 NVIDIA 根本没那么需要基本上我可以说是更加需要的你这个星期都看到 Deep Sea 一红了那一刻它是应付不到一些

是直接下降的又不讓人 Sign up 那他要做什麼呢其實他最需要的是更多 Npedia 的 HPU 他不是要更多任何東西或者可能是華為的 AI 晶片吧總之他就要更多的 Hardware 不是因為他省了錢而要少一些 Hardware 他需要更多的 Hardware

第二就是说人们是踩台的踩低位的踩低位是不要紧的但你要分清楚你是谁你是什么身份你要知道哪一个角度可以是政府的角度可以是投资者的角度可以用一个

寫程式而要用 API 的人的角度可以是一個最普通的 end user 我只不過要一個 checkgpt 而已有這麼多的角度你想踩它踩在什麼角度最多踩的一個就是不可以講中國話你試問問六四問問文化大革命那些東西

是你去 DeepSeed.com 查一下是不能问但是有很多时候我们讨论的角度就是它是不是一个 open source model 我能不能拖现在就是说上个星期末即是上个星期天

如果你付款的话就用 ProAccount 可以选 R1 的模式它已经拆除了 Moderation Layer 没有不允许 64 的模式那个模式是开放的但 Low 是有机会拆除一些不等待的东西是可以改的那个模式是开放的就有很多玩法

有些人说继续问是不是说不到大陆话我不是在 perpetual search 吗喂答完你的拆了就能回答因为那个是有个检查的层次在那里是拆掉的拆掉就能问如果你

就这样用它的 API 或者你敢在 iOS 里安装它的 APP 那你便答不到有些人说你用 DeepSeat 会被大陆拿走你的 data 如果你用它的 website 用 iOSAPP 便会被大陆拿走你的 data 但是如果我 call API 或者我 load

一个 model 在我自己的机器里我用 perplexity 的那就不会被大陆拿走所有的数据你要看一下你一支杆打杀一船人是个角度我用的那个 model 我用的那个

就是没有这个问题你怎知道我在说我用什么程式我不是用他的 IOS App 我用 IOS App 你这么笨安装个 IOS App 你就被人偷了所有的数据把所有的东西都传到大陆这样是很合理的但你不可以一说 DeepSweep 偷了你的数据那你就太

你太廣泛了你一講就講完 Deep Sea 你在講什麼呢你有沒有感覺到這個問題我又不是這樣看的我覺得是因為作為一個報導不是一個科技的不是像我們一樣是科技為主的一個媒體因為它的受眾就是大部一般

一般的 Layman 就是安裝 App 或者上去大部分人應該都是講 DeepSeed.com 所以我覺得這個報導是沒有問題的有幾多人會 call API 和自己安裝好喇嘛來用的我在外國在 Excel 那些人聊天因為我們有太多選擇

在這樣的選擇我有時用 CHATGPT 有時用 SYNC 我到用 Deep Seed 的時候我真的要求有一個高級的

理論要他回答我一個很深的答案我的追求是追求我有沒有一個更聰明的模式去解決我的問題可能我想了原來有 90%的人真的不會叫 API 原來有 90%的人只不過是當他拿一個不用錢的 CHAT GPT 來用可能我想多了但是我一想就是 Deep Seek 就是一個 open model 我就是開創了一個

之前做不到的東西因為之前最厲害的是 Lama 而 Lama 真的不是那麼聰明除了 403B 的模式你講 open source 最厲害的嘛對 open source 只有一個就是 Lama 3 403B 的現在突然間有 Deep Seat 而 Deep Seat 是一個

不是 Lama 的水平是 GPT-01 的水平突然間 O1 連 API 都不敢叫因為實在太貴突然間便宜 20 倍這是開創了一個新的機會給很多人我每天都在查

我公司是用 AWS 的 AWS 用 Entropic 的模式可以逐个 Token 计算钱我每天都要查究竟 Deep Seed 什么时候才在 AWS 开出让人用终于去到昨天 30 日

Amazon 有提示終於在 Amazon 有得用了但是不是每一張 Token 要你開整部機機器大到不得了你們猜不到多少錢因為要開那部機不是計算 Token 而是夜 4 小時租用那部有 6 張 GPU 的機

哇很和味你猜一下多少錢一個月不用想了這些不是一般港式會入貨的遲些等 API 用 per token 計算才試一下用現在 AWS 的 Service 叫 Sagebreaker 就是 load 了一部很大的機有 6 張 GPU 在裡面

就是一個月 27000 元那個模式是你自己專門用的你喜歡的機器你叫多少都可以因為機器已經寄出你用你當是公司的資產 27000 元我心想 27000 元兩個月可以買到

三个月可以买到两张卡我真的可以买到两张 H100 回来真的很贵但是有这样的机会但是你不一定要用 Amazon 我公司跟他有了合约已经签了那些

即是他不會漏我們資料雖然 Amazon 都可以相信但你公司就要簽署這些東西但你可以用 Propensity 的你可以用 Propensity API 但我公司沒有合約所以我不能用 Propensity 所以我還未試 DeepSeek R1 的 API 就是這樣你之前不是說你安裝在你自己的手機上嗎 DeepSeek?

我是裝了奧拉瑪我上星期說我是裝了 Destil Model 來的 Destil 是什麼意思呢基本上底就是奧拉瑪

基本上現在怎樣裝在你自己的手機上都不會是一個 complete 01 的模式不會是一個 Deep-seed R1 可以加密化就可以了但也不是一個完整的

差不多了 Quantize 用的那些是可以的現在說的是你用 Mac Studio 192GB RAM 你可以 load 到 Quantize 一點 Quantize 是為什麼呢譬如那個是 8-bit Model 變成 7-bit 或者不可以 6-bit 或者 5-bit 就將 memory 的需求減低

如果你有 M2 的 Mac Studio 192GB RAM 你可以 load 到整個 Model 到你自己的 Mac Studio 而今個星期有些人做到用 CPU 加 GPU 都可以即是說什麼呢

一張 3090 有 24GB VRAM 接著輸入 96GB 普通電腦記憶體在 Windows 機上用 Limit.cpp 輸入一個 Quantus 模式速度很小約 45bit

可以用 SSD 加記憶體加一點 VRAM 讓它自己完成然後可以運作到全模式當然是 Quantitized 不是原本的比數也有九成多功力不是說很弱雞兩個 Token Per Second 每一秒出

八九个英文字没到你知道是很慢但是可以不是不行是能 load 现在说的 Deep Seat 真的可以 load 在一个普通人的机上是没有互联网的底下用到 Deep Seat 的而不会传送到大陆的但真的很慢

真的很慢沒 20 個 token per second 你都不要發聲但他只有兩個 token per second 一個 token 大約四五個字英文字母每秒有八九十個英文字母但很慢但能做到或者你問他一個問題回床吸一會回到床上就可以看到答案

加加说你不是已经 load 了吗我 load 了的是 distilled model 什么意思呢即是一个 Lama 例如一个 Lama model

不斷問 deep sea 問題令這個喇嘛模式聰明了事實上是可以用 deep sea 來解釋令喇嘛變聰明了我曾經做過這個模式但那個稱不稱職不稱職因為底部是弱雞底部是小學雞就算問一個 PhD 十萬個問題問完底部也是一個

小学生虽然他是一个懂得多了的小学生但他也是一个小学生你真的要用深入设计的模式才能称职那些叫做 Quantash 的模式是缩小了一点但是你当那个深入设计但是

很累的低低低弱了一些但有九成功率今個星期還有什麼要說的很多謠言在網上剛才說了不可以說中國的東西我已經說了可以拆掉的很多人都會拆掉的遲些你會看到可以拆掉的可能 Low Local 你都可以拆掉那些 Moderation Layer

另外一个就是说 Deep Seed 是说谎的根本不是 6M 也就是用 600 万就可以训练出一个模型这可圈可点

第二就是说 600 万是妖言惑众根本他的硬件费就是很贵他的 R&D 费就是很贵可能吧不过我看完开头讲都是说 600 万是训练费我从来没看过他说 600 万是年

买机连所有员工的工资我真的从来没看过如果这个是令到你有少少误会的那是你一厢情愿的我看的就是事实上看完那些文件的人是有很多东西是学到回来的

第一他的模式有 chain of thought 其他模式 O1 是有的他有 chain of thoughtchain of thought 是打完 prompt 之後他把你的 prompt 一直想到什麼一直自己繼續 prompt 下去 prompt 完一輪才最後把答案扔出來你會一直用他的模式看到

他連心底裡的一句話也說出來有些人是一同

Deep Sidd 說話時就罵他他就想了這個人很粗我都要用就他的方式來應酬他然後他就回答了如果你有什麼問題才問我吧他不敢罵他然後下一句就說你給我想一些可以幫助世界和平的事他說

這個人很反覆想的那句也打出來這個人想的東西很反覆開頭叫我閉嘴現在又叫我想怎樣可以世界和平我也要怎樣怎樣回答他他連想的那件事也打出來這個就是現在這些

O1 啊或者 Deep Seek 会做的东西你是看到有些新的新的技术是你可以抄到你自己再研发模特你可以照用他的技术另外一个技术就是呃

上次跟梁凡一起说过拆除了很多不同的技术我今个星期听了一个 Perpacity 的 CEO 的访问就是说很难做的不是说你拆就拆你要每一个模特都稳定

這個是 Expert 我就把這個波交給你那你有一個 Expert 的 LM 的一個 30 多 GB 的一個模式

你要令到他穩定整天那方面都很聰明是很難訓練的他的書本就解釋了給你聽怎樣做另外一樣東西大家都想學的就是因為其他公司有無窮的硬碟從來不需要節省資源但是這個深層系統因為不夠資源去用 Floating Point 8-bit 即是 FP8 來做訓練

為何 FP8 難鍛鍊呢?就是因為要很肯定知道用到這麼少必數要知道這些數字

要在 100 萬位置準確地把插座的位置調整到最高的位置如果需要 0.5-0.5 位置的位置要調整到最高的位置

就不用弄來弄去直接放個數字就一定準確但因為要節省位置要很準確地知道哪一堆 variable

在哪個位置需要很準確的要做一點 offset 這些是 optimization 如果不是的話你用不到 8 bit 因為 8 bit 太粗糙不夠準確不夠細節但它可以用 FP8 來做訓練這個已經節省了一半的 memory8 bit 和 16 bit 就是要多成倍 memory 又節省了可以用少一些 GPU 用少一些 bandwidth 什麼都少了

最后一件事是大家这次也在讨论的最重要的就是它不用清理数据之前 R1 训练了一个 R10 它不用干净的数据干净的数据是什么呢?一加一等于二它就拿了这个数据来训练

这些就叫做干净的数据他训练的不是这样的 1+1=1.5 又有另一篇文章是 1+1=3 这里又有篇文章是 1.2 他就在这些垃圾的数据下从中去找自己去分辨

越训练越觉得原来 1+1=2 那我就立了 1+1=2 但是他训练的那堆资料是网上的垃圾资料他要从垃圾资料里面

找出真正的答案為什麼要拿這個 DeepSeek R1-0 其實跟 AlphaGo AlphaZero 一樣你不給它規則我沒有給它一個世界上什麼叫做對什麼叫做錯的道理給你你自己去 055 它就從中在一些垃圾的數據裡面 055 而這個東西是很多人需要學習的因為

Machine Learning 最大的問題最大的障礙就是拿好的數據現在你告訴我這間公司懂得有一個方式是不需要訓練

不需要好的数据都可以训练到这个真的是一个大发现你就在网上自己搞定只要有足够的硬件给他你不断扔垃圾给他他就一直训练越训练越好这是一个很好的大发现大家都在转移这一件事这就是开放出来的深层的大贡献如果你看不到这个大贡献

你会觉得大陆但是当然你说有没有阴谋论当然有的大陆现在有什么问题它不够 GPU 它当然想做一个好的榜样给你你看我将我的 model 研究到最 top notch 的 model 我将它 open 出来给大家看如果你亲自跟我玩那不就可以大家都

分享大家的发言从中大家都有得益这个当然是他想外出的东西但是

你問政府是可以怎樣小心呢?我真的想了一段時間你可以小心些什麼?你已經不買 GPU 給他了你還可以做些什麼呢?那你自己小心吧你知道是有這個危機的但是你還可以做些什麼呢?就是這樣

所以意大利已經禁止 DeepSeek 的 app 但沒有禁止網頁版如果你是身在意大利的話如果之前未下載 DeepSeek 的 app 現在就找不到但仍然可以用 check.deepseek.com 另外台灣那邊也在討論說打算禁止 DeepSeek 美國好像說不知道哪個政府部門或軍方說不可以用 DeepSeek 是的

我看到今星期 Elon Musk 因為他也在用很多錢他的資料中心是 10 萬張 H100 如果你告訴別人這個少很多資源現在存在 5 萬張卡他只有四分之一或六分之一

H100 来的其他全部都是旧卡有些 A100 那时候还没禁运然后就是 H800 因为买买下大陆买买下 H100 或者买买下 A100 说不准买顶级卡突然禁运那就可以买一些 H800 后来说 H800 都不行了现在有些更差的 H200 应该是买的更差的全部都是有钱的

那些 H100 的人就在传说可能在新加坡调过来但是没关系的重点是他不可以说有多少钱就买多少钱 GPU 而喂

Elon Musk 有多少钱都可以买多少他想要多少都差不多可以要到多少他当然觉得你的 Deep Sea 肯定不是用那么少资源你可以挑战他的这些是开放的你最后看完他的书然后最后证明他就算用你这个技巧都是没可能训练出来我到现在看不到有人说是没可能跟那个技巧用少很多资源训练出来我觉得是

很多人都看完是正面的他不是沒有告訴你他做了什麼技術他不是沒有那個技術給你的你可以吸收他的技術你可以反駁他的但是問題就是為什麼他有一班天才在那裡呢為什麼他有這些人可以做到一些而你所有西方國家都

這些可以說是頂級

他被人绑手绑脚都可以有顶级的研究呢这个就是那个问题而他说的这个我不知道你信不信就是这个只是 side quest 而已他这间公司是做投资的就是拿一些 GPU 拿来计炒股票的就是做 finance 的东西的他只不过是他说用多余的 resource 来研究一个 side project 而做到出来的就是这些是

不小心做到出來你可以信他也可以不信他但我覺得這些是不重要的那些叫做什麼我聽了就算了我小學的時候很多人說我沒有讀過書然後拿了 100 分其實在背後讀了很多書所以我不在乎那個人有沒有讀書我只知道你拿了 100 分回來

我看的訪問不是這樣的是不是美國和香港的訪問不同呢我看的都是二手報道有訪問 Deep Seat 創辦人梁文峰你那個比較近因為是他講出來的你應該比我近其實我看到的報道是這樣說的本身是一間叫做計量金

金融機構即是大陸叫什麼?量化金融即是那些 financial product 的公司但現在變成在大陸不合法大陸很多東西都是以前合法不合法啦國家需要你搞 AI 你們現在要搞那些不合法的

其實那些叫 Quantitative Finance 的東西很多時候都是零錢遊戲你有些人虧了錢你就賺錢其實對於國家的 GDP 來說是沒有增長的只是找一個輪流從中賺了一點點錢那些幾千幾毫的即少成多

基本上對國家來說只會在左袋搬到右袋的錢但在 GDP 來說是沒有增長的例如我賺了 Ed 的錢例如我在 Ed 身上賺了 10 元 Ed 少了 10 元我多了 10 元對於整個聯結這個節目來說其實是沒有增長的所以其實在大陸去突破國家級沒有增長但 GDP 是絕對有增長的我給你 1 元你給我 1 元我們的 GDP 就是 2 元

他之前做了一間簡單來說叫炒東西的公司炒東西公司那間叫幻芳而他 2023 年的年頭就成立了現在這間 Deep Seek 叫深度探索所以他不是一個 side project 來的他的確是成立了兩間公司的其實這個時間點我覺得是有一點巧合因為 2023 年的年初是什麼呢就是 check GPT 3.5

那時是 2022 年年尾 11、12 月左右就爆出來的很明顯就是 GDP3.5 爆紅之後才成立 DipSeq 這間公司而你說那些天才怎樣請回來呢?他引述他的消息他說專門是先目標北京清華超頂尖大學的博士生或者是碩士生

不介意别人是有没有工作经验的新学生也照请或者只有一两年工作经验也照请然后他说他这间公司是没有分部门没有分阶级这件事情为什么这么重要呢因为在大陆很多时候他们那些做事是会需要请示上司你上头说做就做说不做就不做他就很强调他这间公司是没有分阶级的

所有同事来到公司都是一个专案小组,即是一个 project 的形式,然后大家一起扩展出来的一些东西任何人提出什么 idea,在小组里面的其他人就看看是不是可行,如果大家都觉得是可行的,就一起去做所以就是没有阶级的差别

全部成功的人都是這樣例如 Steve Jobs Elon Musk 都是這樣工作表很平坦一有什麼事就報告去 CEO 差不多很不等勢的人但他在做一個很重要的項目上頭匯報就是 CEO

但這件事在大陸來說是非常罕見甚至可以說它是創新我想可能有很多人沒有聽過這個概念就算沒有說大陸香港也很少香港也有某程度上比較有 Hierarchy

然後做這個 side project 然後他請的人不只是讀電腦這些東西他連讀文學那些頂尖的畢業生都請為什麼呢?因為要確保模特理解文字文化方面是正確的不是隨便放一堆字在模特裏面

所以你说它是不是一个 side project 我就觉得不是因为如果它邀请文科人进去的话它是很在意它的 input 和 output 的理解力

這間公司屬不屬於本來的那間?不屬於,只是兩間公司,只是同一個廠辦它不是從屬的關係它是另外開了一間新公司,專門玩 AI 這間新公司就是 Dipsec,中文是深度探索

所以是兩間公司名舊那間之前是 2014 年創立的那間叫幻芳這一間就叫 Deep Siggler 是兩間不同公司都差不多只不過有時候你講故事一個傳一個就越傳可能傳到我那裡就改了故事不過他本身是一個 finance 人他不是一個電腦底的創辦人

我個人認為一個金融人士去做這些看不到回報的投資好像很奇怪我到現在都不能理解一個這樣炒東西的人怎會把錢放在一個不知道自己什麼時候有回報的東西上真的很少有我真的很有保留

對於他這個個人的公司故事但他成功他又投資成功現在最少中國的投資會無限量支持他

國家會支持他不像投資中國的那他就成功了他現在說是進了軍方但不知是真是假他不用最後是怎樣他現在這一刻已經成功了他只是有遠見是一個兩年的 project 來的已經成功了我又不覺得是一個你知道聰明開的人

很多人都很聰明本身跟程式有關不是普通的炒股票是用程式去炒股票你不能說他完全對電腦方面不熟悉他是完全有眼光有策略而他不是沒有版本的他是有 AI 給他抄的他才知道同一套套路

如果國家是在保護這件事即是 openai 不能夠進入中國中國又需要這類型的東西它的對手是甚麼就是那些百度阿里巴巴現在說的那些小型的公司照樣有效在美國也有效 openai 也是一間小型的公司也有效也可以打到那時候沒有對手我想它照

照這套套路覺得有效就照做我覺得他的 side quest 是因為他有另一間公司給資本繼續供應這間公司對於這個人來說這是他的 side quest

她有一家很賺錢的公司養著一個未必賺錢但有機會的公司但其實這個這麼厲害的模特不是她發明的是她請的一個員工是一個 1995 年出生的女生現在 29 30 歲的女生香港大陸的報道給了她一名叫天才少女但我也不知道為什麼 30 歲還叫少女

沒結婚就少女囉那有很多人一輩子都沒結婚那你那個 80 歲是少女

我覺得現在好像多了關於那個女生的報導不過我不記得她叫什麼名字傳說美國給過千萬美金年薪挖角叫她去美國請一個間諜回去就變成了就算她不是間諜也有一半人懷疑她是間諜你請出一個人被人懷疑她在美國做間諜大陸也不讓她走就是啊

他肯制大哥不讓走還有另外一個你還有沒有繼續我們繼續說下一個就是另外一個謠言但你說完這間公司沒有還有沒有補充我補充你剛才說你看到的報導和我看到的不同

最後有一個說是去偷 OpenAI 的模式這與我無關

最正確的說法是用 OpenAI 來 Distill 自己的 Model 即是用 OpenAI 的答案來認證這些不是叫做 Training 而是 Distill 他就是用 API 來問問題給答案然後用答案來將 Deep-seed 的 Model 更加升級

我聽 Propensity CEO 的訪問是這樣說的行內每個人都在做拉馬也有這樣做吧 Propensity 現在沒有模式以前也沒有每個 chain model 都會拿一個最強的模式來做

用作做問答又不能說這樣就叫做複製了 openAI 這不是複製 openAI 是利用 openAI 而這個 term of service 是不容許的你可以叫它的 API 來做你生意需要做的事但你不可以叫它的 API 來訓練你的 model 這個在 term 上是不容許的

他有犯法嗎?可能有的有沒有犯 OPEN AI 條款?應該有的但你可以做些什麼?你真的沒有去付你不要大落到高所以我最後就是

我們幾個星期前都已經有提及過這個問題那時候就說他吃了誠實豆沙包他說自己是 GPT-4O 人們問他用什麼模式你那時候都說沒所謂每個人都是這樣用但是其實不是沒所謂應該說你的模式搞不起的時候沒有什麼人認識 OpenAI 就不理你你現在威脅到 OpenAI 好像震撼到他的地位他就說你不行

不可以說你偷東西說告你 OpenAI 沒有被人不喜歡但有很多人不喜歡 Sam Offman 有些人在 X 就是這樣說的 OpenAI 沒有問過人拿別人有 copyright 的東西來訓練你的 model 到別人拿你的 model 來訓練他的 model 你就罵別人很抄你的 model 最後就說他是 hypocrite 說這些是偽君子氣

就是這樣 X 度很多人這麼說

我們直播也有聽眾問請問各位主持如果在訓練 LLM 的過程中一邊問另一個已經成熟的 LLM 等待他回覆用預先準備好的問題和其他人的答案來訓練自己的 LLM 是否會省很多時間和資源而且衝擊程度也會接近他所學的工智能呢?真的底部很重要我就是這樣說

如果用來解釋底部是不行的我的比喻是這樣 Lama 是一個小學生 GPT-01 是 PhD 就算 Lama 不斷問這個 PhD 的問題不斷回答

他只是一個聰明一點懂得多一些答案的小學生他的思路不會聰明了他的想法也是很簡單他的潛能暫時在這一刻只有這麼多就是這麼多但是如果深入思考他本身有 PhD 的潛能他不斷去問 GPT-01 一些問題這樣就會很快令他聰明了因為他的潛能本身是高的

那能否解釋?本身的底是很重要的你給他一些正確的知識他就會更好但是你又說 GPT 你會不會突然 Lama 用 GPT-01 來訓練會不會變聰明了?真的不行底是不行的譬如 Lama 3 小型模特兒模特兒是小型不行就是不行

你怎樣訓練他十年可能會多 0.1%就是你用很多努力去練習他就是你不停地推他看這本書再看一本書再看一本書他會不會多回答問題會但他做了很久才多一點你會問你為什麼還是這麼蠢你看了這麼多本書為什麼你還是答不到這些 PhD 的問題他的底子是差的就是差的但如果你底子是高的

你教他几条问题他的答案就会出来很多就是这样会快了很多时间因为如果你不用这些你就需要训练多很多的数据就算 Deep Seed 说他就算给很多垃圾没有正确答案的东西他都可以继续进步你要训练多很多数据或者你要给

多好的 data 好 data 就要人 curate 要有人認證這個問題是這個答案我先放下去你就要多做很多功夫最直接的方法就是問一個已經聰明的 model 問他他的答案大概都是正確的那你就快很多你就節省水節省零很多那是會快很多的有一點 cheating 所以我說行內很多人都是這樣去做

關於 DeepSeek 這個星期還有一宗新聞說它有一個 Security 的 Leak 把它的 Log、Chat History、API 等等都 leak 了什麼都 leak 了其實 OPL 也試過這個問題所以不要用它我用它一次就問 Hello 的問題不要用它的 IOS 不要用它的 Web site

盡量去尋找模式在美國公司或是嘗試去推出在自己的電腦然後用兩個 Token Per Second 來玩這樣就很可靠

我們是很自知的要用得很小心尤其是公司的東西比較敏感的就不要放上去但有很多人不是的很多人覺得這個模式不用錢整個檔案都扔上去那是壞事就算你警告過他他會覺得我做事要解決我當前的問題比較重要我不管了扔掉所有東西上去無所謂

Deep C 你可否幫我記住我的 Login PasswordDeep C 這是我的 Bitcoin Password Seed 你可否幫我記住我舉個例子很簡單的例子

例如有个 Excel 图片,有客户名、电话、文言等,半公开的,因为客户的电话也在网上找到,但有一个整齐的图片,可能是工作上才会有的。

可能你想问 Deep Seek 如何在这个文件中自动执行某些事情例如要执行一个 email 给这些人但每一封 email 是个人的

叫他寫一個曲子讓我發送然後我希望每一次我按一個鍵就可以寫一封電郵給在這個桌面裡面的其中一個客戶有些人就想不到他會將整個真實的堅的

file 扔上去如果我工作我就可能會給假名假 email 下去然後自己 replace 到最後有些人是不會的很順手就把公司裡面的 file 扔上去其實都不止 Deep Seek 以前 checkgpt 那些全部都是這樣現在 Deep Seek 其實都應該我估計過去這個星期都應該收集了不少這些機密的資料但是現在都被刪除了全部刪除了

大家少用聽了這個節目知道那條界在哪裡如果你問一下那些常識那就隨便去吧那些不是公開的問題但這些問題就算公開也沒什麼問題

但一去到一些有私隱的東西你就要小心你覺得那些東西是不可以供諸於世的你就要詛咒一點你就要小心一點不要直接放下去了好外讀一讀 Live chat 選一些來讀也挺多有聽眾問如果將來 AI Model 成熟可能會慢慢多用 ASIC instead of GPU 什麼是 ASIC

Azure 的硬件已經把整個模式混合在裡面完全是獨身訂造的給你的模式用的硬件 Azure 只是做那一種東西不做其他東西是獨身訂造的硬件不奇怪

最後現在看出來的走勢就是可能大家已經推論到 Apple 應該是電話在 local load 到一個可以應付普通智慧或普通需要的常識在電話上都能出來了就不用追

聰明的 Siri 而且不用接通訊網站也能解決美國第四個總統是誰就能直接回答因為他已經有通用的知識在裡面不用接通訊網站也可以回答你應該就是這個看來真的可以

不用經過網絡每個人都可以有每個人都有一個 local model 可以應付普通問題可能最後本來是開頭的問題是普通問題然後那個 version 就是 PhD level 的問題都可以回答最後可能是 AGI 即是人 level 的 thinking 都可以在 local 你的電話做到對答

然後又說 AI Service 的價戰可能將會開始好啊現在真的太貴了我覺得 20 元一個月真的挺貴太貴了我給了這麼多應該就不用給了 Patrick 也說我現在暫時在應付我的子女我要問過他們你覺得 CHPT 重要嗎如果不重要就剪掉如果重要就繼續

如果可以幫助讀書的就可以去如果有代替品就用代替品因為很多人說 Gemini 可以用 Cloth GPT 就算免費版也夠用免費也有幾十個 query 給你用可能一個月也用不到幾十個給錢的版本是浪費了錢

但你自己用全家人用一個帳戶你不是一個帳戶一個女生一個帳戶四個人都有用一家人四個人四個人都看到這是我太太問的問題要寫電郵這是我女兒說的數學

另外聽眾問應該沒有人完全誠實地取用資料即是說他取消了 TradeGPT 鬥股惡也是一個方法不是的現在說的除了那件事除了用 TradeGPT 取消綜有網上很多 copyright 的資料也有很多人都靜靜地拿來做訓練

而你已經融化在模式中除非你跟他讀這本書第三十幾頁被人捉到正就沒得說了否則已經融化在內就未必捉到他抄襲你的複製作品

尤其是現在很多公司做一個自己私家的 AI 給自己的客戶用你是不會知道的你不是好像 Deep Seed 這樣搞到全世界都認識它例如說舉例如果 AI 亂做一個 AI 只是給聽眾用的我們拿了什麼來訓練其實是沒有人在意的現在用那個用家只有這麼少的話那些用家用得開心就算了也沒有人去追究他怎麼來

另外一位聽眾說他試了問 Copilot 和 DeepSeek 同一個中文的問題他的問題就是「洗的一詞是為甚麼?」他說中文問題 DeepSeek 是比較詳盡的這個我相信是

第一中文 Trade Data 第二好像他們 CEO 梁文峰這樣說他們有請到一些文科人專門讀文學歷史的人進去看過他們的 input output 所以他們在這一方面做得好一點是不出奇的

我想即使有請這些人,但他們不會是重點,甚至完全沒有,他們有去找其實他們應該有去按摩他們的出口

可能我不知道我沒有這方面的知識但我想說你提到 Copilot Microsoft 也說將會放置一個 Distilled 的 Deep-seat Model 在 Copilot 上使用

即是一個 Distilled 的不是真的 600 多 B 的可能是他的 Microsoft Model 但用 Deep Seek 來 Distilled 他是這樣說的就快在 Copilot+ PC 或 Copilot 有用

然後聽說他覺得 GPD 4o 和 Copilot 差不多是不是應該是同一件事?Copilot 是用 4o 的根本就是在用 4o 的背後是呀上下吧 Deep C 下一個題目

下一个题目是这个星期围绕 Elon Musk 说了很多东西其实星期头 Elon Musk 做了一件事在熟悉火箭太空的人是很担心的就是这样的

特朗普就說被困於 ISS 的兩個太空人就去賴拜登困住了他們兩個人這麼久他現在叫 Elon Musk 立刻拯救他們回來 Elon Musk 就重新拘捕了遵命就是用 Emoji 作為遵命的手勢他就說他也賴拜登是被困住了那兩個人熟悉

太空的人是很難過的為什麼呢?其實是有解釋的不是說我把他們困在這裡拜登把他們困在這裡是有計劃的就是飛一架 Crew 9 上去

特意飛一架飛船上去是兩個人的預留兩個位置帶備困的太空人上去但問題是為什麼這麼久都還沒下來呢?等船員上去因為如果你不等船員上去整個 ISIS 就空了只剩下一個人一個人是我這個星期看了很多報道一個人是搞不定的又要搞倒垃圾又要搞衛生又要搞什麼一個人是

很痛苦而且你是沒有後備的如果這個人有什麼事是沒有後備沒有幫忙的那是很危險的一件事所以怎樣也要等團隊聽電視劇集也做了很多第一個人在太空上的時候就有很多神奇的事情發生了有些異形飄出來有些液體變成刀插你一下那些 anyway

为什么 Crew 10 又延迟呢?Crew 10 原来是用新的太空舱那样东西要跟 NASA 做一个详细的检测本来说 2 月就上去就可以其余 4 个太空人士一起下来但是还没做好检查就要延迟

我就立刻問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問問

如果換過所有東西可能要做一個重新的證明不想有什麼新的東西不想把原定計劃好的東西全部改掉如果繼續用太空艙就要做認證但認證還沒完成因為安全問題還未上去

那問題就是全部計劃都有了也沒有一個快一點的方法那你這個舉動又不說多些東西究竟你叫 Elon Musk 去救那兩個人回來你的意思是什麼是不是都是等到三月救他下來只不過做一個長大龍鳳還是花多一億去送一隻新飛船上去只是他們兩個下來呢

我又不知道好像不是這樣的舉動究竟是什麼呢所以大家都很驚訝最熟悉 space 的寫過兩本 spacex 書的 Eric Berger

寫了一句 ex-post 就是 WTF 他也不明白究竟在說什麼究竟你怎樣接回那兩個太空人來有什麼轉變呢?我都不明白每一件事都卡住了每一件事都在預期之間每一件事都已經入 schedule 了

除非說理論上你只可以賴 NASA 那些決定全部都是 NASA 最後就是你可不可以花一億去發一架太空船上去接兩個人下來跟著

而他们只不过是等多一个月而已就是三月和二月的分别因为现在已经是二月一号了那你就三月尾他就下来那你当他过半月了你是否因为他们等多过半月是不是做一些任何举动去用多一亿来传多架火箭上去呢我觉得不会了那最后不就是

用原定的計劃接下去這堆推特是做什麼呢這堆推特是做戲而已很多人都抬頭了大家看完就算了可能是給一些不熟悉那個時間的人看這堆推特是要來罵一下拜登就是這樣

SpaceX 的另外一件事你也不知道因為實在太秘密了就是 Apple 的 18.3 的更新其實是正常地已經支援了衛星

求救通訊用 Starlink 做衛星求救其實蘋果簽了一個合約跟真正的衛星用另一個 protocol 是 GoBoStar

那個不是真正的衛星星星也是一個衛星但那個是唯一去做的東西就是做衛星求救的那部星星它就加了一顆 chips 本身蘋果有一顆 chips 在 iPhone 裡面你就可以在一些沒有手提電話訊號的情況下都可以做一些求救發訊息等等

Elon Musk 的 starlink 是做到他都沒有理會蘋果總之他就裝作一個遙遠的 LTE 發射塔如果你在沒有其他更強的訊號下你就可以接收到 starlink 的訊號你要求救 send text 就可以了原來蘋果已經做了一個 integration 你既然已經做了

那套 Global Star 的服務就照樣在 Saturn Link 上工作譬如你可以選擇 Emergency SOS with Satellite 那樣東西是可以接駁可以顯示到因為之前沒有顯示的只不過是一個發射塔但現在有顯示你用 Satellite 去做求救就算那個是 Saturn Link 都會

可以显示出来是一个特别的服务不是就这样一个遥远很疲弱的信号这个就是做了一个 integration 理论上 Apple 应该拆掉一颗 chip 不要搞的全世界基本上都覆盖到差不多就不用跟 Global Star 又浪费一颗 chip 又做什么不如全世界用光了 Starlink 就行了又不行大陆用不到 Starlink 但用不到 Global Star 那个东西吗

現在其實都不是全世界用到的最後就說賣大陸機有 Gobo Star 就可以其餘的地方用 Starlink 就可以省了很多錢大陸機大陸沒有這個功能沒有 Gobo Star 香港機也沒有

沒有 Satellite 這部分沒有 Emergency SOS?沒有的那你們走山很危險的不過你們的山很近而已山很近那不用怕是的也可以死人的真的可以死人試過很多次

但是但是有没有讯号你那些试过很多次不一定有的 OK 香港以为覆盖率是很高的不是的不是的 OK 其实等多几年我觉得就是全世界的你就算去到喜马拉雅山的那个

不是遮掩問題是政治上的問題我知道但現在是遮掩問題現在你去行山就是遮掩問題除了講政治的問題現在是遮掩問題首先現在的服務只是給你打訊息到未來就是可以

有 voice call 暫時現在不可以只可以 send 短訊求救就求救短訊但那個不是只有 team mobile 現在暫時是 team mobile 而現在是有顯示最主要是說 iosc 的 update 是有顯示因為特別服務不是一個微弱的 LTE 信號另外就是

今星期最多人傳的影片就是 Tesla 在加州的 Factory

那些車子修理完後它會自動駕駛去停在那條輪圈等貨車來接載它送出去目的地我看了兩次那段路也不近我不是看了兩次現在一次我自己看另一次我給我老婆看

這就是為什麼要用 Tesla 的原因原來在出廠到停車場的路線也有 1.2 米即是大約兩公里路如果要用人手駕駛也只是一段時間人們都會計算到每輛車都會省得 5-10 元你這樣繞出去又要不知怎樣走回去廠要說你看那條影片也要一點時間

你都要花人手走到很快有些位置是快鏡

但其實也不是走得慢的但如果是機械人行即是說自動行的你理會它走得多慢它滾去也可以總之是一大堆車去到目的地就可以了總之在貨櫃車來之前你去到目的地就可以了不要塞住出口那就 ok 了

熟悉 Tesla 的人就知道但未必每個人都知道我們買了一輛車不是立即可以自動駕駛的是需要 20 英里去做調校的他一開始會說還未有的因為每輛車的鏡頭位置都不準確他是用在行車的時間來做調校

你意思是我們買了車回來之後用 FSD 要 Color Rate?對你要走多還未 Ready 我以為你說出廠的時候現在暫時這一刻你買了車回來你已經付了錢走了你還未用 FSD 你要開 20Miles 左右之後就會說 Ready 了你可以用了

很多人在 X 問為什麼你的車可以自動走去它不用做 Calibration 嗎

AI engineer Ashok 出来说现在改良了在 assembly line 一直移动时已经在那时候做 calibration 变成一出厂时已经准备用 FST 了他就有这个改良我觉得挺有趣有很多人问这个问题为什么不想做 calibration 原来是

製造這部車時已經改良了已經在調整因為它的車其實已經鏡頭在那裡你就可以在裝置線上移動時就調整我覺得挺有趣其實我覺得應該要這樣做

一早就要出廠之後最後的步驟就是要調整 FSD 是的那他需要走一段路那可能他一開始沒有想到原來在廠裡面都是在走路的就是一直在移動的時候其實就已經可以一直調整就是一直製造的時候他都是在移動的是的他都是要移動的是的那可以在那個時間調整是的好了那就

加多一两个资讯先说一下其实我在 Patreon 说过就是我其中有一集 Patreon 说就是那些旧硬件就

死心了不會再有更新全自動駕駛不會在舊硬碟上實現但現在不是想有機會更換硬碟嗎?是在賺取率上

有一个问题就是这样问的那些无线无线的人怎样?然后阿 Shok 就是刚才说的 AI engineer 的总裁来的就是 VP 来的就说我们会继续有更新的你看看我们有个小更新好像婴儿一样的自动驾驶也帮助到你会有少少的进步

Elon Musk 太不會說謊了他是一個完全不會說謊的人他說不如說一個真實的事給大家到某一刻 Tesla 就要將所有 Hardware 3 的人更新到 Hardware 4 這是一個很困難的問題但就算多痛苦都要做基本上認證了是不可能的

又是那件事那个就是 BB 仔那个 BB 仔就是做不到 PhD 的困难的东西那个硬件是死症来的完的了大家可以死心而 Tesla 要给一个新 update 来

会是成功了 FSD 之后的起码一两年你不要想着等如果你要试新东西就不要想着等这个车你买过新车如果你是想着等的是说人家每个都在开在街上已经看到一辆没有人开的车在这里走来走去你自己的车还没有更新你等多这样等多一两年不会那么快的不会那么快搞回你的旧车可以做到

全自动驾驶所以你要自己考虑一下每个都在说不如让自动驾驶转移到新车不用钱转移那些人的气就会绝了我都觉得我认同

另外一件事就是 Elon Musk 重新確定 6 月會在德州有 robotaxi 他很肯定就算有一兩架都好我很想看在德州自動駕駛全自動他說在大陸

做自動駕駛是有很大的難處因為原來大陸的影片在 Tesla 拍到的影片是不可以傳送到美國的他不可以做任何的訓練他怎樣做訓練呢就是說

大陸的場景接著再拿回大陸的地圖路牌去抄才可以做訓練他說大陸的東西跟美國有點不同尤其是巴士輪

某些時段就被停在巴士的連結中但有些時段一碰下去就自動罰款很難處理 GD 就是那些例子所以自動駕駛在大陸是有點困難的因為第一就是不讓拿資料來訓練

為什麼 Google Map 不可以在大陸十幾年前剛剛有 Google Map 的時候為什麼大陸的 Google Map 不准因為地圖不只是大陸很多地方都是國家機密來的都是其實是軍事

是軍事資料因為打仗的時候敵方知道你每一條路橫家窄巷在哪裏你是無法理解的所以地圖資料以我所知台灣新加坡都是國家的軍用資料你要有一個 authorization 才可以用

大陸有它的難處歐洲也有它的難處歐洲的難處就是像 Elon Musk 所說他們一年才開一兩次會如果他這次不批你你就要等半年或者等一年他就加一句就是美國做了很多 innovation

但是 EU 就是負責 regulation 的那他呢就是一些東西審批審極都審不到的所以這個就是剛才那個人說為什麼德國這麼落後呢是整個歐洲的東西都是很多 regulation 還要是這麼多的國家一起在那裡談那他就說要在歐洲首先要在

開個會先吧要所有國家都批准你說多痛苦不是一個批是所有國家整個歐盟一起批所以要投票舉手是很痛苦的一件事最安全是什麼

其他地方都能做到他們就會批准跟 LLM 一樣他們都要做到每個人都要做到才想想歐洲人可不可以用 LLM 來幫助最後一樣東西就是你說 vobotax 今天有一條影片有個吸塵機

很明顯那個就是用來做完 votex 之後就可以吸乾淨的車懂得自動吸一些縫隙位懂得譬如你吸走一些

那些水樽喝完就會在水樽位吸走它也很厲害一吸收水樽就有很強的吸力還有就是把螢幕拉開讓螢幕沒有手指毛我心想你的價格就自動收起其餘還有普通人買了 Tesla 會租出去

來做 robotaxi 賺錢的嘛就像 Airbnb 租房子出去你有 Tesla 就租 Tesla 出去我覺得他可能也會賣這個 service 出去 No 就是主人在那裡抹車和吸塵最後就是最後就是在家裡你肯定?不是的我的意思是他就將這個 robot 放進去 supercharger 然後你就付錢你拍過去就做?是啊

我們的車很多縫隙位置但這不是一個車的座椅是一個普通的辦公室座椅因為不用駕駛就不需要遷就司機的舒適坐姿只不過是一張普通的座椅我覺得比較容易吸引但他現在的影片好像是一個駕駛

你看看其实没什么支持的根本就像坐一张办公室的样子而加加会知道多一点的就是美国今年有一个新的 accounting 制度就是那些数字资产可以马上 mark to market 意思是什么呢?今次 Tesla 的 earnings

有 25%是因為 Bitcoin 升了而賺回來的其實他們賺少了錢理論上賺少了錢但是因為 Bitcoin 升了而現在呢以前就只有跌

才会回报说我蚀了钱所以我就会蚀了这么多钱就在报告里出来了但是升就不计算但是现在就有个新的 accounting 制度就是比特币升了或者数字资产升了就立刻可以回报当赚了钱所以今次 Tesla 业绩没有那么差是因为比特币升了

你要小心有些公司突然赚很多钱像之前几集讲的 MicroStrategy 在美国有一年时间让他用这个新制度他不需要立即用但他会突然间有一年里面突然间有一次就会报道突然间升了这么多钱因为我之前没有报道我的 Bitcoin 值

即是赚了多少钱只可以 mark 低不可以 mark 高但突然间由低到 mark 高你会看到那条 bar 会升得很厉害为什么这间公司突然赚了这么多钱呢?你要小心这个新的 accounting 制度不是他突然赚到那些钱而是 Bitcoin 突然这样计算突然间就要汇报所有赚了的钱就要全部出来了

我沒有詳細看新的會計制度但你剛才說的數字資產除了 Bitcoin 和 Crypto 之外我第一樣想到做遊戲的公司

那些都是數碼資產買了武器那些是否算得上那些是他自己生產出來的可以嗎我不知道他要印多少都可以因為數碼資產你可以當它是如果用物理的想法他們自己製造貨品出來

一個實質貨品有軍事如果數字貨品也有計算的話這些貨品有計算嗎不計算因為是免費的你是不是在公開市場有價值你可否有 mark to market 有沒有 mark to market 的價值

不是的例如你有一把保劍市場炒到五千元你又要生產一把好像沒有這個東西沒有一個遊戲有一把保劍可以這樣賣出來的不是這樣的我詳細看看這個新的會計制度是怎樣玩我覺得它叫做 Digital Asset 不是叫做 Crypto 應該要包的範圍是比 Crypto 更多

但包裝了什麼我就沒有詳細研究大家要小心一點不止一兩間公司有一個比特幣的

存了比特幣在這裏有幾間公司 SquareBlock 也有很多 mining 公司突然會見到會彈出來但他們有一年的時間選擇什麼時候用這個方法匯報而 Tesla 業績是差的用這個時間去匯報看來就沒有那麼差其實

如果你只看金融指示不做任何的調整只看報紙報道或是一些 GEN 出來的 metrics 是會有多影響你的 judgment 是因為有些人只是看 screenerTesla 不用怕你看那幾個新聞說今季 Tesla 很差葉正但本來更差

他是不是真的踩到很差但暫時還沒有影響到他的股票還要升很差很差那是那幾樣消息而已

大家以後看這些基礎數據時要自己再看清楚一點很難的你看清楚你不記得幾年前為什麼這一刻發生了什麼就算你現在知道你看回為什麼之前有增長現在沒有增長你已經不記得那一刻發生了什麼所以就要做調整抽起那條數例如說它的減少

你要看報告看細節有多少錢的金額是來自加密貨幣或數字貨幣你賠償那一顆數字在利息中賠償那一顆數字你才可以做到一個 Apple to Apple 的比較

我們讀一下留言留言說大陸機好像有 Satellite Voice Call 這麼厲害?我不懂我不懂這個可能要問一下粉絲可能是可能他們有大陸的 Satellite 怎知道我也不熟而且老實說 Latest firmware 真的不可以 cover 所有不同代的 Hardware 可不可以提供優惠 upgrade 駕車

他在說 FSD 可能最後看 Elon Musk 那天睡醒開心不開心他現在可能會覺得應該這樣做你就有優惠如果他覺得那天很苦惱你就沒有優惠等一等我覺得會有他答應了你一定會達成如果他能力範圍之內

所以他認為現在買的車即是在 2018 年說的將來會自動駕駛你等下車輛有一個方法會令到你這輛車會自動駕駛你等下

你不要管是甚麼方法可能是給你便宜價的優惠碼買新車可能是他死死氣都拼線拼到你的車有最新的硬碟這個可能但你要等你願不願意等還有如果有一個小小的優惠你願不願意拿了那個優惠就算了買新車

最後 Elon Musk 被人提名拿了貝爾和平獎最後被提名拿了貝爾和平獎有一集都說為什麼他還沒有提名這次就是說支持

最基本的人權就是有言論自由這就關乎他買了 X 之後維護言論自由有關很多人都會 disagree 可以 disagree 我再看其實還有另外一個方法拿諾貝爾和平獎

在戰爭上用 Starlink 幫助是可以得到的例如烏克蘭一有戰爭馬上就第一時間運送 Starlink 給他做通訊通訊有什麼幫助就是救援人員立即有聯絡可以幫助受傷的人

另一個例子是加沙你不能說是幫助加沙但是加沙一有事要救亡的時候又會發送 Sarling 去

跟戰爭無關的應該拿不到諾貝爾和平獎但每次災難都有包括北卡羅來納打風水浸立即發送星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星星

我覺得這些一加起來是足夠拿諾貝爾王獎的就算你覺得 X 是有一個疑問有些人覺得你幫右派說話有些人說你是希特勒主義你只是幫那些有希特勒主義的人發言

這是有疑問的但在戰爭中救亡的那一個是毫無疑問的那一個都可以拿到諾貝爾和平獎但最壞是不能加上我有 A 又有 B 可不可以加多點分數給諾貝爾和平獎應該是不能加分的但我覺得是夠信用拿到諾貝爾和平獎的

最後新聞我們還有兩個題目在我們的列表中我們剛才說 Deep Seat 時漏了 Open AIO 3

就是競爭可以推動其他人去積極一點 OpenAI 很多人說如果 Deep-seed 不是迫得太緊它不會這麼快有 O3 的模式出來今天所有人都有 O3 Mini 大家看到了這個 O3 Mini 可以說是一個 optimization 就是一個

快一點便宜一點的 O1 模式好像是九成的 O1 好像差一點點但便宜很多還有免費用戶也可以用 O3 不過有限度你現在出了 O3 mini 嗎?對 O3 mini 是比 4O 蠢的如果你要最便宜的聰明的都要用 4O 或者 O1

O3 Mini 就是一個比較快的便宜一點的最後一個消息美國排大隊 5080 5090 如果你是排幾天的兩天多的那你可能排到 5090 其他那些人就排 5080

我不知道你香港有沒有這回事除了 iPhone 或 iPad 很多年前要排隊買或 PS5 三年前也要排隊買也很久沒什麼要排隊買而前天就是很多人去排隊買 NVIDIA RTX 5090 和 5080 你們沒有這些消息嗎?沒有啊?Patrick 加拿大有沒有?

香港當然沒有只有在美國發生這麼神奇香港也沒有 5080 賣香港禁運的又禁運對不起但是這邊是我們最出名的一間公司 Best Buy 就一秒就已經賣出了你肯定香港是禁運 5080

應該可以的大陸也可以買的 Graphics 玩遊戲的卡是可以的我以為是新出的那張說不能運送的那張不是 H100 H200 那些這張是遊戲卡我不知道我沒有留意可能香港也唱過但我沒有留意你方面的新聞

網上一秒就出現了實體店就漏夜隔一天坐著等 5090 大家知道好像比上一代快 20% 30%但如果排不到頭位就只有 5080 人都殺了

接着今星期出很多 review 5080 只不過是比 4080 快 9%而已拖鱗我覺得浪費這麼多時間去等一張東西原來是快一點的所以是有點浪費的 anyway 就是這麼多講完了有沒有留言那就好了完啦很長

有人說香港有 5080 和 5090D 是不是閹割版的 5090 和 5090D 是 D 是甚麼 Domestic Version

可能是可能是都是有的我想都是搶債的這些是很缺貨的東西現在整間店只有十張八張十張或者三十張整間店排了很長隊的人只有三十個人有

不知道為何 NVIDIA 每次推出新卡都是這麼少貨不可以像蘋果那樣 50 萬張出來一間店只有幾十張人們怎麼買呢

這個禮拜為什麼香港沒有人說搶 5080 5090 那些東西呢因為香港這個禮拜過年店鋪都不開初二初三店鋪都不開 5090D 真的是 China specific 的那是閹割了什麼有沒有說的就是 Limit the tops

Limit 了 Tops 打機會不會差了還是打機的時候就開啟了 AI Tops Performance 可以這樣做的在 Driver 做的 23%都沒有了合理的因為之前炒 Ethereum 炒得很厲害的時候 NVIDIA 就在軟件上做 Limitation 打機沒問題

但你用來挖礦它就減弱你一半這個也是用來做 AI 就減你 30%但打遊戲應該沒問題打遊戲也跌了一點點都跌了很少很少的不小心檢查錯了用了 overhead 來檢查你是否打遊戲真的不知道

聽說初二已經可以賣 5080 在香港賣 12000 元 5090D 是 20000 元

哇多昂貴啊兩萬元啊美國買二千鬆一點要兩萬元的為什麼?說有店是新年特意開特意開來買兩張卡新貨 mark up 很正常 mark up 很多四千元啊很昂貴很正常啊很正常新貨 mark up 還要新年價新年品都貴啊喝茶都貴

这些过半个月可能已经跌了 4090 那时候是整年都跌不到的这些 MAP 是头一水而已之后真的未必有多么多货

好今天星期我在 Patreon 錄了一段說回兩個星期前我沒有說的 Mark Zuckerberg 那段我今天星期又是繼續爭大家的盡力不要這樣我爭得大家中到這個星期我看看還有沒有什麼題目可以錄一下因為這個星期我完全是過年模式我在過年的狀態當中所以這個星期還沒錄

好了就這樣下個星期再說吧涼粉應該會回來的了拜拜再見

亂‌‌‌gad‌‌‌ ‌‌‌‌‌第749集 - Deepseek 震撼全球/Elon Musk 被提名諾貝爾和平奬/OpenAI 發佈新推理模型 o3-mini/ nVidia RTX 5080 賣斷市 01:50:47 Share

亂gad | randgad podcast

Deep Dive

Shownotes Transcript

亂‌‌‌gad‌‌‌ ‌‌‌‌‌第749集 - Deepseek 震撼全球/Elon Musk 被提名諾貝爾和平奬/OpenAI 發佈新推理模型 o3-mini/ nVidia RTX 5080 賣斷市