科技变得这么快,你怎么能跟得上?一个星期一次,听乱架主持 RANDGAD RANDGAD Professional Podcast 欢迎大家收听乱架第 755 集,有我 Patrick 我是嘉嘉我是 Ed 我是良粉
很快介紹一下收聽方法可以去 Spotify, Apple iTunes, YouTube Podcast 和 KKBOX 如果想看直播的話可以去 YouTube Channel 訂閱我們通常星期六中午左右就會開始
另外可以到 patreon.com/randgad 每個月的訂閱可以有額外的節目可以去 facebook 支持我們 facebook 的專頁是 facebook.com/randgad 另外我們也有 facebook 的
是叫做聯結科技吹水台 RandGetChat 可以一起吹水 Telegram 我們也有一個頻道 T.me/randgetx.com 也有一個帳號是@randget 可以有空跟他吹水其他節目可以去 RandGet.com 找到每個星期突然有兩個留言
今个礼拜首先 Felix 告诉我们各位主持人好听完上一期良粉介绍 15 Ultra 没有了 14 Ultra 的可变光圈变成了不想更换的理由之后印发了小弟本身用手机拍文件的疑问第一想了解良粉用小米 14 Ultra 的可变光圈来拍摄纸本文件的时候是用什么软件呢我只用手机自带的相机软件拍照
是否只用手机自带的相机软件拍照?还是用一些例如小弟常用的 Microsoft Lens、Adobe Scan 来拍摄和处理?第二,就是小弟用 iOS,但 iOS 自带的 Note App 里面的 Document 功能有大量拍摄和删除的电子文档功能效果比较一般,就不是很理想例如小弟用 iPhone 15 Pro 自带拍摄 App
当拍摄近物时有微距功能这令拍出来的文字比较清晰但少得用上述两个 App 时都没有触发到这个功能现在 Android 旗舰手机的摄像镜头都很强大
例如梁凡說的海邊光圈功能但是否非自帶 APP 都不能夠引用手機本身相機功能來使用呢祝各位主持身體健康工作順利聽眾 iPhone 相機真的越來越比不上 Android 相機其實不是的 iPhone 有很多優點因為我老婆都不會繼續用 iPhone 我制止了我老婆用 Android 你明白嗎
我老婆又有她的感受我老婆經常看到我的手機拍的照片在很多個案拍出來的效果都比她的 iPhone 好看然後她就說 唉 都很想轉開我就說不要 千萬不要千萬不要轉開你會後悔為什麼 為什麼因為你要技術支持她
對呀 要技術支援它 用 iPhone 真的不需要技術支援東西會有效但 Android 會不會有些奇怪問題有些 bug 會出現 你要自己去處理你要懂得用就很好用我很多年前就是這樣阻止我爸爸繼續用 Android 電腦
你懂得用其實是很好用的東西不過回到他的題目我是用小米自己的相機 APP 小米自己的相機 APP 已經有一個叫文件 Mode 在 14 Ultra 由於它有一個可變光圈它只要進入了文件 Mode 而你現場環境夠光它就會幫你縮小光圈
因為只要縮小光圈,有句話,很多年 F9 沒有攝影鏡,光圈縮得夠小,鏡頭拍出來的一定 sharp
因為這是物理現象,光圈越細,如果有辦法縮到 f9 就更 sharp 這個 14 Ultra 最多縮到 f4 而已,但已經好很多了只要夠光,進入文件模式,就會變成縮小光圈,因為鏡頭真的有一塊塊葉縮小了,你會立刻看到
然後拍出來的文件它還要有三個模式可以給你選擇一個就是原圖即是原始不改色另一個就是會自動幫你變成黑白即是譬如可能你拍一些黑白的文件那你平時拍照的白色
白色的地方它不会很白正常的照片灰灰的它就会帮你白色的地方变白黑色的地方再变黑接着你的文字就会很清晰另外还有一个模式叫增强模式就是将 contrast 推高譬如本身你可能有一些颜色
它就會推高 contrast 拿出來的文件就會 sharp 一點還有它就是 detect 到你是一張紙有一個矩形,它就會幫你 crop 一個矩形出來變回四方形,變回長方形這些功能是內置的而這個功能我是幾成日用的所以我上一集就在說 15 Ultra 它不懂得縮光圈
不懂觸光圈我就不可以很近距離地拍一文件因為如果大家有拍照有留意的話就是你會聞一下照片你拍完四個角落
相片的四角角落头通常都会比较模糊一点因为平时拍风景就不觉得但是你一拍字就很明显了那去到 14 Ultra 就可以用一个缩光圈的方式令到四角角落头都会清一点但是去 15 Ultra 怎么办呢那你唯一的解决方法呢有解决方法的就是你用
長焦鏡,用長焦鏡啦,但問題是長焦鏡就是,例如你可能把文件放在桌面,你坐在椅子上你用長焦鏡你就要站起來拍文件,你就不能坐著拍文件,那個方便程度又大大減低了所以我自己上一集有一個留言說 15 Ultra 就沒有了縮細光圈的功能,我就覺得差一點
所以我是用它內置功能我沒有特別用其他我有用過另一個就是 Microsoft 的鏡頭 Microsoft 的鏡頭它也懂得有我剛才說的東西會把一張紙 即是一個矩形它幫你拉直但是它拍出來的效果
是比較模糊的,對比小米內置的相機 App 所以我沒有用,我現在都是用小米內置的 App 其實他想原汁原味保留檔案還是他想 OCR 了它不是 OCR,我這裡只是說我知道,但他所說的其實是否想 OCR 它呢
我不知道因為它有說 Note App 內的 Document 功能因為 IOS 的 Note App 的 Document 功能好像就是將它 OCR 了或者 PDF 了對,好像可以 Save PDF 的即 Microsoft Office 的 Lens App 是可以將它 OCR 了我記得但如果你想 OCR 就應該用 AI 解決這件事
現在隨便 什麼啊 你現在都 怎麼說想補那個 app 都已經懂得 OCR 不過那個不能 savepdf 而已 iphone 也可以 iphone 都有 OCRiphone 都直接在照片中你已經可以 select 字馬上就可以 select 小米也是 應該 Android 隨便你隨便拍照那些是文件馬上那些字都可以 select 到書房裏面
我不知道他那些東西會不會很複雜 如果他很複雜的就不知道了我純粹是需要做記錄 我純粹是需要拍一些文件出來變成一張我很容易可以找出來的一張照片看到一些字就 ok 所以我 so far so good
我可不可以放一件事 今個星期我太太竟然說為什麼不行竟然放了整張 Pdf 在 checkgpt 中 放不出 word document
圖像變文字 竟然懂得去 checkgpt 這樣做我理論上是可以的 我也用過很多但是這個蠢蠢的 他說檔案太大 逐張 capto 做 checkgpt 做得不好
最後就是 Entropic 我平時在公司用的你只要給他一大堆文字 但他的驚喜是什麼呢很普通的人都會用 LLM 去丟一些很複雜的東西 期望他可以拿一些 RAW 的東西出來只是字 不要 format
出一支 PD 可以的手寫一亂 PDF 有三個 column 亂了如果整個一打動是很容易的事
因為我自己試過幾次是我兒子回幼稚園跟老師的聯絡簿那老師的聯絡簿那個英文老師他的字很厲害厲害到我有時候看不到他說什麼然後我就找個 checkGP 拍照那個老師在寫什麼
然後就立刻幫我猜這個字又像什麼 有什麼可能性前文後理是不是然後就說有幾個可能性 可能是這個
是猜測器是幫到很多忙的例如有些公司有些 QA 無緣無故說這個用途不合用那條 URL 是長到哭的那一隻他就說這個用途不合用弄了一個 screen cap 給我我也是立刻把 screen cap 拉到那個 LLM 叫他可不可以給我那條 URL 他又立刻弄了一條 URL 出來給我我再複製下去 用軟件就搞定了
如果你不容許錯的 因為它不是真的 OCR 它現在也很 OCR 的了但是它是可以錯字的不會的 我真的沒試過錯字它是可以的 現在做到 screencap 的文字 應該能輸出
給大家一些例子 為什麼我們講這麼多 AI 的東西好像有些人都沒有怎麼談論過呢不過你剛剛的例子 我褻瀆一句在 Windows 上有個方便一點的方法因為你要一幅圖 不是 Copilot 不用 Copilot 不用 AI 功能是 Windows 內置的 screencap 的 app
已经有 OCR?已经有 OCR 的那个是 Windows 内置的 screen capture appcapt 完之后它就会弹出 app 即是在 notification 里面就已经是有一个键中文叫做剪取工具我不知道英文的 app 叫什么
打印屏幕也可以 按印屏幕它都會展示這個 app 不過看你怎樣寫 接著就已經有 OCR 功能了你就可以剪裁裡面的字 中文英文全部都可以那個叫做 snipping tool 我真的很常用到 我將它放在我的 taskbar 上為什麼要按鍵 當然是按 hotkey 的做 taskbar
我喜歡按勾拾 要求很高其實你一掩蓋完之後 如果你打開 Snipping Tool 它本身已經有一個按鈕叫做 Text Actions 好像一個掃描器的標誌 就可以在那裡掩蓋另外還有一樣東西 因為我發現很多人都不懂其實 Snipping Tool 現在已經支援錄影片
例如在電腦遇到問題,你要跟別人說我有這樣的問題,拍段影片不要用手機錄,你用 sleeping tool,它就可以拍片不用拍整個 screen,可以讓你框某一個框框,只錄框框裡面的東西,然後你在裡面 demo 你遇到的問題,就可以發片給別人
大家要不懂的學會這東西不懂的還有一件事因為今個星期一定要試新的 Google 東西 Google 有個叫 AI Studio
AI Studio 有个 screen sharing 的功能是分享给 AI 你可以问 AI 现在画面上的问题它可以回答你这个我真的不懂你的 AI Studio 是用标签的吗是的标签可以拿到你的屏幕你要给标签的插头但你可以在看 YouTube 问它里面发生的事也可以
這麼有趣?你說他懂得錄音影片你可以用螢幕去看到影片我想也是一個多個螢幕拍攝我找到了
我真的不懂很多人都說去 gemini.google.com 但其實又有 aistudio.google.com 其實他這些東西很瘋狂的為什麼要這樣呢我只是想試試新的 Gen 相的 feature 找了很久又不是在 Gemini 裡面然後我看一些 blog
不知道他在說什麼 去哪裡 結果我要去 YouTuber 介紹新的才知道原來應該要去 AIStudio.google.com Google 的東西真的有點混亂太多方法去做同一件事繼續我們有聽眾留言 還有第二個聽眾留言還有第二個留言
第二位在德國的聽眾留言給我們 LS Cole 說各位主持好他說其實他想說這件事很久了因為他是一個 PurpleCity 的重度使用者他只付了錢用 Pro account 一個月但他覺得
他经常要检查 preparecity 的结果和 preparecity 说是错的他说他通常搜索的方法是有一个 rough idea 他想可以省下一些时间所以他就用 preparecity 但是每一次他越来越多发现
不可以依靠 Perplicity 的搜索结果因为 Perplicity 说自己的卖点很准确但他觉得不准确他说你可以看到他们的反应因为他给我们盖了两幅图他说结果是很错的
但你跟他说他错了,他就很淡然地说:「是的,你对,我的资料是不正确的。」然后他就截了两幅图。其实他那两幅图,我觉得这位听众,你用错了 Perpacity。我不是想帮 Perpacity 辩护,但其实你用错了。我在节目里也不止一次说过,Perpacity 只是一个搜索引擎,
它是不能够帮你处理数字的而这位听众他会剪辑给我的两个例子都是他在他的 prime 里面是用一些数字的就是他用一些数字来做 criteria 去做 search 例如他说你要帮我列 20 间公司而他的 net profit margin 是大于 10
其实这一件事,你是已经在叫团队计算你想团队是要理解什么叫大于 15%和理解它是 20 间公司其实你说列出 20 间公司我觉得没问题因为那些 top 多少那些你叫他们列出通常都做到但是
你要去计算,首先要找到整个范围,例如香港的科技公司,然后你要去计算每一间科技公司的 net profit margin 多少,然后你要去每一个 profit margin 去 compare with 你的 problem 只是 15%其实你是根本叫 Purposity 去计算,但是 Purposity 只是一个 search engine
他做不到你的事 或者很差勁的而且跟 Purpositives 無關 GTT 就是這樣很簡單的就是 9.11 比 9.9 大就是一個很常見的問題但又不是經常的 所以你估計不到的你不能說你估計到他做到什麼 做不到什麼但我可以說 我自己的經驗這些叫 Hallucination 幻覺明明他說了一件事是假的
然後你追問他為什麼你要告訴他一些假的東西然後他說「啊!是喔!你說得對啊!」我真的說了一件假的事情這些是 Hallucination 是很普遍的事情你自己要知道這個用途是會有 Hallucination 的你以後就要
知道這個用途是會有滅亡如果你試過兩三次都是有效的那就是有效的我公司要檢查醫生紙裡面的做過的我就是要找到大約哪些是有滅亡你知道它是會錯的但只要它做到七成
你就要利用那七成如何可以帮到你你不可以说为什么你只有七成为什么你不可以是 100%你可不可以我问你几次变成 100%不行它的底子是差就是差你就要期望它给你七成你下次再问同样的问题它都是错你就不要自己激气因为你已经知道它的效果
已經去到他的局限直到他換另一個模式或者有什麼更新你可以重新再提供他你就有另一個期望但你不要期望他他為什麼不會更厲害又說他很厲害我再問你一次這次我問完你已經矯正了我希望下一次你不會犯同一個錯哎呀 為什麼你又犯同一個錯是這樣的
最終他會錯的就是會錯的你不要預期他會錯除非現在是 4O 等到直至 5O 就會解決問題你再試多一次現在解決了問題那些模式是越來越好但你怎樣找都會找到很多証明只不過是那條線在哪
可能以前計不到某些數 現在計到這些數但現在複雜到要給整個股票市場最高 20%的年增長加一定在 14-15%之間可能那條數已經令他有點混亂然後他就開始把假東西吐出來我想 20 隻吧 他做不到就是做不到
其實這些問題比數 Strawberry 有幾個 R 更複雜你想想沒有 Chain of Thoughts 的模式他們連數 Strawberry 有三個 R 都數不到你還叫他在股票市場幫你找什麼 Lap of Foot Margin 大於 15%是不可能的因為他給我看的就是 ProSearch 其實 ProSearch 就是用那些沒有 Chain of Thoughts 的舊模式所以他們真的處理不了
它只有一个可以用到 Chain of Thought 就是拆了 Deep Seat R1 出来放进去但其实它也不是做 Calculation 的 R1 的强项也不是帮你做 Stock Screener
Stock Screener 用一些傳統的 finance 網站可能要付錢的做那些 Stock Screener 就輸唱過你現在用的 LLM 來做 Stock Screener 也不像是 Bloomberg 有些免費的 Stock Screener 也有 2 萬元一年
免費的都有 炸炸的都有的那些 criteria 很普通的 net profit margin 應該免費的 stock screener 都會找到你要去到很複雜的 好像你剛才說的 net profit margin 再加不知什麼加很多 criteria 可能要付錢但是應該開心過你付錢用一個 llm 之後你發現裡面的全部都是錯的現在開始可以 program 了 如果你有個
如果你有流程可以设定一会儿说的 agent sdk 可以说我现在要拿这个季度的 earnings report 然后你再跟我计算一条数然后你又可以存取所有 earnings report 但是你要存取整个市场又比较复杂所以要看你想的 problem 多简单和流程多简单要复杂的现在是可以做到的
有一件事我見過但沒有用過有一個功能 LINE 開始說有很多人都用的 如果你是買股票的很多時候你可能會用 tradingview 它有一個付費的功能但我沒有用過 你是可以自己寫曲的如果它的功能觸不到你
你可以 load code 下去你想怎樣玩都可以你想怎樣 screen 都可以
Ticker 很難搞 單個 Ticker 就行了你要 screen 又要 call 自己我認識網上朋友要搞到很複雜要 screen 所有最後他叫自己的伺服器拿資料放回去我覺得這麼複雜又要用 TradingView 又要寫 script 但又要用 REST API 來 call 自己的伺服器有點多餘
Ticker 很麻煩 所以我也不建議這樣做 Single Ticker 的分析都可以在 Trading View 裡面做
但是我看到他的用途例如 stock screener 用回傳統的那些用回 10 年前已經適用的東西就夠了你不要用 LLM 搞他應該可以的 暫時計數是差一點我覺得要自己寫 program 好 就是這樣 聽眾留言
今個星期我要講一下剛剛說的 GoogleGoogle 今個星期出了一款新的模式叫 Gemma 3 我真的很不信為什麼這麼複雜 Gemma 3 和 Gemini 2.0 其實我第一時間想問你是否串錯字了
不是是 Gemma 3 這是一個 open source 的 lightweight model 它出了那些什麼 1 billion parameter4 billion 然後不知道多少然後有一個夜測
總之目標是能夠上載普通的硬碟最大的模式應該能夠上載普通的 GPU 目標不是要做最好的 LLM 而是要做一個 Multi-model 的 LLM 最好的上載普通硬碟目標是最好的上載
其實它的底部也是 Gemini 2.0 為什麼要解釋到這麼複雜呢 Gemini 2.0 出來的小模型叫 Gemma 3 你說多複雜我想不是一個普通用家會用如果你是一個發展者想混合一些小模型或者你是用一些本地的 LM 你可以用
用 Olama 來 loadOlama 就是你可以試不同的 open source 的 model 你可以用小的 DeepSeek R1 小的 model 你可以試上個禮拜嘉嘉介紹的叫什麼 QWQ 那個我這個禮拜試過在 Mac 很容易 load 到 QWQ 那個 model 那
但上星期說普通人可以上載一張 4090 原來 4090 上載的也是縮小版 4bit 上載因為它的模式剛剛夜 7GB 是否夜 7GB 呢?夜 7GB 其實是比夜 4GB RAM 大所以 16bit full version 是上載不到的但縮小了一點就上載得到
Google 就出了一件小事,我看完也沒什麼好說的,就是說他跑分不是你跑分,他跑分說已經跑贏了那些很大的模特兒,自己排第二三,但是我真的不太相信這些夜七極的模特兒是可以跑贏那些百多人,
百多個 billion 夜七的 billion parameter 怎可以跑贏百多個 billion parameter 的 model 但他說可以就行不是啊不是這樣解釋他是在 open source 裡面排第二是啊 是啊 是啊 他說 open source 但他說跑贏 Deep sea 這樣像 R1 啊是啊 他說跑贏 Deep sea 哪個 modelV3 我現在開了 checkbox arena 如果只看 open source 的
第一名是 R1 第二名是 Gemma 3 第三名是 Deep Seek V3 那 Grog 3 呢? 不算吧?因為不是開放版如果是這樣 那上次的 QWQ 不是已經全贏了嗎?
因為 QWQ 是基於 R1 的所以立位在 R1 那裡?我看回 TrackBot ArenaGlock 3 的 Elo 跑分是 1407 而 Germar 3 是 1339Deep Seat R1 是 1361
但也挺厲害的如果這麼小可以跑到頭其實也算威風但現在的問題是什麼呢很多小模特兒都是為跑分而
而計算出來的 怎樣可以訓練到跑分跑得高但實際用途是否真的那麼高分呢就真的聽起來很多人說這些所謂跑分跑得高都是一般的 到了實戰來說但起碼有一個很小的我沒理由踩它 這個是 open source 的 Google 終於 open source 的東西出來 Google 終於給大家玩的所以都要
但就沒有聲音 只有一些人說因為他一連串宣佈了幾件事我補充一下 你問 QWQ 的跑分是 1153 低分很多因為上次他只計算 reasoning model 即是 open source 的 reasoning model 你第一名是 R1 第二名就是他 以上個星期因為不是那麼多 reasoning model
但這個 Gemma 3 我記得好像是 Recently Model 我記得是 Recently Model 但上星期還未公佈 下星期才公佈這個也叫做 Multi Model 真的又有照片又有影片 什麼都可以做到 Input 不是每個 Model 都可以做到又有照片又有什麼的還有說回
Gemma 3 和 Gemini 2.0 Flash 最大分別是 Gemma 3 的訓練數據只到 2021 年 9 月所以它不能回答你的新問題
為什麼變成 G3 的等級 Gemini 2.0 Flash 是常常更新的沒有日子限制所以最大分別在於它的數據
Gemma 3 是不能回答你一些新近發生的問題但它最大的優點就是可以輸入到你自己的手機和開放軟件我想這一刻我覺得這麼多開放軟件是這麼厲害
不如在這裡說一句因為今個星期 Apple 說 Apple Intelligence 有很多功能要延遲到明年為什麼不開放出來用其他那些 LM 呢暫時做一個平台跟 Google Map
當年 iPhone 第一代用 Google Map 沒有分別的你就是輸入一個讓人選擇的模式最多你自己做一個測試你覺得它需要的道德標準非常高要過到蘋果的測試才可以輸入到蘋果的 AI App Store 那就這樣做但是你不要限制著 iPhone
明明那些硬件是可以做到 LM 但你限制了因為你自己的 Apple Intelligence 還未完成所以就不出來但你就可以混這些你就可以混 Gemma 3、Lama 3.2、3.3 你就可以混那些你就可以混 Grog 2 也好 什麼也好為什麼你不放出來呢
你將來救人家那麼厲害 你就讓人選擇或者你自己放在 Apple Map 自己的 AI 就放在頭上其他就要特外下載就可以了 你不用怕別人爬了你頭但是起碼可以使用 你的硬體就在 但用不到 AI 的東西你玩過嗎有啊 我安裝了 Gemma 3 不如我待會再說
因為我安裝在 LOM Studio 那裡 OK 你想調一下 Gemini 先吧 Gemini 我先說完但我想說它的相片的功能會不會打斷流程不會 你先說 Gemini 2.0 吧 OK 今個星期 Gemini 2.0 Flash 就出了一排好像上個月出的即是二月的時候出的但它就出了一個新功能叫 Gemini 2.0 Flash 括號 Image Generation
Experimental 嘗試用來 Gen 相這個 Gemini 2.0 的 Flash 我在哪裡試呢?就是剛才說的 Aistudio.google.com 我是為了試這個 Gen 相而
找 Google 放了新的功能在哪裏呢?我試試在 Gemini 原來不是在 Gemini.google.com 結果就是在 Aistudio.google.com 裏面你要選擇模式 要選擇誰呢?我又不知道原來 Gem 相是這個?你不可以就這樣選擇 Gemini 2.0 Flash 你要選擇 Gemini 2.0 Flash 括號 Image Generation
明明同一個模特兒有分有得將相和沒有得將相的模特兒我想他試驗完之後就會合併但暫時一刻試驗就是你要知道你選擇什麼你要選擇一個特別的模特兒可以將相為什麼要試這個模特兒呢就是說他聲稱改相很厲害意思是什麼呢首先將一隻狗你叫他將一張照片的狗
跟着整完之後你可以改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改改
我上載一個女生的照片出來不行 很多界限這個是真人像所以我不可以做一些跟真人像有關然後我叫她上載一個女生的照片出來這樣有可能會有內容
有危险就是怕有些踩到界我心想就这样一个女生我不是叫你她穿任何的特别的衣服只不过是普通一个人这样也不行很多界限的如果你要要拉到人我是 up
撿到一张在 GROK 里出现的女生照片他就收货因为那个不是一个真人他认不到是一个名人他就 OK 我说你可不可以帮他整个心形他真的整了一个
這樣做出來的再改不如他提起手指弓怎料他改了一個心形然後手指尾變成手指弓那樣飛出來無論如何他是有錯有不有性的但都可以說用 Prom 來改想
Photoshop 也可以這樣做但如果在網上要普通的 GEN 照片如果用 Prom 來改成照片這個都算是最容易用 Prom 操控的一個
可以這樣說 不說 Inpainting 如果你自己有方法擴一格改位置 那些叫 Inpainting 那些操控能力就大 但我只不過是說整張照片我想用一個 Prompt
就這樣一句話改一張照片的某一個部分不是把照片全部改成一張照片這也算是一個比較好的你說它是否稱職很多人不稱職我試過有一棵花我把花放在沙漠它真的放在沙漠裡我加三隻駱駝上去有一隻很像樣的駱駝然後有一隻不知為何縮小的駱駝第三隻是一隻狗我都操控不了牠
可能是那個 Strawberry 的 3 個 R 的問題他數到第三隻他已經忘記了要將駱駝或者那個三字令他很困擾很影響到他他就忘記了要將駱駝就將狗出來但是我告訴你是有這樣的功能
普通是可以的而我看到 Twitter X 裡面有人配合這些 Gen 相一個女生 Gen 用某一個手勢然後再用 Pika 的 AI 相你可以給她幾個 frame 她就 Gen 一個 video 出來她真的做到女生本來看著鏡頭然後手就弄個心是很順的有一個動作出來你可以配合幾個 tool 去做這樣
這個 Gemini Flash 的 Gem 照片只有其中一部分還有兩部分第二部分就是 Visual Story 就是你講一個故事給你製造一個卡通畫板就是下一格的卡通製造出來你可以試一下我覺得圖像比較普通而我沒有心機試在這個時候大家可以試一下第三就是弄
生日卡你可以叫他把生日卡刷出來下面那段文字是這樣的他就用你形容的方法刷一張生日卡出來真的可以用文字去刷一張照片兼且可以很容易地改同一張生日卡你可以說我還是不想打這個字你打另外一隻字你用哪個字看他就可以刷出來我覺得也不錯
在可以更改圖片的情況下 這個照片是可以的你說是不是很好 說不好 因為很多東西不給 GEN 誇張的東西不給 GEN 即是我要下駝式飛他說這些不現實 不現實不 GEN 心想有沒有搞錯 GEN 照片也要現實 你不是耍我嗎然後上載照片是一個女生
你可不可以由她生氣的樣子變成笑的樣子她說這樣可能有可能有危險不給 Gent 總之一同女生的照片她差不多都很怕踏到街而那條街我覺得是離譜的離譜到我差點不想用為了試
今天才試試 試到我生氣這條街怎麼可以低到這樣可能將來會鬆開一點但暫時這一刻你會說 哇 要不要這麼保守差不多是保守到女生只可以露眼睛 頭髮一粒一粒我不知道這條街在哪裡 總之很誇張
我看到另一个用途,就是在 YouTube 上看到外国的 YouTuber 他不是要他上传照片,而是上传了两张照片给他一张是那个 YouTuber 自己的样子,就是他自己坐在家里的另一张照片就是一只海龟然后他就给他一个提示,说我想坐在一只海龟上面
然後就將一張照片放在海底 Youtuber 自己原本的身體剪了出來然後坐在海龜上面然後是很正常的他又不會說很正經很 work 的真的很 work 的真的好像人家那些 photoshop 改圖這樣坐在海龜上面然後就說我想弄件 T-shirt 你幫我弄個 mockup
就可以把海底本身背景有些海水在那裏拿走海水就只有海龜和人物坐在海龜裏然後就真的摸上了一件 T 恤如果你這樣看你當以前的 Photoshop 用這樣是一個很 OK 的用途
但如果要像你剛才試的那個是沒有中生有的 更精緻的上來可能就差一點但我覺得即是改上 ok 的意思是已經是有現實的 只不過是加多減少減少應該說不是加多 是減少或者將兩件事混合在一起就 ok 了
你可能以前要用 Photoshop 做 可能很複雜用一些專門的 app 去做你現在不用 你只是說兩句話就可以做到好 那就是我那部分
好了,我移到下一个题目,就是 LM Studio 其实这个星期我在看 YouTube 的时候看到有人用了一样东西叫 LM Studio,好像挺好用那是什么呢?之前我们一直说,如果你想自己
在电脑上,即是你自己的电脑在 offline 上,去 load LLM 就用 Ollama 但 Ollama 我安装过,我不太喜欢它的界面我不喜欢那些 CMD 的界面这样 LM Studio 就适合我的口味我喜欢按 mouse 有个 GUI 让我按一下其实它的用法有点像以前 Stable Diffusion 有个 automatic 一日都是 GUI 来的但这个 LM Studio 就只是用来 load 一些
LM 就不是用來 GEN 相的它就是很容易的在 Google 打 LM Studio 你便安裝在你的電腦上 Mac Windows 和 Linux 都有的你裝了軟件裝好軟件之後你打開它就有一個只有幾個按鍵你第一次用
你便要搜寻你要装的模型它有个放大镜在左边按搜寻例如我想装一个 Gemma 3 这样你便打回 Gemma 3 然后它便会 load 到几个 Gemma 的模型给你有什么 1B 2B 12B 27B 这样你便可以点进去它会告诉你你部机能不能装到那个模型如果是模型太大的话它便会弹红
你部机不能上传了不会推荐你安装但仍然有下载按钮你要安装它不会阻止你例如我试了 Perplexity 拆了 R1 的 1776 模型我试过搜索 370 多 GB 当然 200B 的部机是不能运作的我部机只有 12GB VRAM 是不可能运作的它有一个红色的
但如果我硬要下載 仍然可以下載但問題是不能運作 Gemma 3 在四個模式中 我選擇了最大的 27B 我這部機只有 12GB VRAM 3060 都可以運作 不過有點慢的它不是在 CPU 運作嗎 為什麼會運作
因为 LM Studio 还有一个 set 本来后点先讲这个要先上来因为 LM Studio 其实有很多 settings 可以给你 set 好像你用 automatic11 有很多 parameter 可以 set 其中一个 parameter 叫 GPU offload 就是你分多少东西去你的 GPU 里
Gemma 3 我只分了 GPU 的一半去 load 其他就用 CPU 去 load 所以是用 RAM 的 所以很慢所以是 load 到 但慢 可能你去洗手間才 load 完答案
我記得有人用 LM Studio 就是這樣的方法 幾張影片卡都可以下載 變成可以下載很大的 LM 是不是全速 也許是慢 但起碼做到好像 我懷疑是
我没有试过因为我没有寄张 Display Card 但我看到它真的有很多 Settings 可以调整就像 Automatic A1 你只要多到都不知道 Settings 在做什么但是基本上应该是你想设置的东西全部都设置到那说回一些 Model 你搜寻到的 Model 可以搜寻到什么呢基本上在 Hacking Face 那里所有在 Hacking Face 找到的 Model 你都可以搜寻到问题是你的机器 Hardware 能不能安装
另外除了 GPU Offload 还有 Temperature 可以设定它是有 Temperature 的如果你不知道什么是 Temperature 就是它是有多少与你的 Prum 合适或者它有多少创意你想它跟足你的 Prum 你的 Temperature 就设低一点你想它多点创意要天马行空一点你的 Temperature 就设高一点这些全部都可以调校
还有你可以放一个系统的文件例如你要写文字你可以给它一个系统文件它就是一个专业的文字处理它是专业的语言你也可以给它一个系统文件而这些设定我刚才说的所有东西你可以设定完之后你可以保存它你可以保存它做一个定书
每一次你需要用同一个 present 的时候你一按下去就可以出现你之前设置好的所有 settings 另外就是
它有一个不好处就是它可以复制到画面的 input 但它做不到 output 例如好像刚才的 Gemma 3 它是一个 multi-model 你可以丢一张照片给它你叫它做一些东西但是它就偶不回另一张照片出来例如说可能叫它改图它是偶不出改图的东西出来的就是它给不到一张照片出来的
你叫他做他之后会说是呀我正在做然后他会写了一句我正在做然后就说我做完了你是看不到一张出现的照片但是你叫他 OCR 的东西例如说我刚刚刚才试了我试了 CAP 了我们现在直播的画面 CAP 了阿 Ed 和良粉的样子还有些字在这张照片上叫他搜索人名他搜索到良粉的名字但搜索不到阿 Ed 的名字
然後他還會另外加一些創作我就說他是一個香港的設計師現在是有什麼現代風格和奢華的住宅設計人名即是會突然之間無緣無故我叫他去記錄人名出來他又會創作一些東西出來可能就是我的溫度沒有特別設定到但是他記錄出來
是真的 良粉的名字 良粉的英文名字是一個室內設計師很出名的是嗎 是啊但我沒有叫他講那麼多東西我只是叫他幫我記錄裡面的文字出來
我以為我現在在載夜 7B 的模式 理論上我夜 7B 的模式載不到夜 4Gig VRAM 但你可以看到它在載什麼來的比如你看這個模式寫著 QQUF 的模式如果尾的 extension 那些是縮小版縮小版怎麼看它如何縮小呢如果寫著 Q4 它是 quantize 了 4bit 本來是 16bit
現在用 4bit 來代替 16bit 變成縮小了可以縮小到一半或者再小一點我這張夜 4GB VRAM 的卡都可以 load 到 JAMA 的夜 7B 的模式你想想我 12GB 都可以 你 24GB 都可以可能你也能 offload GPU
所以它的缺點就是就算模特可以將相片出來但你在 LM Studio 上載就載不到例如你剛才說整個女生想由哭變做笑那在網上我忘記在 Gemma 3 能否做到但我沒有直接用 Gemma 3 在網上我都不見得有得做在 Google 的 AI Studio 就有
是嗎 有的 Google AI Studio 有的但我選擇了 Gemini 2.0 等我試試我不記得 Gemini 3.0 我能不能輸入相片但 LM Studio 就一定不行 總之去 Openshift 就不行我記得我想說什麼了 Gemini 3.0 支援 140 種不同的語言 包括廣東話厲害的是 我在 LM Studio 可以用
廣東話跟他說我剛才說那個叫他記錄一些人名出來我是用 CAP 記錄記錄這張照片裡面的人名出來他是可以理解到的而他真的可以記錄出來的你怎麼跟他說話
我用廣東話打 CAP 但你想想 CAP 本來是解無但你是打字不是有語音的方法錄一條音帶聲給他不是這樣不是打文字的我用文字輸入你因為 Multimotor 除了可以有照片還可以說話其實是可以說話但我不知道 LM Studio 有沒有一個
渠道給你錄音 再傳錄音帶進去 LM 裡面不是 沒有的 但其實我的重點是可以理解廣東話 CAPTOL 我想也有人這樣寫 也可以訓練到 CAPTOL 這個字我會覺得你理解到中文字的廣東話那些 CAP 出來的例字你可以理解得 OK
但你可能是 Captal 你竟然明白我在說什麼 我覺得真的很 Amazing 在香港如果你跟老一輩說 他也未必知道你在說什麼叫 Captal 但這個是近十年八載才有的語言 說法 他是可以理解到所以我覺得是 Amazing 的 在這方面 是很 Impressive 的
但是我會問你 因為我自己也很少用奧拉瑪你說你不喜歡用 command prompt 不喜歡用 terminal 但是就算我是接受到 terminal 我自己也會說
Local LLM 不是做到很多特別的東西而外面的 LLM 是做不到的或者應該說你只不過是外面 LLM 的一成或者兩成而已你現在試過 LM Studio 可以 load 到不同的 open source 的 model 你覺得你會不會繼續用呢還是試一下算了但平時都是用外面的
如果要找一些最新的,最新的就没办法,一定是用上网上的但如果我的用途是要做一些感染性的事情,例如要混入公司的东西进去可能要问一些问题,我无可避免一定要把公司里面的资料放在我的公司里面,那我就一定要用上网上的东西
例如你剛才說的用途例如你公司裏面有些修改你要去輸出我覺得用網上的我不舒服如果是我的做法我就可能會留在自動電腦裏面做是最少我做到的就是慢一點是 我現在還在找怎樣可以自動輸入我的 GPU 裏面我完全找不到
你安装了 LM Studio,在最顶头有一个紫色的很长的 bar,它会显示你在使用哪个模型它左边有一个 settings,有一个按键,你在 settings 按键里面就有一个叫 GPU offload 的 setup
例如它寫著 62RF62 是不是全部都已經下載到 GPU 上我已經用到 GPU 但我覺得很慢我用最大的模式是很慢的你 24V RAM 都來也覺得慢 我 12V RAM 就更加慢
我觉得可以让你感受一下一个 offline 的 LLM 你是可以控制到去什么程度真的超级多 settings 你真的可以逐个 settings 慢慢转研一下自己去试一下如何 tune 到你觉得是最合适就和你用 online 不同 online 那些是快 资料最新但你没有这些 settings 可以给你玩
原來之前錄影不夠 第二次開始很快其實可以接受得到
但始终 Gemma 3 的数据很旧,2021 年 9 月我想对于我来说,可能最大用途用一些旧的训练数据模式可能都是问它写 code 那些因为写 code 那些你不会有新的,是它 well trained,找它写 code 可能是挺好用的,还有如果你可能要 input 一些 sensitive information
可以安心使用看看有没有留言请问主持 LMSize 越大所 generate 的答案图像是否越好
YES AND NO 看看你是哪個模式當然越大越好 但同時要看你是哪個模式例如 R1 R1 是 Reasoning Model 但圖像不一定是最好圖像是指 Genre 照片出來?
好像 R1 不能掃描照片 是不是是 我不太記得 應該不行如果是最近的模式
我想帶出的就是 它不只是大小越大越好 也要看它是哪一款如果同一個模式 它有幾個不同的大小 理論上越大越準確是最好的模式 但會慢很多 而且要多一點 VRAM 才可以 load 到同一個模式但如果 A 和 B 選擇 你就要看
你做什麼 要看那個模式 潛質是多少但如果你選定了一個模式 最大是最好的但問題是你能不能做到
這個星期為什麼 Gemma 3 講得這麼厲害就是它比未到 R1 因為 R1 是一個 200B 的模式不是 最大是 675 即如果你做原生的 675 但是 Gemma 3 只是一個 27B 的模式但是它的跑分只是低於 R1 一點所以其實它的 breakthrough 就是在於它是一個這麼小的模式但是它的分數是可以拍得上一個
但它是幾十倍的模式但 R1 不是一個全尺寸模式其實它是一個叫做什麼 Multiple Agent 叫做 Mix of Agent
Mixed of expert 就是有一個頭 評估了你的問題是什麼然後分配給一個 30 多 B 的模式去答案就是有幾個 30 多 B 的模式 加上所有的 agent 加上所有的 expert 才是 671B 但是其實每一個模式只不過是一個 30 多 B 的模式
所以它是快很多的 它的速度或者價錢去運作是比現在的快 現在你說的 7GBT 4.5 大劑這麼貴才能運作 人家 Deep-Sea R1 這麼便宜它便宜就便宜了 因為它其實是一個小模型 只不過有很多小模型
但你這樣說 QWQ 都很厲害 已經 32B 了所以為什麼可以拍得住 R1 所以我上星期還未真正試但我覺得這些是跑分模式
他全都訓練了常問的問題 用別人的答案去訓練他他變成跑分就很厲害但如果到實戰的時候 我覺得是不夠別人理由因為有一點大變化的問題 他應該就回答不了
你這樣說 我突然想起那些中國大陸的考生去考英文試 是啊 你可以這樣說去考 SAT 去考 TOPO 那些 是啊 這些小模特兒去讀考試 背試卷
他會跑這些常問的 LLM 測試的問題就算他變化 但都差不多問題 他都會回答但問題是一有新品種的問題 他可能會回答好 Gemma3 和 LLM Studio 就說到這裡有興趣如果想玩 Local LLM 可以試用 LLM Studio 我覺得是很容易操作的很容易操作 試試吧
Apple Intelligence 剛才說了有一個大黑 Q 是不是說 Apple Intelligence 要延長一年?Siri 的 Apple Siri
因为原本是打算 18.4 才会出的现在是 18.3 左右所以应该这 1-2 个月就好了其实会不会去买了上周我说的 Sesame
Sesame AI 就成功了可以嗎?不是的 Sesame AI 只是聲音 Personal Siri 不是一百聲嗎?不是的 是下層 AI 的功能 Sesame 也有下層 AI 的功能也是一個可以說話的 AI 不是蠢的 只是說話的重點不是說它是不是應該要賣但問題是現在
原本應該很快出現的 18.4 但是之後又去延遲到 5 月然後現在內部直接開了一個碟會就說可能要延遲到去...IOS 19 也未必見到不是 IOS 19 是 IOS 17 總而言之就是下年
不是 19 了嗎 iPhone 16 就是 iOS 18 那是 19 了
今個星期我聽 John Gruber 即是 Darren Fireball 他是鬧得很狠他很笨 一個寫了很多年蘋果的 Blog 的人都很熟悉蘋果如果蘋果讓你試試那樣東西可能還有幾個月就推出 或者最遲 Vision Pro 半年
或者九个月都出到他说从来苹果都没给过这个 feature 所有人试或者体验只不过是形容出来的他其实是应该斩钉截铁早大半年就应该要猜基本上是有牌都不出这一样东西如果不是为什么会没得试呢
又沒有 Beta 又沒有什麼的所以他就說為什麼他不早寫是說這樣呢現在回想起來就是很笨拙為什麼他不早一點做一個起碼有一個先見之明在這裡
那就是说一句 苹果为什么这么差呢?苹果才做了一个 Apple Siri 人家 Alexa 立刻做了一个 Alexa Plus 已经可以出现了 为什么苹果的 Siri 搞不定呢?我也不知道苹果是不是要做得很好 是不是要做到像 ChessGPT 的 Advanced Voice Mode 那样呢?我不是很清楚 但是我想说的是
最好用的也是一個沒有界限的 AIGrog 的聲音模式是一個沒有界限的是比任何有界限的好用我不知道蘋果是不是浪費很多時間去做那些這個我又不能說但是現在很普通的一個 LMM 都懂得有這些防範
有這些怎樣說自己評審的為什麼蘋果要做得為什麼好像這麼吃力為什麼他做 AI 就是做個人性思維是要做得這麼吃力他是不是有些特別的 feature 是從來所有 AI 都做不到直到現在他有一個新 feature 還是怎樣還是他舊那些現在加了一個新的 LLM 下去做不回之前那些 set timer 問天氣問那些 feature 因為
Alexa Plus 其實好像有人說是破壞了很多舊的功能 Alexa 你可以用很多指令去做很多事情但是那些指令你一定要很正確的你一定要說英文說到一模一樣才行有新的 Alexa Plus 你可以跟他聊天
但做不回之前的指令好像要做分隔 Alexa+和 Alexa 是有點不同未必完全跟舊時的指令相比會不會 Apple Siri 做不回之前的指令
我不知道這個挑戰在哪裡我看到兩年了 LLM 不斷推出隔兩個月推出一次為什麼蘋果推出這個東西這麼複雜究竟它複雜在哪裡 Grok 又沒有變成有都是十多個月還要是最高的 LLM 蘋果這個系列還要再推出一年 Grok 也不知道去了哪裡如果再推出一年你追不追到其他的 LLM 呢
不如付錢買吧 人家都開放了 我覺得是可以的先載一個 Gemma 或者 Lamma
最後一個題目 Patrick 你是不是說 OpenAI 今個星期說了些東西很討人厭?OpenAI 新聞基本上每個星期都有今個星期有一個新聞 它想跟美國政府談的是什麼呢?之前就說 OpenAI 是其中一個公司支持這些去管理 AI 安全的東西
但現在要反過來 要脫離這個限制
因為他說現在有這個限制 跟中國的 AI 模式無法相比當他大哥還拋離其他人兩條街他就說需要限制 應該要停一停管一管現在的 AI 是否發展得太快 要做一些管制到一看到
有機會被人「爬頭」即是有機會也不是叫「爬了頭」即刻就說「我這邊走路不知道錄音能不能錄到」一有機會被人「爬頭」就說「政府其實你應該要放開這個管制給我進程去放」這樣是被人瞄的 Sam Ockman 其實是
說了很多東西是別人了解的 之前也說自己在議會上說我一元都沒有收 只有健康保險我做這件事是因為我熱愛這份工作不夠一年就說想將這間公司私有化
大股东来的公司是值 1500 亿的是被人瞄准的 Sam Offman 之前又说 AI 是需要管的一到自己需要竞争的时候其实 AI 是不需要管的不要管了要不然不够别人练的了其实谈一下他这个礼拜有几样好东西我的 CheckGPT Plus Account 是可以用 GPT 4.5 是好用的但是
用不久就已經用完這個月可以用的 quota 用完就算了我覺得比較短印 好像用了兩天就已經用完整個月的 quota 只會笑 突然間這麼少的數字 就沒有了開頭很開心 用了兩天沒有就算了其實 4O 也差不多 跟 4.5 4.5 是慢一段的
最後今個禮拜 OpenAI 就 released 了 agents 的 SDK 今個禮拜會很多人講 agentsagents 的意思是寫 code 可以用 LLM
寫多些 code 而已 因為其他公司已經開始有 agent 了但是這次就是 CheckGPT OpenAI 做的 agents 有什麼 feature 你先聽聽不是真的 agents 而已 但是你先聽聽其中一樣東西就是有 file reference file reference 的意思是什麼呢
你可以你知道如果你玩 CheckGPT 可以上传一些档案你再可以搜索现在 Core API 是可以参照档案而且档案是可以有 metadata 的你可以说这个 PDF 就是 20
二三年 tag 了就是你加一些 tag 下去到你用 LLM 的时候我要我要 search 这些 file 你可以 search 一些 tag 就是我只是 search 这些 file 又不 search 这些 file 因为你可以说我要二零二三年那个年报我又不要看二零二四年你可以用 metadata 来 search 你觉不觉得这些是 agent 我绝对不觉得这些是 agent 这些只不过是
擴大了的 LLM 可以用你 Customize 的 Data 用你用家的 Data 來做 LLM 我不覺得很 agent 第二就是 Web Search 都有少少 agent 你可以說我去哪個哪個 Web Site 給我看看有沒有跟最新的 Data 那是不是 agent 也可以說你可以說是你指使了一個
一個 agent 即是你指使他他自動幫你去 web site 查看新的東西都可以叫 agent 最後就是 computer user
就是刷某些 webpage 来点击有些按钮是可以这样做的就是有这一大堆 API 你不要想着现在就叫 agents 陆续会有多一些比较流畅的东西但是暂时头一炮的东西我觉得就是比较简单你用得着的就是有一大堆 LLM 可以帮到你什么叫 LLM 帮到你呢比如看一个 website
普通程式是很困難的 但 LLM 可以幫你看到網站 取得從中的資料或者之後會更容易點擊到一些按鍵 幫你搜尋一些東西甚至乎我現在還未見到有人這樣做 譬如幫你買東西 幫你訂票 這是之後的 但這是目標
但要計劃是很難的事 可能要記錄到程式後經常都要按那個鍵但有了 LM 之後 你告訴他買這東西他應該大概可以理解到人可以做到的事他就做到了 這就是目標但暫時做不做到好像有微木的 API 可以做到這件事但你可以看到它的功能是很初型的就是這樣
有很多人暫時很興奮的 例如你找工作 便可以自動叫一個 agent 去連結 找適合的規則 存在一個檔案 發給不知誰 請人便可以跟著這個履歷
这一大群人你就打电话给他们好像很自动本来需要复制一些很具体的东西现在就不用复制一些很具体的东西只不过是写了一些文字就可以做到你想做的东西但也要复制的不是不用复制的要复制的但如果 LinkedIn 改 UI 你不用怕
你不用重新寫 只要去連結找一些東西你不要在 html 裡面打一個要懂 Java 的然後列出一些人 然後逐一去讀這個人的履歷不是這樣 你只不過是說要找這些人
這個大概就是 Agent 我現在下雨聲很大 所以有點干擾到我說話
打擾了你的思路我看到 agent 最多人說是用來 screen resume 可能一些 HR 或 agency 公司例如你丟一個 job 出來可能會收幾百封幾千封的 resume 現在也叫做有 AI 不是 LLM 現在或者幾年前的 AI 是幫忙 screen 的但你也要中 keywords
但這個不用 agent API 掃描也行但你有張良計我有過長梯現在的描述有很多 keywords 會廢掉 AI 你可以種植一些你覺得很重的 keywords 在描述中
哦 OK 舉例吧你說那些隱形的關鍵字是不是你所說的舉例吧 例如說你可能不懂得用 Excel 但你可能懂得用 Google Spreadsheet 的舉例才算然後你就可以說我有經驗用 Google Spreadsheet 然後括弧 similar software with Excel 現在的 AI 就中了 Excel 的關鍵字啊 OK
等於在 Amazon、Ebay 賣東西他們的題目會有很多不關攝的字是 更加近曝光但不關系是 會否漏掉一宗生意回來的意思是 要盡量令到他的 Referral 也好 產量也好 出現在搜尋結果中
AI agent 是可以幫助改善這個問題的那些 NOTS 就能夠幫助你清理掉是 人看得到的東西 AI 也應該看得到本來機器分不到但現在的 LM 是可以分普通文字跟人沒有分別我也期待 AI agent
我們有留言嗎 沒有 算吧說 AI 為什麼大家這麼靜 應該很興奮說 AI 應該是 我很多東西都要試但時間上非常不足可以試到很多東西
為什麼人們不利用它我在節目前說很重要的事情就是現在大陸美國都在製造機械人未來就是
未來就是每個人的家或者每個人都有一個機械人幫你無論是摺衣服或是做什麼都好你想不想控制到它呢我覺得控制到它最少也要做得好你要 Customize 它我覺得第一輪或者第二三輪你要控制到它的都是跟現在玩 LLM 有很相近的關係還是你想要等到一個 Product 完全成熟
你不要你要譬如 Google 给一个他觉得很适合全家大小用的你不能 customize 的还是你想玩一个是 open source 的是你喜欢他做什么都可以的可以
跳出它的范围比如切菜也可以因为 LM 因为 Google 那个版本觉得它拿着刀很危险它就不可以切菜但是如果你用一个是完全设计的可以让它拿着刀我给你一些例子你去到某一个位置就是你可不可以设计到那一样东西就是机械人加 LM 加
AI 那些東西我覺得現在是一個時候
不斷要跟隨這些資訊不然到某一刻我又怕我的年紀又要老你知道到了差不多的年紀你就不想學習又要等小孩的小孩可否幫我搞定機械人幫我洗衣服我不想到某一刻是這樣我要貼著這些資訊而最近的就是現在玩的 LLM
是的 我觉得是的因为你写 prom 虽然你说不同 model 可能你写 prom 的方法不同但是其实你去表达你自己想要的东西是很重要的
我舉個例子 我有朋友他本身不是做開技術這方面的事不過他也知道 AI 現在基本上有誰不懂 AI 但他是比較懷疑 AI 他是用一個挑戰測試的心態去試用 AI 模式他做哪一行的 他做主要部門
所以在日常工作上是顛倒的他用一個挑機的心態問了一個很簡單的問題他就問 我忘了是問 preparsity 還是 checkgpt 總之無所謂 他就一句扔過去因為珍珠有分野生和養豬但我們大部分現在買到的珍珠九成都是
當然要養 因為野生物很貴不是 它不圓 因為我看了太多 TikTok 你想想它要一層一層堆成 你要堆成圓是很巧合的東西但如果你直接放一顆圓的東西 它就在那一層包
那個是不是叫蚌?我不知道那東西是不是叫蚌還是蜆?我不知道總之如果你放了一塊膠或是那東西叫矽那東西只不過是包一些珍珠的東西進去這樣很容易弄到它圓形和有珍珠的顏色但你說天然的那東西三尖八角 靈靈稱基本上是比登天更難是啊 就是說如果你在野生裡找到一顆圓的珍珠應該要把它拍賣行
怎樣完呢 根本是亂來的他用一個挑機的心態去問 AI 他就扔了一句問我應該買野生還是養珍珠他的提議只有一句然後人家就吐了一句給他然後他就不是很滿意他說 AI 都答不到我想要的問題他有沒有告訴你 AI 怎樣回答他有 有 有 我不記得了
好像是一個月前也不好的很經典 講完都沒有說 廢廢的流氓我問 是你不懂寫一個 prompt 因為你的 prompt 其實沒有方向
我應該買什麼買什麼都好 有錢就買珍貴的那你的方案例如你是想買日常配帶還是收藏用還是大小你預算 或者是你個人的偏好
一個我 一個我字 AI 不是你肚子裡的蟲我都不知道你的 predeference 是什麼你的偏好是你喜歡什麼類型的東西都不知道你都沒有跟我說然後他就說 AR 答不到我想答的問題就算你沒有 AI 你沒有示範給他看講伏
有啊 我有 send 了一些短短的文章教人家如何写一个 prompt 例如你一开播你可能要讲你的问题接着你下面可能要有你的 criteria 你要列一些 criteria 出来例如好像刚才那条问题你应该可能是问我的编号我是要
是三千八角的 还是要圆润的还是要什么颜色的是用来做首饰 还是做收藏的就是要列这些规则然后最后就最好给一个例子如果我给例子的话就 optional 的可能写 email 写文那些就可能给个例子会好一点一个这样的 prompt 我说你最少都可能要有百多二百字的就是 minimum 的你不可以就这样丢一句
也可以很短的 因為他的問題實在太簡單了如果他只要問我要便宜又漂亮 帶出來別人喜歡的那我應該買養豬還是要買真珠呢其實應該已經回答了 但他的問題是我應該買什麼 你喜歡什麼就買什麼我想他回答了
我示範了一次給他看我說不如你要問他野生和天然珍珠有什麼分別可能用表格的方式列出列完之後再問你想問的問題會好一點他滿不滿意呢他就誤
其實他沒有心去用 他只是挑戰他最後他覺得跟人差不多 為什麼要用你我隔壁請的員工都可以回答這個問題 這些太簡單了他只是挑戰他 回答不到簡單的問題 回答了簡單的問題他還是回答了很簡單的問題因為這些知識實在太簡單
有聽眾留言 用 AI 出問題來訓練自己另外有聽眾問 可否用 LLM 教人類如何表達自己
我觉得可以的,因为通常一个新的 model 例如 custom GPT,我通常第一句就是问我应该怎样去问你,而你是给到一个最好的回应通常他就会答,我想要什么,例如说出你的要求,给一个例子
我覺得再強烈的聲音模式已經可以訓練到一個人的談吐方式現在你寫字當然不行了你喜歡用聲音 我真的很不喜歡用聲音我是很討厭說話的你喜歡現在跟我們說話嗎 還是你想跟我打電話
例如 WhatsApp 人們發 voice message 我是很討厭的因為那不是 conversation 我現在是說 advanced voice mode 就是對答你想跟你朋友說話還是想 text message 他?就是這樣 試試看說什麼內容 這些比較複雜 可能要 text 會比較好
你吹嘴就當然是聲音好一點現在就是想那個人訓練你的談吐或者表達方式當然就是需要聲音怎會用字幕來訓練你的談吐方式不是談吐方式 是內容你誇張的範圍要誇張到多少好像剛才我的朋友基本上沒有範圍
你沒有給 LLM 回答你的問題這與聲音或語音無關我理解錯了聽眾問是否可以用 LLM 來訓練表達方式我覺得表達自己是需要
說話談吐是包在內 不是直接寫一大堆文章在內我便想了一定要用聲音才可以做到但可能問題不是這樣問我覺得其實人很多時候根本連自己想要甚麼都不知道所以他拋出一個很經典的問題出來
他是期望你一回答就 哎呀 你在我肚子裡跳蟲 你竟然知道我在腦裡在想什麼其實我覺得有很多人的期望是這樣但是可以的 將來真的有記憶 有 context 你真的可以隨便問一個問題 他其實知道你做什麼而快要可能 譬如
CHATGPT 做的那些經常看著你的 Desktop 做什麼大約你問今天發生什麼事他都應該知道你在做什麼他可以幫到你你突然問他一個問題說我想不起我今天之前說的那些東西他應該可以回答你而未來是真的可以的好像你肚子裡的蟲一樣
你講的那件事我醒起 Google 這個星期是 release germany 2.0 的時候它有講到它說將會將會推出一個 feature 就是根據
用戶的搜尋習慣 應該是 Google search 你 tailor-made 內容給他我猜 Google 是想帶回一些人用 Google search 因為我想後來數據會見到我聽到都沒有人 每個人都說我已經不再用 Google search 因為 Google search 被 SUO 玩爛了
總之是 LM 已經回答到的問題如果我要搜尋即時新聞我用 Glog 我真的沒試過我可以搜尋兩樣東西我可以搜尋 Web Content 我可以搜尋所有 X 的貼文基本上是回答到我所有要知道的問題那我為什麼要 Google 搜尋呢我完全不需要 Google 搜尋
我觉得是 Google 因为看到很多人转了不再用 Google search 所以推出这个功能就是说我可以很贴心的根据你平时搜索的习惯使用习惯我就可以给你一些调整的反应
想帶回一些人去用 Google search 但我覺得 Google search 先搞定 SEO 那些東西人們玩 SEO 玩到 Google search 都搜尋不到我想要的東西我覺得不太對你要去第二和第三條連結已經太遙遠了即是你第一個答案給不到我已經太遲了
現在的人需要我打一個問題 第一樣你彈給我的就是答案而我不應該再按到連結上所以 Google 整個模式已經是
我上星期聽到那些叫做 Organic SearchOrganic Search 已經在廣告之後有些很好的網站說是 traffic 跌了六成 比起最高的時候基本上是不可行的 靠 Google 去到你的網站是不可行的我已經極少用 Google Search 第一件事真的是 Perplexity
我們在完之前說一些不是 AI 的新聞現在 Nintendo Switch 第二代差不多推出現在有消息說已經有 40 萬部 Switch 送了過來
我怕又是搶不到 你不記得他說 4 月 12 號我記得 4 月 12 號 但他說公佈所以他公佈的時候可能已經很快就有得訂 所以可能森馬是有得買的我很想他做一個公正一點的
每間店舖有幾部 但我又沒有隊排你給我一條隊排就行了我排到的就是要那一部我不要多一部 我只要一部公平一點不要給炒家拿光機我希望他們會這樣你走不掉的他怎樣做都會有炒家在對死你問題是他沒有逼商戶為什麼你不可以單人 queue waiting list
有很多個商戶只有幾個 最大的 Best Buy Target
Amazon 三個大賽 Amazon Best BuyCostco 呢 Costco 很慢的很慢?Costco 不慢?很慢的 高普出了第二代八九個月都還在賣之前的高普以後再說高普當然了但它是很慢的 PS5 又要遲一大段 它不是第一輪的 Costco 不是第一輪的
但主要是 Walmart、Target、Best Buy 只要逼每间有一条队而你只要排这条队就是顺次序去买而你不可以多买一个
到你拿到第一部機你可以重新在隊尾再排算了 你說這麼多我覺得是不會發生的解決所有問題 沒有炒家可以炒到因為你只能買到一部對他來說沒有影響有沒有炒家總之有人買他的機就行了
但令到人們很苦惱 人們不斷罵我 每個人都不斷罵你罵完你還是要繼續不去賣所以不會有分別
解決問題而已肯定的那你想有什麼策略有 40 萬部我買不買到 40 萬份之一我不急的我急的我需要第一輪沒有 都要擁有摸一下聞一下浸場撕掉那塊膠我真的需要那我幫不了你
這些心理上的滿足源 拿著 Switch 2 出來就是這樣 但是已經運過來有 Walmart 說有 40 萬部已經來到北美洲了 40 萬不是很足夠 起碼也要 200 萬部
那你現在這一水嘛之後還會有不知幾多步那我真的要找到途徑我覺得如果我要靠那些你現在去想是沒用的但我那時候是買到預訂的
如果你不去到那天開始買就不知道發生什麼事了如果你想到預訂清單就有機會買了但如果你要等店鋪已經有貨了 再加 再檢查那些就死定了你就只有個「i」字好了 那就等吧我是願意分配的我願意分配一隻遊戲 半隻遊戲希望能買到
有聽說 SW2 有沒有炒?我不知道 有吧 但我不是想炒 我只是想買部機回來玩而已 玩遊戲而已我不知道 有吧 有吧如果你炒 你炒 NVIDIA 5090 吧你炒那些吧 但那些太昂貴了如果你可以虧蝕金錢的話 Anyway
還有多一宗不過其實香港新聞也有說過 Intel 有新 CEO 新 CEO 這個死定了其實什麼死定了
那個桌子不好現在的人說那個桌子是垃圾桌子你不應該試之前叫什麼 Gal Singer 我不記得他的名字你不應該試他因為他說明是不拆公司的現在這個也不拆他說但是你不拆他想拆你是想
誰說想拆?你講誰想拆?board 不是想拆,其實是想快點接到 flap 的生意那不是拆,他現在說但不拆是做不到 flap 的生意,沒有人會相信你 intel 獨立又做 CPU 又做 flap 的生意根本整個文化都未做到一次做 flap 的生意
但他又沒有給機會 給三年時間他又不可以炒你換新 CEO 又給三年 CPU 加 Fab 是十年的投資你給他三年時間 又再換我覺得是一路走下坡的 死定了總而言之現在整件事是正面的正面?
新 CEO 是正面的 還要等了一個月 那個辭職找不到人頂上 等了一個月才有人頂上總而言之就是正面 但你是 negative 但全世界的人都是正面的這個不是說我現在有一個更有能力的 CEO 所以我就找這個 這個辭去
我要找新 CEO 我快要找了 終於找到一個了我不明白有什麼這麼正面我自己本人暫時除非他有一個現在這個新 CEO 是不是很有能力 有什麼背景可以說一下嗎他是亞洲人 亞洲人養之前有沒有做過什麼改變世界的事
我不太記得 我看過他因為看到他是亞洲人面行的那樣 搭一搭我就記得是馬來西亞人 好像但是生意人還是技術人?兩樣都是 OK 那祝他好運吧他的技術應該沒有之前那個 Jayl Singer 沒有那麼好的因為 Jayl Singer 是引擎出來的但是他自己是
翻過幾間 startup 都是 tag 來的 okok 那麼就是他有些 background 了那看看他怎樣扭轉呢?即是我覺得...他之前是 CEO of Cadence 是呀即是做...Cadence 是做什麼?不懂怎麼會不懂啊?Cadence 沒認識的 Cadence 是什麼來的?Cadence 現在是在做...咦?
我現在要做資料搜集了 隨便吧你問我吧 它也是做 chips 的但不是它有做 IC Design 簡單來說還有應該之前有做 IC Design 的軟件應該有一份 anyway 總之它都是在這個範疇的人
我自己看死 Intel 我真的想不到一個成功的故事 很多人都覺得正面的但現在 Intel 是一個沉船 所以不要給太多期望出來還有需要錢
你不說沒有 600 億 700 億投資你不要想它可以追近 TSMC 一點我覺得是那條數是這麼多的雖然美國政府上一屆政府是給了一些錢去建 Fab 出來但是現在怎樣 能不能建出來我也不知道我覺得是極蠢極蠢給錢 Intel 來建 Fab
好 還有沒有第二個題目但如果在美國來說 它應該是最近那個有能力建 Fab 來說但你不可以這樣給錢去建的嘛你一定要 我不知道
是不是有能力呢 我真的不知道還有誰有能力呢在美國但你不可以去最近的地方付錢去最後我不知道怎樣可以把那個 industry 起死回生但我覺得在 Intel 是不行的如果可以的話 本來這麼有財力也可以一直 pick up 一個在墮後的 你想用錢來推上前我覺得比較難
很多 還有它以前說 CPU 每個人的電腦都需要 它就雙負雙成兩件事 又做 Fab 又做 CPU 沒得頂現在 X86 CPU 不是必要的東西最必要的就是 Mobile chip 它也沒份做 沒份背它怎麽乘風破浪
做一個沒落的 X86 加上現在是第二都不如那怎樣回覆呢我真的不太知道怎樣回覆我真的回覆不到你怎樣回覆我只覺得很悲觀
可能換個 CEO 去做 但很難 建一間新公司比起死回生更容易我的看法是 我不懂做生意
看看這幾年會怎樣吧看看 Intel 會不會向上但可以捱很多年啊你看看 IBM 可以捱多少年因為它很多老本的東西都在很多老本的東西你不要想著你還不死我要買你跌千萬不要因為它可以玩你十年二十年它的 Cion 的市場都不知道多深是嗎還有的?有的我真的不知道每個買伺服器都還是買 Cion
OK 但還是
但是 Growth 就難了我覺得 Growth 就難了但是慢慢開下去還有很多玩所以就是老本吃老本 慢慢吃老本看看有沒有轉機其實轉機很明顯如果沒有新的東西就是沒有轉機不會突然間 X86 起死回生你也要讓我看到會不會 AMD 給他 fab
会不会有些 chips 譬如 Blockcom 会不会被他 fab 最 top 的 mobile chip 你看到这些生意你才觉得他起死回生如果你见不到这些生意他就和之前没有分别他就是没有人相信他被他弄 chips 你自己看一下留意一下这些新闻
換 CEO 不會換到有人在你的公司用 fabric chips 所以我就是希望他可以成功就是這樣好了就這樣了上個禮拜的 Patreon 我上個禮拜說了我錄了兩集沒有新的但是今個禮拜再看嘉嘉你有沒有錄
還沒下,不過可以在劇透下我最近在看一些舊劇在 Netflix 上看一些十年前的舊劇我以前沒有看過,現在就有空再看我試試說說舊劇好的,下星期再說再見再見
听完节目当然想 Facebook 和我们聊聊天 Facebook.com 是 LandGadR-A-N-D-G-A-D 你现在在听的是 LandGad