We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode EP544 【主題專訪】深度解析「AI真正應用」:商業化與工業化AI。ft.馬里蘭大學特聘教授暨工業AI中心主任 李傑Jay Lee

EP544 【主題專訪】深度解析「AI真正應用」:商業化與工業化AI。ft.馬里蘭大學特聘教授暨工業AI中心主任 李傑Jay Lee

2025/2/24
logo of podcast 美股投資學-財女珍妮

美股投資學-財女珍妮

AI Deep Dive AI Chapters Transcript
People
李杰
Topics
李杰:DeepSeek 作为 AI 加速发展的催化剂,带来了新的思维方式,例如采用更小、更分散的模型而非大型单一模型。这推动了 AI 平台的转变,从基础设施转向平台,并促进了开源生态系统的形成。开源模型的出现,打破了大公司对 AI 模型的垄断,加速了 AI 的发展,并促使其他公司转向开源。闭源模型在需要领域专业知识的应用中受到限制,而开源模型可以结合领域知识进行更精密的推理,并通过混合专家模型 (MOE) 提高推理效率和性能。未来 AI 的重点将从模型训练转向推理,这将改变 AI 的应用方式。在数据量有限的企业应用中,可以使用检索增强生成 (RAG) 技术结合链式思维 (Chain of Thought) 来提高推理的逻辑性。 工业化 AI 与通用 AI 的区别在于其针对特定行业的应用和数据,关注的是产品级的 AI 应用,例如在边缘设备上运行的 AI。工业 AI 的应用案例包括电梯故障预测、汽车发动机省油、风力发电优化和半导体制造工艺优化等。DeepSeek 的出现加速了工业 AI 在各个领域的应用,提高生产力至关重要。工业 AI 的进入门槛较高,需要信任和信誉。 未来,低阶 GPU 和处理器将为工业 AI 应用提供新的机会。构建专用数据中心比通用数据中心更有效率。工业 AI 应用需要明确的目标和目的,数据准备和处理是 AI 应用中的重要环节,数据质量、工程和精简至关重要。工业 AI 的目标是通过预测来解决可见和不可见的问题,将数据转化为知识,并提高预测能力。 在人才培养方面,需要进行原理、实践、项目和职业四个层面的训练,才能培养出真正实用的工业 AI 人才。各个领域都可以结合数据分析成为工业 AI 需要的人才。AI 的核心是算法、数据和计算能力,而增值能力包括数据管理、安全管理等。要成为 AI 赢家,需要明确目标,并懂得运用策略和战术。 Jenny: 引导访谈,提出问题,并对李杰教授的观点进行总结和回应。

Deep Dive

Chapters
This chapter explores the disruptive impact of DeepSeek, its open-source nature, and how it has changed the AI landscape. It discusses the shift from focusing on training large models to inference, the rise of AI platforms, and the implications for competition between companies.
  • DeepSeek acted as a catalyst for AI development.
  • Open-source models allow for wider adoption and collaboration.
  • The shift is from large, centralized models to smaller, specialized models (Mix of Experts).
  • The focus is shifting from infrastructure to platforms and applications.

Shownotes Transcript

Hello 大家好我是 Jenny 今天继续来跟大家分享美股近期的大小事今天呢我们的专题报道要特别的继续延伸之前 AI 的主题来跟大家探讨最近每一天都有新的进展出现到底哪一些 AI 领域的变革是一时的热潮还是有哪一些是真正可以落地去做变现的

大家知道从年前的时候我们就一直不断的跟大家分享 DeepSeek 所带来的市场震撼有很多的公司它的股价在当时大跌但是现阶段都已经涨回来了未来有可能是一个百花齐放的局面各家的当场不断的推出新的消息甚至 OpenAI 的创办人 Sam Altman 也说自己在当初呢有可能是选错路了未来有可能会把

大家好,Jenny 好

之前有请教过李杰教授关于 AI 的问题其实老师给我的非常多的一个见解都让我印象深刻李杰老师是美国马里兰大学工业人工智慧中心的主任在过去也曾经担任富士康集团副董事长跟董事会的成员负责领导威斯康星州的工厂也是美国国家科学基金会世界经济论坛的主要成员所以对于很多 AI

如何真正的落地应用带来更多商业化的价值有最专业的见解今天我们也准备了很多问题想要请教老师相信会给大家带来非常大的收获那我第一个问题呢当然就是要请教老师因为这一次呢引发事件的主角就是 DeepSync 很多人都说已经不需要用

目前大家在谈到的新的发展包括 Deep Seek 还有现在今天晚上

在美國要發布的所以 Clock 3 馬上要發布就是在半小時就會發布在西岸時間 8 點鐘其實我們這邊美國東岸時間 11 點所以基本上這些都會朝向一個稍微不一樣的方向那我想我們在

過去這幾年因為 AI 是已經從 1956 年就開始很久了所以這也不是新的東西可是在三四年前開始談到深層式就 GAI CheckGPT 出來之後大家把重點都放在這邊包括我們在世界經濟論壇從 2003 年開始都在談 AI

包括去年跟今年 今年我剛從大臥室回來基本上已經有一點還是停留在 AI 所帶來的衝擊但是現在缺乏應用所以我們看一個現在今天就是我們 AI 發展當然來看一下這個圖 AI 跟 GAI 我們來看左邊我們就拿 GAI 代表 OpenAI CheckGPT

我常讲 AI 的三元素就 ABC 就是 algorithmsbig data 跟 computingof course 这里面就是 chips 所以这三个基本上是 AI 的基本三元素

那這 Big Data 裡面也包括就是數據量要大海洋的數據大量數據那這裡面很明顯的按照傳統過去三年大家的慣性思維就是 Data Center 下一個因為你要很大的 computing 那 NVIDIA 就是我可以把 Data Center 裡面的 server 變成 GPU 因此 AF 工廠的觀念就是講大的 Data Center

但是之後所以大家拼命投資包括有幾十萬幾百萬的 GPU 這樣才帶動今天大家看到的現況然後馬上面對就是一個高度投資然後甚至更多單一優的電力

按照 Electricity 的發展在美國預測的話現在今年那是 20 幾個 Gigawatts 那再過幾年到 2030 年我們可以到 30 到 30 幾個 Gigawatts 那相當於美國 9 到 10%的美國電力那這絕對不是免費的東西所以這樣投資的話那你幾個比就是講 AI infrastructure

所以過去這兩年我們談的都是 AI infrastructure 就是買 GPU 買這個 whatever 就是 Data Center 投資可是你看現在我們有一個新的轉折點出來就是說我們大模型來講在開發裡面實際上有很多可以用新的思維這也是 Deep Seeker 帶來出一個新的思維

他說我的算法有很多 大模型有很多可是我可能用更多的小模型譬如說我用這個 Mixer of experts 用 MOE 我把大的模型當 teacher 當老師那我把很多小模型當作學生然後我把它 divide and conquer 給它分開所以這樣子的話 我某些應用我用不同的模型那這樣子的話用蒸餾之後

我就可以創造一個所謂比較分散式的就是我們常常講三個臭皮匠勝為諸葛亮就我不見得要最大的資源去解決問題我有三個不同的專家可以解決掉一個然後呢 這個由於它是開源的所以現在很重要下一個 E 就是 Ecosystem 所以我突然之間因為它本身的方向點就變了它是一個 Pivot 我們講創新進行一個 Pivot 一個轉折點

既然我是可以开源了我的模型又分好多种比如说我从有 1.5B 的对不对 7 个 B 的有 14 个 B 的有 32 个 B 70 个 B671 个 B 的 billion 我讲 billion data 有不同的大的我可以做不同的运算 hardware 应用这里面就变成是一个生态所以我们现在来讲你可以看得到 DeepSeeker 它现在开始走向开源所形成的生态系统

也就是然后进入到一个 AI Platform 就从 Infrastructure 到 Platform 这个转折点 事实上过去一直大家在想可是都要想直接跳到 Agent 因为没有人再去做 Platform 事实上这 Platform 有好几种一种是开发者的 Platform 一种是应用的 Platform 这两种是不一样的所以开发者 Platform 基本上你没有开源的话他就很难去产生应用的 Platform 现在这个平台出来了

那这个是带动一个新的动力目前是这样子看那看起来的话 DeepSeek 反而是 AI 加速发展的一个催化剂包括了像是 OpenAIGoogle 也开始推出他们自己的压箱宝我有发现他们最近更新模型的速度都已经变得很快了甚至有可能在未来呢也会变成是开源的在这一段时间 Meta 它的股价呢一直不断的涨

就是因为大家觉得它也是一个开源的模型我这边有一个基本的问题想要先请教老师到底开源跟闭源之间他们最大的差异是什么他们也会影响到这些公司未来的一个竞争格局吗因为闭源模型是别人没有办法用你去做新的所谓逻辑推理真实的东西

因为他必须要利用一个开源的系统可以加上 domain 的推理专业的专业式的推理比如说我们拿医疗系统来讲因为他的很多数据的真正推理在医生上面所以说你只是用病例你没有医生的这个 influencing 推理那你的应用开发是受到很局限的这种所谓精密性

所以在這裡面就是那現在你現在看到很多最近這幾個禮拜你可以看到很多的企業都在街道的這個所謂

DeepSeek 裡面開始有醫療的有金融的包括電視也接進去了所以你可以看到很多系統它新的生態慢慢起來了開源裡面它是一個可以讓大家來用甚至來可以分享甚至可以來形成一個雪球式的成長這是一個很重要的自然規律

所以有很多的开发者他其实就有去下载 DeepSeek 的开源模型来创造自己的 AI Agent 包括像是 Hugging Face 他的执行长就表示说 DeepSeek 的 R1 模型现阶段在发布才几个礼拜就已经成为了平台有史以来最受欢迎的模型下载量已经超过了 1000 万次好像这种事情已经不是大公司他的一个专有优势了这种转变对于 AI 产业有什么样最大的影响

我第一个想到的可能就是以前是大家着重在训练的部分在未来就是朝向的推理可是朝向推理其实它最重要的一个背后的意义是什么

我们再看另外一张图,再下一张我们可以看到 DeepSeq 跟 JPGT,就是 R1 跟 V2 它有 V1,V2,V2.5,V3,甚至它有更多的现在我们讲 R1 跟 V2,这里面它每一个模型不一样有的适合做研究,比如说 ART

这个 V2 适合做 research 用用 R1 适合做一些不是 V1 适合做一些一般通用那这个 R1 更比较深的能够做推理那你可以看到它有一个很重要的就是用 open way 的 mix of expert 那这个是跟 close way 的 transformer 是不太一样的

我把用不同的专家式的小模型把它分开之后我根据它的 weight 变动再经过 teacher 跟学生的 cross entropy 的 loss 我可以来 fine tune 最后做一些更多的 domain 应用

所以它的性能事实上它可以 competitive 但没有说一定说超过但是 very competitive 但最主要是它的 inference cost 很低因为他把这个 MOE 加起来你刚刚讲到很多推理应用都是在我们所谓应用层我们在做很多的商业应用比如说律师他一定是推理的东西他不是条款你金融投资也是一个推理我们做工程设计也是一个推理

然后我们做很多大型的所谓重要的差异化的工程设计也是推理所以这里面很多都是所谓你需要不同的模型来去加入所以这里面是很重要的那在 CHP 来讲它基本上就是 API based 基本上你每次用我常常讲一个笑话就是说

如果说你的模型很大 就一个大模型 好比说我们一个渔船要钓要抓鱼那我每次抓鱼 我要把这个网子全部撒过去把这整个网的鱼要拖上到渔 到船上面再去分那如果说你有不同的网 小鱼大鱼的不同网 那你就没有必要把每次把数的鱼都捞上来 是吧那这个是这种观 这种观念 所以你没有必要为了吃鱼把所有的东西都用一遍 没有必要的

以前我們也在問一個問題說為什麼我們在大家走大模型裡面實際上我們對產業用是沒有那麼大的數據量而且很多都是我們自己企業用的他覺得不會 open 他不會 open 但是他會自己 open 但是他自己會產生所以我們會用 Retrieval Augmented Generation 用 RAG 來做訓練然後產生專家的這種那到底是一樣的只是他先把模型分開了之後更重要第二個是說在

在 Deep Seeker 他用了一個很好的就是說因為我們做 prompt 的時候你會得到一個很多的這個所謂這個回饋但是呢這個 answer 往往你沒有一個 logics 所以它有一個 chain of thought 就是思維鏈那這個邏輯鏈很重要這個 chain of thought 基本上就是你在要解釋一個事情後面最重要的原因在這裡

當這個變成是一個核心的時候你可以把這個當作一個很重要的差異化所以這個也是未來我們在做各種應用所需要用的就是這個 Chain of Thought

也就是在过去大型语言模型这些科技巨头他在做的时候他是一个无差别的训练我就是什么数据收集到之后反正我就把它全部的拿去做处理但是未来如果我真的要落地的去做商业的应用的话其实各个产业别他所需要的可能就是一些专有的数据而已这也是我当时在看到 DeepSync 所引起的风暴或者是风波的时候第一个想到的就是老师因为老师之前有跟我们提到工业化 AI 这个部分老师在

他過去其實一直專注於工業化 AI 的導入似乎在 AI 加速的普及之下我覺得這個部分其實會被更為的重視是不是可以請您再跟我們說明什麼是工業化的 AI 以及他跟我們一般人知道的 AI 人工智慧有什麼樣不一樣的地方我們在看兩張圖然後後面可能有一張圖再解釋一下你可以再往下看一下就是說這個是一個

因為我們剛講過 ABC 嘛對不對 ABC 那我們做現在就是對亞洲的產業包括台灣的很多產業比較是產品製造為核心的東西

所以說你跟他講很多大模型 AI 這個很多產業不知道怎麼樣去跟你他說我就做 GPU 的那 GPU 那你還是在做代工所以說那這個有個機會就是 Product AI 就是 ABC 這是 Device levelDevice 是什麼就是 Edge 嘛對不對 Device 比如說 Apple Watch 這 Watch 就 Device 那 Watch 裡面那基本上它變成一個 Apple Intelligence 它就可以接入 AI 的生態

像最近 Apple 宣布跟阿里巴巴合作用阿里 Cloud 是吧倒计在这里在 Edge 那我的 iGlass 我的 Glass 可以变 Device 然后直接接到 Edge 譬如说做 Training 做 Learning 做 Art Design 还是做维护 设备维护还做专家指导远程这都是 Device 那更高层的就是说

特斯拉本身就是一个 device 他本身车子就是一个 over the air download OTA 他就是一个 AI platform 就是一个 AI product 所以这个就是很明显是一个目前已经开始进入商业化产品化工业化的一个条件可是另另外一个 ABC domain 就是说我们真正的工业化产业化我讲产业化它是不同的领域产业我们比如说我们拿交通领域

你從醫療領域 半導體 然後能源 風電 垂直走向目前來講 這部分很多人講 AI 都是談到很專業的東西它沒有辦法擴大所以我們過去這 20 幾年來 25 年來從 2000 年做 NSF 美國國科學基金會的中心智能維護中心 就做這個東西

包括我们最早 2001 年在电梯里面装了这个 AI 的东西我可以知道电梯的门会不会坏掉那我车子里面有这个知道可以做故障的预测然后发动机可以做省油那这些都是风电里面可以

可以調整它的使用 就是我的角度可以增加我的 power generation 那我半導體製程 我可以用這種所謂預測式的量測減少不必要的所謂調機的次數跟導致的 EU 增加的時間太長所以這些的 Domain 那 Eventually 它會進到 Enterprise 一個商業

一个整个产业化那这叫工业 AI 他说这两个现在正在发生那现在 device 已经开始了你也看到 Apple intelligence 已经开始了 Tesla 早就开始了那些慢慢大家跟进的很快的你注意看 Deep-seek 出来之后这很快的大家会去用到很多领域了包括车子车载的电视已经接入了电视现在已经有人在进入了

然後醫療診斷也開始了咬有傳感器可以監測到在三條脈然後你直接可以來大概是每一個是淺 中 高就是不同的脈象它基本上就慢慢幫助醫生就是說可以更成熟 更快速的診斷醫生來做一個最後的一個 conclusion

那 x ray 未来的 data center 会一个专业式的 data center 我们现在是叫通 general purpose data center 这是很浪费的啊就是我所有东西要进去 data center 里面上以后呢你像你要小的 data center 比较 mobilized

就是小的 很小 我們甚至叫 mini micro data center 你沒有必要是做 general purpose data center 我們現在講的所有的 AI infrastructure 都講 general purpose 所以未來一定是 medical 是一定絕對是一個很大的領域那未來你所有重要的裝備譬如說你的所謂 mission driven 的東西

他整个的 Trader 到那个地方那个地方的 Micro-Dev Center 马上就可以运作我觉得未来 5 年会发生的更快所以为什么我们讲工业 AI 现在已经开始了事实上明天早上德国那边跟我一个 Interview 他说他们用 ChangePT 去找工业 AI 就找到都是我们他说希望我们可以跟他们讲一讲工业 AI 在德国未来该怎么走工业 AI 的话发展很重要就是生产力的提升

我們下一個我們人面臨的是自己會讓自己取代什麼意思呢如果說我有很好的生產力工具那過去的我會改變如果沒有改變那就被取代包括我們是寫 code 的就是編程的甚至我們是做設計者做基本上都會變

可是這裡面我覺得它是一個有一個一旦落地之後它會很快的跟雪球式的發展公園 AI 是因為它的啟動比較慢因為它本身的本身就是過去的包袱很重一般很難的進得去比如我們做半導體如果沒有跟半導體公司合作別人不會相信你的所以你需要有 trust 跟 credibility 不是說我想做就是做的問題

那感觉工业 AI 这个领域其实它的进入障碍是更高的因为老师是这个领域二三十年以上的专家有跟很多的公司之前都有合作过其实我们身为投资人我觉得现在投资市场还在反映的其实还是设备端还是譬如说像您刚刚讲到的穿戴式装置眼镜这一块

那以 Domain 来看的话其实医疗领域确实是有一些跟 AI 比较密切在合作的公司在目前已经有一些股价上面的反应了但是我还是想要了解一件事情就是如果我们未来真的要再进入到企业端的领域怎么样去提升这些公司它的营运效率甚至它未来它的获利也可以做一个提振嘛

是不是就是需要大型的语言模型再去结合他们的 domain knowledge 就是主领域的一个知识去应用那为什么工业 AI 它不能直接的用 TradeGPT 这种通用的大型语言模型老师是不是可以举几个比较具体的案例最主要是在 domain 里面我们用的很多的数据是所谓有三种不同的数据一种是叫做人看得懂的数据比如说报告

譬如說我手寫的文獻對不對 還是說我的資料人可以讀懂 第二個是機器讀懂的數據那就是感測器 是吧 那就是控制的數據還有第三種是過去歷史的數據歷史數據從 XLC 過來的 那很多數據是有用但不見得可用什麼意思 我常常講數據有三個 B 的問題一個是背景 Background 不清楚

一个是 baseline 它的基它的 baseline 不一样比如说我机器是多少速度 baseline 什么速度我不知道那你我拿到震动没有意义飞机在飞是什么样天气 background 不知道那你拿到数据

跟我燃烧的特性跟省油完全是我无法去预测所以我不是说我只拿发动机的数据 Engine 的数据我要知道天气它的湿度空气里面的水分都要知道所以突然之间你发现我们在 Domain 里面只懂我们产品不够的因为顾客要的比如我的卖的发动机我的 Engine 是要省油并不是说

安全是不用談的 安全是 pre-requisite 是先決條件 是吧它不是 pre-requisite 它不是一個 你說我的飛機很安全這個有問題

你講這個話就有問題了 基本上就是安全的但是我分析更省多的有 這個你怎麼做的這個很重要 風電也是一樣嘛 電池的壽命也是一樣所以我們在東京裡面有很多叫可用跟有用的數據你有用不見得可用 所以光這個套系統你會發現 80%的數據產業界沒有辦法用作 AI

這個我覺得不是開玩笑大概我是保守科技 80%以上的數據是無法用來做 AI 或我們做機器訓練的因為第一個它沒有背景沒有基礎它不能夠做 BENCHMARKING 所以你做了就跟說我們捐血你這誰捐的血型什麼不知道他有沒有愛滋病不知道那一定要去量這個他有代言者那我不能用

所以你一條魚哪邊來的不知道那你敢吃嗎對不對所以你要背景要很清楚一個人你不知道背景你也不敢用道理是一樣所以我們有用跟可用是兩回事情第一個第二個是我在做在工業領域裡面用這些數據的時候很重要的是一個就是說我怎麼用少量的數據

更能够找到它的因果 机密性要很高 收敛性要很快所以这里面我们要用一个比较有系统的归类方法比如说我怎么样从降维到减少它不必要的过度的训练然后我可以增加它的收敛性

那這樣的話專家是很重要所以我們會更多是 expert domain driven 的這個 input 或者說是一個 model based 因為我們工程系統工程系統都會有一個 model 不管是一個製程也是一個 model 那我的這個設計也是有一個 model

那我封店也是有 model 都有一个 model 可是 model 本身它是固定的它是一个基础但它会变为什么因为我在使用的环境变了嘛我们可以设计出的东西跟使用不一样所以因此我们要用使用中数据再去增强它原来模型不够的地方那这种叫我们叫 physics informed machine learning 那这个是目前也在做的东西那第三种很重要的就是未来就大的知识模型

因為我們大語言模型講的是語言嘛那像我們人在尤其在工程系統工業系統我們講的是知識模型我們人是用知識來設計產品不是用語言設計產品是吧事實上我們大語言模型有一個缺點先一個人來講語言用語言來說服人的地方呢版本上是一部分往往是一個你人的手勢或是一個例子是吧比如我說服你領導同意的能力講一大堆理由

艾森豪以前說把一個皮帶放桌上面他說我推 你看推不動一拉他跟你走所以你做領導要帶頭走 啊 別人都懂了我的手勢一看這是 ad gap 就懂了所以這是人的 gesture 用這個所謂這個用手勢來解釋事情那這個是大語言文型沒有的所以我們有人很多的知識它的闡述啊 它的這個描述啊它的這個所謂推理它不是用單純語言來做的

它是用邏輯 它是有一種 pattern 它是用一種 example 來帶的 是吧那這個是一個我們在工程裡面很重要的東西一般 所以大致式模型我們建立起來之後呢它可以用所以我還有另外一張圖你可以看一下下一張圖可以解釋得更清楚一點

下一张对比如说我们现在假设我们就是拿 DeepSeek 来看假设因为 ChipGP 它是比较是 close 的所以基本上我们一直在等说你怎么来用大家说你没有 GPU 不能用那就不对了

那现在好了我们假设我们试过现在已经试了一些虽然就几个星期我们已经在试了我用 DeepSeq 譬如说我们现在讲 Knowledge Graph 就像刚才讲的大师是不行我要做一个设备的诊断我要做一个设备的一个 reason 设计里面的逻辑我是我有专家的很多经验但我怎么去接到连到 DeepSeq 里面去它可以帮我做一些推理分析

然后把这个推理分析变得可以重复的使用这是很明显叫 Narge Graph 加上 DeepSeq 那第二个是 Retrieval Augment Generation with DeepSeq 这 RAG 本来就我们在做的我们现在过去用 Lama2 Lama3 在做那现在我们想我们如果说用这个 RAG 做的话

用 DeepSeq 我們發現也是有相當 competitive 的東西因為我們更多是用它有這個 mix of expert 我可以把原來的這個 chunks 把它變成一個 feminine tree 的 chunks 現在 chunks 分類就是每一個是一樣的平行的我把它變成是一個 treefeminine tree 的模型我之間每一個 data vector 之後它的 chunks 歸類之後它關係就出來了以前是沒有關係的

所以這是一個新的做法第三個是 fine tuning 在這個 proprietary data 我有很多專業的數據是完全是閉環的我不會跟別人分享半導體製程裡面也許我跟我的應用應用這個 supplier 分享但我不會跟別人分享的這是很保密那這些的數據 training 是完全需要這個比較內部的 expert reports 這裡面這 fine tuning

但这里面完全是属于小模型就可以了所以比如我们用这种东西三个东西一个是 Large Graph 一个是 RAG Augmented 第三个就是 Fine Tuning 用 Proprietary Data 这三种应用基本上对产业界是最实用的

也是最重要的觉得看老师这样讲等于是这一次 DeepSeek 所带来最大的技术突破是我们发现其实我们可以从更专精的角度然后去分析这些模型去做出我们自己专有的模型那当然我觉得技术的突破是很重要的一件事情但是以老师这样讲的话我觉得更重要的一件事情是成本的考量老师刚在前面其实有讲到我们之前都用 Huida 的 GPU 都是用那种很高阶的来做一个训练可是在未来呢如果

譬如说像医院譬如说像公司企业端他们都有他们自己本地的伺服器都有他们自己小型的数据中心的话是不是真的就像市场上面目前大家在讨论的我不需要到那么高阶的 GPU 它为一些比较低阶的 GPU 甚至是一些比较低阶的处理器它也带来了新的机会或者是成长的契机

這些都是理論,但重點是你去做的時候你會發現多少是合理的你做一個 general purpose,通用式的數據中心那就是 everything, all kinds, right?你要做一個工廠,你要做任何東西那你蓋了很大的空間,到底要做什麼呢?如果我做一個只是一個做手錶的,那我只要 1%的空間就好了

那我要做大機器 可能你來出價不夠呢 是吧所以我做 general purpose 工廠是沒有意義的事情不是嗎所以你出去中心也是道理是一樣 你到底要做什麼 What's the purpose 那現在講的都沒有 purpose 就是說我要很大那不是 purpose 你的廚房要很大 但你不會做菜 你為什麼要做那麼大的廚房最後你還叫這個 Uber Eats 是吧 What's the purpose of big kitchen

所以你一定要懂得去有 purpose first 所以你要会做饭的人不见得要 big kitchen 是不是这样子它是 lifestyle 它不是个 kitchen 如果 lifestyle 是 purpose not differentIt's not cooking 所以我们的 purpose 完全不是在 kitchen 的 size 也不在 GPU 的大也不在我的 AI 的这个 Foundry 多大不是这个东西是在它的 purpose 你要做什么所以因此我们在很多制造工厂里面

你根本就沒有必要去做那麼大的沒有錯我們台灣的代工廠很多工廠你去看我們做的事業經營都在工廠裡面基本上很多都是邊緣計算工業控制器去做到的東西

至少你會不會用這個 ABC 就是你的 algorithm 會不會用你數據的 broken 的 baseline databenchmark data 你可以找得到第三個 computing 你可不可以用簡單的包括最基層的這個 Edge computer 工業控制器包括甚至未來的所謂雲跟霧之間的這種

computing 使用包括 Federate Learning 來做加密做參數的調集不用把數據送出去這個叫做聯邦式的學習這都是一些我們在實作經驗裡面在工業 AI 常用的方法但一般企業界你不去做這個事情你光去談什麼

我觉得是没有办法去了解这个事情刚刚老师有讲到一件事就是如果今天是一般的中小型企业他要去导入的话你要先知道你自己的目标是什么这样你比较好去建构你后面导入 AI 的一个流程所以这个我们可以再延伸一个问题比如说像中小企业当然我今天在建构自己的数据中心的时候我可以花比较少的成本

但是他最大的成本是不是在数据获取这一块就是他可能就像刚刚老师讲的我没有一个可用的数据那如果今天我要导入的话我要从哪边去获取这些数据那是不是也代表现在很多的新创公司他可能是提供软体啊他可能是提供数据收集啊他在未来就会更有成长潜力因为掌握数据的人可能就是未来最大的一个赢家

一般来说所以我们在做人工智慧文工智能在产业里面应用的话数据是最重要的一环因为就跟说你厨房里面没有食物你怎么煮数据就是食物对不对你必须要有食物食物你的算法就是你的 recipe 你要该怎么煮是吧

你的这个算力就是你的 cooking 你的 oven 高温可以调多高是不是 锅多大这都是就你的算力但是重点你的 data 就是你的食物你没有新鲜的食材怎么去

怎么做饭所以这是基础那问题是我们在公共线里面数据就我讲它的来源性很重要它的归属性它的可用性跟有用性这两回事情这里面你会发现百分之也是大概百分之八十的时间都是在数据 hunting 真正能够用工具结合的时候已经差不多了

就是說我們在煮飯的時候你發現下鍋之後就快了炒個菜多快比如說一分鐘就炒完了但你要做一條魚你多少時間再清理再切再殺再冷再浸泡你這個時間可能半個小時以上甚至一個小時事先還要去醃所以

所以你數據的處理跟準備都是一個很大的一種 清理就 Data QualityData EngineeringData Streamlining 這個 Prepareation 這部分很大所以我們這個條件是你要有實作去解決比如說我在工廠裡面提值增效降本減存低碳是 10 個字你這 10 個字做好 You're world classYou're world class already 但是怎麼提值怎麼增效怎麼降本怎麼減存怎麼低碳

你可以講高大上的話沒有用你做這個目的就是我們要做預測儘量從預測端去解決看不到的問題所以這裡面我們在講 AI 裡面下張圖再看一下就好這張這個就是說我們今天公衛 AI 我常常講在我書裡面講過說我們真正 AI 要在產業落地這張圖就解釋了它的最核心問題

就我们所看到的世界跟看不到的世界跟我可以解决问题跟避免问题的能力我们一开始从看到了问题去解决然后再从解决去避免可是我对看不到的问题还是不知道就跟人一样我得肿瘤了怎么得的不知道对不知道你看不到所以医生要去 X 光要去照找到验血找到原因

對 怎麼避免呢那沒有系統你怎麼知道免疫力是吧所以他是有一個你的生活習慣當你家族遺傳但這個我們 AI 解決就是那些從現在紅色的部分要推到藍色部分去

你把這個藍色部分這裡面解決掉了基本上你的不管你是做半導體製造的還是做先進材料的基本上你已經達到一個絕對是 world class 在不可見世界你都可以可控了可見你做預測了我們在企業界有三個問題我常講一個是知識一個是常識一個是見識我們有知識往往缺乏常識

因為常識是要跟過去的東西都要累積起來的,我說有專業的知識,但我沒有這個業界的常識,這是不夠的然後你沒有發展產業的這種見識,發展趨勢看不到,也是沒有用的所以說你的過去講的就是所謂常識,現在是知識多少,未來是見識,帶你到哪裡

那這個東西就是我們要談的工業 AI 的問題說我們要把數據把它變成是一個看不到的知識的一個獲取來源然後從換不到看不到的知識裡面去發展出更有預測性的能力避免我的質量不好品質不好避免我的效率不好那這個就是一個 AI 的最高境界

听完老师这样讲的话其实我发现这一条路其实在未来发展的过程应该还是非常的长的你可能从现阶段的大型公司到中型公司到未来真的已经变成一种普及的 AI 领域的导入那我们就先从我们比较可见的好了比如说过去已经有大数据已经导入一些自动化

像我们在讲人工智慧的时候最早的自动化就至少比较前期的可能是什么机械手背或者是产线它可能是有一个自动化但是今年已经很多人开始觉得 AI 未来的发展会从大型语言模型然后到我们的软体 agent 然后再到最后是自驾车机器人这些领域像是人形机器人就是最近非常夯的一个话题

老師是不是也覺得 DeepSeek 的事件呢就像您剛剛有告訴我們我要怎麼樣去有一個目的然後在未來我要實地的去運用它真的會加速我們在自駕車跟機器人領域的它會比我們原本預期的時間還要更早的達到就是我們在談 AI 的話呢它是你回到上一張圖上一張圖對這張圖這個很重要那這個就你可以看得到 AI 有三個發展方向

所有的 AI 都是早期从人就中间那个 human 来的我们最早自然语言语音辨识人脸辨识包括你进机场出机场人脸辨识手指指纹辨识 Biometrics 是吧然后头脑接口这都是人为核心的数据跟 AI 互动这是目前 AI 的主流

百分之九十几都在做这个东西平常心讲机器人也是从这里面去在做更多的这个就是你的视觉在行动最后在做执行但是重点是我们人之所以会人不是譬如我去机器交易去开一个门

人之所以为人 当门开不开怎么解决这才是人之所以为人就开个门不是人该做的事情当门开不开了 人怎么把它打开用钥匙还是用什么方法这才是人 但机器人不会做这一点所以我的意思是说 我现在做的是一个 execution 就是开一个动作 可是动作并不是人真正的能力当这个动作不能做的时候 才是人的真正能力的发生所以这个是我们在做

机器人的误点在这里那第二个呢是机器那我们工业 AI 所有做的都是机器这个东西风电汽车高铁飞机啊

能源 smart grid 工廠 都這個東西那這部分就是我們最早工業互聯網 工業大數據早期我們寫的那本書都講這個東西這個已經發展也是 20 幾年早期很早有 可是前面那麼成熟那現在很成熟第三個就是講的現在過去感情 AI infrastructure 就知道多少包括是 Stargate 是吧有 500 個 billion 的 investment 去做這個講的就是這個東西

就讲这东西这个是目前就是 AI infrastructure 大家讲的东西事实上回到终点 AI platform 才是王道你没有平台的话你就是阳台阳台跟平台差别阳台是自己用的平台是给别人用的比如说

百老汇是一个平台任何人在上面你演剧你都会出名你做演好就出名了阳台是在阳台自己逛放花晒衣服自己看让别人也可以看但问题是自己的别人用不到的所以这就是阳台跟平台的差别平台是给别人用的阳台给自己用的收费用的问题是你有谁要去照你的楼梯最后会到 agentagent 就变成说 user driven

是一个 application driven 是 purpose driven 它是一个每一个小的 domain 所以一定是这样子的我们现在讲说我们手机 APP 已经是一个 shared agent 但它不是一个 personalized agent 它是一个 shared agent 你用的 跟我用的是一样的只是我们的订的订单里面内容不一样的

但以後是個 Personalized Agent 因為我的習慣 我的使用的目的我的背景都在裡面目前也算是一個 Agent 只是它沒有很多的 re-inferencing 沒有一個推理的功能所以這張圖解釋說未來我們更多的產業會開始走向平台化

目前三个主流 AI 是在人我们最近这几十年发展的都是在工业现在大家炒最热的就是 AI Infrastructure 事实上我们不管你做哪个方式最早一定要是平台平台之后可以 Democratize 这样的话把它就扁平化之后大家可以去用未来是走向从 Algorithm 到 Platform 到 Agent 一定是这样子的

所以我觉得刚刚老师讲的其实也很符合您刚刚讲的我要怎么样从知识然后到尝试然后到见识才可以让它有进一步的发展我要怎么样发展成一个 AI 平台让大家都可以去使用让大家都可以受惠甚至在上面去做货币化商业化之前我看过老师很多的访问都认为说聪明的去使用 AI 是真正的可以提高一个国家它的经济生产力是真的可以去促进经济成长

甚至重新定义制造业现阶段大家都会觉得制造业好像不是一个年轻人想要去参与的一个行业可是老师觉得在 AI 导入了之后其实制造业也会变得更吸引人老师是不是也可以在最后跟我们分享如果我今天想要抓住这一次 AI 重塑产业的机会的话到底现阶段的一些制造产业或者是传统产业它要怎么样去培养 AI 的相关人

或者是我要怎么样去培养我自己的 AI 能力让我在这个产业重塑的机会里面我可以抓到更好的一个商机对 这是一个很好的问题那也是一个基础就是我们每天在在努力的方向那基本上人才我常常讲 AI 是三个 T 一个是 technology 一个是 tool 一个是 talents 就是技术工具跟人才那因为我们技术一直会

發展往前走工具要留下來人才要訓練是吧就是說工欲善其事必先利其器這個器就是工具技術一直變可以技術變成工具工具變成人才就是這個東西就三個一直在循環一直循環那我們 AI 要發展的好不是只是大家去談 Technology 不是的你廚房裡面都是工具你沒有工具你怎麼煮飯是吧你醫院裡面都是工具才可以做

藥也是工具之一嘛 治病嘛所以你不能只是講技術只是讓你看不到的地方然後之後你要工具那我們做人才訓練有很重要的觀念就是並不是怎麼教原理所以我們在 AI 訓練有四層訓練

第一個層 我叫四個 P 一個 P 叫 principle based 就原理式訓練比如說我去上現在大部分的傳統上我去上 AI 課都教你基本原理是什麼這個 machine learning 是吧你回來之後 我都聽了聽完之後我不知道該怎麼做以前學校的考完試就書都賣掉了 是吧就是考過了嘛 拿了 A 就算了那不對的那第二個是呢 practice based

就是你用學完之後我馬上把數據給你你來開始用我數據給的可能是不一樣的數據我不是用傳統的 images 我用飛機發動機的數據半導體數據學生說我跟我沒有關係我教你怎麼用突然之間你的學生裡面他有分成團隊他有不同的數據他都會用他信心大增好了你現在回去回到公司去了開始用你自己的數據叫 Project based

你 practice 之後 你開始自己去找數據了事實上大部分的人失敗是在這一層比如說我在你的上課 哼人課我都會用 回家就不會用了因為你都幫我弄好了我自己怎麼去切 我不會切那就你只會學一點所以你自己去買東西 自己去處理自己完全自己弄自己和麵 自己包水餃這個就叫 problem-based 你自己要做了 是吧

最後是 professional based 你再去教別人重複剛剛講的 123principle practices can problembecome 職業化那就是我們講的黑帶 black belt 就六 Sigma 的 black belt 黑帶所以你這樣的話才會有一個真正實作型從原理實用解決問題到職業化的四層的這樣累積你如果沒有經過這四訓練

你没有资格去谈你是工业 AI 的人才你只学了 AI 的原理那是完完不够的就会在军校里面只会念书只会书上打靶根本没有下过战场那不可能的

老师那这样如果我们今天在选择像比如说我们的观众可能有一些人他要选大学的学科或者是研究所的学科的时候那你会最推荐如果在未来这种 AI 或者是工业 AI 发展的路上我要怎么样去选择未来成长潜力最大的一个学科然后来就读还是各个领域其实都可以我今天就算是念医学院我今天就算是念商学院其实到最后我再去结合这种数据的分析其实也会变成一个工业 AI 非常需要的一个人才

在 AI 的所謂叫做整個領域裡面除了我們講的叫蛋黃跟蛋白的知識蛋黃知識是核心嘛就是你的算力、算法、數據是核心嘛那蛋白部分是叫增值的能力

譬如說你數據的準備能力收集能力這很重要的所以你的對數據的安全性保護性很重要的就是 Cyber Security Data Security 對數據的所謂 AI 的 Safety 很重要的對怎麼去做開源的管理很重要的這些是目前還沒有完全成形的一個叫做知識體系但是在演變中

就是 AI governance system 在怎么来管理然后他的 legal 他 right 这些都是讲很多 talk too much 但重点是你自己要一套自己的系统 right 但你说我从哪边学你不可能所以你要知 AI 的蛋黄跟蛋白蛋黄就是核心的 ABCright

蛋白就是 Domain 數據的管理怎麼做訓練 怎麼做集成 怎麼做 RAG 怎麼做這個 Machine 的簡化跟特徵的就在這裡面 安全管理你周邊的沒有配套那你蛋黃懂了基本上沒有多大用不是嗎因為你 AI 專家都在蛋黃已經加蛋黃加蛋白

所以我在达沃斯这次开会有一个人问我说 Professor Lee 李教授你可以分享我怎么训练 AI 专家我说我不是训练 AI 专家我训练 AI 赢家每个人在笑因为我说你是专家你专家上战场一样被打死因为你不懂得保护自己不懂得用战法用战术你只会拿着武器冲没有用的

因為你的 AI 並不是你的數據多大 算力多強 多少 GPU 這不是工業 AI 的東西最重要你的 Purpose 要很清楚 是吧就我們的開發藥物 我現在 18 年其中有 7 年做 Clinical Trial

11 年是在做验证 做很多的审核现在在上去年我们在白宫他们有办个会议就开这个怎么把 FDA 从 18 年的药物 certificationFDA approval 缩短更短其中 7 年是 clinical trial 你不能改变的 11 年可以缩的越缩越短你要快速的这种 computational 方法去开发新药这个是一个很重要的努力方向

新的材料开发也是一样不是吗我的医疗我现在很多医生的诊断误差很大的就是我的误诊很大的我怎么增加 accuracy 10x 你说不要讲 10 2x 就了不起了这都是我们要去解决的问题所以 AI 医院现在很多地方都在盖这个东西就是并不是 AI 的医院而是说用 AI 来帮助医生你的专家是治病把重点放在治病上面去

所以這個就是完全不一樣的把你的 democratize 把它分開了嘛

我觉得老师刚刚讲的这一段真的很有感触因为我最近在看网路上面的一个访谈的时候他也提到一件事情他说医院其实现阶段都在导入 AI 而如果有医生他不愿意去接受 AI 所带来的改变的话其实是有一点不道德的因为 AI 确实就可以提升你的准确率提升你在治病的时候效率甚至老师之前有讲过在急诊室的时候病人一送进来我要怎么样用最快的速度去

普希这个病人他在未来他有可能发生的状况以及我要怎么样去做急救其实透过科技的技术帮忙都可以有大幅度效率跟效果的一个提升今天真的非常感谢李杰教授百忙之中抽空接受我的访问分享最新的产业资讯而且我觉得老师讲到一个很重要的事情是专家跟赢家所做的事情其实是不太一样的我们要怎么样去利用专家所带来的技术的突破技术的进步或者是数据的收集

但是赢家是真的可以把这些数据落地然后去进行分析去进行更好的决策的人那也期待之后在 AI 趋势的发展之上每一个人都可以借由这样子的能力去找到自己的立足之地为我们的生活跟工作也都带来更好生产力的提升也可以让这个世界变得更美好谢谢教授好 谢谢

好那我们今天的节目呢也到这边如果大家对于工业 AI 有任何的问题的话也欢迎在留言的地方告诉我们希望之后还有机会可以访问到李杰教授请他带来第一线最新的产业资讯给我们大家再见拜拜拜拜