We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 人工智能的崛起與發展 (上) / 講者: 張家俊博士 (香港浸會大學數學系特邀副教授)

人工智能的崛起與發展 (上) / 講者: 張家俊博士 (香港浸會大學數學系特邀副教授)

2025/4/27
logo of podcast 大學堂

大學堂

AI Deep Dive Transcript
People
張家俊
李秋婷
Topics
李秋婷: 我观察到人工智能技术在社交媒体上得到了广泛应用,例如图片风格转换和照片编辑等功能,这使得普通用户能够轻松完成以前需要专业技能才能完成的任务。此外,人工智能技术已经从科幻电影中的幻想走向现实,并逐渐成为我们工作中不可或缺的一部分,处理越来越复杂的程序。 張家俊: 人工智能的概念最早在1956年的达特茅斯会议上被提出。早期的人工智能程序,例如1966年的ELSA,已经具备了与现代人工智能软件相似的交互能力,这在当时是一个非常新颖的概念。1997年,IBM的Deep Blue人工智能系统首次战胜了国际象棋世界冠军,这标志着人工智能技术发展的一个重要里程碑。2016年,AlphaGo战胜了围棋世界冠军,这表明人工智能技术在更复杂的游戏领域取得了突破性进展。AlphaGo的技术目前也正被应用于医疗领域,例如药物研发等。 人工智能的应用非常广泛,包括图像识别、道路监控等。人工智能与数据科学密切相关,数据是研发人工智能的重要组成部分。机器学习通过不断提供数据和修正答案来训练数学模型,使其能够做出准确的预测。机器学习可以用于处理复杂的算法和大量数据,例如预测一个人的身高。深度学习是机器学习的一种特殊方法,它模拟人类大脑神经网络的工作方式,通过多层神经网络处理数据。深度学习的发展受到计算能力和数据量的限制,直到近年来才得到普及。ImageNet竞赛和AlexNet的出现是深度学习发展中的重要里程碑,标志着深度学习在图像识别领域的突破。图像识别技术在医学领域应用广泛。增强学习通过反复试验和奖励惩罚机制来训练人工智能系统,例如训练机器人踢足球或玩游戏。增强学习可以应用于机器人学习玩捉迷藏等场景。近年来比较多人使用的人工智能软件大部分都属于生成式人工智能(Gen AI),这引发了人们对其潜在风险的担忧。

Deep Dive

Shownotes Transcript

文学 历史 哲学 商业 工程 艺术 音乐 随时随地穿梭大学电台 捕捉智慧光芒大家好 欢迎星期日晚留在香港电台第一台收听由文教组制作的节目《大学堂》我是李秋婷

最近我們在社交媒體上都見到不少人將相片轉換成不同動畫風格的圖畫他們不需要畫工超速因為用家可以藉著人工智能的技術在短時間內就做得到其實越來越多社交媒體用戶會利用人工智能幫忙執照最常見的就是清除照片裡面的雜物又或者路人有時候甚至會以一段文字生成適合的圖片

過去人工智能只是停留在電影中的幻想世界但今時今日人工智能已經在幫助大部分人在工作上處理相對複雜的程序逐漸變得不可或缺而且相關技術還在發展不過在幾十年前人工智能其實離普羅大眾有多遠呢?

今集大學堂我們從溫言之局公眾講座系列在 2024 年 10 月 19 日舉行的講座人工智能的崛起與發展講者是香港浸會大學數學系特邀副教授張家俊博士今集我們會認識人工智能的發展進程了解這一項技術是如何逐步崛起

雖然人工智能的技術近年發展蓬勃但這個名字其實在 69 年前就已經出現了 1956 年時任美國達特茅斯大學數學系教授約翰·麥卡錫與其他學者進行達特茅斯會議研究日後有沒有機會以機器精準模擬人類的各項智能而人工智能這個名字就是在達特茅斯會議中第一次出現

張家俊介紹幾個早期應用人工智能的例子某些程式的操作過程其實與今時今日的人工智能軟件相當接近 1966 年的時候其實已經開始有一些我們叫做 checkbox 我們可以和它聊天的一些例如假設現在大家有電話我們可以和它聊天其實 1966 年都有類似的一些我們叫做 checkbox 的東西這個叫做 ELSA 當年其實你看到它就會問有些什麼

「我看到你了」然後他說「我們其實大家都很像」你可以開始跟他溝通但你想想現在我們 2024 年但是 1966 年已經開始有這樣的概念其實當時也是比較新穎的

1997 年 這個其實是一個很大的我們叫做 MilestoneDeep Blue 就是當年 IBM 做了一個人工智能的系統用來捉棋 這個捉什麼棋呢這個是捉國際象棋而當時 Deep Blue 是第一次贏到人類就是 1997 年的 Deep Blue 那時候那部電腦是很大部的

當時我們有些超級電腦 其實我們有排名的這部在當時排 259 名我們有些數字去評估它究竟計算有多快 HPC 我們叫做超級計算機 High Performance Computing96 年的時候我們大概是 11 個 GFROPS

到現在最盡我們已經去到是我都不懂怎樣數是好幾十幾百倍幾千倍的一個增長所以你可以想像現在我們的電腦發展得非常之快在運算速度上所以你可以想像一下大家都拿著一個超級電腦逛街現在好了講得

國際象棋當然要講維奇為什麼要講維奇呢因為國際象棋對比維奇其實維奇是難很多的所以當時涅布其實也攻破不了人類直到 2016 年迪馬研究了一個系統它就叫 AlphaGoAlphaGo 成功在 2016 年贏了人類當時應該是韓國的棋手所以 AlphaGo 已經贏了它 AlphaGo 現在已經沒有作用了它已經退役了

他的團隊會將這個技術去研究他的技術轉移到醫療方面我們可以嘗試用 AlphaGo 的技術去做一些藥物的生成等等有些人會問我弄了一個人工智能系統出來竹棋有什麼用呢其實不是沒用的我們嘗試在當中學習了究竟我們怎樣去研究發展人工智能系統然後就把它轉移到其他地方在醫療相關的地方

人工智能的應用並不單止一開始提及的相片生成和編輯也不是局限於比較多人會接觸得到的各種聊天機械人

過去人工智能的用途很廣泛例如可以進行圖像識別幫助學者辨別生物的物種甚至是農作物的成熟程度又或協助執行道路監測透過智能鏡頭識別行人或車輛是否處於一個安全的位置

而說起人工智能相信聽眾都會聽過機器學習 Machine Learning 和深度學習 Deep Learning 但人工智能其實都與數據科學有關數據科學即是嘗試研究一段時間內所收集到的不同數據溫度、股票價格、人數等等的數字都與數據科學有關而數據就是研發人工智能相當重要的一環

說回機器學習和深度學習相信有聽眾未必懂得分辨這兩個概念不時會混在一起來說張家俊首先介紹機器學習的概念

人類是怎樣學習的?例如我小朋友想學習的時候是怎樣做?例如我想教他,這是一個蘋果,這是一個香蕉通常我就會給蘋果去,告訴他這是蘋果然後可能第二天或者轉頭就問他,這是甚麼?他可能不會回答又或者可能他回答你是玩具車然後你就告訴他,其實不是玩具車,其實是一個蘋果其實我就不斷告訴你,是一個正確的答案

久而久之可能一兩天之後其實他就會懂得知道 OK 這是一個蘋果

同樣地我們希望用這樣的方法去訓練一個稱之為機器所謂的機器其實是一些數學模型我們有些數學資料假設我有張照片這張照片我給模型看當我放進機器裏面之後它就會給我們一個答案可能它會說是香蕉但我會告訴它其實它不是香蕉它其實是一個蘋果

不斷地給他數據 看看他出來的答案是否正確對的 告訴他 給他一個答案如果不對的 告訴他 其實他不正確的你需要去做一個更正這個稱之為訓練機器我們不斷訓練機器令到機器每次說出來的答案都是我們滿意的結果

張家俊提出一個機器學習的例子例如需要找一個人在其中一個歲數的新高我們可以收集這個人在不同年紀的高度透過電腦程式嘗試推斷如果想更進一步我們可以嘗試將數據列成中軸和橫軸叫機器在圖表當中用一條直線嘗試描述年齡和新高的關係

當然機器學習的範疇還可以牽涉更複雜的算法處理更多數據在眾多算式之中有一種稱為神經網絡的算法在機器學習當中算是比較特別的數據學習法張家俊說這個神經網絡逐漸開發出一種叫做深度學習的模式究竟所謂神經其實是什麼來的呢

神經其實是當年大概 1960 年左右的年代嘗試了解人類腦袋有很多不同的神經我們如何傳達腦袋內的訊息就是會有一些神經元 可能會閃一閃將訊息傳達到另一個神經元那裡從而我們去想事情 腦袋不斷有神經元閃一閃

科學家嘗試用數學模擬人類腦袋究竟如何思考這稱之為 Neural Network 左邊是我們人類腦袋內的 Neuron 剛才那些神經元它思考時會如何跳動真的閃閃的但當它在思考時我便無法解釋

我們在電腦上現在所謂的我們叫做 neural network 神經網絡究竟我們怎樣去 design 怎樣去設計這件事同樣地左邊我就會將一些數據由左邊放進去慢慢慢慢它就會一層一層一層這樣傳導到右邊就會給我們的結果而因為我們有一個一層一層的關係我們就稱之為深度學習因為一層一層我們將一些數據由一個數據由第一層轉到第二層

其實它已經做了一些轉化我們就可以一層、兩層、三層其實通常我們叫做三層以上就稱之為深度學習好了是不是又是十多年的事其實不是 1940 年已經有當然當年的深度學習的性能當然沒有現在那麼強勁但是其實能夠真真正正跟現在最像的深度學習我們的神經網絡應該是大概 1970 年左右 1969 年

當它們能夠我們加了一些叫非線性的一些我們叫 activation 進去令到它可以處理到我們叫 XORexclusive all 一些邏輯上的問題的話其實我們當時其實已經是很成熟亦都很近似我們現在用的一個神經網絡

深度學習中運用的神經網絡算法 1940 年已有科學家在用在 1970 年左右已發展得相當成熟但這種算法一直到現在才開始有學者選用張家俊說當時的環境很難滿足到運用神經網絡作為機器學習的條件

我們要去訓練或者我們要做這個神經網絡我需要三大元素一 我們需要有算力我們需要一個很強勁的我們的電話其實等於我們在 90 年代的超級電腦我們需要算力 我們電話都不行第二 我們需要一些很強很好的算法因為剛才說了雖然有神經網絡我們其實有很多不同的變化第三 Data 在 70 年代 80 年代我們沒有算力

我當中間有很多學者可以做出來但問題是你沒有算力沒有數據的情況下其實學者根本做不到什麼研究出來所以最大的一個制肘就是算力和數據數據過去那 20 年大家都經常提的因為我們有了互聯網還有我們有互聯網收集了很多大量的數據所以我們有大數據有 Big Data 這件事所以其實我們開始越來越多數據可以幫你去做一些不同的分析

算力 近年我們有很多 AI 的芯片嘗試主力用來做一些人工智能的計算亦都因為有了這些算力和數據我們在大學裏面的學者就可以繼續研究很多創新和很有用的一些算法

1970 年後不同學者都嘗試研發神經網絡的應用但在發展上依然有阻力直至近年開始有技術幫助收集數據加上晶片研發加強電腦的算力才令到神經網絡越來越普及促使人工智能的深度學習

踏入先希年代美國史丹福大學 AI 研究員李飛飛教授研發出大型視覺數據庫 ImageNet 每年都會舉行挑戰賽利用龐大的數據庫測試不同軟件的視覺識別能力

過去參賽軟件的誤差值大約維持兩成至三成直至 2012 年一個名為 AlexNet 的卷積神經網絡成功在比賽中將誤差值收窄至兩成以下令大家看到神經網絡在發展人工智能學習方面的可能性張家俊形容 AlexNet 的出現是人工智能深度學習的突破

在 2012 年的比賽的時候其實大家都是 20%多當然 30%多的比較差咦 突然有一個 16%的喂 他突然間跳出來是什麼來的那個就是叫做 RXNetOK 他就是用一個在當年的時候比較深的一個我們叫做神經網絡我叫做 Deep Learning 的 Algorithm 的一個算法他就發現咦 原來我們用神經網絡是可以有一個很大的突破所以在 2012 年之後呢就每個人都

去嘗試研究神經網絡而為何叫 AlexNetNet 就是我們的網絡 Alex 其實是一個人名我們諾貝爾得獎就是 HintonHinton 當年的博士學生就是 Alex 所以當年除了 Alex 之外其實都是 Hinton 一起去做所以你看到 Layers 就是說究竟我的神經網絡有多少層由 2012 年的時候 Alex 是 8 層然後到 2015 年已經到 152 層

然後我都不再說了 2015 年的時候是 3.73%這是我們叫做誤差值其實它已經超過了人類因為我們也同時間做了一個研究就是說我把這個 RNX-Z 找了好幾個真人類嘗試幫我看一看那些數據人類對於那個數據集的誤差值是 5%因為始終它的圖其實不是很高清的

其實都有機會很模糊所以人類的誤殺值當年是 5%所以在 2015 年的時候已經可以超過了人類而這個比賽現在已經沒有了因為做得太好了當年這個比賽 2018 年的時候贏的是中文大學我們其實都很厲害的當年我們都贏過冠軍這個世界性的比賽好了

這就是剛才說的圖像識別應用得最多的是一些醫學上一些我們叫 MRI 或者 CT 幫手去看看究竟有沒有什麼病變其實已經應用得非常廣泛但是這個還是在說 2015 年到 2017 年這個時段的 AI 還沒到現在

至於早幾年新聞提到世界旗手在旗盤上挑戰 AlphaGo 等等的超級電腦就應用到張家俊接著要介紹的一種訓練機器的方法叫做增強學習背後的原理就是透過 Trial and Error 的學習模式簡單來說就是從錯誤中學習

這是很特別的 做什麼呢假設我想去做一個機械人我怎樣去令到他 譬如我要去踢球進去龍門我們怎樣去設計機械人可以很準確地射龍門當然你可以很小心地告訴你你見到龍在你前面多少米然後你的力度是多少但其實很花時間所以增強學習是做什麼呢就是我們不斷有一個機器不斷隨機去試 不斷去試踢

如果他能夠進入龍門我就給他一個獎勵如果他踢到進不了龍門我就會給他一個不好的我們稱之為 Penalty 久而久之他透過不斷地嘗試他就會知道我應該的角度我的力度是怎樣我才會有糖而不是被人打劈劈的

所以這個就稱之為 Reinforcement Learning 而當時 AlphaGo 做維基的也是用 Reinforcement Learning 去做出來那有什麼應用呢?我選了一些比較有趣的就是 Mario 可能大家小時候也有玩過現在我們可以用 Reinforcement Learning 去玩 Mario 而是做到很完美的因為有些他們叫 Atari Game 是很難去玩的但是我們可以用 AI 幫我們去玩又是玩得好基本上 100 分

我們完全通慣另外就是我們可以做一些我們叫做 Pick and Paste 在工廠裏面我們有很多機械手臂幫我們夾不同的東西我們現在也可以用 Reinforcement 幫我們告訴你究竟哪個角度夾那個是最好的什麼力度是最好的

運用到增強學習的例子還有很多張家俊也分享了一個機器人學習玩捉迷藏的例子透過增強學習防守的機器人懂得利用牆上的障礙物隱藏自己不讓進攻的機器人捉到而進攻的機器人也開始利用工具越過障礙物捉到對手而隨著場景有變機器人也會學會用不同的策略去進攻和防守

而近年比较多人用的人工智能软件大部分都是属于生成式人工智能 Gen AI 不少人会用来制作又或者整理图片甚至创作音乐所以有业界人士会担心生成式人工智能会威胁各类型创作者的生存空间下一集张嘉俊会为大家介绍生成式人工智能的发展历程和背后需要解决的潜在风险

今集的节目时间来到这里约定大家下星期日晚上 8 点钟香港电台第一台的大学堂再见