We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode EP283|AI 大模型的開源與閉源 — 歷史巨輪倒哪邊?!feat. Richard 林旅強

EP283|AI 大模型的開源與閉源 — 歷史巨輪倒哪邊?!feat. Richard 林旅強

2025/3/19
logo of podcast 寶博朋友說

寶博朋友說

AI Deep Dive AI Chapters Transcript
Topics
葛如钧(宝博士):我观察到扎克伯格和Sam Altman在AI开源闭源问题上的转变,这很有趣。AI模型的开源与闭源是一个重要的议题,需要了解其含义和未来发展。我想先请Richard解释什么是开源和闭源。DeepSeek开源引发了广泛讨论,但可能存在误解。算力可以比作大脑的脑细胞数量,越多则处理速度越快。开源大模型的权重可以类比为大脑星图的公开,允许调整和微调。开源大模型类似免费软件,但可以进行后训练和对齐。开源大模型的后训练和对齐,可以类比为冷战时期情报机构吸收对方特工。Sam Altman公开认错并考虑开源,这让我感到惊讶。 Richard林旅强:软件的开源是指原始码可以被阅读、分享和共建。开源大模型与开源软件不同,它需要数据、算法和庞大的算力。坊间所谓的开源模型,其实是训练完成后的权重(参数)。权重是一个巨大的文件,类似于黑盒子,无法反编译。开源模型虽然是黑盒子,但可以基于它进行微调和再训练。Meta的Llama和DeepSeek的开源方式不同,开源的定义也存在差异。Llama和DeepSeek都公开了权重,但许可证不同,Llama的开源条件受到质疑。目前行业对开源大模型的定义尚未统一,开源的含义存在差异。DeepSeek不仅公开权重,还公开论文和算法,这使得其他人可以基于它进行再开发。开源大模型通常会公开论文,这是行业标准。ChatGPT的出现促使各大公司思考应对策略,有人预测开源模型将成为未来的竞争对手。我观察到Meta开源Llama,这可能是一种弯道超车策略。闭源模型只能通过API调用,而开源模型可以部署、后训练和定制。Meta开源是为了建立产业事实标准,成为产业领导者。开源决定了大模型的地板,闭源模型可能会被淘汰。开源是一种自损800,伤敌1000的策略,可以扩大市场或淘汰竞争对手。开源大模型无法像开源软件那样被其他工程师直接优化,但可以基于它进行二次开发。阿里巴巴的通义千问,是我认为中国开源大模型中做得比较好的。Apple选择通义千问作为简体中文版AI的底层模型,这说明千问在业界有一定的认可度。闭源模型的未来发展空间可能有限。越来越多的公司开始开源大模型,闭源的堡垒正在瓦解。Grok的最新版本已经开源,这表明闭源模型也在发生变化。AI时代,效率是关键,这将影响大国和小国、大语言和小语言的发展。小语种或资源匮乏的地区,可以通过后训练和对齐的方式,基于现有开源大模型进行本地化开发。资源匮乏的地区可以基于现有开源大模型进行二次开发,例如后训练和对齐。选择开源大模型需要考虑是否会被断供,以及模型的特性是否符合自身需求。选择开源大模型时,要确保其长期稳定性,避免被断供。选择开源大模型需要根据自身需求和模型特性进行评估。后训练和对齐技术与所选的基座模型无关。进行后训练和对齐需要资金和专业人员。后训练需要对数据进行标注,这需要专业人员。进行后训练需要懂大模型的人员和资源。如果对开源项目有贡献,则更有发言权。DeepSeek开源对投资圈产生了冲击,改变了商业模式。开源可以建立商业信任,并通过占领市场来实现变现。开源可以提高客户信任度,因为代码是公开透明的。开源可以建立用户基础和社区,从而实现商业变现。开源是一种占领市场的方式,变现方式需要另行考虑。DeepSeek的成功为开源大模型的商业模式提供了示范。开源硬件的成功案例,例如树莓派,证明了开源的商业模式的可行性。台湾的硬件厂商可以尝试探索开源的商业模式,跳脱供应链的限制。我愿意与台湾厂商合作,探索开源的可能性。建议关注台湾的COSCUP开源人年会和Gen AI Conference。建议关注开源社的微信公众号,了解开源资讯。公开原始码不等于开源,开源需要附带许可证。

Deep Dive

Chapters
本段落釐清開源與閉源模型的定義,並比較兩者的優缺點。開源模型指原始碼公開,可被修改和分享,促進共同開發;閉源模型則相反,限制使用和修改。開源大模型與開源軟體不同,它需要大量數據、算法和算力,因此,坊間的開源模型多指訓練完成的權重,而非原始碼。儘管權重是黑盒子,但可被重新利用,進行微調和對齊。
  • 開源模型原始碼公開,可被修改和分享
  • 閉源模型相反,限制使用和修改
  • 開源大模型與開源軟體不同,需要大量數據、算法和算力
  • 坊間開源模型多指訓練完成的權重,可被重新利用

Shownotes Transcript

隨著最近AI 模型不斷開發演進,有一個問題也開始引發討論,就是開源與閉源。什麼是開源?什麼是閉源?到底開源好還是閉源好?不同的選擇會有什麼影響?又如今天標題所說:歷史巨輪會倒向哪邊?

馬上就一起來歡迎今天的大來賓 Richard 林旅強!


【寶博朋友說千萬粉絲專屬社群頻道 Discord 開張啦 👉 https://discord.gg/ddao) 歡迎加入喔!】

⭐葛如鈞(寶博士)

Twitter▶️ https://twitter.com/dAAAb) Instagram▶️ https://instagram.com/daaab.eth/) Discord▶️ https://discord.gg/ddao)>) Facebook▶️https://www.facebook.com/dAAAb) YouTube▶️https://youtube.com/c/dAAAb)


📣訂閱SoundOn APP▶️http://www.soundon.fm/download) Facebook⏩https://reurl.cc/1QxXzQ) 官網▶️https://www.soundon.fm) Instagram▶️ https://reurl.cc/XX6Z3j) ----以下訊息由 SoundOn 動態廣告贊助商提供---- YES!我的高股息國際巨星來啦! 國際級的高股息!?哪一檔這麼給力? 00963 中信全球高股息,嚴選海外優息企業,掌握全球收益機會,3月首次除息囉! 上除息行列!打開券商APP,輸入00963,3/17前買進即可參與,趕緊下單去! https://user285523.pse.is/79hhbf)

高雄美術特區3-4房全新落成,《惟美術》輕軌C22站散步即到家,近鄰青海商圈,卡位明星學區,徜徉萬坪綠海。 住近美術館,擁抱優雅日常,盡現驕傲風範!美術東四路29號 07-553-3838 https://user285523.pse.is/79p2pd)

Hosting provided by SoundOn)