We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode E105 大模型部署指南: 住酒店、买房还是自己盖别墅?

E105 大模型部署指南: 住酒店、买房还是自己盖别墅?

2025/3/11
logo of podcast 揭秘科技

揭秘科技

AI Deep Dive AI Chapters Transcript
People
主持人
专注于电动车和能源领域的播客主持人和内容创作者。
Topics
主持人:大模型部署是指将已训练好的大模型(如GPT、DeepSeek)集成到实际应用中,使其可被用户或系统调用,实现推理并完成任务。部署的核心环节是模型托管,需要选择合适的计算环境(云服务器、本地服务器或边缘计算设备)。根据托管方式的不同,部署方式主要分为云端部署、本地部署和边缘部署三种。 云端部署适用于需要高计算力、可弹性扩展的场景。公有云部署类似于住酒店,方便快捷,按需付费,但成本较高,数据安全性相对较低。私有云部署类似于买房,安全性高,数据可控,但成本高,维护复杂,需要专业的团队管理。 本地部署适合对数据隐私要求极高、需要低延迟的场景,类似于自己盖别墅,数据安全,但成本极高,扩展性有限,维护复杂。 边缘部署适用于需要离线运行或在终端设备(如手机、机器人)上运行的场景,通常采用蒸馏过的小模型,以适应设备的有限算力。优点是隐私安全、低功耗、实时响应,缺点是算力受限,模型需要优化。

Deep Dive

Chapters

Shownotes Transcript

自从 DeepSeek 爆火后,铺天盖地的新闻都在报道“某某公司全面接入 DeepSeek”,甚至连阿里巴巴的云服务也随之水涨船高,热度飙升。那么,这里提到的“全面接入”到底意味着什么?其实,它背后涉及一个核心概念——大模型的部署。但究竟什么是大模型部署?为什么企业要部署大模型?有哪些不同的部署方式?这些部署方式又是如何与云服务厂商紧密相关的?今天这期节目,就一一解读这些关键问题。

00:53 大模型的部署,是指将已经训练好的大模型,比如GPT或DeepSeek等集成到实际的应用当中,使其可以被用户或者是系统来调用。

02:02 大模型的部署的最核心的环节,就是模型的托管,hosting。

02:29 无论你选择哪一种的部署方式,都需要根据未来业务量的需求来选择相应的GPU和数量

02:49 根据托管方式的不同,大模型的部署方式也就分为。。。

02:59 云端部署,适用的场景是。。

05:44 公有云部署,某种程度上就像是去酒店去订房间。

06:20 如果你不喜欢公有云部署的弊端,那和公有云对应的这个部署的方式就是私有云部署。

07:14 如果说公有云部署类似于去住酒店,那私有云部署就类似于。。。

08:42 行业里面通用的做法是。。。

11:28 本地部署适用的场景是对于数据隐私有更加严格要求的

12:12 本地部署就相当于是自己给自己建立一套独栋的别墅

13:30 边缘部署,适用的场景是那些需要离线运行或者是在终端设备上运行,比如手机、机器人

15:06 边缘部署,通常采用的是蒸馏过的小模型

15:23 对蒸馏这一概念感兴趣的听友,可以去我的第96期节目)