We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 18.互联网是应用大模型的冲锋军?我们都想错了|专访华为云CTO张宇昕

18.互联网是应用大模型的冲锋军?我们都想错了|专访华为云CTO张宇昕

2024/12/27
logo of podcast 卫诗婕|商业漫谈Jane's talk

卫诗婕|商业漫谈Jane's talk

AI Deep Dive Transcript
People
卫诗婕
独立商业作者,曾任极客公园执行总编,专注于商业、科技和人文领域的深度报道和分析。
张宇昕
Topics
张宇昕:我于1999年加入华为,历经互联网、移动互联网和生成式AI浪潮。我认为这波AI浪潮与以往不同,其通用性使得所有企业都必须拥抱AI。华为的大模型战略是AI for Industry,专注于工业领域的应用,这基于中国在许多工业领域处于全球领先地位,拥有丰富的技术经验和数据积累。我们选择这条道路,是因为中国在全球600多个工业行业中,有220多个行业处于全球领先地位,这些行业蕴含着丰富的技术经验和数据,是发展人工智能的宝贵资源。我们致力于为企业提供AI基础能力和服务,帮助企业快速便捷地应用AI技术,实现一切皆服务。我们不追求大模型的通用能力,而是专注于解决企业生产系统中的具体问题,提升效率和质量。我们通过深入客户一线,了解客户需求,并推动技术进步。我们不热衷于刷榜,而是专注于帮助客户构建他们自身的大模型。我们认为,大模型应该‘高而不贵’,能够被广泛应用,并专注于解决具体问题。我们已经帮助许多企业应用大模型,并取得了显著的效益提升。 我们认为,推理的算力需求远大于训练的算力需求,未来只有少数厂商会进行大模型训练。当前AI计算成本和效率仍然很高,需要继续扩大算力规模才能降低成本。要使AI能够替代人工,必须降低其成本到与人工相当甚至更低的水平。我们需要寻找低门槛、高效率、低成本的方案,让更多企业能够应用AI技术。我们已经看到了第一批应用AI技术的企业已经开始产生效益,并推动了技术进步。我们通过派科学家深入客户一线,了解客户需求并推动技术进步。我们认同大模型应该落地应用,解决实际问题,而不是追求星辰大海。我们专注于2B行业,不参与刷榜,而是专注于帮助客户构建行业大模型。我们构建的是大模型底座和工具链,帮助客户构建他们自己的大模型。我们扮演的是使能者的角色,为客户提供大模型底座和工具链,而不是直接提供大模型应用。我们专注于帮助客户构建其自身的大模型,而不是提供通用大模型API。我们追求模型的专业能力和多模态组合,并选择合适的尺寸,以降低成本。我们已经发现了很多高价值的AI场景,例如在煤矿、钢铁等行业应用大模型,取得了显著的效益提升。 我们认为,模型泛化能力和专业性之间存在矛盾,需要技术发展来解决。目前只有大企业能够应用大模型,因为他们拥有足够的数据。我们倡导行业共建开放数据集,以降低中小企业应用大模型的门槛。我们认为,大的企业把这些经验分享出来也是很正常的事情,因为同行之间可以互相帮助,取长补短。我们认为,小参数但精度高的模型是未来企业追求的目标。我们认为,模型和产品是相辅相成的,技术会推动产品升级,产品反过来又会定义或牵引技术的方向。我们认为,中国的人工智能发展道路要走中国特色,结合中国产业的特点。我们需要发挥自身的优势,扬长避短,另辟蹊径。我们需要产业界和学术界协同起来,共同推动人工智能产业发展。 卫诗婕:大模型应用落地困难,因为许多企业缺乏算力、算法和数据,且技术认知门槛高,只有云厂商能满足这些需求。云厂商在大模型浪潮中扮演双重角色:辅导员和攒局者,帮助企业应用大模型并整合产业资源。华为云选择“AI for Industry”战略,率先将大模型应用于工业领域,展现了中国产业在AI浪潮下的机遇与挑战。这波AI浪潮与以往不同,其通用性和颠覆性促使所有企业都必须拥抱AI。中国企业拥抱AI的态度各不相同,既有渐进式变革的,也有急于抓住新机遇的。许多企业缺乏华为这样的技术积累和财力,希望通过华为提供的服务快速应用AI技术。大模型的到来提升了云厂商的角色和价值,使其成为AI生态的中心。云厂商的价值已经从提供基础设施提升到提供更有价值的决策判断。大模型的竞争有两个层面:卖算力(铲子)和发展大模型本身。互联网厂商倾向于通用大模型,而华为专注于行业大模型。目前只有大企业能够应用大模型,因为他们拥有足够的数据。

Deep Dive

Shownotes Transcript

所有的弊端的企业都一射到了这次真的是狼来了过去我们做一次气象预报得几千台高档的服务器算半天现在用一张卡十秒钟就能出来山东一个矿井我们一年帮它多生产两千吨煤企业可能是有一些可以讲焦虑

技术的每一层都变化这么多年积累的代码谁都不想说要改甚至于有些代码要抛弃掉但是华为公司有一句话优势挡不住趋势大模型的淘金热卖铲子的人最高兴我们是一个使能者拿您的话来说是个黑土地我们这几年派了几百个科学家深入田间地头深入工厂车间

全球 600 多个工业行业里面我们国家有 220 多个是全球领先的这些技术经验工程能力用数据沉淀下来就是人工智能最好的数据集与其被颠覆掉不如及早地拥抱它哈喽大家好欢迎来到商业漫谈我是诗杰还记得 2023 年年初国内的大模型浪潮兴起时热情和焦虑感几乎相伴而生

那时我供职于一家科技媒体,一边感受到整个创投圈对于新技术的热情,另一边也看到了产业界的焦虑,划时代的技术已经来了,可企业应该如何使用它?这不是一件容易的事。大模型的三大要素:算力、算法、数据,对许多企业来说连生产要素都未配齐,更何况新技术本身的认知门槛也极高。

凑齐这一切要素的只有云厂商于是方言中外云厂商成为大模型剧目中的绝对主角他们既是辅导员帮助企业用上大模型过程中也收买出自己的算力基础设施和服务同时也是团局者凭借对产业上下游的连接有条件充分的观察统筹并整合

而在中国的众多云厂商中只有华为坚定地选择了 AI for Industry 要将大模型率先运用于工业领域如果将华为视作一扇窗口便能窥见千行百业在新技术浪潮下的终身相本期节目我在海南创园会现场专访了华为云的 CTO 张雨昕我们谈到了新的人工智能浪潮下

中国产业里的集体性焦虑机器对策以及华为对于 AI Native 的思考大模型为什么是云市场的 game changer 这项技术在哪些行业已经率先落地具体如何应用华为所倡导的大模型 2B 路线如何理解有关这些关键问题以及大量华为的内部视角都蕴藏在这次高密度的访谈之中

很荣幸今天可以邀请到雨昕总来做客商业漫谈能不能先跟我们的听友打个招呼也介绍一下您在华为的历程好

大家好 我叫张雨昕 我是华为云 CTO 我是 1999 年加入到华为从最基层的软件开发工程师做起在公司的头些年主要在做通信领域然后在 2011 年我们成立了 2012 实验室我在 2012 实验室下面创立了我们的欧拉部今天的欧拉操作系统我是第一任部长

当时欧拉操作系统里面有电信设备里面所用的嵌入式操作系统也有 IT 行业所用的服务器和虚拟化支持服务器当然也有支持今天手机终端的操作系统所以从这个时候开始我个人的职业生涯是从通信领域逐步转向了 IT

所以华为对您的影响一句话概括的话是什么样子

因为我是做研发出来的我们公司的价值观是为客户创造价值这样我们自己才能获取价值所以从研发的技术的角度来讲就是我们要用技术为客户创造价值从而获取自己的价值

我们今天这一期播客的录制其实是在华为的创业会万宁的现场今年大模型浪潮还是一个主叙事嘛所以我们开篇先来捋一下时间线如果我们姑且把拆 GPT 诞生作为这一波大模型浪潮的源头的话这两三年的时间华为云内部是怎么去反映这股浪潮的有哪些关键的决策和判断其实华为对于人工智能机会的捕捉或者说我们的准备吧比这个早

如果你有印象的话在 2018 年华为的全连接大会 HC 大会上就已经发布了我们人工智能的相关的战略我们认为人工智能未来会成为一个通用技术那到了 21 年的时候实际上我们跟 CHAT GDP 几乎是同步 21 年在华为云的开发者大会上当时是余存东余总发布了我们的盘古大模型应该是 23 年我们把盘古大模型升级到了 3.0 版

今年华为开发者大画商我们升级到 5.08 基本上是跟夏威夷差不多同步但是我们所走的这个路可能跟美国的大模型的路不完全相同包括跟国内其他人业界的大模型的路不完全相同我们一开始上来就定位我们要做 AI for Industry

这样的一个战略是基于华为的基因你们本身是连接千行百业的这样的基因对不对对也是结合我们中国的产业的特点我早上我的演讲里也讲了中国在人工智能上要构建优势的话一定是要充分发挥中国制造业领先的优势

我们在全球 600 多个工业行业里面首先我们国家是最全的第二是 600 多个工业行业里面我们有 220 多个是全球领先的

在这些领先的行业其实就蕴含了我们国家在这些行业里面的技术经验工程能力是领先的这些技术经验工程能力其实如果把它用数据沉淀下来它就是人工智能最好的数据集这是人工智能大有可为的地方我也留意到一句很有意思的话他们说中国是 AI 发展的黑土地您认同吗我认同我们的结构决定的对我们的结构决定的我们的产业特点决定的

如果把华为云作为一扇窗口中国企业在拥抱新的技术浪潮的时候它呈现出来的心态和姿态是什么样子的我觉得可能不同的客户有不同的特点当然有一些客户对于新技术的敏感性或者对于新技术变革的意愿度

不是太高 因为他们有大量的我们讲的 Lexit 系统有传统的业务 传统的模式有传统的这样的软硬件的包袱它很难改变他们希望一种平缓的渐进式的变革但是很多创新型的企业新技术来临的时候我觉得他们可能是有一些可以讲焦虑

首先是新技术来的时候他们是很敏感的他们认为这些技术一定会带来新机会会带来市场的变化带来价值分配的变化可能他们在这个当中有这种急迫感或者渴望这是一种但是技术肯定是有门槛的对于很多企业而言他们获取掌握这些技术运用这些技术存在很多的困难

很多的困难因为不见得所有的企业都像华为这么大我们有很大的力量长期的投入研发持续的跟踪和掌握这些技术那很多企业他们可能希望用一些快捷低门槛但是能够支撑他们自己的业务诉求的这样的方式来了解掌握及运用这些技术

这个种心情也是很急迫的因为华为的整个技术战是非常深的就是技术积累很厚那很多的企业其实没有这样的财力也没有这样的技术积累所以他们可能想干一件移植的事就是在华为这个很深的土壤当中长出什么样的技术什么样子的一些工具我直接拿来用我就可以把这个 AI 的果实有可能能摘到对 这也是我们的职责

搭一个台我们把基础的能力构建好然后我们把业务所需要的一些能力我们把它做成服务所以我们提出来叫一切皆服务包括技术设施然后客户需要很多总门类的技术数据库啊大数据啊包括人工智能的平台啊包括安全啊对吧这些技术我们帮你准备好把它也做成云服然后行业里面还有些经验共性的东西啊帮客户沉淀下来也做成一种服务这样客户就可以在这个服务基础上比较快捷的

方便的使用这些技术使用这些服务他就可以搭他自己的业务系统其实您刚才介绍了两大类客户的画像第一大类是希望能够渐进的平缓的拥抱这个技术浪潮也许他们的规模也都挺大的牵一发动全身的另外一种是非常渴望能够抓住新的技术浪潮能够实现颠覆那这两类客户如果从比例上看的话哪一类占比更大呢现在来看我

我觉得起码五五开甚至于拥抱新技术的还超过一半以上这也是我想问的就是这波技术浪潮跟过往的技术浪潮会有什么不一样吗就感觉大家好像更热情更乐观更兴奋或者说大家更觉得这个浪潮是难以抵挡的是我们所有的企业可能都必须踩到的

你看我们国家在云化的过程当中我们实际上是比美国的节奏至少晚五年我们还有很多企业觉得我可能是不是不用上云或者说我可能不一定要拥抱公有云我建一个私有的专属的云也可以我们国家还有各种形态当然我们看到美国绝大部分的企业绝大部分的政府机构都已经拥抱尤其是公有云了对吧在这个节奏上还有明显的中国美国还有一个五年左右的差距

但是人工智能这个浪潮起来以后没有一个企业说我不用人工智能大家都觉得我必须拥有这个浪潮如果我不拥抱它我就会被这个浪潮给打翻我可能就被这个浪潮给淘汰掉几乎所有的企业为什么呢

我觉得首先是人工智能这一波浪潮来历后大家已经看到了人工智能泛化或者叫广泛应用或者变成叫通用技术的一个前景所有通用就是大家都能用各行各业都能用这是首先看到的这个可能性

过去这么多年人工智能其实一直是在一个比较小众的范围第二大家看到了人工智能如果应用于我们的业务和技术带来了很多新的颠覆式的商业模式颠覆式的创新的体验他们是很担心的要么我做我去改变我自己要么我就被新的我有可能会被别人颠覆掉对所以这种颠覆性大家是看到了我看人工智能这个词出现已经 70 年了

过程当中也有一些热点的高潮比如说当年 AlphaGo 下棋人脸识别但是感觉好像是昙花一现热情高度一下子脉冲到很高的地方然后又回落了是不是因为这种泛化的通用的能力让千行百业看到它其实可以离我很近对过去 70 年人工智能的科学理论科学原理有很多的进步

但是这些科学原理始终难以落地到实际的产业当中去都是在一些局部的环境局部的场景里面有些应用如您提到的比如说过去我们也有专家系统也有人点识别或者图形的识别但是它只能用于很小的范围它影响的都是很小的一些客户或者很小一些场景而这一次 ChatGP 解决了大家一个共识问题这个共识是什么呢

让大家终于意识到通过海量 AI 算力的计算用这种无监督或者自动化的训练方法是完全可以实现人工智能的通用化的 ChatGDP 给大家最大的震撼在于这里以前大家觉得人工智能都是一个局部真理在你这儿使用到我这儿未必使用但是这一次一旦它是一个通用的技术那所有的人

都与此相关了通用这个词吧可以用一个通俗的比喻我们经常说训大模型就像训一个大学生像华为有那么多的就业岗位很多也是从校招大学生开始培养起来的那如果可以培养一个人的话我们也可以培养一个我们可以把一个机器训练成一个大学生是的完全是可以这样所以一个是企业在自己的场景里面看到了技术落地的实践化另外一个就是它带来的想象空间很大可能会有一个非常直观的成本的节省可能

可能是成本的节省可能是效率提升可能是以前做不了的事情现在能做了您刚才也讲到这波技术浪潮跟互联网还有移动互联网的都非常不一样您在业界跟行业上下游的伙伴去接触的时候你有从他们的所思所想当中感受到这种巨大的差异吗

有没有一个对比其实移动互联网跟我们所专注的 2B 有关联但是关联性不是那么强所以后来国家也在提互联网家或者叫工业互联网之所以要提工业互联网就说明互联网其实跟原来这些产业有点远它毕竟还只是 2C 的

而这一次人工智能浪潮当然仍然是 2C 的产业他们也比较积极比较敏感但是所有的 2B 弊端的企业都一射到了这一次真的是狼来了这个新的技术会深刻改变我们弊端的企业这是他们又兴奋又焦虑的非常重要的原因

那您觉得这个当中有没有什么泡沫幻想或者误解是要戳破的这个当然也会有因为这个新技术来大家可能期望很高那首先来讲人工智能

不是无所不能人工智能毕竟沉淀的是我们人的这种知识经验和技能人不会的不能指望大模型它会人所不具备的知识和经验它一样不具备这是第一个那你看现在现在的哪怕是大模型解题可能也就是大学生的水平我们输入哥德巴克猜想给他他还是解不出来的因为人没解决这问题

另外一个例子你看今年推出了 SORA 虽然可以生成视频大家觉得很新奇但是 SORA 生成视频还是没有我们现在通过拍摄我们制作这种方式你拿他跟李安比对 那还差太远他也不具备思想他的美学的观点可能也不行

他毕竟不太懂现实世界的物理规律包括光包括流体动力学这个他都不懂我们叫可控性比较差离真实也比较差这是人工智能当前的局限技术还要进步当然还有幻觉问题还有深层的这种可控性也比较差那人工智能可能还不成熟

那如果当人工智能已经特别成熟了已经到了百分之百可以产业化的阶段可能你再去用你就已经落后于这个时代先下场练习很重要我觉得叫做拥抱 AI 与人工智能技术共同成长

因为这个产业的成熟是要靠我们的产业实践不断去推动它我早上讲了新技术一定会带来新应用反过来新应用又会给技术提要求给它提供场景提供练兵场所以它是像 DNA 一样螺旋形的循环成长的过程

绝对不是说一个新技术等到它成熟成熟了以后才落地把技术前瞻性的专业的理解传递到比较滞后的一些产业当中华为是不是很擅长这个事这个我觉得是华为服务于 2B 客户这么多年来这是我们最擅长的事情我不知道用教育这个词合不合适这次教育的过程是有更顺利吗我觉得客户的机器性是

应该是空前的几乎我们谈到了所有的客户都想拥抱人工智能只是他们不知道该从哪里下手或者该如何去应用这个他们不知道但是这种愿望是很强烈的但你们就帮他们迈出第一步对回顾整个大模型浪潮的话我们会发现不管是中国还是美国其实云厂商在这个过程当中扮演最关键的角色其实挺想听听您的看法就您觉得当中深层次的逻辑是什么

从我来看因为人工智能要消耗第一是要消耗大量的算力第二人工智能的原料是大量的数据第三人工智能还需要有很多的客户的应用场景客户的业务这些要素加入进来才能让客户使用成功那我们看看在哪一个平台上能让人工智能把这些要素能聚集到一起想

想来想去只有云云上有规模的算力云上汇聚了海量的数据然后云上通过云的生态我们可能有一个企业所需要的上下游的所有的伙伴所以我们是最好的一个人工智能的黑土地除了云我还想不出来其他地方能够当然个别大厂商也许他自己能传一个局让所有的要素取备但是对于绝大部分的企业客户包括正企客户

他们依托云平台来把这些要素聚集起来来进行这种协同的创新这是非常现实的最便捷的手段这个也是我很好奇的过去我们如果外行就很粗略的去看云做的事情的话就感觉卖算力卖存储帮大家把这个底层基座做好但是好像大模型来临之后云厂商是不是会有额外的角色或者价值会凸显

当然在云的最早期我们是卖算力卖计算卖存储帮助客户搭建基础设施这是云的最初级的价值我们给客户提供的第二层价值是技术级服务软件开发的技术数据库大数据的技术包括安全的技术包括我们的媒体相关的技术到了人工智能来临的时候这个技术级服务这一层就会做得更加的厚实早上我们讲过比如说数据库大数据

我們過去的數據庫和大數據儘管用了數據庫但是我的數據庫和大數據系統裡面並不理解這個數據本身的價值這個數據裡面的含義是什麼?當然客戶知道那我們用了人工智能以後就是幫助客戶把沉澱在數據庫大數據庫數據壺裡面這些數據的價值進一步發揮出來所以他們的數倉大數據數據壺裡面的數據要變成人工智能數據集

通过人工智能的训练训练出模型模型表达是什么模型是表达这些数据里面的知识经验以及他们之间的相互关系这些东西其实原来是停留在各个行各业专家脑海里的企业专家的脑海里的比如说财务专家他看财务报表像我这个不懂财务的人给我个财务报表可能就是个阿拉伯数字而已但是财务专家他一看这个数据他就知道这些数据背后的含义对我而言就是我脑海里没有这些知识

但是财务专家就有这些知识我们现在做的人工智能就是帮助企业进一步的把这些知识数字化通过软件的方式让它发挥价值那我们过去用人来做各种各样的数据分析洞察决策支撑那我现在就可以用机器来辅助辅助成本要低一些效率要高可能精度也要更高作为一个专家我可能理解 50 个维度 100 个维度的经验

但是另外的专家他可能也有另外的五十一百个维度那我一个人掌握不了这么多但是机器它可以掌握所以这样的话机器就能够帮助大家提升质量提升效率这就是人工智能的价值过去你能够跟我提供技术设施提供基础技术你现在还能帮我把经验传承帮我把我的宝藏的数据的价值发挥就意味着云的价值要再提升

我留意到你们有一个主张就是你们其实呼吁企业能够基于模型来改造自己的应用和软件把原本行业里面的各个专家含金量最高的经验喂给人工智能然后让它产生更大的效率对 以我们最开始刚才您的比方一个大学生进到一个企业他只学了科本上的知识同时

其实他的职业生涯就是一些老师傅老专家们把他培养成一个专家但是培养成专家他还是个人知识经验还在他脑子里通用大模型可能是把他训练成一个大学生水平

但是如果我们能够把行业知识注入到大毛心里去就相当于把一台计算机变成了一个行业专家当然可能行业专家不知道事情他也不知道没关系但是至少他懂得的更多能够帮助我们这些行业专家从繁重的这个劳动里面解脱出来他们去探索那些未知而以致的路线让这些机器来干不更好吗

所以我之前看到一句话说过去的云厂商它提供的这种价值就像水电煤气你不可能缺少它但是你好像也不会为它付出太高的交易价格但是现在云厂商能做的事情可能更丰富更多了然后它提供的价值其实可能某种程度也更大对 它变成一种类似于你业务的一种咨询顾问提供一些更有价值的决策的判断

这就跟过去的云发挥的价值层次就不一样那我们来回顾一下过去一年行业的竞争我们说大模型的淘金热卖铲子的人最高兴那过去一年在你看来整个行业经历了怎样的一个竞争呢诸如你所说其实整个行业里面我觉得有两个层面的竞争一个是卖铲子

就是卖蒜泥这是你们的擅长这是我们擅长的第二个层面是大模型本身从我来看未来几年基于客户的需求的变化大模型可能会走向不同的路径我还是讲了美国包括中国的互联网厂商因为他们做的是以 QC 为主以服务为主这样的一个业务类型

所以他们还是倾向于通用大模型里面放更多的知识通识更多因为它本来就服务于 2C 服务于大众这样的话它会让大模型更大然后大模型里面含通识更多更广这是一条路子所以我们看见现在国内海外很多云的厂商都提供了类似于 ChatGP 这样的对话这样一些能力大家去调用这 API 然后小厂商基于这种 API 很快的能做出自己的对话系统

但是我们也看到了尤其华为服务 E2B 我们看到了很多的企业客户他们关心的可能你给我提供一个对话机器人又如何呢当然你能帮我们解决一些比如说客户服务或者说内部的交流沟通这问题但是我们更关注我们自己的生产系统人工智能能不能发挥价值这就是这两年华为探索的一条道路我们走的一条道路简单来讲叫 AI for industry 要让每一个企业

都拥有自己的大模型让每一个开发者都有自己的人工智能的助手说白了我们就是要把人工智能 2B 结合行业应用行业知识来做行业的大模型我觉得慢慢慢慢这两条路径可能会分叉开来那我接下来就沿着您讲的这两大主竞争的叙事来聊一聊好

其实这次来见您之前我也在行业里面做了一些访谈其实业内很多人还是会认为算力是华为云的最大的优势包括据我所知一些友商他们也买你们的芯片我们刚才有谈到就是在美国对于中国芯片竞售的这么一个背景之下一些友商他们的正企客户也只能买国产芯片那国产芯片里面毫无疑问华为是最优解

所以第一个问题是您认可算力是华为云目前最大的优势吗在云厂商里面来讲算力肯定是我们的优势之一当然如您所说我们这个算力不是华为自己有我们也卖给我们的友商卖给行业我们也要支撑国家的产业发展所以我觉得是优势但不是独特优势也不是唯一优势

在算力这块要做的事情是跟友商我们一起要把这个算力的生态做大如果说我们华为云有什么独特的优势的话我觉得是我们能实现软件协同所谓软件协同就是我们能驱动我们的芯片和硬件的定义我们能

结合我们对于客户的这些业务的要求场景来设计整个系统基于整个系统的要求来驱动硬件和芯片的进步这种我们叫做软硬件协同的设计这是能发挥整系统的优势的这是华为的优势简单来说就是自家又做硬件又做软件而且可以把它协同起来对 所以对于正期客户而言是最省心的 最优的关于算力的这个需求我再多问两嘴我们如果看硅谷那边

有看到两个趋势吧一个趋势是感觉 scaling load 追求有放缓可能基于数据的一些局限吧但是与此同时我们又看到一些世界大厂他们仍然在算力好赌这条路上在狂奔着然后国内的话

前阵子袁敬辉老师他也提出了一个观点就是说大家之前老师提训练的成本如果跟推理成本比起来的话训练成本是一池游泳池的池水但是推理成本可能是汪洋大海是无止境的所以我比较好奇的是您有观察到中美两边对于算力的需求趋势有变化吗如果说推理成本是无限的话那是不是意味着在算力这门生意上是无限的

我只能这样说叫做推理的算力需求远远大于训练的算力需求我们早就判断这个世界上未来能做或者持续做大模型训练的可能中国和美国各国

夸张一点说各五家就差不多了因为没必要每一个厂商都去从头开始做模型的训练模型的训练是一个很高的投入很苦的差事而绝大部分的客户是用用大模型其实主要就是推理所以推理的市场空间是远远大于训练的市场空间的这是第一个第二个就是关于成本的问题我的观点是 Skilling Law 还会持续的发展为什么

是因为基于当前的人工智能技术我们可以看到单位的人工智能的计算成本仍然太高效率还是太低就以我们人脑为例首先现在还没达到我们人脑的算力水平第二我们的人脑计算我们消耗的不多我们就消耗一点吃的穿的我们这个成本能有多高但是你想想我们要堆起一个跟人的思维能力相同的这样一个算力系统我们还要多少钱

如果人工智能要真正的能够替代人的一些基础工作它必须把这个成本要降到跟我们人相当甚至于更低才是真正的符合经济规律的就像您手上拿这个

PC 如果还是大型机的阶段绝对我们都拥有不了那要做成这样一个成本水平意味着什么其实算力规模还要继续扩大在算力规模扩大的情况下我们才能够把新的技术功课使得单位成本更低效率更高所以其实我觉得从长期来看未来五年十年可能还有几十倍数百倍的增长但是现在我们看到了大家的这个理性是因为在当前这个成本结构的情况下

你为了扩大算力你为了高代价这不是所有的厂商都负担得起的所以必须要有人来考虑能不能在现有的条件下能够有一些低门槛高效率低成本的方案能够让这些愿意吃我们叫头蛋汤的这样的客户愿意吃螃蟹的客户他能够及早的

去应用这些人工智能技术及早的产生效益更重要的是他应用了这些人工智能技术以后他就会给技术与反馈给技术与要求来推动技术及进步您觉得这种正反馈发生了吗

我觉得时时刻刻都在就是第一批吃螃蟹的人吃完螃蟹之后你看我们这几年做了三十多个行业大几百到上千个客户其实每一个客户在构建大模型的这个过程中都会提出很多新的要求

都是当前这个大模型的能力没有马上具备的所以我们这几年派了几百个科学家博士专家深入田间地头深入工厂车间深入人家的生产一线的原因就在这里不是说我们做好了一个东西拿给人家用人家马上就能用的而是要到人家的业务系统里去现场去看到人家的业务的问题提出新的挑战我们再来攻克这些技术

这个过程其实就是人工智能技术发展的过程您刚刚其实讲到大模型现在成本还是不够低效率还是不够高周鸿一前不久在演讲当中讲了一句话我觉得还挺有意思的他说他希望把大模型拉下神坛让大家能够用得上以及不要星辰大海我们先用一个模型解决一个具体的问题他觉得这个是最重要的我觉得您应该挺认同的吧我觉得我非常认同他这个观点

他这个观点表达了我觉得有两个含义第一大模型高但是不能贵华为其实过去也经常讲这句话叫高而不贵因为一个技术如果高又贵那只能飘在天上落不了地大家都能用得起来这是叫高而不贵第二是在大模型的早期

不要贪图大模型能够无所不能如果大模型能够聚焦解决你生产系统当中的某一个问题或者某一类问题把人工成本降下来把自动化水平提上去把质量提升上去

那也是个好事这里我就想提一个有一点点尖锐的问题因为华为其实也自研大模型但其实我们仿佛不会在社交网络或者是这种媒体宣传当中特别高频的去看到盘古达模型如果跟其他模型厂商比起来的话

第二就是我发现他好像不太参与刷榜一个是我比较好奇这是为什么然后另外一个是我观察到的是华为其实沿着行业就像您说的做了很多小模型我比较想知道这两方面华为是怎么思考的好这个其实我刚才已经提到了大模型现在有两条路一条是 2C 的路一条是 2B 的路华为可能是走 2B 的路的走得早一点最坚定的践行者之一

所以基于这个选择我们没有必要去跟人家去刷榜因为现在刷榜绝大部分的刷榜是基于 NLP 基于通用的评测榜这种通用能力当然你不能说它没用但是这个榜刷得好了以后到企业里来就能解决企业的问题吗也解决不了也未必因为企业里不是用通识通用能力来解决它的问题而是要用它的专业专长这个行业的 know how 来解决问题的

所以我们不太热衷于去刷这些榜这些榜刷了以后对我们支持 2B 客户没有太可能对营销有点帮助但是解决客户的问题并没有太大的帮助不如沉下心来踏踏实实的帮助客户去构建他们的人

人工智能系统这是第一第二个方面我们在人工智能这个策略上我们可能跟其他的一些云厂商不一样的是其他的云厂商可能我个人判断也是基于他们的业务特点他们还是希望把大模型平台做成类似于互联网平台一样汇聚流量也就是说消费者使用者直接来调用我的大模型就完了

你只要用就行这样流量聚集这是符合互联网业务特点的但是我们在 2B 的行业里我们并不是做应用我们因为没有流量生意也不做流量生意我们构建的是一个大模型的底座以及大模型的一套工具链这个东西都不是客户最终用的客户最终用的是自己的大模型

那我们提供这个底座只是让你不要去做重复性的工作打地基的事你不用做了同时我跟你训练成这样就可以了够了然后我给你一套工具链这套工具链沉淀了如何训练大模型的工程方法和经验然后客户拿自己的行业都好

去在我们的底座上去做增量训练去做微调去结合你自己的业务系统去虚拟自己的大大部分这才是我们的目的所以我们是一个使能者或者拿您的话来说是个黑土地我们并不是黑土地上最后长出了的那个树五或那朵花树五和花是客户的对于互联网而言或者对于像 QCDER 不一样他们本身就是树就是花我们只做黑土地各自的定位不一样

所以这些指标没有必要去比因为对于比如说基础大模型而言在特定的情况下我可能要考虑行业数据和基础数据的配比才能使得整体的效果最优一味的追求我这个指标

可能是个浪费可能是个浪费这当中就有一个细节问题啊就您刚才讲的这个配比问题据我所知啊在训大模型或者说推移的全链路当中是有一组矛盾的就是说模型的这个泛化能力高低和它的专业性是相牵制甚至相背的就是说专业数据训的越多呢可能它泛化性就会影响如果你要追求泛化性很好那它的专业能力肯定就会比较差这是目前的难题现在有解吗

这个还是要随着技术的发展,还是要随着技术的发展去不断的去攻克,看有没有新的工程的方法去训练,当然也取决于也许未来算力大了,这个问题就不成问题了,我为什么有这个猜测呢,就像小学生一样,一次教多了,他消耗不了,你把这个东西教了,他其他的东西忘了,但是如果当我是个大学生的时候,你会发现你一次教他三件事,他是记得住的,

小朋友你可能一次只能教一件事这就是我们现在的人工智能大模型技术还不成熟如果未来还有更新的技术更强的算力也许这种泛化性和专业性的矛盾就不会这么均润方向就两种可能一种就是比如说我们 AI 芯片或者算力本身有提升或者效率提升或者它的这个量级更大或者说技术比如说模型的架构模型的结构发生变化或者对于训练数据的处理方法也有发生一些变化兴许这个问题能解决

然后另外一个细节问题是因为我今天也看了你们上台的一些客户案例吧我觉得有个很有意思的点就是至少上去的都是巨无霸体量都挺大的都是大企业所以第一个问题是我会有点怀疑您刚才说的说还是希望成本价格给打下来让大家都能用得起但我们现在看到的案例都是这些巨无霸企业的代表

他们肯定是很有财力的那实际上如果把你们的服务放在整个市场去衡量的话是一个普通企业能够去应用的这么一个状态这个

所以这也是我们你看我们的大模型我们率先提出来大模型的层次结构里面我们 L0 叫通识大模型通用大模型是一个底座其实并不是客户最终使用的我们希望构建 L1 的行业大模型以及 L2 的特定场景的大模型我们其实隐含了一个理念就是我们也希望这些行业客户他能够把他的行业的通用能力也能做成大模型对外提供服务

那提供服务了以后意味着不仅仅是行业的领头羊能够使用 AI 它同时也可以服务本行业上下游的客户或者同类型的客户为什么现在是只有大企业在玩人工智能因为人工智能三要素里面一个是算法

要靠技术要靠专家第二是算力第三是数据算法和算力的问题也许华为能帮客户解决我们有足够多的专家 博士算力我们也可以帮他去建但是数据这件事情只有大企业它有足够的数据一个行业里面的小企业他们也很想赶紧拥抱人工智能但是他自己的积累太少了手上所掌握的数据也就是知识和经验太少

那我们也提倡在行业里面我们做行业通用大模型那行业通用大模型做出来了以后因为行业的领头羊它掌握的数据够多只要这些数据是能行业里通用的他们也开放出来给中小企业用实际上这就降低了中小客户的门槛

这有点帮带船的意思大家在不同的生态位做不同的事情对 产业只有这样才能做大这样中小企业才能看得到我的未来在哪里不然感觉好像都是巨头的事情当然还有我们也号召行业来共建这种开放数据集因为一类型的企业你有一些 我有一些只要这些数据不涉及你企业的各自的隐私或者保密的东西通用的数据或者脱敏的数据可以拿出来这些行业经验大家是能够共享的

共享建立一个行业的通用数据集那我作为一个行业领头一样一个大企业我为什么要来干这个看起来是公益的事情这个

这个还是这样说每一个行业里面都有大企业都有中小企业各自的市场定位不同看似竞争其实我认为是一个竞合关系因为大企业它可能它的成本很高它只能做大项目小项目养不活它但是它也会面临大量的客户我做不了

我的人可能到不了那个地方或者说我的成本我 cover 不住或者说这些细小的场景我并不专业反而是一些很小的厂商他专注这样一个领域他比我还专业那为什么不提携一下这些客户来补充我的这些能力呢所以这个市场上我觉得进和合一定是一体两面不会只有绝对的竞争当然同行的企业里面也不会只有合作一定是进和合是个很好的动态平衡所以

大的企业把这些经验分享出来也是个很正常的事情你像我们软件开发有开源开源典型的是同行之间我提携同行为什么要提携同行因为同行也能给我做贡献的也能补我之不足啊

那还有一个观察就是今天上午嘛讲的一些案例里面啊我发现拿出来讲的模型从参数量级来看的话并不算大甚至我看到了一个特别有意思的案例是一个药物分子大模型它是一级参数其实我们今天在公共叙事当中很少去提一级参数的模型啊

所以我很想问您一个小模型它的价值有多大以及模型现在越做越小或者说把小模型做好会是一个趋势吗其实我不认为这些是小模型我们过去的小模型说白了只是对特定数据集进行特定的训练抽取出来的

它不具有繁华性您提到了比如说我们在 21 年发布大模型之前我们也在做人工智能我们也给很多企业做了一些模型那个时候就是小模型我把你的企业的数据拿来我把这些数据帮你训练一下生成一个模型这个模型可能只对你这个企业或者只对你这个企业的一部分业务场景鼎用那这个叫小模型而

大模型首先來說它是有一個通識教育的過程也就通用數據訓練的過程然後我們再把它疊加專用數據它整個模型的訓練方法工程跟過去的小模型是完全不一樣的這個不能看參數量的大小說它是

小模型它可以我认为它是小的大模型对 我是这个意思那为什么会有小的大模型我觉得我们可能业界也很多客户容易被误导了其实参数量大的主要是自然语言的模型 NLP 的模型它参数量大现在 NLP 的模型起步千亿级百亿级的大家都觉得都不够了

千亿级甚至于万亿级对吧这是 NOP 但是你如果到了视觉模型 CV 的模型可能

几十亿也够如果对于推理决策的模型几十亿几亿我觉得这个都够像药物分子大模型就典型的它不是自然语言的那我为什么要这么大不需要这么大你看我们华为做的七项大模型也是一样的它不是自然语言的为什么要那么大所以这是我早上提的一个具体的实践当中的问题对于企业而言它要求大模型要有专业能力这是第一第二

一个企业要选择多种模态我补物质是要有语言的我可能也要视觉的比如说我用视觉来做交通的路况的观察或者气象的观察可能是视觉但是我可能也有决策推理我可能有优化像分子药物和我讲的气象大模型我们叫做科学计算大模型说白了它的大模型的核心原理是一系列的科学计算的方程过去我们是通过解方程的方式解出来

那现在我们用学习的方式加速计算说白了是加速计算过去我们做一次气象预报得几千台大概三千台到五千台高档的服务器要算可能半天才能算一次结果算错了我下回还去解答

那我们现在用一张卡十秒钟就能出来这就是用人工智能用小的大模型来加速科学计算其实分子药物也是一样过去研制一个药物要十年现在我一个药物筛选我可以由月的时间我缩短到天甚至缩短到小时就就是因为我们用人工智能的方法在加速科学计算

那這種客粹資算的大模型沒必要像自然語言那樣要幾千億幾萬億沒有必要所以小的大模型也有價值那對於企業而言關鍵是你選擇哪一個模態或者說是多種模態的組合當然也選擇尺寸因為

同样一个能力的大模型如果尺寸越小当然成本越低这就需要我们有技术了比如说做量化抽取能不能够尽量的降低它的算力成本这样使得我的精度在下降不多的情况下我低成本的使用这都是企业要综合考虑的问题

这个就让我想到我 23 年年中当时跟人大有一个前沿的学者他其实当时说了一句话他说其实我们现在一直都在谈大参数模型但实际上相对来讲小一点参数的模型能够真正在行业里面应用好的他还没有见到过但我想可能到今年为止有一些行业已经应用的有一些成效了

如果做 2B 这种场景会比较多小的参数但是精度非常好的大模型我觉得可能是未来企业也会不断追求的一个结果其实您刚才有提到很多行业的应用我们能不能更细化一些就比方说你们现在跟那么多客户贴身去合作这些模型的应用有没有发现哪些比较高价值的 AI 场景

你看我讲过了气象你也提到了这个医疗对吧这个我们就不说了其实你看我们这些年跟工业企业面做了煤矿这个煤矿我们有好多场景挖煤是一个

高风险的场景靠人去执手那我们现在可以通过远程的摄像头通过 CV 来看这个煤层挖煤的这个面它的工况甚至于还可以通过声音来听挖的那个声音对不对背后是水还是煤还是岩石因为过去都是老师傅站在那老师傅听老师听得不对不能挖了

因为再挖可能挖透了或者怎么的这些东西我们完全都可以用人工智能方式来进行判断然后挖出来的煤因为毕竟它不是纯煤它有煤渣有石头有什么东西那在传送带上要做分解那做这个分解的过程过去还是靠人

效率又低成本又高如果我们现在用摄像头来实践哪些东西是煤哪些东西是义务很快的就能自动的做一些分解生产效率会大幅提升然后你看煤矿场景还有就是金煤生产金煤金煤是需要个

各种配比那种配比呢过去也是配一个比例生产出来然后还得把个煤烧烧完了以后的最后的那个煤渣分析里面的成分这个成分如果达不到我们期望回去再重新配又人工重新配那我们现在把

多种数据比如说我有过去这么多次配媒的这些数据我能够综合起来我能够进行一个模型分析我的模型分析就能给我一个最佳的这样一个参数就省了我反复的去实验反复实验是浪费多少成本的

所以就一个煤就有很多这样的场景比如说我们在山东某一个煤矿就一个矿井我们一年帮它可能多生产 2000 吨煤如果推广到全国我们那么多个煤矿可以想而知可以多产多少对吧同样的也在比如说钢铁

钢铁最难的是炼钢这个环节炼钢原来这是一个纯化学过程因为钢要炼的质量好温度配原料的各种微量元素的配比这些东西都是有很精确的过去是靠炼钢的师傅他们的经验一炉钢 60 吨

浪费多少一炉钢几十吨就去了我不能这个高炉老在那去做这种试验而且还不能停那我们基于把这些炼钢的这些参数也把它数字化然后基于炉温啊这些湿度啊各种情况我不知道啊因为我不是炼钢专家但是类似于这样的一些参数我们把它数字化训练模型了以后它就不用这么长时间跑去反复试验那炼出的精度质量就比原来要要好很多一吨钢哪怕我降低

现在来看我们初步达到的效果可能还不止一块钱我们可以看一看我们国家一年生产多少亿吨钢

您刚才能够讲得这么细我还挺意外的因为您是 CTO 最顶层的一个决策者的角色我比较好奇华为接触那么多客户我相信你们肯定是从客户从产业里面挖掘了非常多的场景和需求但是不可能一上来所有的需求都做肯定有一个排列优先级的过程以及选择做什么和不做什么在华为内部这个过程是什么样的可以分享一些吗

这个首先第一步还是我讲的我们得深入客户到客户一线因为不到客户一线我不知道什么东西是

客户那里最着急的或者说对客户价值最大的假设比如说我们人力有限的情况下我们就以煤炭为例煤矿企业有三种场景我如果人力有限我只能给它做一种场景那我必须知道哪一个场景条件最成熟给它产生的价值最大那我首先从这个场景做起那我们这些东西必须得到

客户一线看了客户的生产系统现场基于客户自己的经验以及我们的经验结合起来我们才能做判断我们做了 30 个行业几百个客户每个客户可能都有三五条需求每个需求都有它的价值但是终归我们的人力是有限的所以我们每一层的专家和主管我们都在碰撞我们手上有限的人

那怎么能够把这些需求里面的共性的东西抽取出来我们也要去不断的去鉴别从价值大快速能帮客户创造价值来进行排序所以我们工作过程就是不断的先理解业务识别需求在这些需求里面去抽取我们讲的叫去粗存金去伪存真然后有表即理

由此即彼这样的话客户也许没有提出来的问题但是我这样一做我可能还有另外一些问题都能解决这是我们技术专家的价值不只是说客户让你做一你就做一而是我们要能把很多客户提的一二三四提了这么多东西背后的规律

给抽取出来把这些需求最大的通用化 共享化这是我们技术团队最大的价值所以我们粗略化这个流程的话它大概就是你们的技术专家真正深入到客户的内部去搜集这些需求然后回来在内部不停地碰撞然后杀权出来做出了产品之后再把它带到客户现场去验证我做的对不对所以是非常是一个持续迭代的过程以及会做 dirty work 对对

一定要去我们叫双手在泥因为你不到客户现场你根本不知道我们最后需求对不对然后做出来的效果是不是满足客户需求所以做 2B 的这种企业它的气质可能跟其他行业是不一样的比较实干对这是不一样的 OK 你刚才讲的收集一波需求内部碰撞然后筛选出我们姑且把它称作第一批次要做的事情确定第一批次的目标的这样的一个流程周期

当中大概经历了多久这个我倒觉得我们是一个快速的

这个过程当然你看我们对于需求大颗粒需求有年度的规划实际上我们还有迭代性的版本以季度或者以月为单位的这样的需求可以识别和纳入进去然后对于很多紧急的需求我们还可以走紧急的判断和决策的流程那大模型浪潮来临之后对于一家云厂商要定义的新目标这个目标的确立大概花了多久属于你们华为云的我觉得

不太好说这几年我们还在不断的学习我们也在不断的调整目标有些调整是觉得我们的方向偏了有些调整是觉得我们的目标低了或者有些调整是把目标的优先级要排一排有些事情是当前要实现有些事情远近实现了这也是一个迭代过程方向偏了和目标低了可以举一个例子吗比如说大模型走的路线我们到底是要走一个

但是从我来看大模型的 API 其实是个类 2C 的业务我们绝大部分的正企客户你提供一个大模型的 API 其实这个 API 主要是类似于 ChatGP 这样的对话的 API 这个东西来说对企业的应用尤其是生产类型的应用帮助

幫助並不太大然後企業又是他希望他的數據是專屬的答的問題背後的知識可能是機密的比如說政府的那是政府的機密數據比如說醫療行業那是可能涉及醫療或者病人的隱私數據那是不能開放在外面的所以你說讓我們提供一個公開的 API 到底該不該提供優先級高不高這個其實公司內部就有爭論那我們

通过一段时间思考我们觉得不要走这条路我们走 AFO industry 我们走一个使能器我们提供大模型的底座和大模型的工具链帮助客户来构建他的大模型这条路这其实就是修正方向好那修正这个方向以后那我们也不断的在调整比如说你可以看到我们

华为的开发者大会和全联监大会上平安总每次都会发布一些新的大模型那到底先做车还是先做煤矿还是先做能源还是先做什么这个我们基于对行业的理解的程度基于我们和客户各自的准备程度我们都会不断地去调整调整这些目标那哪些目标定低了呢

定低的目标那当然还是大家最关心的性价比我们每一回都觉得自己的性价比的追求还不够还要再去挖可靠性尽管我们现在的我们的大模型的训练集群的稳定度已经在业界算是比较好的了但是我们还是希望能不能中断的时间短一点然后客户恢复的时间能长一点最好不要影响客户业务这东西都是不断的每回都在给自己调整目标还要加码还要再提升

其实我们之前说三四年前我们还在提云原生但今天所有人都在提 AI 原生华为云怎么理解 AI Native 去年李彦宏在提到 AI Native 的时候他讲到他要内部抛弃所有旧有的认知完全解构了之后重新做以及他说大厂在这件事情上肯定会反应慢的可能基于很多过往的经验或者他的体谅我比较好奇您认不认同他的看法以及华为有没有经历过这种解构又重构的一个过程

这是两个大问题我先说 AI Native 的认知 AI Native 认知通过我们这几年跟 2B 的客户的这样的一些合作和实践我把它总结成四个方面不一定全但是是我们看到的现在比较主要的四个实践的路径或者四个实践的范式

第一是如果要做人工智能因为当前的人工智能这个浪潮是算力驱动的所以第一是一定要选择 AI Native 的算力换句话说我们要用新型的算力这个新型的算力一定要能支持大算力大带宽低时延能支持人工智能的训练和推理当中的这样的大量数据同步的这样些要求模型训练和推理的要求这种必须要有新型算力传统的算力是搞不定的那第二是

因为客户的要求是要构建它的应用要智能化它的业务系统智能化所以它的业务系统必须要构筑于一个已经智能化的底座之上那我们过去所提供的这些底座包括传统的数据库 数仓大数据 安全这些技术等等包括软件开发这些基础的技术它自身都要升级如果我们这些支撑性的技术自己都不能智能化你怎么可能支撑客户业务的智能化

对吧好所以第二部分就是要采用 AI native 云服务来构建客户的业务系统第三很关键的一点要构建行业或者企业的大模型这是人工智能的核心的路径一个企业他能不能把他的知识经验能够人工智能化的核心就在于他能不能把这些知识经验做到大模型里去

然后第四如果我们既用了算力也用了智能化的这样的底座服务也构建了自己的大模型毫无疑问那我整个应用系统就要改造就要基于大模型来构建它的应用系统我们叫一个大模型系统那这四个方面是企业必须要做的事情如果这四个方面做得比较好我们觉得可能这是走向 AI Native 主那第二个问题我相信就不言之明了我们发现每一层都变化了

所以李彦宏说要重构这个很自然的我们华为云如果你看我们这两年我们提的我们自己的战略我们已经把我们的技术设施全部重构了我们甚至于从数据中心的设计都已经改了然后再到芯片硬件的设计底层软件的设计已经全部都改了第二我们把我们的云服务全部用人工智能升级了一遍我们叫 RESHAPE 的 Cloud Service 就把我们的人工智能全部升级

我们的所有的云服务都用人工智能加持了那有的是增加了这个 intelligent assistant 的这种智能助手有的是为大模型做了很多功能比如说安全也有的是用人工智能来提升了本身的

很多的能力比如说我数据库的管理数据库的运维包括安全的这种态势的感知漏洞攻击的这种感知都可以用人工智能来驾驶我们自己都把我们的云的服务全部都升级了一遍当然这个升级的过程还没完成这是个长期的过程是个不断的迭代的过程我们还在持续的

去做这些事所以这个重构我觉得已经开始了我们已经在做了重构和解构这件事情对华为来说是不是没有包袱的这个阻碍存在吗包袱肯定是有因为这么多年过去积累的比如说技术团队我们的研发团队我们过去这么多年积累的代码谁都不想说这些代码要改或者甚至于有些代码要抛弃掉但是我们华为公司有一句话叫做优势挡不住趋势

如果你不想變革 你可能就被這場變革給顛覆掉那與其去被這場變革顛覆掉不如你及早的擁抱它你還成為這個改革的紅利的享受者 對吧所以這個時候如果有一個新變化的機會我們做技術團隊反而是很興奮的 苦是苦一點

因为我有很多东西要重新进行升级还要考虑客户怎么从老的系统里能够迁移到我这个系统来对于技术团队要求是很高但是我觉得这是技术团队也必须要追求的否则我们不能保持我们的领先嗯

那您觉得是应该先有模型再有产品还是先有产品再用模型呢因为这个问题最近被业内讨论了很多我们看今年的明星公司 Perplexity 它其实就有一个非常有名的主张就是我们不是先想模型再想产品的我们就是先有产品的

这个我刚才已经讲过了模型我把它看作更技术成分的东西产品是更看重商业成分的东西是业务的东西这两个是一个相辅相成一个像 DNA 的螺旋一样这样的过程

就是技术会带来产品的升级但是产品反过来又定义或者牵引了技术的方向这个玩意肯定不是先后的关系绝对不是先后的关系我认为是半生的关系所以一个产品要及早的应用新的技术

然后这些新的技术又要在产品里及早的得到验证然后这些新的技术又被这些产品推动再往下一个阶段发展这种相互协同的发展是对于新的产业新的技术的成功之道就在我们谈话的今天其实行业里面也是发生了一件大事就是 ChatGPT 支付离开了 OpenAI 我们也看到美国现在人才流动非常的剧烈在

在中美大模型 AI 的竞争道路上您有什么自己的主张和判断吗首先来讲我有几个想法第一个是中国的人工智能发展的道路一定要走中国特色结合我们中国自己的产业的特点去走我们如果走美国的道路我们

不一定能成功所以我们要发挥我们自己的优势扬长避短另辟袭击还是想说比如说以语言大模型为例我个人认为英语的语言的大模型我们是无论如何很难超过西方世界的因为英语是西方世界的主流语言工业革命以来我们不说历史上吧工业革命以来人类的最主要的文化和知识的经验

公开的啊 基本上都是英语的包括公开的论文 公开的这些技术文档可能都是英语的如果我们去走这条路我们可能不太现实来讲我们可能赶不上他我们中文可能我们有优势但是英文我们赶不上优势所以作为一个企业我们可能走这条路不见得是你的成功之道但是我们在我们自己的行业

我们是领先的第二点就是美国现在在打压我们的人工智能对吧技术上打压甚至于未来在人才上也打压你看中国可能学生再想去美国学计算机啊人工智能相关专业很困难这就更加要求我们中国的产业界

大家协同起来在人工智能这个事情上我们更多的是协作而不是竞争发挥各自的优势 2C 的企业去发挥 2C 企业的优势 2B 的企业去发挥 2B 企业的优势一起协同起来能够把整个人工智能的产业才能带起来才能跟美国进行这种全战的竞争我早上有一页交片已经提到了我们从底层到上面的应用中国和美国其实都有对位的企业

但是我们可能在某些环节上我们还有差距这需要我们一起来协同第三个我觉得我们产业界和学术界要协同起来比较好的事情是人工智能的学术研究除了美国就是中国世界上再找不到其他地方了所以我们中国的产业一定要给

学术界提出问题给他们一场景给他们一种理论发展的空间和机会那当然他们研究出来了这些技术研究出来这些理论要快速的到产业里来进行验证那我们如果能够把这样的一个循环做起来那我们人工智能这个产业也不怕谁了谁也封锁不了嗯嗯

本期节目就到这里你从这期节目中获得哪些有价值的认知有何不同见解都欢迎在评论区留言分享有关本期独家访谈的文字内容也已经在我的公众号卫视节商业漫谈上发布欢迎前往阅读好了我们下期再见