欢迎收听本期的晚点聊今天的主播是曼琪这个一月即将到来的农历春节也没有丝毫减速模型竞赛 DeepSeek 发布开源推理模型 RE 以相对低的成本在一些 benchmark 上比肩甚至超越了 OE 的表现在全球掀起了广泛的讨论
这期节目我们邀请了 2015 年与硅谷成立的 Fusion Fund 的创始合伙人张璐来和我们一起聊聊当前美国科技圈和硅谷的语境中对 DeepSeq 等中国模型的讨论
我们也延展聊了 OE 还有 DeepSeq RE 等推理模型打开的 Agent 也就是智能体的应用空间以及在美国的科技投资视野中除了 AI 大家还在关注什么 Fusion Fund 曾投资 SpaceXAI 音频公司 Altered AI 还有 AI 与医疗结合的公司 Sato Medical 等
在 AI 领域他们重点投资美国本土的 2B AI 公司张璐认为 DeepSeek 的出圈和影响力是开源生态的胜利而开源的繁荣更有利于初创企业张璐也谈了她对 DeepSeek 利空英伟大和 GPU 算力需求以及 Meta 等美国大公司感受到的压力她的观察是长线看 DeepSeek 这类大幅降低 AI 模型训练部署成本和使用成本的开源成果会促进更多其他公司把
AI 大模型带到各行各业长期会带来 AI 用量和算力需求的提升所以这对算力需求并不是一个利空
对 Meta 这样大力投入开源的大型科技公司张璐认为他们的一些贡献和整个开源社区的进展本身是 RE 这类成果出现的条件之一同时 Meta 作为美国 AI 开源生态的主要玩家之一也将长期受益于开源的繁荣我们聊这期节目时是 2025 年的 1 月 27 日上午当时还没有发生英伟大的股价大跌这次波动的幅度超出了一些人的预期但也许并不影响长期的趋势判断
下面就正式进入本期节目吧今天我们很高兴邀请到了 FusionFund 的创始合伙人张璐来录制我们的节目你可以和我们的听友打个招呼好的 谢谢曼琪大家好 很高兴参与到今天的讨论我可以再补充介绍一下就是张璐她作为科技投资人自己是有技术背景和创业经历的她之前是毕业于斯坦福大学的材料科学工程学院
然后在斯坦福期间他又创立一个医疗器械公司后来是被收购从 2015 年开始张璐创立了 Fusion Fund 他们是在硅谷去做投资重点是关注医疗企业级 AI 工业自动化和太空科技领域所以这一次我觉得也是一个很难得的机会可以请张璐来跟我们聊聊就是在硅谷在美国感受到的一些前沿科技投资的动向
包括大家现在最关注的 AI 技术变革同时我们也会聊聊除了 AI 之外现在在美国的科技投资的热点还有什么好的没问题我想就是先从最近这一个多月非常热闹的大模型的更新还有竞争开始聊我觉得正好也是可以两边来对对大家的感觉是否一样比如说最近这段时间在中国讨论最多的一家公司
就是 DeepSeek 那它其实既不是之前像字节腾讯这一类大的科技巨头也不是 2023 年之后形成的中国大模型的六小虎它是之前比较神秘的公司然后在杭州最近它我觉得在国内特别火的一个原因也是因为墙里开花墙外香就是大家发现好像在国外大家对 DeepSeek 特别是美国的技术社区对 DeepSeek 的关注是非常高的也是想问一下就是您自己的感觉是怎样的了
对是的尤其过去这一周时间吧对 DeepSick 的讨论也非常多我其实上周是在达沃斯在达沃斯的时候呢其实你们可能也看到了当时也有人采访我记得是 Skyle AI 的创始人 Alex 接受采访的时候还提到了 DeepSick 这家公司那我带 Davos 参与各种讨论时候势必也会聊到硅谷人工智能模型等等也会有几个甚至说是非科技圈的因为达沃斯也汇聚了各个领域的这些 leader 们会问到我说现在中美模型的一个比较啊
听说到这家公司所以确实我觉得 DeepSick 这次是也是代表中国的模型公司可能是在国际的整个科技领域获得了很广泛的一个认知度和一个关注度那在硅谷这边的话呢其实比如说像我们这边我记得我去年年中吧都不是说年底的时候因为年底的时候 New Europe 的 conference 当时已经有很多人开始讨论 DeepSick 了
在那个之前其实跟一些 OpenAI 和 Anthropic 的朋友聊到当时他们已经有提到他们也在关注 DeepSick 在做的方向其实我觉得主要还是因为大家在整个开源的生态里面的话信息沟通交互还是比较高效的尤其是对于一些新的模型的 Architecture 基础架构层面上的一些新的探索
大家都会比较关注但那个时候我觉得 OpenAI Anthropic 在谈到 DeepSeq 的话并没有特别多的一个感受会觉得说他们可能会比我们做得更好或说会做出来的模型各方面的向往会更加的优化到去年年底的时候这方面的关注度会更多最近这一段时间尤其过去这一周确实它新发布的 R1 是给大家了一个很大的惊喜
其实我觉得在美国这边也有很多的讨论无论是在业内甚至说在推特上你会看到很多讨论包括像过去这一周虽然我在 doubles 我在群里面因为我们自己有一个 fusion 放的内部讨论的一个群我的几个合伙人尤其是做人工智能相关的我有一个合伙人以前是最早雅虎的搜索隐形他参与的团队当时陆七也在雅虎的时候他们就共事过
那他呢就一直在群里在问我说你对这个公司了解多少啊你认不认识他们的创始人因为觉得我是华人吗然后我也在跟他聊我们在群里甚至包括过去这两天其实也都在讨论他的优势在哪里然后包括他的这个训练等等所以我觉得还是确实是引起了大家的很多的关注和一个惊喜是今年模型领域说是说去年到今年的一个黑马
具体来说您和你周围的硅谷投资人和 AI 创业者朋友们大家看到的惊喜是哪些了或者说大家会怎么理解 DeepSeek 这类公司的异军突起这个公司做得非常的优秀但是最大的是一个开源生态的胜利其实整体的开源平台至少在美国的整个开源生态我觉得大家的信息交互还是比较及时的甚至说不需要说点对点的去信息交互整个大的开源生态它就是一个大生态
我记得大概去年三月份的时候我在斯坦福利活动上我们一直是非常支持开源生态非常 bullish 就觉得这个生态其实还是有很大的潜能的所以在过去的这一段时间或者说过去的这一段时间
几个星期吧可能对大家比较兴奋的一点是觉得 DeepSeek 也代表了其实开源是在超越币源甚至说赶得上币源甚至会超越币源的一个发展速度那开源的发展速度可能会让大家看到说整个一个大的生态合作的可能性它不是一个区域的局部性的可能性甚至包括像 DeepSeek 这样的其实是在远在中国的团队也可以在开源生态做出非常大的一个贡献
所以我觉得开源彼此的支持还是比较重要的包括当然 DeepSeq 有很多创新的地方但它也一定是站在了很多前年的一些其他的开源生态包括说避原生态它体中各种各样的一个模型还包括各种各样的架构有些人可能是给它试出来了让他觉得可以去探索的方向还有一些可能是让他看到了说有些方向可能我就不要去试了我要不要去探索一些新的架构怎么样通过这样的一个新的架构的达设去达到成本降低的一个可能性
对就是他们这个公司是这个创始人可能本人自己出来的比较少就大家对这个人的了解可能比较少但实际上包括之前 DeepSync V2 还有 V3 它也都是开源的嘛他们每一代模型都是开源的
最开始 V2 在技术社区有一些反响也是因为它的这个当时开源的技术报告写得非常细它可能把一些中间过程的实验结果也释放得很充分其实这个对很多研究者来说大家是会觉得我很佩服你的这个做法所以他们整个做法还是挺开放的
你刚说到那点我也想到就是 Meta 的杨乐坤他最近也是发了一个推特对他就是说其实我们要把这个 DeepSeek 这件事理解成开源的模型再超过一些闭源的系统对对对对另外其实我觉得还是就是说对于 reinforcement learning 你说其实 reinforcement learning 也不是一个新的东西都这么久了
那现在可以做到完全是无监督的 unsupervised 的 reinforcement learning 而且很重要的一点是这个相当于对于整个 scouting log 也是一个好的消息就是说它可以免除大量的这种标注过程的一个数据尤其是二弯让模型去进行自我探索自我的探索自我的思考自我的反思这个其实是让人大家非常非常惊喜的因为之前其实业内所有人其实包括 deep mind 的人都觉得
过程的这个标注是必须要做到的才可以去达成这样的一个结果
才可以去实现自发的叫做 chain of thought 但是现在相当于发现说没有标注没有过程数据的标注无监督的 reforcement learning 也可以做到我觉得这个是让大家非常惊喜的一点因为现在也有很多人就觉得说这个是不是证明 scaling law 或怎么样我说不是啊这个其实反而是对 scaling law 的一个非常大的提升
它对于 Scalenow 的一个进一步的提升和支持包括我们在还是在继续在 Scalenow 这个方法层面上这个大的方向上如果我们去应用更多的算力就可以把模型能力再提高一个数量级我觉得这个是对整个产业不管是开源闭源非常大的一个启发和推进
其实我觉得大家最关注的就是它可以真的是做到了无监督的 reinforcement learning 然后免除了大量的一个标注过程的数据我觉得这两点是大家比较意外的当然还有很多人关注的是说它这个成本确实成本的降低它是一个结果达成了这样的一个结果让大家觉得非常惊喜
包括你看有些人可能因为他们也是开源说实话开源生态在美国这边包括我们投的很多公司他们在开源生态的贡献也很大也会非常详细的把自己的这个所有的细节都去分享出去所以这个可能倒没有让大家在这边觉得说多么难得但就像你想的可能之前中国的模型公司或者开源的模型公司没有分享的这么详细的包括在过去这一段时间大家也会看到
open ai 现在我们都开玩笑是 close ai 对吧他也不会去开源 miss trouble 来是开源的现在也不开源了包括像 deep mind 他这个 alpha fold alpha fold three 他最后也没有去开源也没有很多细节去分享出来所以在这样的一个大厂逐渐逐渐在收紧他们信息分享的这个过程中可能 deep seek 出现了他有做了很多新的东西他要把这个新的东西非常详细的分享出来
也会让大家会很尊敬这个公司的行事方法和对开源生态的贡献开源它本身就是一个互相支持的过程你很难去讲说我对这个开源生态的贡献绝对是别人不法比拟的我觉得大家是一起贡献了这个生态的发展
所以我觉得这点也是 DeepSeek 可能是让整个看人生态看到了中国企业家中国创业者的一个非常大的对于生态的认可度吧还有说行动的一个一致性当然这个成本的降低我觉得也是非常好的这个本身也是对于整个未来人工智能的产业应用还有包括吹着领域应用的一个很大的
助力因为大家其实现在担心担忧最大的其实还是人工智能的成本问题包括我在大沃斯包括我们投的项目基本上做的都是 2B 的应用那这个时候所有的客户你去跟这些大的公司去讲说做人工智能的植入他们第一反应并不是说你的模型是不是最好的或者是模型是不是最准确它就是一个词 ROI
你的 RRI 怎么样 Return of Investment 你的成本有多少我需要用多少的算力多少的耗电量然后包括在这个基础上怎么样可以让我的回报和我的投入是成一个正比的我觉得这个也是可能让大家看到 DeepSick 可以把成本降到这么多打开了大家更好的未来大规模商业化的一个可能性
现在我看有很多其实用户已经开始用去蒸馏它这个模型把它做小基本上做出来跟 O1 它的表现差不多模型的成本可以非常低这个也是我觉得让大家可以快速地看到开源的生态的价值我记得是 Perplacity CEO 其实讲过他提过一句说历史告诉我们一旦开源追上甚至超越必然软件的话开发者就会转向开源
那现在其实已经让大家看到这个可能性所以很多的开发者也会继续涌入到开源生态里所以您自己是一直比较相信在大模型这个技术上其实开源是很有可能会追上币源的是吗因为这事可能在前两年我觉得还是有一些争议的
对我们从一开始像我讲到去年三月份的公开演讲我当时就提到了我说我们非常 bullish 我们非常有信心也很相信开源生态的一个发展的可能性二来其实那个时候还是有一个整体的大的理念是在于当然这个也有我们自己投资的偏好性相关于我们不投 2C 我们投的所有的企业都是 2B 的企业景应用的这样一个人工智能公司所以它势必其实要发展的方向不是一个大模型更多的是垂直领域小模型
那怎么样在垂直领域小模型的基础之上提升模型的一个效能然后包括模型的准确率但是又是在模型的规模相对来说比较小的情况下那开源生态的好处是它的多样性比较大你可以在它看到各种各样不同的架构还有包括 Inference 层面上的一个创新去帮助它优化让它这个垂直领域小模型可以做得更好所以这个可能跟我们投资的偏好和属性也会有一些相关
但是你说我那个时候是不是很笃定很快就能追上我那时候可能也没有一个具体的时间线另外的话呢还是要讲说那开源生态对谁是最有利的一定还是对初创企业是最有利的那币源的话呢它一定是对于大企业是最有利的所以我们作为一个早期的科技投资人投资机构那当然也从私心的角度希望开源生态可以发展的更好
你也能看到说包括这些蓬勃发展的初状企业的生态对于开源生态的一个支持和需要
就是您刚才讲的几个点包括这个开源包括这次 R1 的技术报告里提到的它技术上的一些改进它没有做监督为条是直接从零开始强化学习还有它成本上的这个亮点之外我觉得这些都是专业人士可能会关注的点就你周围的一些其他领域的朋友或者说你比较直观的一些体验上你最近有感到就是大家对这个
中国模型的一些讨论的变化因为我注意到其实在这个 APP Store 上就美区的 APP Store 上现在 DeepSeek 的下载排名还挺高的它在免费纵棒的话我今天早上看的时候已经是第一了我昨天晚上看是第四它今天又上升了几名已经超过全 HPT 了
对我觉得其实对于很多包括你看他下载量大依赖是说他允许用户去进行他他是开源的吗所以的话你也可以去进行蒸馏小模型自己他的灵活度就比较高另外还有一点的话呢就是他确实他的这个整个成本
它无论是它公布的数据还是说大家看到它本身的这个训练成本还有包括 reasoning 的成本其实很多人讨论是说它的模型训练成本很低其实它做 reasoning 推理的成本也很低这个就非常适合初创企业包括小企业它毕竟用的资源有限无论是做训练还有说做 reasoning 推理层面上需要的
能拿到的资源都比较有限无论从资金层面上还是说从算力层面上所以呢它也是一个比较比较优异的一个选择那我觉得 DeepSeek 会不会是改变大家对于中国模型的讨论呢我觉得可能会带来一些讨论但我觉得可能 DeepSeek
还是和其他的一些中国的模型公司走的路径不太一样当然我可能对中国其他模型公司也没有那么的熟悉但我觉得 DeepSick 可能是一家可能是第一家让美国的这边的模型公司还有初创企业甚至说整个 AI 圈看到说其实中国的这些人工智能公司模型公司也在做一些底层的
architecture 构架的创新探索因为大家也知道中国的企业家执行能力很强包括美国只要出现了新的 API 包括 LamaSuite 出来之后这边有很多快速的基础上去做应用大家可能会有一个概念是觉得说很多从 0 到 1 的创新在美国这边发生之后的话中国那边会很快的落地应用的一些搭建但是我觉得 DeepSeek 其实
反而是说他更多的他并没有去关注一些 Camosa 的一些角度的探索他更多的还是一个相对偏底层架构的一个创新方向的一个探索当然他在工程领域有很多的就是 engineering 层面上有很多的好的创新但我觉得这一点可能是让他
和别的一些中国的模型公司区别开的一个原因之一另外的话呢可能他最近因为也受到很多讨论就是昨天吧我记得 AMD 也做了一个对他的一个背书吧就是宣布说其实 DeepSeek 这个模型是在用他们的
他们自己的这个最强的 AI 芯片之一就是 300X 在进行大模型的推理其实是做 Risling 那方面的训练所以我觉得从这些从它这个角度来讲的话像 AMD 和英美达现在竞争过程中在 AI 这个赛道里面确实还是处于劣势包括很多的这个模型对于 Cuda System 基本上是绑定的
所以我觉得 DeepSeek 和 AMD 的这个合作可能也会帮他带来一些从大厂层面上的一些关注度对昨天其实就是有不是很关注 AI 的朋友来问我说为什么大家现在都在讨论 DeepSeek 以及为什么这件事会去做空因为的就是比较关注股票的一些朋友他可能之前不是那么关注 AI 模型这一层嗯
我觉得这个离做空英美达还差得很远这个不会做空英美达其实我觉得反而因为 DeepSync 大家要看到说整个人工智能的市场的增速会继续加速那为什么其实很简单的道理那人工智能其实从这个概念到 XGP 到现在接两年了我们下一步要推进的或者说要去期待的是大规模的人工智能垂直领域的应用大产业的一个铺设不只是在科技行业包括一些传统行业
所有具有海量的高质量数据的行业其实人工智能的应用植入现在都是一个很好的时机那现在最大的一个挑战就是我们讲到的成本问题
那 DeepSeek 其实给大家提供一种可能性成本可以有指数级的降低而且它只是一个开始那除了 DeepSeek 之外还有很多其他的开源模型也在发展包括 Lama 这边的团队他们也在继续的去探索低成本包括我们投的一些项目他们也有很好的一个新的一些技术方向我们前段有家公司也是和 AMD 合作他也可以马上将模型的规模降低至少四倍
然后的话效率提升 2.5 倍相当于整个成本降低 10 倍所以有很多这种新的开源模型的出现会让大家看到在相对更短的时间之内人工智能有可能以更低的成本更低的价格进行大规模的产业应用那这个时候对于 GPU 的需求当然就会更高了所以我不觉得这是一个做空或者利空因伟达的信号这反而是说能让大家看到可能全产业人工智能带来的数字化转型
它可能时间点会更加提前会有更大的快速迭代的可能性对现在大家在这个上面建立一个联系我觉得它是一个比较简单的数字关系因为就是按照 DeepSync 的披露他们训练他们之前有一个模型叫 V3 是用了 2048 张 H800 然后那个效果就是在一些 benchmark 上的效果是超越 Lamar 的 3.1 的然后 Meta 训练 Lamar 3.1 是用了 16000 张 H100
对所以大家就会觉得这个数字很悬殊但是你刚才说的那点我觉得很重要就是你正是因为可能在它某一个性能差不多的模型上我的成本变得更便宜了我其实打开了更多的
产业的空间然后 AI 是可以渗透到更多行业的是的说到这个成本我最近看到一个段子我想求证一下我不知道这个在美国大家讨不讨论这个事就是说 Meta 有一个员工在应该是美国的一个职场社区网站叫 Team Blind 上发了一个帖子然后说就是这个 DeepSeek V3 之后 Meta 内部也有一些压力因为他们发现这个 V3 的训练费用可能比 Meta 的这个部门的很多高管的年薪还要低哈哈
我不知道实际上那边大家会讨论这些事情吗我不知道这个段子是真是假因为我也没有去关注你说的这个平台但是我觉得怎么说呢对就像我提到的刚才他们也公布了他们训练的这个价格是 500 多万但是他这个训练的价格他也没有包含比如说他前期的投入还有前期的研发就相当于是说比如说你要炒一道菜
那你到底是只算说你炒菜时加的这些原材料和包括什么加的这些调味品的成本呢还是说你要算进去你有一个厨房你要大家买这些锅碗瓢盆然后把这个菜炒出来这两个成本的计算还是不一样的所以我觉得这是第一点
第二点的话呢其实怎么说呢我觉得在成本层面上的考量确实也是人工智能模型发展方向现在可能最主要的一个话题之一那你说 Meta 会不会有压力它一定会有压力因为在整个开源生态里面一直 Lama 的架构是 Lama 整个这个结构和架构是大家公认会用的比较多的甚至说我们简单一点想经常说你要是要去
利用开源生态的这个模型去建一些应用的话大家可能会选择优先先去 copy 一下 Lama 的一个结构去做对吧所以呢现在相当于他们也希望说 Lama3 之后的话 Lama4 可以去不仅是让你成为大家开源里面关注的最好的一个开源模型之一其实 Lama 也一直是希望 Meta 也是一直希望自己的开源模型可以去匹配甚至超越闭源模型的一个表现
所以我觉得 DeepSeek 其实是帮助 Lama 探索到了一个新的一个模型结构的一个方向所以对于 Lama 来讲其实整体内部产品发展是利好的但是你说从一个大科技公司前期这么多投入有这么大的一个体量那他从品牌的公关层面角度讲可能会面临一些小小的挑战就觉得说为什么一个小的公司可能做比你这个大的公司做得更好
所以我觉得是有一个实际层面上的好处和可能另外一个不是实际的技术发展层面更多是一个大公司我们讲 perception 产品的对外的一个认知价值层面上的一个考量所以我觉得从这个角度来看的话呢对于 meta 长线也是一个好消息
只是说现在大家可能就会直接去拿它去比较因为它毕竟是做开源的生态里面唯一一家大的科技公司而且它一直以来也是希望自己可以作为开源生态领头羊的这样一个位置出现的但它这样做的目的也是为了自己去和谷歌他们这些做闭源模型的大公司科技公司进行一个区别来打出自己的一个优越性另外的话你也是鼓励更多的开发者去在开源生态层面上利用他们 Lama 的一个结构
刚才还有一点我觉得挺好的就是说 DeepSeek 说的这个 557 万美元的训练的费用其实它这个报告里写了它只算了 GPU hours 的成本它并没有算前期的研发它有些 idea 可能也是从开源社区获得的然后它也没有算这些人的工资它算的就是 GPU 的这么一个成本对对对其实开源生态里面你会发现各种各样的小模型也非常多
其实当然 Lama 的这个架构是大家会觉得说比较成熟的相对来说可以去用的我们也经常讲说很有意思一点你会发现开源生态里面有两类这种模型的架构一类的话呢是你觉得像 Lama 这种架构比较成熟的你拿来之后大概自己在上面再再加一点东西做一点翻 tuning 你就可以直接可以用了
另外一种的话呢其实相当于是有点像半成品菜可能一个不再恰当的比较就是相当于是一个预制菜还是说是一个外卖的对相当于是一个预制菜的感觉你来了之后自己还要再做剩下的 20%或 30%但是翻听之后的话呢你会发现这个模型它相对可控的部分比较大然后呢可你要见的这个应用的这个灵活度也比较大所以
开源生态里面其实可用的模型还是比较多的我们其实现在投的很多包括过去几年投的很多生成是 AI 驱动的垂直领域的人工智能模型我们没有投什么公司他需要从头自己去训练模型的基本上都是
利用开源的模型或者也会叫一些调用一些 API 然后在这个基础之上就像鸡尾酒一样在层面上再去做自己的优化做自己的 funtuning 然后用自己的一个我们叫 data library 他自己的专属的行业高质量的行业专属数据库去进行优化模型训练然后在不停的训练
不停的这个调整过程中形成一个垂直领域的应用然后这个产品再去进行销售所以它基本上的一个特点就是我刚刚提到的模型的规模都比较小都是小模型垂直领域小模型所以它的成本相对来讲也比较低
所以说实话从我们的角度来看的话很多人会讨论说 DeepSeek 它的成本降低还有模型的规模等等我们可能之前就会比较相信在未来整个行业可能会有一个大的趋势就是垂直领域小模型的发展而这个垂直领域小模型它也会让整个产业应用 AI 的成本会大规模降低接下来也想聊一下在硅谷大家对避免模型的一些观察和看法其实
其实一方面我们可以看到就是现在中国这些公司或者说在全球吧有很多这种模型的进展但另一方面其实大家更新的这个方向它还是在 OpenAI 这个 O 系列也就是 O1 O3 开启的这么一个方向上也就是推理模型其实 OpenAI 它还是一个必然的系统然后也有人猜测说 OpenAI 其实有更多更厉害的东西还没有放出来
大家是不是会高估了开源大模型和闭源模型的接近程度低估了它们之间的实际技术差距不仅是 OpenAI 包括 AnswerPack 包括 Gemini 其实现在发展速度是非常非常快的所以我觉得为什么大家现在这次会对这个消息这么兴奋的一点也是因为其实会有很多担忧会不会未来人工智能的发展包括这个基础模型的迭代的话会被这几家大的科技公司去控制
因为毕竟他们无论是从资源还有包括算力还有包括整个人才层面上是有绝对的优势的那开源生态其实是就像我提到它是对整个创新生态尤其初创企业创新生态更加有帮助更加有支持的一个生态所以 DeepSeek 这次我觉得引起这么大的关注可能跟这个整个大的环境也会相关
那现在 OpenAI 确实是一个行业的 benchmark 就像你提到的大家都会去跟他对齐说他发布的欧万怎么样啊我们的表现跟他表现如何但其实其他的公司追赶的速度也非常快像比如说 AnswerPick 其实现在在 2B 领域的发力是很强的你可能也会看到一些行业的数据包括他收入的增长还有包括他现在整个在行业的一个影响力其实你知道这个也是一个相互
成就的一个过程因为比如说 anthropic 他可以拿到更多的企业级订单也就意味着他可以拿到更多的行业的数据你要知道 openai 你也知道他的这个网络爬虫非常厉害他会去爬到很多的 public 的这些 c 端的数据去进行自己的数据训练包括现在还有很多讨论就是用合成数据嘛 synthetic data 来去训练大家的一些问题和挑战也有很多的前一段 new yorks 的也有文章在去讲谷歌也有在去讲
但是你想如果你 C 端的数据已经用的差不多了那下一步怎么样可以拿到更多样的更高质量的数据训练呢其实 B 端的数据也很关键那 Anthropic 其实在这个领域层面上它可能拿到的 B 端的数据量以及它的行业的多样性会越来越好那对于 Anthropic 它模型的发展也是一个非常大的优势那除此之外的话呢还有另外一家其实大家也讨论比较多就 XAI
XAI 是马斯克旗下的公司那 XAI 它一方面是说它本身具体的人才质量它核心的这个三神的团队确实实力都很强更重要的你也想想它可以拿到的数据资源它拿到数据资源不仅仅是说数据的高质量你想它拿到的数据的一个特点我们经常讲语言模型语言模型那可能 language model 它核心用来训练的很多数据它其实还是 2D 的
但是你想 XAI 它其实可以拿到的数据有什么特斯拉整个不仅是汽车相关的这个数据还有包括整个特斯拉工业工厂的数据这个工业工厂的数据可以升级到这个 3D 的工厂
它内部的生产调度 supply chain 供应链自动化的所有的一个数据那还有另外还有一个什么数据 SpaceX 相关的数据一来 SpaceX 有很巨大的卫星工厂自己的火箭的一个基础的一些相关的数据更重要的是还有很多卫星数据 Starlink 收集来所有的卫星数据有 2D 有 3D 所以它有海量的高质量的 3D 的产业数据这个数据可能是其他公司也很难拿到的
所以你从这个角度去想的话呢确实有很多东西我们可能不知道因为他们还没有发布但是他内部迭代的速度是非常非常惊人的包括像前一段我就不讲哪家公司了刚才我们提到的这些公司里面其中有一家他的这个其中一个创始成员跟我关系很好他说他们内部用自己做了一个人工智能编程的工具相当于人工智能写代码基本上内部现在 70% 80%的代码都用人工智能来写
所以也就导致他们的团队的效能提升的速度很快所以你可以看到他们内部其实不仅是在做模型他也在自己的模型基础之上去做各种各样的应用而这些应用他是没有推出市场让第三方去使用的他第一步做的是我做出来的应用是服务内部的进行我内部大规模的效能提升
对所以就是一方面就他们内部可能有一些进展外面不知道然后另一方面确实就是像您刚才说的 Anthopeak 最近这一年它的企业级市场的市场份额包括整个技术社区对它的认可我觉得也是在提升的它好像跟之前 OpenAI 一家独大一记绝尘的那个局面也不太一样就哪怕是这些币源的公司之间他们好像也没有之前说的差距那么悬殊了
对 是的 是的包括你看 Gemini 的发布其实 Gemini 的产品也非常好所以的话我觉得其实这几家甚至说像我一个合伙人他很有意思他会用 Gemini 会用 Cloud 也会用 XGPT 他会跟我讲说就觉得说 XGPT 在这个层面上用起来的话准确率比较高但我在写作风格上他自己也是写作能力很强
以前也做过一段 journalist 的所以他很有意思虽然是学技术的他说但是我觉得比如说 Cloud 的这个写作的水平更高就写出来感觉更好是一个更高水平的一个写作所以你会发现他各家都有自己的一个优势在这个过程中也会能看到说他背后无论是他的整个模型架构的可能说他体现出了不同优势还有包括他训练数据的一个区别性
其实包括像 XGP 现在其实还是有一个问题就是它一个准确性的问题这跟它的训练数据也是很相关的说到这个写作风格我昨天不是给你转了一个小红书的帖子吗但是我不知道你能不能看这个小红书的帖子里面的内容反正大家现在在小红书上对 DeepSick 一个比较多的讨论也是有的时候你问它一些问题它会突然给你输出非常诗意或者非常科幻文学的那种表达不同模型的输出性格现在确实也都是不太一样
对这个其实我刚才我是今天我们聊聊之前的话我才看到那个图片嘛然后我看你给我截图的几个我觉得很有意思其实我之前没有从这个角度想过而且你想想更有意思的一点是 DeepSick 它的这个过程像我们提到它是 Unsupervised Reinforcement Learning 它是无监督的这个强化学习
那所以相当于你让模型自己去进行探索自己去进行自我发现自我反思然后他这样的一个思考的过程形成的答案是这个样子的所以很有意思就像你讲的他确实也代表一种性格或者说可能不同的架构确实会让
他最后探索出来的一个沟通交流方式也不一样对比如说他回答问题的时候会说每次你输入文字时我的大脑就是这个模型的大脑会瞬间点亮一片庞大的数据星云空间我就感觉他这个表达怎么想出来的就挺有意思的对我当然还有一个非常不成熟的想法就是我其实之前因为毕竟在美国的话你想这边所有的训练数据其实大部分还是以英文主体为主
但实际上我觉得 DeepSick 作为一个中国的公司甚至说一些公司他其实在去训练的时候可能也会用中文然后英文同时去训练那你是本身是做记者你也知道其实文字语言这个东西它其实体现的是背后的一个思维逻辑甚至文化的一个不同对吧
那在这个层面上是不是可以通过不同的语言的训练数据带给模型不同的一个训练结果我觉得也是很有意思很有可能的我前段跟朋友找讨论一个话题很有意思就是说
比如说我们就从基本的数据来讲以美国为例那在美国的历史课本里他去讲美国当时的独立战争他的描述的方法和英国的教材里去讲当时美国的独立战争应该是有很大的不同的那其实是同样的一个事实但是是完全不一样的哪怕都是英文体系的一个对事件的一个描述那用不一样的这个信息去训练的这个模型那同样问一个问题说那美国独立战争当时的诱因是什么
是不是也会得到一个相对不一样的答案这还是简单的一个文化语境历史不一样的背景那如果是不一样的语言呢英文语系是一个语系中文语系是一个语系我觉得也会很有意思甚至说你想中文语系和英文语系有它自己的特点那种语言会更简洁那种语言会像你说的有诗意会有很多的这个直大的意象我觉得也是可以值得讨论当然这是我一个自己比较不成熟的想法
我觉得在后面如果我们见到更多的公司它去用不同的类型的数据去信念得到更多像你跟我发的图片里面这样不同的反馈结构说不定我们可以找到一些相关性您觉得就是 2025 年全球的这个 AI 技术升级就是模型的这个升级中有什么你期待的方向和可能的新的动向当然从最现实的角度就是跟我投资息息相关的话我当然非常关注就是更多的小模型的发生
就是垂直领域小模型模型的规模越来越小然后越来越灵活越来越激动因为
一方面是我提到的我投的很多企业都是做 2B 的那做 2B 的话一方面是垂直领域小模型它是一个从商业角度成本角度一个很明确的要求二来的话呢我是非常相信人工智能的未来有一个很大的方向叫 AI on the edge devices 就人工智能在边缘设备上的铺设和应用那现在可能大家想到的边缘设备第一反应就是我们的手机那手机它是一个有很强运算能力的边缘设备
但是我们有其他的比如说像你的话筒你戴的耳机你的台灯这些都是一个边缘设备那怎么样这样一些设备未来可以搭载人工智能模型变成一个智能的人工智能的和人去对接的一个接口
这个其实是未来发展的一个大的方向那不止我这样想其实像美国的一些大的科技公司高通啊博通啊还有包括惠普这些公司他们其实都在探索怎么样可以让自己的产品包括一些比较大规模出现在产业里面的一个边缘的设备可以有
能力去搭载人工智能模型包括我们提到的一些工厂的应用供应链制造生产的应用那工厂里面有很多的传感器那这个传感器是不是可以搭载人工智能模型但你再想那一个小小的传感器它的运算能力能有多大它的耗电量也是很有限的它能够去调度到的电量也是很有限的那你如果你在这个上面要去运行人工智能模型那前提这个人工智能模型就要
又小又好用所以我们在这个方向上很期待有新的技术和架构出来我们也有很多自己的公司在这方面的成长速度也很快我们之前有家公司它的最小的模型是做到了一个边缘 token 以下而且它的表现当时是就可以相当于在把这个模型在 RespiPi 上运行
如果说大家用过 ResperPi 就知道它的其实算力还有包括的这个能耗是非常有限的可以在上面运行一个人工智能模型它当时的表现和 GPT-4 是比较相当的这是在去年下半年的时候他们出的一个新的一个模型的技术产品所以
我觉得这个方向还是可以持续的去期待我们也希望可以有更多的技术期待可以去真的是加速人工智能在就 AI on the edge device 人工智能在边缘设备在边缘端的一个铺设这个时候就可以真正实现我们说不只是你在手机上或电脑上使用人工智能在各种各样的设备层面上都有一个智能的 AI 包括 AI 的 agent 的一个铺设
所以这个方向是我相对来说比较期待的而且现在发展的速度也比较快而且这个方向还有很重要的一个考量就是我们现在对于人工智能有一个成本之外还有另外两点比较大的担忧一个是它的延迟性你也不希望包括你可能用一些产品会发现还是有一些延迟性如果说在边缘端的话相对来说
相当于它的反馈速度会更快另外还有一个很重要一点就是数据隐私其实现在在人工智能时代确实数据隐私的担忧会越来越大那如果所有的东西到传到云端去进行处理返还的话呢这个一来中间会有一个延迟二来的话呢会有更多的耗电量还有更重要的一点的话数据隐私不一定会得到保障但如果说你所有的敏感信息比如说我跟你面对面在聊天那我们所
对话的这些内容都进入到这个话筒里但话筒当地处理当地给你反馈信息这样它在数据的安全性层面上的话保证性就会更强所以你想一些像比较敏感的金融领域啊比如说像保险啊还包括像医疗领域它可能也会更愿意在这个大天体之下去使用人工智能的技术
所以我觉得这是一个大方向另外一个的话呢其实就像 DeepSick 给大家带来的一个讨论一样那 Tension 的架构已经这么多年了很多人也没有去动它那 DeepSick 它相当于做了一个调整发现可以获得更好的结果所以我在去年一直在各种场合会讲的一点是我们才刚刚开始虽然大家现在觉得人工智能已经整个领域发展热火朝天但是在对于很多模型架构层面上我们还才刚刚开始有很多新的模型架构也在涌现出来
包括 DeepSeq 是其中的一个例子另外的话我们其实也有看到一些新的算法模型架构比如说有一个我们看到的我不能提名字但是他们的这样的一个新的架构可以让他 AI 模型在 CPU 上运行的效率比在 GPU 上更高
这个其实也是非常有意思的一个方向因为现在大家刚才不是讨论到英伟达吗大家觉得所有的人工智能都要去用 GPU 的芯片才可以去进行应用和铺设那如果出现新的算法模型它是可以在它新的架构可以在 CPU 上运行的比 GPU 上更高效的话那 CPU 的厂商它的供货量还有包括它的
整体的产业里面的影响力可能会跟以前也不太一样它不是一个简单的替代它不会形成一个替代它更多的是一个多样性所以我觉得这也是开源生态它最大的价值一点就开源生态会让我们看到更多的多样性开源生态会有更多的激发你会看到大家不只是局限在一种架构里去进行探索会有更多的信息交互互相配合互相支持
涌现很多新的架构新的算法模型同时带来更多新的产业的 AI 应用的可能性
对你刚说这三个都挺好一个是行业更小的垂直模型服务各行业还有一个是 AI 在边缘设备上的应用还有一个是架构上的更新对正好这个我觉得接下来一 part 也是想聊聊就是在模型升级之后其实最后大家肯定还是期待你带来一些应用上的变化然后目前大家比较多去做的这个推理模型它的一个很重要的意义其实就是让之前设想很久的智能体的应用 agent 的应用
它会有更多的可能性那 OpenAI 也是刚刚发了他们的一个新的应用叫 operator 这个有点像之前 Answer Peak 发的这个 computer use 这个我们接下来想聊聊就是这些模型变化可能带来的一些应用你也可以讲讲就是你们已经投的一些企业或者说你们见过的一些企业他们有些什么常识您自己用过那个 operator 或者这个 computer use 了吗
我没有用过 computer usecomputer use 好像是只有 API 吧所以我们没有用过对然后 operator 我试了一下我个人的感觉是他觉得像你说的他又多了一层他其实核心就是说他可以帮你去做事情不只是单纯的说一问一答你说我要订一个机票他会再去调用怎么样去查这个机票然后再去确认等等等等或者说你要去
做一个什么样的其他的一个指令但是我觉得从一来是说速度层面上还是比较慢的比如说他简单查询的一个东西你会发现他其实比如说你会能看到他调度比如说他是用病啊去搜索啊怎么样那个速度就很慢你就觉得自己要查一下可能两秒就搞完了他可能慢慢的挪过去像一个老太太另外其实还是有一个问题就是他会编造一些信息编编造一些数据那有些你可能能看出来有些可能看不出来
这个可能也是他早期存在的一个问题但我觉得前景还是非常美好的因为也不只是 openAI 其实现在包括大公司在 AI 上聊的比较多的就 Southforce 也一直是在推说他们未来在 AI 上面的布局等等这次其实像 Mark Benioff 在 doubles 我们也有碰到
他们也一直在聊这个事情所以我觉得它是一个大的产业发展方向那 AI agent 在各种各样行业的垂直的应用跟我刚才提到的行业应用垂直领域的这种小模型它其实是相辅相成的所以有很多好的机会但只是说我们现在可能还是要探讨一点比较清晰的认知到技术的边界就它现在
他不一定能够就比如说你在一个金融公司里面你有经理你有那个分析师你有实习生那你现在觉得 AI 只能做到哪一步呢我觉得可能就是一个非常初级的实习生的位置那可能你说他能不能做一些 analyst 的工作呢可能现在还做不到
那如果说他只能做一些基础的实习生的工作那怎么样去安排 workflow 的 integration 等等等等这可能就是现在要做应用的这些公司的一个考虑当然未来的希望是因为他这个希望 AI 可以越来越高级到后面可以做 analyst 的工作到后面甚至可以去做一些 associate 的工作这样的话从每个经理人来讲他下面可能要管十个分析师现在可能管一个分析师就可以了让这一个分析师去
应用 AI 一整的去覆盖所有的工作量现在在美国的金融公司或者投资公司里面实习生一个月的工资大概是多少我觉得可能实习生的工资的话可能从五万到十万之间吧年收入对因为我在想他这个东西你怎么去就是和目前的这个订阅费来做一个比较嘛
就是 OpenAI 的 operator 它目前只有 Pro 能用的话它的每月的订阅费就是 200 美元它还挺贵的但是最近昨天我看 Sam Altman 发了一个推特他说马上会把这个 operator 也放到 Plus 版的会员上就是 Plus 也可以用那个就便宜很多那是 20 美元对对对这个你当然也要给它一个折扣不是说折扣你要 Sam Altman 说的一些这种时间线的话可能还要稍微给它多延长一点
可能没有那么快 OK 她现在说话的这个风格已经被大家认定就是肯定是要大折的对吧是
对是但是你要知道他们现在确实也是有很大的压力因为大公司之间的竞争 OpenAI 大家可能也都比较了解他现在虽然说之前是一个领头粮的位置但是 Anthropic 也在追上再加上现在 OpenAI 大家会看到一些新闻其实他们和微软的关系也是比较敏感一方面说微软之前是说我要全部支持但是现在包括
这一段微软自己在人工智能层面上的投入还有和 opena 在一些客户层面上的竞争再加上其实其他的一些包括说开源的发展也可能会让微软再去思考到底要在 opena 上面继续投入多少的资源
所以 OpenAI 现在也是处在一个相对比较有挑战的时刻但另外一方面它确实无论是它过去这一段时间做的发布还有说它进一步的在行业的影响力确实还是在领军的位置对因为我觉得就我自己设想一下就 Operator 这个应用如果你继续放在 Pro 版就 200 美元的这个
订阅里面那我觉得可能也不能帮 OpenAI 获得很多新增的用户它有可能是本来我就买了 Pro 的人我可能会用一下对吧就从 C 端的角度那 B 端的角度因为您这边肯定接触各种企业客户是比较多的就你觉得美国的这种 B 端客户他会愿意为目前的这个功能比如说我有一个每月 200 美元的这样的支出吗可能性相对比较低因为从 B 端客户来讲的话依赖他对准确性和专业度的要求还是非常高的
所以说你有一个 generic 的一个 AI agent 说我可以帮你做各种各样的事情但是出现各种各样的无论是编造的信息或者是专业度的问题这个在企业级用户层面上他可能还是不太能接受的所以他可能更希望的是说我不需要你这个 AI agent 解决所有问题但是 specialized 就是针对的明确的这个应用场景或者说应用体验我要做到很专业很精准
那这个是不是就要去用 AI 的 operator 还是说去用一些初创企业针对这个行业和这个应用去做的产品那他们可能就要做一个比较了另外一方面像我提到像 Salesforce 的他们也一直在跟他的客户去讲他们 AIA 整层面上的布局他本身就有很多阶级客户包括 Microsoft
现在在这方面的讨论也非常多所以我觉得在 B 端市场的话 OpenAI 的 operator 不一定占优或者说可能不一定有优势 C 端的话可能一来是价格的问题二来就像你讲的它是不是能够帮助他们增加 C 端的用户数量可能还是一个疑问其实这个 operator 包括 AnswerPick 的 computer use 它很容易想到前几年火过的一个企业市场的细分赛道就是 RPA 流程自动化像这个 UiPods 这些公司就是做 RPA 的
就是你觉得这个东西它实际上的区别是什么我觉得其实实际上的区别是在于说交互的过程是怎么样的一个交互包括其实大家为什么对 XGBT 它的接受度这么高其实主要是因为你用这个产品的门槛很低
它的门槛就是说你会不会聊天如果说你会 chat 你就可以用它那 operator 也一样对吧你只要 chat 就相当于你有一个个人助理一样你每个人都会的一个非常简单的口头语言的沟通交流发布任务它就可以从这里去持续执行这个任务去进行流程的一个自动化但是传统的流程自动化的这些软件它还有一个叫什么 integration 的过程就是一个产品整合植入的过程它有一个使用的门槛
和使用的技术使用植入的一个周期所以我觉得这可能是比较根本上的一个区别其实根本上来讲你说人工智能是一个新的概念新的技术吗当然不是人工智能也存在这么久了我们甚至讲说刚才提到了很多次的 reinforcement learning
强化学习它也不是一个新的东西所以之所以现在大家会突然间觉得接触度这么高人工智能的整个推广速度会这么快我觉得还是一个交互层面上的创新让大家看到说我可以有这么简单的一个交互这么低的门槛去使用人工智能工具嗯
而它这个背后是一些技术上的变化导致的对吧就你以前用自然语言其实你做不了这些事对我不知道你们投过这个 RPA 类型的公司没有就是你会觉得说这种新的技术出现之后它对已经存在的这一类公司就是它的功能上看起来跟目前的 AI 能实现的一些功能是有重叠的但以前可能它实现的技术不一样就对这类公司来说它更多是一个利好还是说它有可能会被新的这些 AI 的公司给覆盖掉
我觉得取决于这类公司他会被自己也非常主动的去植入人工智能技术去进行自动化我们确实没有投过这类的公司因为我们其实在人工智能的布局比较早我们可能 17 年开始当时就最早从 AI in healthcare 人工智能在医疗领域的应用就会投很多公司从一些临床 clinical 的这些诊断治疗层面上的投入再到后面的话其实也有很多比如说针对医疗系统的
像医疗影像增强还有包括叫 medical coding 这些用人工智能的应用其实早年都开始布局再到企业级层面的话当时比较早像你可能听过一家公司 Other AIOTTR.AI 我们也是很早 19 年就投资了所以可能是因为我们在 AI 层面上布局比较早可能就没有投传统的流程自动化的公司因为其实人工智能在应用效率上会更高
您觉得就是像 operator 之类应用它会带来什么相关的创业的新的机会吗包括你们有看到什么类似的项目了吗垂直行业的类似于 AI agent 的应用其实已经涌现很多了不只是说现在才有可能在过去的这一年时间已经有很多公司在进行这方面的一个探索了
这是一个特别大的方向当然也要看哪些产业比较可以进行更加快速的落地这个可能是现在大家还没有探索清楚的一点就哪些产业更适合快速 AI agent 的一个落地我们也有投公司其实是做 AI agent 的一个 influence 包括 infrastructure 的一个优化怎么样帮助 AI agent 的这个落地和产业整合可以做得更加高效简单以及低成本
所以你能看到说它也不只是一个单纯应用层面上的创新你在 infrastructure 层面上也要做好准备如果是在 infrastructure 层的话就是他们做的事其实就是他相当于要服务很多这种做不同 agent 的公司对吧是的然后帮他们去和行业结合对对对就降本降低他的成本然后降低他的这个整合的流程让他更快的把应用可以打设起来
其实我觉得投这一类公司也挺有意思的因为你应该能看到就是一些 agent 的一些变化就这个平台上他能看到这种变化就是在你的提感里面在硅谷在美国什么行业对 AI 我说指科技之外的行业对 AI 这个事它的接受程度是会比较好的可能是有行业 agent 的比较大的机会的我觉得第一个就是医疗正好也是非常巧上周之前其实是旧金山的 JP Morgan Healthcare Conference
每年也是在旧金山举办的全美最大的一个医疗峰会那今年其实对 AI 的讨论就非常多因为医疗领域很大的一个特点就是它的数据的量很大数据质量又很高其实我记得我看过一个数据在美国的话呢我们其实现在所有的数据里面就人类社会相关数据里面有 30%是医疗相关的但这 30%相关的医疗数据里面现在可能只用到了 5%
所以其实你想它又不是像 C 端的数据有很多噪音数据其实医疗数据它的质量和它的价值是非常大的但是我们的应用比例又很低所以现在人工智能的应用其实是给医疗数据它无论是商业化变现以及达到我们说医疗的未来其实是医疗的个性化还有包括我们讲说是一个 cult of life 就是生命质量的一个提高
都是非常重要的一个应用的方向所以我们在这个领域看到很多对于 AI agent 的一个讨论以及垂直领域人工智能应用的一个讨论另外的话金融也是一个非常大家讨论很多的一个领域主要也是因为跟它的一个数据量还有包括就很简单我们提到的其实很多的这些金融公司它也希望进行内部的流程的一个简化
还有包括数据的一个多效的应用那还有另外两个行业一个是保险保险行业是美国一个非常大的产业其实也是因为它缺乏自动化的原因导致它现在更希望可以在人工智能的一个趋势层面上布局更多垂直的应用而且你会发现保险行业它其实它的变化就是说它的这个变数它没有像医疗领域那么多
因为无论是各种各样的保险它的其实流程相对是比较标准化的所以它再去应用垂直的这种人工智能应用甚至说 AI 整的应用的话它不需要有那么多的五花八门的应用场景它其实应用场景相对比较统一最后一个就是太空科技太空科技主要也是因为太空领域现在有大量的可能性可以去收集到海量的高质量的卫星数据
这个也是未来人工智能应用的一个方向之一所以总结一下就是有数据比较多而且这些数据质量高价值大的一些行业对有海量的高质量的数据的行业包括当然数据海量的高质量的数据所以同时产业也足够大有多样化的应用场景这个都是一个先决条件说一个题外话我前天刚去采访了王小川
就他现在在国内也是在做一个大模型的创业嘛然后他们的聚焦点就是把 AI 和医疗做结合他想去做这个 AI 医生我觉得做 AI 医生的话呢不好说但是你说是不是 AI agent 可以辅助医生这绝对是可以预见的短期的一个未来我们其实在这方面布局 AI healthcare 也投了很多年了你也知道我本身在医疗领域就比较有自己的热情所以在过去这几年能看到很多这方面的运用落地的速度是非常快的
然后就是当这个 agent 这种应用出现之后它不是一个简单的聊天对吧它涉及到更多操作其实它也涉及到更多用户的敏感信息其实刚才你也提到就是它可能会有些接下来大家对隐私的担忧对比如说如果你用这个 operator 去买个机票那它可能就涉及到你的一些 ID 的信息或者是支付登录的一些信息嗯
你知道吗你提到这个特别有意思我就是在 JP Morgan Health Care Conference 的时候呢跟很多业内的人去聊嘛当时我是碰到一个他其实是做有点是医疗保险领域的一个人去聊他跟我说了一个很有意思的数据他们呢其实比如说公司给员工提供了一个福利是你可以通过线上平台去叫叫 Mental Health 就心理健康吧就心理健康的咨询服务
如果说你有这个焦虑症啊或什么的话可以去通过现场平台要么约一个
心理医生去聊或者说和 AI 去聊就是和 AI 去分享你自己有什么样的问题等等等等可能 AI 给你一个反馈怎么样的一些解决方案他说发现大部分人会选择和 AI 去分享自己一些隐秘的信息而不是去约一个心理医生去聊这是一个非常非常有意思的现象而且他发现尤其是在年轻的人群里面这个情况更多就年轻人他会有一种
怎么说呢偏好他会觉得他更愿意和一个人工智能去分享自己的个人的信息隐私的信息当然你说这里面有没有隐私的信息的一个担忧确实有但是从人使用的角度来讲感觉他对于人工智能的这个信任值要高于对于和一个心理医生聊天的信任值或者说更愿意去打开自己
他跟我去分享这个数据的时候我也很惊讶我说哎我没有想到可能确实是年轻一代他成长的环境跟我们不一样我在想像我们成长的这一代环境可能对于我们来讲智能手机互联网这些东西是非常
非常怎么说呢自然的天然的你不会去多想那可能对于下一代成长的人来讲会不会说使用人工智能甚至说使用 AI agent 是它更自然的一种和世界交互的方式所以我觉得一定是有隐私的考量但是呢在用户行为上我觉得也会有很多的变化
刚刚说到这个代际的这种变化我也想到一个比较有意思的事就是其实现在有一类创业的方向就是给儿童做这种 AI 陪伴类的应用比如说 AI 宠物 AI 玩具所以可能现在确实有孩子他是一出生就在和 AI 聊天
那接下来想聊一下中美投资 AI 的一些差别因为我感觉你刚才讲的很多你们看好的方向它其实是有一点像这样的一个组合就是我基于一个开源的机座模型我再加上一些第三方的 infra 层面的服务
这里面也会有一些单独的创业公司的机会然后我再加上做应用层的公司这个组合它其实代表着全家桶啥都做我从模型到 infra 到应用都做的这种路径之外的另一种发展方式那后一种路径的代表就是 OpenAI
前一种路径在美国是不是还挺活跃的因为我感觉国内的投资人其实不太愿意投第一种路线里的这些每个环节上的创业公司因为大家会觉得你只做一个环节太轻了好像没有壁垒你很容易被巨头挤压
对我觉得这可能也是两边的一个区别点吧我觉得在美国这边当然你说巨头是不是很强势确实很强势但是你会发现巨头聚焦的更多的还是在偏向基础模型层层面上的一个竞争那在应用层面上的话呢很多巨头是愿意去搭造生态的就是希望说我搭建一个生态然后呢我让更多的初创企业在我这个生态平台上面去搭建各种各样多样化的一个应用
所以其实你会看到确实有存在竞争但另外一方面也有一个相对比较和谐的大的企业和初创企业的一个协同合作和战略合作所以我觉得这个可能是硅谷这个创新生态比较特别的一点再加上说实话就举一个简单的例子比如说你要做一些垂直领域的人工智能应用做一些 AI agent 比如说针对制药行业针对金融行业还有包括保险行业这些行业有一个很大的特点它先天都是高度监管的
他如果一直过去这几十年都是高监管行业那他现在要应用人工智能他会更加的谨慎你在这个层面上你说他如果和一个人工智能公司合作他势必要考虑怎么样去分享自己内部的行业数据让这家公司去给自己搭造更好的技术产品
他可能会对初创企业的信任度会更高一点或者说他会觉得初创企业更可控一点你做的这个解决方案可能是在我当地运行的我们说 runs on prime 然后同时来讲的话呢也会有更强的我对于这个数据的一个把控性如果说我这个时候要去和谷歌合作那谷歌是一个大的科技公司那他的商业模式又有一部分是说实话也是在变现他所拥有的这些用户数据那我的数据是不是就会有一些
高度的风险会被我这个合作方会去打去所以你会发现很多很有意思的你可能和技术觉得并不直接相关的点去决定了这个生态的发展也就让这些初创企业有了更多的和产业的大企业合作的机会而不是说所有的大企业都会去选择和微软合作和谷歌合作
很多现在大的企业它其实在人工智能探索层面上它的最有选择现在反而是和多家的初创的 AI 公司去进行合作包括我们最近有家公司它是做垂直领域人工智能应用针对金融的一个应用金融产品的一个应用它现在签了三个 500 强企业的公司订单基本上是到千万美金级别的这个团队只有六个人
它是一个初创企业所以其实你能够看到这边整个生态的一个多样性的所以这边有这种
就是超级个人和超级公司对吧我就是指它的人数其实非常小但它可能承载了一个比较大的商业价值对我们还有一家公司他们团队可能就 20 多个人一年收入从没有收入然后涨到了 2000 万美金的收入而且他也就第一刚开始可能就花掉了几百万美金吧融了钱根本就没有用掉一半都没有用到
所以现在我觉得一方面是说本身这个产业发展速度很快另外一方面就是我刚才提到的各大公司它也在应用人工智能的产品或者说初创企业也在也在应用人工智能的产品和技术让自己的效能提高
那到底有多少需要招聘多少工程师以前可能需要招十个人现在发现招三个人就可以了那剩下是不是可以应用一下 GitHub 的 Copilot 来写一些代码可以降低它的开发成本提加速它的开发周期其实这些对于初创企业来讲都是利好的消息你刚才说的那个只有二十多个人收入从零到两千万美元他们这个也是做 AI2B 的一个项目是吗都是 2B 我们投的所有公司都是 2B
其实这可能也是中美投资一个区别就是在硅谷的话好像 AI2B 的我是指这个公司持续的获得一些健康收入好像还是相对容易一些或者说这种公司会多一些对我觉得确实美国它有一个非常成熟的企业级销售的生态
那大的企业它是愿意在一些新的技术探索新的产品探索层面上和初创企业进行紧密的合作的那以前可能这类合作你会发现科技领域多一些那现在的话不只是科技领域反而说科技领域现在也会发现谷歌或者说微软以前愿意给一些订单现在反而发现他们可能自己做的速度会更快因为他们自己现在开发的速度也比较快那反而是非科技领域的这些大的企业现在在这方面的投入会越来越大
比如说我自己设想的一种情境这个是不是在硅谷的语境就比较难发生刚才也提到微软旗下也在做这个编程的软件就是 Gahub Copilot 编程工具对然后也有创业公司像 Cursor 对吧 2024 年下半年增长的很迅猛如果你在国内的话你可能能看到的一件事就是这个 Copilot 也许会和 OpenAI 的更多新的产品比如说 Operator 做一些结合就是它会变成一个更加整合的一个功能更全的产品
这个在国内是会发生的这个在美国是不是会
不太容易发生这种事情就它会导致 co-pilot 和 operator 它其实可以功能上做一个整合然后我可以让你在编程的自动化的程度上有更多的提升对我觉得可能还是两边的一个产品概念和市场市场情况确实不太一样你们现在就是做一些投资的话你感觉到的这种创业公司的创始人的心态氛围是怎样的就比较感性层面的
因为其实我自己感觉就是从 23 年到 24 年国内的这个 AI 创投它是经历了一个之前还是挺高涨的然后之后可能大家会觉得有一些平静会有一些徘徊啊
就是在美国它可能是一个什么情况在美国这边现在是非常热闹的我觉得就是从创投券整体是持续在加速持续在打击血经常有新的东西出来其实包括像你提到说 DeepSick 这个出现了之后被大家关注度很高但其实你如果真的看硅谷的常态的话是每个星期都有新的东西出来每个星期有新的东西出来之后大家都会兴奋一下这周是 DeepSick 下周可能是别的东西
所以从创投圈来讲的话可能幸福感比较高但是压力也比较大就是因为觉得整个竞争的环境还是很大的一个竞争的生态然后同时呢技术演变的速度可能也比大家想象的要快很多总是有新的东西那你说是不是有些社会感慨说是不是能跟上这个技术发展的节奏这也是很多投资人和企业家在讨论的一个话题但是从创业角度来讲的话现在是非常好的创业的时代
我经常开玩笑说我的这些合伙人我现在不需要去催着他们工作或者是给他们压力他每天都是一个打气血的状态我以前我是会每个星期周末都会去看很多 paper 和很多文章去看一下说新的技术发展那现在其实很多时候我也不需要自己去看了一来是我们自己 18 年做了一个人工智能的 analyst 叫 Ada 就 Ada Lovelace 很有名的 programmer 我们用她来命名的所以她会给我们总结一些好的文章我们关注的研究机构每周五发给我们
但现在说实话我出差的时候我也不需要去专门看那个邮件我的合伙人在群里面会空空发很多今天这个发的 paper 那个发的 paper 然后再做一个总结然后说要点是哪些不同点是哪些所以大家的一个信息交互的速度和密度是非常非常高的
那在这个层面上就体现在我们只是做投资我们还不是一线的做创业的企业家那做创业的企业家他的这个交互的密度和还有包括他的速度也都是非常快的所以现在硅谷如果你来的话你会感觉到如火如荼大家都是一个打鸡血的状态那在另外一方面打鸡血也意味着竞争环境的压力增加所以你说有没有竞争的压力呢一定是有竞争的压力的
可以分享一下现在硅谷的投资氛围吗核心圈还是在 San Hill 沙山路上是吗硅谷整个核心其实我们是在 University Avenue 上就是斯坦福门口的这个大学路大学路的这一圈它一直都是整个创投圈的一个核心那因为背靠斯坦福嘛它本身离 Facebook 也很近离谷歌也很近都是基本上谷歌 Facebook 英美达都是在 30 分钟之内的车程
所以这就是一个大中心再加上去年的话 New York 的那个大会出了很多新的东西今年年初 JP Morgan 马上三月份也有英伟达的 GTC 所以这边现在的各方面的讨论度都很高这边是不是在咖啡馆和餐厅里面经常就能听到周围的人在讨论 AI 我想象一下也许是这样那当然是
是的包括我其他的地方来的朋友也会说在这边其实你在任何的一个餐厅咖啡厅去聊一下旁边的人大概率不是在讨论创业就在讨论投资那现在创业投资的核心一定是围绕 AI 来展开的我觉得国内有一个相似的地方可能就是在清华大学门口的这个清华科技大厦那附近是这样的
就是他周围你去吃饭或者在咖啡馆首先是能偶遇一些创始人然后也基本上周围的桌都是在讨论 AI 最后一段是想聊一下就是在硅谷的讨论和视野之中除了 AI 大家现在关注的一些热点还有什么两个热点一个热点是我说的医疗包括其实现在有一个新的词叫 TechBioT-E-C-HBio 相当于是说科技和生命科学的一个结合
包括在 JP Morgan 层面上的话我参加了一个演讲它的主题是讲 Longevity 长寿但是现在对于长寿的定义和之前已经不一样了可能几年前大家更多的讨论是在于我们怎么样活得更长但现在的核心是在于怎么样可以提升生命的质量
这个生命的质量也就意味着说我们的探讨不再是拘泥于我们是不是要活到 150 岁 200 岁而是说如果我们就活到 100 岁是不是可以以更高的身体的这个素质健康的体魄清晰的大脑去活到 100 岁甚至 120 岁那这个势必就要求很多新的技术医疗技术上面的一个创新包括早期的诊断疾病的个性化的治疗还有包括我们从很多探讨比如说像靶向治疗免疫疗法
还有 MRA 的一些基础的应用那现在再加上人工智能的话人工智能又可以加速在医疗层面上的基础创新所以我经常讲说人工智能有点像一个催化剂它不只是催化很多产业的数字化展型它其实也会催化和加速很多其他技术的一个创新包括医疗领域技术的创新
所以现在我们看讲 tech bio 其实相对应的话呢很多的讨论是在我们叫 AI in biology 比如说 computational biologydigital biology 数字化生物学还有包括我们讲的数字化治疗数字化诊断等等这些都是一个非常大的好的方向另外一个我个人很看好包括现在也在茁壮成长的方向就是太空科技
太空科技当然大家也知道在从去年开始 SpaceX 的几次新建的一个发射未来的三年到五年不是说十年时间整个火箭发射卫星发射的成本会大幅的降低那甚至说到一定程度如果说有一天把一个人送到宇宙的成本只需要五万到十万美金把一个卫星发射到太空的成本只需要一万到两万美金那我觉得可能我们发射的数量和发射的品次都会很
很多而且我说的这几个数据不是说未来 10 年的发展可能性是未来 3 年到 5 年的可能性所以它发展速度是很快的我们从 17 年开始布局一些太空科技包括到过去这一两年布局很多人工智能驱动的太空科技的一些应用我们有家公司就是用人工智能进行交通卫星的交通管理以卫星数据的交易它的整个收入就已经冲到了 1000 万美金以上才一年的时间
所以你会发现整个市场蓬勃发展的速度是很快的当然现在大家也看到前一段特朗普在进行就职演讲的时候专门提到了在他的任期内也希望大规模的支持太空科技的一个发展所以呢这也是相当于从政府政策层面上还有包括福祉层面上加速这个产业的快速发展如果你现在去洛杉矶你会发现洛杉矶大家也知道 SpaceX 最早他的公司就在那边
那现在 SpaceX 不仅进行了很多太空领域的技术的一个探索
它还有出现了很多周围的一个小生态那边可能大有几百家太空科技公司围绕 SpaceX 展开很多可能和 SpaceX 都有一些战略层面上的合作甚至说是 SpaceX 的供应方而大部分的创业者都是 SpaceX 的前员工我们投了好几家也都是 SpaceX 前员工出来做的企业所以它形成了一个非常好的创新生态因为你们之前也投了 SpaceX 嘛因为你本来也是 SpaceX 的投资方然后它又是一个算是这个生态产业链的一个
练主的这样一个角色对吧然后你也可以发掘到他周围的这些公司对对所以是一个非常好的大时代像这个 TechBio 还有这个 SpaceTech 他们的中心还是在硅谷吗还是地理上其实是会有一些不一样的因为我看 SpaceX 不是说要搬到要搬到德州去吗对吧然后特斯拉的总部也是在德州其实你现在说如果说全美国最核心的创新中心在哪里确实还是在硅谷
因为其实这次你想整个创新大趋势的一个核心引擎发动器确实还是在人工智能我刚才无论是提到太空科技还是医疗其实我也都有提到它其中有一个很重要的点是人工智能在这两个领域的应用只是说它真的是这两个产业在做很多技术的创新所以的话呢探讨人工智能它整个创新中心确实还是在硅谷
但同时呢硅谷也不只是唯一的一个创新中心包括你看在东海安波士顿也在崛起纽约也在崛起德州的话奥斯汀也在崛起甚至说洛杉矶也在崛起所以其实确实是有更多样的一个创新生态包括我们投的企业 60%都在硅谷但 40%也在硅谷之外
所以其实它是一个更加多样的创新生态的形成但是核心确实还是在硅谷这也是为什么我们所有的我整个公司我们整个投资公司的所有的员工合伙人都是在硅谷这边最近洛杉矶大火是不是对这个太空科技的生态会有些印象 NASA 好像有个实验室也烧了
对这个确实也是非常悲伤的一个新的消息但是它并没有对那个生态情形有什么太多的影响因为很好玩的一点你会发现很多被烧的豪宅它其实处在非常好的区但其实 SpaceX 包括他们所处的那个工业区离大伙相对还是比较远的还有很多初创企业它毕竟相对是比较小而灵活的企业它并不是处在那几个核心区
很多企业也是远程工作等等其实我们没有听到说太多的这个创业公司受到这个大火的影响但是对于整个洛杉矶的城市打击还是非常巨大的包括现在山火还在继续烧还没有结束所以它只是换了一个方向又再烧起来
所以这可能就是另外一个城市构建的一个问题了在美国的话就是这个 AI 之外的一些科技投资啊它会出现那种和一些政策紧密相关的热点吗并不会我觉得其实在美国的话呢当然说可能跟十年前相比的话呢科技领域和华盛顿的互相的合作或者说协同或者说是讨论会跟十年前相比更多一点
但是在美国它所有的创新还是以私营企业和私有资本为主导的一个大的方向
政策层面上的话呢他会给一些扶植比如说他会有更多的一些政府的免费的资助像我们说一些 government funding 对吧还有包括补贴还有包括不能叫补贴了他就还是说像那个国家科技基金会他会给的一些不占股的资本还有包括的话军方会给一些订单但是整个大的科技趋势还是由民营企业和私营企业去主导的
包括你看特朗普前一段发言不还说他要开始加速审批在美国加速所有建这个电站的审批流程那他为什么会说要去审加速审批电站的审批流程是因为所有这些科技公司跟他讲我们需要电呢我们在发展人工智能电不够用啊所以要加速电站的建设还有包括他审批流程的一个高效性
就最后如果总结一下的话你刚才也讲到其实在于现在在硅谷投资科技还是很幸福的一件事情就总体来说你觉得接下来你自己比较期待的这个投资上的一些变化和你觉得可能需要去提前应对的风险会是什么
我觉得不一定是风险我觉得 2025 年会是一个充满变数的年份 2024 年其实大家经常讲说发生了很多事情有很多的不确定性那可能不确定性会变成唯一一件确定的事情无论是在创新圈还是在整个大的生态
所以我觉得 2025 年我们可能需要做好的一个准备就是怎么样去更好的应对这样一个巨大的不确定性这个不确定性包括整个我们说全球的这个政治格局的一个变革它对于整个区域经济的影响还有包括整个金融市场的可能会面临的一些黑天鹅事件带来的一些机遇和挑战还有说更加具体的我们在看到人工智能领域科技创新领域
每个星期都在有新的东西出现每个星期都在有新的架构出现然后这个过程中怎么样保证初创企业它可以去保持它的竞争性和优先性可以去利用好最新的技术发展快速的迭代快速的发展当然另外一方面的话呢虽然说我刚才提到说这边的一个生态有大企业和小初创企业的一个协同合作但是毕竟还是有一个根本上的竞争
怎么样可以保护我们这个创新生态也非常关键不要让所有的技术还有资源都垄断或者说控制在大的企业的一个手里所以这也是为什么我们作为早期投资人的话我不只是在投资技术投资初创企业家我们其实在投资他们之后我们自己建了一个网络我们也不只是一家这样做的我们这个网络里有 40 多个 500 强企业的 CTO
那我们投完企业之后就让他有最快的渠道最好的渠道可以买上把他的技术产品和这些他要去合作销售的大的企业的 CTO 进行对接可以让他更快的进行产业的验证产业的一个变现然后进入快速的商业化所以我觉得这些都是未来可能初创企业需要更多支持的地方也是我们可以做到对他们更多的不只是投资层面上
资金层面上的支持还有包括它商业化的一个大规模的一个支持所以 2025 年会是一个非常激动的年份我会特别期待今年能看到一些更加新的东西和更加一些有意思的新的创新趋势好的那非常感谢今天张璐做客晚点聊谢谢她的分享我们下期再见好的谢谢
下期再见