We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

S3E93｜ChatGPT替代谷歌搜索？不，是降维打击｜AIGC特辑

2022/12/16

硅谷101

AI Deep Dive AI Chapters Transcript

People

余

余家辉

泓

泓君

陶

陶芳波

Topics

余家辉认为ChatGPT在Linux模拟、角色扮演、创造性和实用性方面表现出色，并对长对话和上下文理解能力的提升进行了分析。他详细解释了人工标注和强化学习在提升模型性能方面的作用，并指出了ChatGPT中庸的回答是模型刻意为之的结果。陶芳波则从AI从业者的角度对ChatGPT的惊艳表现给予高度评价，认为其通用性强，能够解决广泛的问题，并以规范的方式生成和迭代代码，具有成为未来数字世界基础设施的潜力。他深入分析了人工标注在强化学习中的作用，以及如何通过奖励模型引导模型输出符合预期的答案。泓君作为主持人，引导嘉宾就ChatGPT与GPT-3、Siri等其他模型的差异，以及ChatGPT对程序员、谷歌搜索引擎等的影响进行了深入探讨，并对ChatGPT的未来发展趋势进行了展望。

Deep Dive

Chapters

Initial reactions from AI researchers to ChatGPT, highlighting its surprising capabilities and advancements over GPT-3. Discussion includes its ability to generate and improve code, and the implications for programmers.

ChatGPT's performance surprised even seasoned AI experts.
Key improvements over GPT-3 include a refined feedback function and human labeling.
ChatGPT demonstrates enhanced abilities in complex conversations, creative tasks, and code generation.

Shownotes Transcript

欢迎收听硅谷 101，这是一档分享当下最新鲜的技术知识与思想的科技博客。我是红军，这期我们继续来 AIGC 特辑的第四期。前三集的话题其实我们主要还是集中在 A I 生成图片。最近关注这个领域的小伙伴应该都注意到了， OpenAI 放出了一个新的聊天机器人，叫做 ChatGPT。

网上也流传着各种各样 GPT 的对话。比如说可以让他去帮你写小说，或者算加减乘除，又或者是写代码，写智能合约。那我看还有人去用 ChatGPT 来纠正英文语法。比如说最近我自己在做播客的时候， ChatGPT 已经开始帮我去写修 notes 了。比如说之前我做的一期节目需要解释一下一个比特币的信托产品 gbt c ChatGPT 很好的帮我回答了这个问。所以我当时是觉得，他的回答会比谷歌更快速，更完整。网上其实现在也有这样一种观点，就是说 ChatGPT 它会不会替代谷歌搜索，我们也会详细的讨论一下。那这期我们也请到了两位可以说是行业顶级的研究员来跟我们分享，欢迎 A I 研究员余家辉。 Hello 家辉你好。

hello 主持人好，听众朋友们好。

家辉算是硅谷在这个领域非常核心的研究者，他今天的观点仅代表个人，不代表公司。还有一位是星矢宇宙 mad words 的创始人陶芳波。方波在创业之前是 facebook research 的高级研究科学家。

Hello 方波你好， hello 主持人好，大家好。

两位家辉跟方波你们有一直在做 A I 方向的前沿研究，看到 ChatGPT 你们的第一感觉是怎么样的？你觉得是经验还是没有想象中好？

我第一次看到 ChatGPT 是某天早上收到一个 email O N I 推送过来说 release 了这个 ChatGPT。一开始没有特别惊讶，因为 O N I 在语言生成模型上已经耕耘了很多年。往 dialog 的方案上做，我觉得也是一个非常 matured 的这种步骤。因为这个之后，后面逐渐的才看到说一些数学 media 上他们的一些结果，一些对话。才开始意识到整个 ChatGPT 的给人的感觉还是非常不一样。

我印象比较深刻的一些例子是说，一个是还能做一些 linux 的 simulation，可以告诉他你现在是一个 linux system。我现在告诉你一条指令，你可以给我秀一些 linux 应该有的结果，然后他也能做这种事情。另外的一些方面包括长的对话，包括 characteristic ChatGPT 这个模型本身它有一些有点像角色扮演，就是你可以通过这种去告诉他应该扮演什么样的角色，他的回答也是比较 respect 你的输入。另外还有一些比如说他更加的 creative 一些，在我们看到的一些例子上来，最后还有更 useful 一些。

方波的印象是怎么样的？

我的印象对 chat P T 的感受和很多可能对于 A I 没有那么了解的人其实是一样的。我觉得 ChatGPT 这次的表现对于哪怕是在 A I 做了超过十年的人而言，也是非常惊艳的。大模型的能力，它的通用性大家都很了解，尤其是两年前 GPT three 出来之后。他今天把它调制到一个真正可以解决非常广泛的问题，而且是以一种非常规范的方式来解决。同时除了解决自然语言的问题，还可以生成代码，并且是迭代式的去改造自我的代码。这样的方式将来 ChatGPT 可能成为数字世界的一个通用的接口。让人可以通过它来改造数字世界，来使用数字世界。这个是我看到的一个巨大的成为未来的基础设施的一个潜力。所以我觉得它的出现进一步的拓宽了大家对于大模型能做到的一个能力的边界和对它在商业上的一个想象力。这个我比较兴奋的一个点。

我觉得刚刚你提到的它能够生成代码，还有改善代码这块儿，待会儿后面我们还会详细的聊。其实我也挺关心，比如说像 ChatGPT，它到底会不会让程序员失业的。而且它的 GPT 不仅仅是它，包括谷歌的阿尔法 code，它也是表现的很惊艳。待会儿我们可以详细聊。

在此之前其实我有一个问题，大概在两年多以前， GPT3 刚刚出来的时候，我们的播客专门聊了一期关于 GPT3。当时他的表现其实是续写的能力。就比如说给他一个新闻的前面一段话，让他把一篇新闻续写完，他会去写的非常像人类写的一篇小作文。我们很难去判断这个是机器写的还是人写的那这次 ChatGPT 它跟 GPT3 它的技术上的一些提高跟区别在哪里？我有问他一些稍微刁钻一点的问题，他给我的回答我感觉都非常的中庸。这种中庸指的是正面一点点，反面一点点，非常像一个八股文。或者说他的很多文章，如果从我们写文章的人来看，就非常像一种官宣的文章，或者有一点马屁文章这样的感觉。所以还是想从技术上知道它跟 GPT3 的区别到底在哪里。

我觉得官宣的文章它也是一种能力，对吧？其实他们做了一些这种人工标注，我才可能在做的过程中也会筛选出那些不要过于极端化的，然后不要过于 aggressive 的这种味道。等那些消失掉之后，所以给你的一个主观的感觉是说，好像很中庸，然后好像没有什么鲜明的观点在他的 response 里面。我觉得可能他也是一种相当于人想让他成为这样一个方式。

就是人有对他调教过。

对，刚才都问到的问题是说技术上有哪些提高和区别，对吧？对，就 chat G P 它本身还是基于 GPT3，或者是更是不是有一个 GPT3.5 这样的一个模型。 3.5 的话我的理解是说跟原来的 GPT3 的那个相当于那个配是用了一些新的数据，这个应该是从 O N I 的 blog 上有说是 2022年年初的时候 finish training，在 GPT3点5分的这基础上再去做了一些主人公的标注调教和这种所谓的叫做 I O H F，就是 reinforce learning。当这种 human feedback k 的方式使得这个模型能更加的输出，就是说人想要的，就是人想看到的这种答案。而不是说简单的去 follow 一些 pattern，或者说简单的像这种互联网上没有筛选过的这种文字一样。

所以我觉得他中庸的那一部分，其实是模型故意这样调的。然后他想让我看到这样的一个答案。

我觉得跟你问的问题也有关系。你特别想知道他的某些观点，他反而就不想告诉你了。我所看到的绝大多数问题，他的回答的结果都还是不错，比较 surprising。比如说像是当你问的对话的 motto m 当它变长的时候，他还是能去比较好的理解到前面说了什么，前面有什么样的 context。这些我觉得在一定程度上是比较新的能看到的一些能力。

什么叫人工标注？能跟大家解释一下吗？

我简单补充一下家辉的观点，家辉刚才提到一个概念叫 reinforcement learning with human feedback。我觉得你说的那一点是对的。我觉得他的中庸，包括他不愿意去表达观点是刻意为之。因为 ChatGPT 跟 GPT3 包括 GPT3.5有一个很大的不同，就是他尝试把强化学习引入其中。强化学习本质上是要有一个反馈函数的，在这个反馈函数的制定当中，它加入了很多 OpenAI。对于一个聊天任务型机器人，它应该具有的一些特点。比方说它应该很安全，他的表达应该比较标准，不要太跳脱，不要去随意的评论别的观点。

我认为他在设计这个 reward model 的时候，就已经把这样的一些 buyers，一些偏执能够嵌入到其中了。所以这个就是你刚才提的人工标注。因为我们以前在说大模型的训练的时候，往往说的是用微调的方法， fine tune 方法，用新的大模型的文本数据去让这个大模型学会新的说法。而他是相当于构造了一个类似于判定的老师，这个老师他的判定是有一些标准的。然后他不断的去告诉那个老师，不断的跟他去来调整自己的行为模式，说话的方式，使得他最终能够符合这个老师的标准。这我觉得是一个比较有意思的创新。然后使得他目前的表现，无论从内容的扎实度，回答的有效性，还有整个像你说的说话的方式比较中庸，都会受到 reward model 的影响。这就是人工标注的一种全新的使用方式。这是给很多做大模型训练的人打开了一个新的空间和一个新的可能性。

这个人工标注是不是指比如说我来问他一些问题，然后当大家回答的时候，你来告诉他哪一种回答是最好的。

它有两种标注方法。第一种标注方法是直接让真人去写答案，然后直接喂给他，让他去学会说当这样的问题的时候，真人应该怎么来回答。这个有点像是中国的那种填鸭式教育，就是让你去背，背的过程当中让你学会怎么去回答问题。另外一种就是你刚才提到的，我去训练一个判断的模型。判断的模型会说你给我这三个答案里面，哪一个答案是我最想要的。然后把这个模型训练好了之后， ChatGPT 就可以不断地产生新的答案。针对不同的问题，然后这个判断的模型会不断的给他反馈，说我到底想要哪个答案。他最后不断的调整自己，使得他适合最终他想要展现的那种判断的方法。

我觉得训练 A I 的方法还挺有意思的，跟训练小朋友也是有一点点像的。方波我们之前有聊到，他之前在大概三月份的时候发了一个 GPT3 之后发了一个 InstructGPT 的一个论文。

ChatGPT 就像家辉刚才讲的，因为它背后还是基于 GPT 来训练的，尤其是基于 GPT3.5 来训练的。 GPT3.5 你可以理解为是比 GPT3。又加入了代码的能力。所以他会用所有的互联网上的文本数据，加上他找到的所有的代码的数据，一块来训练它。所以它本身的这个模型里面已经拥有了几乎全部的常识。就是所有的大模型，首先它训练好之后就已经拥有常识了。而 ChatGPT 包括 InstructGPT 我的是说我到底怎样构造一种理解的方式，让 chatbot 可以更好的去使用这些常识，理解这些常识，然后真的能变成服务到用户。但它的这个训练，哪怕它的微调的部分数据量很少，也不影响它背后的知识。

这是无穷大的。你可以理解为 InstructGPT 相当于提供一种方法，比较确定是这种方法是被用到了。刚才方波也提到相当于三步走，就第一步是生成性的去做一些标注，比如说给你一些问题，然后人工去给一些答案。第二步，就是这种判别式的给一些标注。就是说现在我机器或者说这个大模型给你一些答案，然后人来判断哪个好哪个差，整个方法应该是不变。但是这具体上对于每一个步骤，比如说做生成性的这种标注，大概有了多少人工人力，多少的数据量，这个其实都还不知道。

相比之下，最后用来做人工标注的部分，比起他一开始的训练数据肯定是少得多的。因为一开始的数据是非标注的，它可以拿互联网上所有的数据，你可以理解为几十亿的人类在过去几十年积累的文本数据来训练它。而他自己在 ChatGPT 公开的一个介绍里面会说，他大概用了一个 40人左右的标注团队来完成对他的数据的达标和微调。所以 40个人的数据相比于整个人类社会的互联网数据再多，也只是九牛一毛而已。这个是比较有意思的一个点，就是在不成比例的数据情况下，还是可以给他带来很大的性能上的变化。我觉得这个是 ChatGPT 这次给我们展示的一个很有意思的地方。

我接下来问一个特别小白的问题。我觉得可能不是很了解聊天机器人的人会关心 ChatGPT 跟苹果的 siri 有什么不一样。

从我的角度来讲， ChatGPT 的优势是在于它有一个无线的开放域，它可以在一种通用的描述下去完成通用的任务。这个是它相比于传统的聊天机器人，比方说 C I 比方说我们知道的 alexa 甚至包括天猫精灵这样的工作的一个特点。原因是因为它背后的这个大模型在做的足够大之后，它就具有了某种叫 in context learning，就是一种通用性的解决问题的能力了。并且可以使用底下的整个通用的互联网的常识来解决。

传统的聊天机器人因为已经存在很久了，它并不是一个新的概念。它们往往有几个特点，就是它首先是垂直的，它可能只能解决一个行业的问题。第二，他可能需要为一个行业特定的问题去做专门的训练。比方说我需要去先训练一个分类模型来理解一个用户这句话的意图，然后再把它导到一个合适的处理模块里面。所以它的整个部署的成本和它的使用的通用性会比 ChatGPT 这种要少很多。

但是它也有它的优势，就是今天 ChatGPT 你虽然你看到了，比如说你刚才提到了一个他比较中庸目前的一个小缺点，但其实他还有一些更大的缺点。我们也发现由于它依赖的是背后的常识，而没有办法使用真正的公开的数据去验证它的正确性。所以有的时候会经常说一些错误的事实。比方说如果你问他为什么 C P U 会比 G P U 更快，更有利于去做 A I 的推理？他会说是的，我认为 C P U 会比 G P U 更快。因为什么什么？就是它会顺着你的话说，然后编造一个他觉得合理的逻辑，但事实上这个事实本身就是错误的，所以他会出现一些这样的问题，他没有办法把外部的信息融合进来。同时他今天可能也没有办法把外部的技能给融合起来。

因为聊天机器人本质并不完全只是为了对话，而是希望通过对话来完成某种服务。这个过程当中他可能需要可以更好的去融入外部的信息来做，这个是聊天机器人做的比较好的。所以我其实看到的一个趋势是可以把这两个东西未来结合的更好一些。既能够有这种开放域的通用问题的处理能力的同时，又可以对这种事实性的或者专业技能型的东西有更好的融入。

我觉得方波的总结是非常到位的。 Summary 一下，第一是 ChatGPT，它是基于大语言模型的。然后苹果 S I R I 或者其他聊天机器人，可能绝大多数上还是基于这种 search based 这种 rule based。这里也不好说谁好谁坏，因为有很大的 effort 是在说，是不是用这种大的语言模型来替代这种聊天机器人，或者说作为里面的一个相当于 backbone 的这种角色。在这里要解决的问题也是像方波所提到的，是不是足够的准确，是不是尊重。

其实是有能够看到这些例子。 ChatGPT release 之后可能就不到 1到2天，就一个叫 plexi A I 的这么一个。其实 ChatGPT 加上微软的 beam search，它能做的一个事情就是它能 provide 一些 seat，就相当于你所得到的结论有迹可循。这样子其实是作为聊天机器人，或者说真正的去商业化这些 chatbot 的时候必不可少的一些能力。

官方博你还提到了一个觉得就是像 GPT3.5 跟 ChatGPT 他们都有生成代码，包括改善代码的能力。我看见最近就不仅仅是 ChatGPT，其实还有谷歌的阿尔法。它是连续登上了最好的两本科学杂志。一本是科学杂志，一本是自然杂志。

像阿尔法扣的，它已经在一个国际的编程大赛中大概是达到了 1238分。这个意味着什么呢？就是说他在人类的参与者中排名有占到 54.3%就相当于他是一个人类中等偏上的一个程序员的水平了。自然杂志就更直接了，用的标题就是说未来像 ChatGPT 跟阿尔法 code，他们会不会取代程序员。你们怎么看这个问题？你觉得他会取代程序员吗？

首先可能一个 quickly 的 answer，我觉得取代程序员现在来看还是有点早。这个原因是什么呢？就是我能想象的这种不管是 ChatGPT 或者说像是阿尔法 code，很多时候它能帮已有的程序员去优化一些现有的步骤。比如说我们平时写 code 也是说有人写，也有人看看他写的到底是不是对。那有可能在这个过程，比如说像阿尔法 code 或者说 GPT3.5，它能写一部分的 code，然后人可以来做 review，这种是可以，但这个并不意味着说它能取代程序员。如果是说完全取代程序员，他自己在那边跑，自己在那边看我觉得这个可能会带来在一些比如说整个 system 是不是足够鲁棒，是不是会出现一些 bug.

是不是会把整个 system 斜挎，是吗？

对，斜挎那些瘫痪的时候，其实你也不知道怎么处理 bug。因为目前还没有看到说还能很专业的去找一个问题去 debug。最后他如果还是人来 debug 的话，你可能一下子也找不到他写的 code 里面哪里有问题。

你觉得比如说它取代一个初级一点的程序员，他把代码都写好，然后你大概 review 一遍就可以放上去了。假设一天，比如说以前解决一个问题，现在一天因为有了 ChatGPT 跟阿尔法 code 的帮助，一天可以解决十个问题。

我觉得这个也比较难，原因是在整个 engineering 里面，其实它写 code 并不是简简单单写一些代码片段，更多的是整个 system 怎么去 design。目前来看，其实是还没有看到这种大规模程序去的这种能力。对于你刚才说的能不能取代这种初级程序员，我的看法也是这样子。就是说任何一个程序员他都是通过初级慢慢开始去去那个，所以他一定会有这样一个过程。就是说初级程序员还是需要自己去写一些 code，自己去理解，然后同时也去做一些 review。可以是说 review 一些机器写的 code，也可以 review 一些人写的 code，相当于还是一个学习的一个过程。

对我说一个比较有意思的事情，就是 ChatGPT 出来大概十天的时间，我是对他还是比较乐观的。但是我同意家辉讲的，就是对于真正的复杂的系统架构的设计，包括整个代码结构的一些些设计。可能这个在真人，无论是初级程序员还是高级程序员，对于他的理解能力都还是会比 ChatGPT 更强的。但其实我已经可以看到 ChatGPT 可以提升效率的一点了。所以从 12月开始，我们公司已经在推行一个 engineering 去探索一下 ChatGPT 到底怎么样能够引入到我们的整个开发流程当中。然后来看看它到底在哪些功能的模块，哪些 pipeline 的环节可以来提升我们对于开发的效率。

我觉得因为 ChatGPT 它的代码训练有很大的一个原因是来自于跟比方说 stack overflow 这样的一些代码问答的网站的数据来进行训练的。所以我们会发现他做简单的任务其实做的还蛮好。包括一种新的语言里面某个库应该怎么去使用。那以前我们可能要查很多 post 才可以总结出来，它可以直接根据你的大概的需求直接帮你写好。这个方面我觉得肯定是可以提效的。但是如果最后所有的程序员都依赖于现在这个版本的 ChatGPT 去做，他对于系统的稳定性和鲁棒性还是。

有很大的挑战。我看到之前像 ChatGPT 的母公司 OpenAI，因为微软有给他们投资，所以他们跟微软有合作一个编程的项目 copilot。我是看见有人他去起诉 OpenAI，大概他的程序可能是超了 github 上的一些，就比如说开源的程序库或者什么，我不知道会不会有这种代码版权不明的问题。因为我们前几期其实去聊这个生成式 AI 在图片方面的表现的时候，有很多的艺术家他们其实是不太敢用生成式 A I 生成的图片的，主要是担心有一个版权风险。那我不知道比如说像 ChatGPT 跟包括。像阿尔法 code 的，他们来商用的时候，跟一些开源社区，包括一些有 license 的版权是不是会有冲突或者有抄袭嫌疑？

这个蛮有意思的。因为最近还有一个新闻，就是 ChatGPT 出来了之后，首先 stack overflow 直接就把它给禁掉了，防止让 T 来污染它的整个代码库。我觉得可能未来也会涉及到类似的情况。就是是否希望它的整个上面积累下来的这些代码的资产，可以让这样的大模型去理解和使用。因为确实有可能会存在一些版权和知识产权的问题。但回过头来讲，我觉得程序员的知识产权的保护一直都没有艺术家或者其他的那些专家会更加严谨或者更加的规范。

其实我们在日常当中去在 over floor 上抄别人的代码，也不能叫抄了。借鉴别人的使用的方法，然后使用到我们的系统里面，这种现象还是比较常见的。所以如果他做的都是到这个程度，我个人觉得还好。除非他真的是对于给 hub 上的整个项目进行大段的抄袭，这样的话可能会有一些风险。

你刚刚说 step over flow 把它禁掉了。什么叫禁掉？

Stack overflow 是这样，因为他发现 ChatGPT 对于代码的回答很大程度上是来自于 stack overflow 的数据。它是全世界最大的一个代码问答的网站。然后他发现会有人在 stack overflow 上再去做一个 ChatGPT 的插件。

相当于当有一个人来问了一个代码的问题，他直接让 ChatGPT 来回答。但是这个回答因为不是由人来回答的，所以平台并没有办法确保他这个系统一定是正确的，它对它的正确性无法验证。同时他又会觉得你只是拿了我原来的一些解答的思路来做了一定的整理。本质上你并没有为这个平台带来新的信息。所以你就在用 A I 生成的代码来污染我的这个社区，有可能会造成整个社区内容质量的下降。所以他就把这些插件，用 s ChatGPT 来完成代码回答的插件给禁掉了。

是禁掉插件。

对对对，这其实是有两块了，一块是说是不是可以 post 的内容到这个 stack of flow。另外一块就是说 open a 还能不能用 stack of flow 的一些数据去听他的这个模型。现在来看是前面那一则应该是被禁掉，后面这个还不知道。其实后面是不是能用它的数据才是更加的关系与产权。但这个东西跟整个 term of use 这些都有关系。

我觉得整个大模型，包括像这种斜扣的，到现在其实会有一些这种产权的问题，也是一个一边发展，一边就是模型发展，他确实能做好这些事情了，才会有这个问题。如果你做不好，反正 nobody cares，对吧？等他开始做好的时候，这些相关的知识产权的拥有者会去重新思考。可以是不是有可能存在这种双方都能获利的一种情况。或者说是不是有这种产权侵犯，导致某一些领域或者某一些商业的场景会被覆盖掉，或者说会被占用掉。从我自己的角度上来看，还是谨慎乐观再看这个整个会怎么样发展。 Hopefully 就是说大家能 figure out 一个最终的出路。

现在是不是相当于 OpenAI 并没有公布他们的训练数据是从哪里来的？他有没有用 stack overflow 的数据大家是不知道的。

Open I 的有些文章里面会有提到它整体上这个数据是怎么爬过来的。因为这个东西如果要展开讲，本身自己就可以成为一个非常重要的一个技术细节了。所以基本上我们看到的情况还是缺少很多细节，不确定有一些数据到底有没有用。这里可能比较明确的是这种跟 personal identification 相关的这些数据是被 remove，就是说他能 review。比如说今天，比如说我是家辉，然后我做了什么事情，那这种数据是会被这个 open I 给 filter 掉。其他的话没有一个特别的细节的这种阐述具体是怎么做。

所以大家并不知道他的数据是哪里来的。

你可以广义的理解为它是互联网上你能看到的，没有被显示的变掉的这种数据。他其实看到的是互联网的这个数据。因为比较有意思的是，他们还有一个叫做 web GPT，那个东西是他可以去在线的去浏览一些互联网。大概做法就是生成一些语言，生成一些语言导致的全景商硬伤，搜索到一些网页，还可以选择性的点进去，把这个文字再弹下来，再放到这个语言模型里面，再去做一个 response。就相当于也是另外一个 GPT，可能 3或者 3.5 的一个 violent。

这个 web GPT 它有开放吗？它是一个发布的产品，还是一个什么内部使用的？

它是有一个 blog post，然后有一个技术细节的 application 是有处分。

我的预测是他应该很快就会把 web GPT 和 ChatGPT 的两个技术融合到一起。如果他 ChatGPT 的目标是为了更好的解决人们的任务需求的话，他用外部的信息来 validate 来做强化，其实是非常合理的路线。所以到那个时候可能你就会发现 ChatGPT 在事实性的任务的回答上，或者是对于更实时的任务的回答上都会表现的比现在要好很多。

我们刚刚其实有聊到 ChatGPT 最近非常的火爆。其实不仅仅只是 ChatGPT，包括我们之前聊到的 AIGC，包括 OpenAI 的大2。我很好奇这一轮整个 A I 大模型它的浪潮是怎么样发展起来的。因为家辉我知道你也在做这方面的研究，比如说最开始是你是怎么注意到这个浪潮的，它为什么现在生成式 A I 突然火起来了。

这个是一个很好的问题了当你讲是浪潮的话，好像是一下子起来的感觉。那其实前面有不少的这种铺垫，整个互联网它首先就是一个很好的铺垫。你互联网上有这样大量的数据，因为也有越来越多的这种 user generate 的数据。比如说像这种 social media，像这种 reddit 这种论坛之类的，大家都开始 post 自己的一些观点。在大语言模型下面，它其实都是他所相当于养料，就是说他能拿这些数据做训练，所以数据我觉得是一个几十年来一直在积累的一个东西。第二就是计算，计算是 G P U，包括这边 T P U，这些计算其实也是必不可少的部分。

比较有意思的是大家有一些研究就是说对这些模型训练，让他去把模型变大，它的各方面的能力会怎么样？这里有一个有意思的 behavior 就是 emerging capabilities。很多时候我们看到的机器学习的任务，都说这模型在小规模上就已经能处理，比如说 80% 的 task，然后把这个模型变大一点，计算资源更多一点，发现能比如说处理到 85% 的准确率。 Emerging capability 意思是说这个模型它开始不能处理，这个 task 就很差很差。比如说 2% success visual。然后当这个模型大到一定程度的时候，突然它具备了这种能力。 Success ratio 是指数级的上升的。

在某个特定的模型大小下面有了这个之后，大家就开始尝试去 scale。刚好计算资源也在那里，计算资源在这个时间点上已经足过去 support 这种几百 billion size 的大语言模型的这种训练和 serving。这个是我觉得第二点也是必不可少的。

第三个是说 neo architecture，比较火的是说 transformer 的这一类 architecture。那就 transformer 之前也有不少的这种积累，比如说像 residual network，像每一些 capture 上的积累，也使得到目前为止这样的 transformer 这种 architecture 非常方便，非常容易去 skill。它没有特别严重的优化的问题，它没有特别严重的 skilling 的问题。有了这种 a new architecture 之后，我们才能看到它的模型具备这样。

其实我觉得家辉讲的很好了，包括 transformer 的架构的价值和整个模型做大到一定程度的涌现出来的一些可以解决通用问题的能力。基本上就是大模型本身它发展的背后的几个技术基础。我稍微再加两点蛮有意思的。第一个是因为我们自己是做脑启发 A I 的一家公司，我们会经常去结合脑科学来看 A I 的一些技术。然后你就会发现 transformer 它的结构和人脑里面的整个就 near cortex 叫新皮层的这些六层的神经元之间的结构是有一定的相似度的。而且这种结构本质上具有一个通用性，就像今天传 former 既可以用来处理视觉的数据，也可以用来处理文本的或者其他模态的数据。我们人脑里面的新皮层的部分也是不同的。脑区的新皮层本质上它的结构是没有区别的，只是在任务上做了分块而已。所以这个是一个很有意思的，就是我们找到了一个类似于人脑心皮层那样的一个通用的 neural architecture 来处理，以承载不同的任务类型。

第二个是我觉得这里也要非常肯定， OpenAI 这个组织在生成是大模型这件事情上的一个贡献。因为我觉得没有 OpenAI 就不会有现在的 generative A I。他通过高毅也好，通过 GPT three 也好，本质上它背后有它非常强的把技术能够通过一套很好的工程的体系去实施出来，或者说是能够交付出来的能力在背后。所以 OpenAI 我觉得他和其他的公司，和其他的学术的组织最大的区别就是它非常注重 engineering。包括 ChatGPT 这件事情，他也知道怎么样去控制数据的质量，怎么样去把每一个环节做到非常好。再用一种大家发现了科学上的方法，通过工程师的放大的效应，放大的杠杆，把它的效果做到极致。所以这个我觉得是它独特的一个价值。所以 ChatGPT 今天出来了之后，我其实是会怀疑就是另外一家公司有没有可能像他那样可以更快的把这件事情给做出来。因为他背后并完全是一个科学和技术上的路线而已，而是有很多背后的工程的 excEllence 在背后来支撑他。

你指的另一家公司是谁？是 deep mind 吗？

有很多，包括 facebook，包括 google，包括 deep mind，包括。国内的阿里、腾讯，因为大模型本身目前来看还是大玩家的一个角力场。这些大玩家肯定每一家都希望有自己的一整套世界领先的大模型的架构。它背后如果没有一套很强的工程能力在，只是靠大力出奇迹，我觉得也是不一定能达到这样的效果。

因为之前在分享 GPT3 的时候就说了，最开始 GPT3 证明了堆足够多的数据与算力的话，我们就可以大力出奇迹。那现在你是觉得并不是比如说像谷歌或者 meta 或者阿里或者腾讯去做了就可以大力出奇迹，而是还有一些技巧在里面的。我在想它的核心竞争力是什么呢？

对我是认同这一点的。我一直在看一个事情，就是谷歌他推自己的 lambda。 Lambda 本也不只是今年才出来的，它之前已经有好几年一直在做这个事情。他的目标我觉得和 ChatGPT 是类似的。就是谷歌可能也从某种程度上希望自我迭代，把它的搜索能力借由这样的大模型来提升。但是从公开出来的信息和他的使用的样例来看，其实 ChatGPT 的在对大模型的使用上比 lambda 是要强的。它背后大家的路线其实还是比较类似的，所以还是有一个整个 engineering excEllence 在里面。

Lambda 现在应该是没有开源的对吧？

对，没有开放。

对，准确的说应该是没有开放。我记得之前谷歌在 google I O 上它是有展示，就是用 lambda 去订餐。然后对面其实是一个人工智能的助手接起来的。但是他的模拟场景就非常像一个真实的人，你可以点餐，可以说你要什么，他可以给你 share。这只是一个 demo 的场景，它并没有真实的发生。

对我理解是这样的。但是 lambda 做了其他的事情，是真的把外部的信息接入的。所以 lambda 的使用的过程当中，根据他的文章里面的描述，他是可以在互联网上拿实时的信息来帮助他提升他的回答质量。这点可能 ChatGPT 没做好。

对，因为谷歌它毕竟还是有一个搜索的入口的。如果说谷歌来做这件事情的话，你会觉得它比 OpenAI 更有优势吗？

我的观点是这样的， OpenAI 今天想要完全去替代掉谷歌，作为世界上最大的搜索引擎，它的成熟度还有很大的差距。因为搜索这件事情对产品的成熟度要求很高。但是比方说它更多模态的搜索的内容，这些事情只有谷歌能做。

ChatGPT 还是一个对话引擎，它做不了。但是我认为他在通过对于大模型的使用和他的回答的整个调优上面，目前来看我觉得 ChatGPT 是有优势的。而且这种优势并不是简单的 follow 他的方法就可以做到的。因为佳慧也说了，他并没有公开他的细节。我是严重怀疑他背后有很多很多的 engineering 的一些 trick 在里面，才使得他的效果可以使用的那么好。那这件事情如果他的优势是可以保持的时间足够长，也许他再加上 web GPT 的能力，他再把一些多模态的信息整合进到他的回答里面，可能他会在更大程度上去代替谷歌能做到的事情。直到有一天我们觉得也许他们真的是可以对比，甚至是真的在使用的时候会值得选择的一个东西。

对，这里补充一点，我讲到了除了数据和算力之外，其他还有一个 engineering 的 excise 在里面。这个东西我觉得可以展开来讲一讲。就是说对于 OpenAI 来讲，首先它有一定时间的积累。最早 open I 其实是做 learning 做了很多的，他们有 robot sting，但后面就解散了。现在您又能看到在大语言模型里面，他们又重新把这个 reinforce learning 用起来。这些时间和这些经验的积累，我觉得是一些其他的公司都还比较缺少的这是一块。然后第二需要一个人才积累，他这个人不是说完全是 financial support 到了人就会来，他还是有一个是不是有足够好的 leadership，是不是这些人以前就能做一些，有没有一个 check record success，这个我觉得也是必不可少的。如果你说现在我们有了这个数据，有了这个算力，刚成立起来做一个 team，其实很难去吸引到这样的人才的。

还有一块就是有点像是组织逻辑的积累。我注意到一个有意思的事情是，他们这个 ChatGPT 或者之前的 InstructGPT open add book 上 specific 提到了他们的一个 team，叫做 lime team。怎么样能把大语言的模型更好 align 到 user 想要的输出上。这个我觉得是一种 open 背后在思考这些 team 之间应该怎么去组织，使得整个公司的这样一个 mission 更加的高效能，把这个东西做出来。这个并不是说拍脑袋一想今天我要成立三个 team，可能也是一定时间的摸索出来。包括他之前不是还解散了那个 robotics team，我觉得这个也是需要一定的积累。

最后还有一块就是在我看来就是这种自信的积累。 OpenAI 在整个往 A I 往前去推动的过程中，是有一个很好的 record of success。我们最早期 GPT3 它已经是第三个版本了，有 G P T、 GPT2，然后 GPT3，然后 3.5。三点完了之后，有一些往上面做这种 application ation 往 application 上走的这种工作。像我们刚才所提到的 ChatGPT， web GPT，还有传说中的 rumor 里面 GPT four。我觉得这些其实也是一定程度上一边作为，一边积累一种自信。包括整个 team 的这一种自信，可以更好的延续这种 momentum，更好的往前去 push 整个 resize。

所以对于这个问题就是说是不是有足够多的数据和算力就能训练这样的模式，我觉得是远远不够的。可能一定程度上你想上去好像这个就是一个答案。就是说我只要对数据，对算力就可以。但其实真正做起来的时候，发现全部都是问题，这是我的观点。

我总结一下特别好，时间跟经验的积累，人才积累、组织积累，还有自信的积累。我们说即使一个公司有数据跟算力，最后它的效果能不能达到 OpenAI 这个效果，或者说花几年的时间他能不能追赶得上，可能都是一个问题。

我稍微 echo 一下，我觉得家辉讲的特别好。除了刚才你提到还有一个就是认知的积累。就是 OpenAI 在推动大模型，尤其是自回归的大语言模型的使用上面，它不断的在尝试定义它自己的问题。比方说他刚才讲的这个 aligning research，这其实是他们花大精力投入的，而很多其他的机构没有再投入，我不相信会有像他们那样的投入。比方说他们为什么会引入强化学习？是因为他们认识到了大模型虽然知识面很广，能力很强很通用，但并不知道怎么去更好的把新的标注信息，把人的监督的信号更好的融入进去，所以他们才会再重新捡起来，强化学习来做这件事情。所以这些创新性的方法代表了他背后其实不断的在认知上去探索大模型的使用边界。这个不是说一家能够 follow 他们的公司，可以很短期内跟得上的。也许我们可以抄到他们的做法，但是抄不到他背后的整个思考。

那你觉得像 google 或者 meta 这样的公司，其实他们一直都有在研究。像 meta 他前一段时间也放出来了，它可以自动生成视频。然后谷歌里面它有自己的组织，非常类似于 OpenAI 的机构，像 deep mind。同时它也有各种图片生成式的研发，包括 lambda 这种聊天机器人的这样的研发，它其实方方面面面都有触及到。那你觉得他跟 OpenAI 它能 follow 的上吗？

这个我不太好评论，我们毕竟只是一家小创业公司，家辉在谷歌内部他应该可以评价一下这个问题。

我觉得从两个阶级来看，一个是像大公司的比较成熟的这种 research lab。我觉得对他们来说，其实真正重要的并不是说能去 follow 到整个 research。真正重要的是怎么继续去 push 前沿，或者说下一个这种 milestone。下一个 milestone 在什么地方，应该要去看这种问题。

对于这个来说，我觉得 O N I 是有一定的优势。在目前上他们其实是在一定程度上不断地在创建下一个 my stone 大公司。其实 follow 并不是一件难事情，在我看来这是第一个大公司的叫其他的。因为我注意到国内也有一些这种 map，有一些可能也是政府牵头做起来的一些 lap。对他们来说如果要去做这件事情，我觉得需要用到之前我所提到的那几个积累。不管是人才也好，还是整个架构怎么去设置也好，包括方波提到的整个认知这些东西，就是大概是怎么在理解这个事情，或者说下面要怎么做。这些上可能需要更长的时间。

对大公司来说的话，人才也已经有至少有一些人才储备组织，其实也是比较完善的，自信其实也是有的。 Open idol 的这些技术里面，也并不是所有的技术都是来自于 U N I 的。像 transformer 或者说像一些最早的 reinforcement learning 的一些他们的 P P O 或者一些别的算法。比如说 best nets 这些其实并不是说完全是 O N I 积累出来的。

刚刚方波你在回答问题的时候，你有提到 OpenAI 它能不能替代谷歌？你觉得在现阶段可能它还是挺难的。我说一下我自己的几个小体验，就是我之前有在谷歌上搜索，比如说一个 2岁的儿童他应该每天摄入多少脂肪？谷歌搜索的他给我的一些答案都是一些非常泛泛而谈的一些新闻稿。就比如说 0.5岁以下应该摄入多少， 1到2岁他是一个非常泛的东西，我并不能从他的文章中得到，我需要给一个 2岁的儿童每天摄入多少的脂肪。

但是我在 ChatGPT 上问了一下这个问题，他给我的回答非常好，就是大概分了几个层次，说你应该根据小朋友的体重，他有一个数据公式你去计算。最后。得到的是它的脂肪量。然后通用的标准是什么？我当时看了以后，就像你说的，他有的时候他的回答是错误的，我不能确定他的回答是正确还是不正确。

所以我又问了 Chat GPT1个问题，我就说一个女性每天应该该摄入多少糖？它同样也是除了告诉我一个通用的数据以外，还有一套方法，怎么样去计算女性的摄入的糖数。因为我是知道女生应该摄入多少糖的，所以我知道这个问题的答案，我觉得他的那个回答是正确的那反推到上一个问题，我觉得我好像可以相信他从这个点上我会觉得好像 ChatGPT 会比谷歌它要在使用上更容易。

但是同时它可能也会有不精准，或者有很多实时信息就没有办法去更新的问题。所以我也很想知教一下，比如说像家辉跟方波，你们觉得站在现在的角度看，他可能还不能替代谷歌。但是站在未来的角度看，当他有了更多的数据，更精准的调配，包括大家提到的刚刚他把这个 web GPT 也切入进来了。我们从更长远的一个角度看，你们觉得他会是谷歌的一个竞争对手吗？

我简单说一下，刚才我也提到过了，如果我们把一个人对于信息的需求，尤其是主动式的信息需求分为几个步骤，第一个就是意图的理解。第二步去寻找合适的信息。第三步可能就是寻找完合适的信息之后做理解和整合。第四步可能就是回答谷歌以前做的很好的几个点，包括意图的理解，包括信息的匹配和寻找，包括它的呈现。其实这几步他做的都很好，但他其实一直在对信息的理解和整合上面尝试去做的更多。

你有的时候可以看到谷歌可以直接回答一些你简单的问题，会放在所有的页面之前，或者说它右边有一个叫 N T T pen，可以直接把它你相关的知识用结构化的方式呈现出来。其实谷歌在做这件事情上面花的时间会更长。只不过今天技术的发展让大家觉得说，其实对于知识的理解和整合这件事情，其实是用大模型来做会更好的。而且它的效率会远远高于你其他以前的。比如说先对问题分类，如果是个天气问题我就去查天气，就这种传统的对话机器人的方法相比会好很多。这就是 ChatGPT 今天的优势。所以他们可以理解为是在整个人对于信息需求的几个环节里面，各自占有一些优势。

至于说未来要做的话，谷歌肯定也会更多的往这个理解的层面去走。 ChatGPT 可能也会更多的往信息的匹配这个角度去走。比方说把 web GPT 的东西融合进来，那谁能更快，谁能把串在一起的整个 pipeline 的体验做到更极致。我相信他就是未来有机会成为下一代的信息检索引擎的一个，或者说都不应该叫信息检索了，叫做个人助理的一个机会。

张波提到的最后一句也非常好，就是说它到底是不是还能叫做信息检索的引擎？有可能我们换一个角度来思考这个问题，并不是说 ChatGPT 是不是颠覆这种搜索引擎的问题，而是说 check boat 和这种搜索引擎之间的关系会是怎么样子。一定程度上我在想 chat 或 dialogue 这个东西本身它是一个比较完备的一个载体。就是说你能从一定程度上做你想做的几乎所有事情，包括那个搜索引擎上面。但它其实也不限于搜索引擎上。就是因为刚才你所提到的 case 还是一个一问一答的这么一个情况，其实他能做的更多这种一问一答，然后你可以继续有问题，然后他可以继续给你去 either。他可以 elaborate 一下他为什么这么回答，或者说他什么 follow up 的这种 answer。这种程度或者这种体验，其实现在的搜索引擎不具备。所以我们在比较这个东西的时候，其实有一定程度上是有点在小看 dialogue。

或者说这种 chatbot 所能带来的这种颠覆，或者说所能 enable 的这种应用场景。我自己对这个 chatbot 的整个未来的应用场景是非常看好的，但是它现在状态还是需要提高，包括这种是不是足够基于现实，包括能不能提供 set，甚至比如说你看今天这个时间是什么样的天气，你如果只用一个大语言，模型都已经去完了，其实很难做这件事情。在技术上还是需要提高。但是 check bot 这个东西或者这个载体，它是非常有应用场景的。一定程度上是要远大于一问一答式的，或者说搜索式的，或者说这种 web answer。刚才冯波也提到，你如果说一个问题，其实像 google 社区能给你一个然后是 on top of 其他的一些链接的 chatbot，我觉得其实是能做的比这个远多的。所以我们在讨论的并不是说是不是能颠覆 google，而是说它到底能带来什么样的一个用户体验，或者说能解决用户剩下的那些还没被解决的一些痛点。

你们觉不觉得有一点像高维打低。

维我很同意对。

降维打击 chatbot 来说是有这种。

对我稍微补充一个观点，我看 jenie 也问了一个很有意思的问题，跟创业机会有关的就是今天我们看到的更多的人是在说它到底能不能替代谷歌。但是从整个互联网的角度来讲，你会发现谷歌也只是其中一个很重要的信息服务，但不代表互联网全体，对吧？移动互联网里面每一个特殊的场景，我们都有各自的 A P P。我们有各种各样的网站来解决人的各种各样的信息需求、服务需求，甚至陪伴需求。我看到的其实更多的是在后者。

如果我们说 A I 可以是一个比互联网更大的机会的话，那我相信被他重做的东西绝对不只是谷歌而已。而是说我今天所有的软件的服务，无论它是用 A P P 的形式，还是用一个网页的形式，他可能都可以被这种交互式的角色式的能力给包起来。然后让他的那些服务通过这种更自然的方式来提供。这种能力的出现，它其实是有可能把整个互联网行业给重掉的。

所以这两天我在听到有一个投资人在说，因为 ChatGPT 的出现，让他觉得他做 T M T 的投资可以再做 15年。原因也在这里，就是可能以前我们对于人的需求的满足都是说我拿一个 A P P 或者拿一个软件来更好的用信息化的方式来满足它。但今天也许我们到了一个新的拐点，可以把信息化再提升到一种基于 dialog 来为中心的一种交互式的智能化的服务上面。所以这里面机会是巨大的。

谷歌只是其中很小的一部分而已。然后那个机会我觉得是大家可以再多关心一下。因为这些也不仅仅是一些应用级的机会了。就比如说每个应用应该怎么样去改造，而是它底下会有很多平台级的机会来产生，可以产生它自己的 android，我觉得这个是非常 exciting。

所以类似于像 ChatGPT，尤其是像 OpenAI 大模型这样的公司，它会成为未来的一个平台跟一个基础建设。

对我认为他更像是下一代互联网底下的基础设施，而且他做这件事情非常擅长，确实想要超过他也很难。就要把他的这个能力真正像毛细血管一样的，使用到我们社会的方方面面里面去做升级。其实它中间有大量的机会，就像我们其实星矢宇宙这家公司，也就是我们创立的这家公司在做的这个事情就有点累。类似就是我们会在底下使用大模型的能力。但是在于说我怎么样把大模型的能力更好的放到一个具体的场景里面，它其实是需要有一个平台来解决的。

因为我单独的使用大模新的名义，就像你看到了 ChatGPT，他虽然很厉害，但他并不是真正的了解对方的用户。他没有跟用户有关的记忆，对吧？他也没有一个真正的可以 validate 的信息源，让他保证他说的所有话都是靠谱的。然后他也没有办法像刚才提到的，跟真正场景里面的一些能力和背后的一些执行的操作去结合。让他直接通过这一个接口来帮你完成场景里面的任务的闭环。他也不会像人提供服务一样，还会主动来提供服务，有一种主动性，有一个主体性在背后。所以我觉得像这些问题是通过单独的大模型比较难解决的。那么怎么样把这些问题解决好，让每一个场景都可以变成用这种很有个性的，很有意思的 dialog 的方式去提供更好的体验，更高的效率，然后更沉浸式的一种感受。我觉得这里面有很多的创业公司的机会在里面。所以我认为 OpenAI 做 ChatGPT 它的目的是说这个，而不是说我直接跟谷歌头对头的去打。

我看见已经有公司会用 OpenAI 底层的能力去做 A I 制药了。之前我们在 AIGC 的某一期里面也提到过，像 OpenAI 它的大模型。如果你把它用来做科学，它就会生成科学。你把它用来做策略就可以生成策略，做艺术就可以生成艺术。就是它是可以生成万物的，但具体就是说人有什么想法，我们去怎么玩它。

因为其实现在大家看到的 ChatGPT，我们刚刚反复提到了，它是 GPT3.5 的版本。现在 GPT 它还有一个是 GPT4 的版本，然后还有谷歌的这个阿尔法 code deep mind 也在做一个这样的模型。你觉得有哪些是我们现在还没有看到，但是比如说 GPT four 或者阿尔法 code 有放出来以后会更有潜力，更有想象力的部分。我们只单谈这两件事情。

对，首先这个 G P T four 我听到的也基本上是 romance 一些传言。可能就是从我自己的观点了，就是说这个模型自然资源是一个比较大的规模，跟前面的一个版本来。就不是同一个量级的这种规模的资源。它的能力我听说是有一些除了语言之外的，因为人毕竟还是一个视觉动物。那就是人在看一些东西，比如说看一些 video，通过这些 video 里面你能了解一些新的概念，了解一些视觉和这种语言的定。可能听说是 GPT four 是有大家叫做 multi model 的这种能力。

当然也有一些谣言说 GPT four 它有可能不是一个 dance model，它是一个 bus model，或者说 dance spas 结合的一个 model。这个意思是说，并不是说 neon 在每一个输入里面都会被激活，它可能会像人脑一样选择性的激活大脑的某一块。类似于这种谣言还是比较多。对我自己觉得这里面就是说给了我们现在已经看到的这些结果，可能不久的将来我们能看到一些新的，但是现在还没有的结果。比如说语言，语言的交互和这种图像生成结合在一起。那现在比如说图像生成还是一个一问一答的一个方式，对吧？我说一个文字，你给我生成一个图片，如果我需要上面进行修改的话，可以稍微画一画，涂一涂，然后通过语言的一些调整。这个其实本质上并没有这么的自然。

其实更加自然的方式是说，你就是通过一个 dialog 来进行一些图像的修改。比如说我想修改图像的上面这一块，或者说我想修改图像的整个色调。然后以这种多轮方式的问题，或者说多轮的问题答案这种方是去进行图像的编辑。这个我觉得是可能可行，但是目前还没有看到有哪个模型能具备这个能力。

当然另外还有一些对着图像做一些问答的这种模型其实也有，但没有说到一个。比如说我看一个奥巴马的一个图，或者说看一个 trump 的图，它能理解后面的一些逻辑，还是在哪个场景下面在做一些什么样事情，就被后面什么 story。其实人是具备这个能力的，尤其是比如说历史书上对吧？他其实给你修了很多这种图。那这个上面其实目前还没有看到有这样的能力。但是我觉得现在的技术可能已经成熟，来做这些事情。我觉得后面可能会逐渐看到这样的一些 demo，或者说这样的一些 capability 被表现出来。

其实阿尔法 code 这一块其实是另外一个角度，就是说对于这个 coding 或者对这个程序员能有什么样的一种提高。这里其实比较好量化的。就是他们有那个 school，包括应该其实也有一些发表的文章，就怎么来 measure 这种 coder 或者 a robot code 来做这种 coding 的能力。那我相信这个 score 会逐渐的提升。

但是可能如果说我们还没有看到什么能力，就是今天聊天最早提到的是不是有这种组织整个 code 架构的这种能力，或者说 design 的这种能力。就 software design 并不是说像这种小的 little code 的 cold peace 的这种 completion，就这个我觉得目前还没有看到，但有可能可以看到，其实本质上很多基础设施都已经在那了。数据在那，包括开源软件在那，计算资源在那，然后神经网络，刚才讲到的这些东西其实都在。但是就需要有人去把这些细节执行好，把它做出来。这个我觉得是啊，但我没有任何内部消息或者怎么样。就是说从我自己的做一个研究员观察来看，我觉得这些。

可能会出现方波。因为我们刚刚其实讨论的一直是大模型，它其实只是 A I 的一的方向。可不可以跟大家介绍一下你之前跟我提过的全脑模型。

大模型肯定是对于原来的我们叫判别式的或者分析性的 A I 的一次范式的升级。他可以很好的把知识融合在底下，然后基于它的模型扩大，可以涌现出一些解决通用问题的能力。但是我们的理念更多的是在于说，能不能让这样的 A I 不是一个简单的解决问题的东西，而是说它真的可以变成各种各样的数字生命，变成各种各样的角色，能够进入到我们生活当中的各种各样的场景。做你的健身教练，做你的营养师，甚至成为你的个人的陪半或者数字分身。

在研究这个问题的时候，你就会发现大模型本身它提供的这种信息和任务能力并不足够完全解决这样的生命感的问题，或者叫人性的问题。在这时候我们就会想要去用一种更宏观的架构来解决它。但比较巧的也是我们自己做这种宏观的架构，做了大概有三年。然后这两年无论是养老坤或者有小斑鸠，他们都是图灵奖的，也是深度学习的创始人了。尤其是老困在今年 6月的时候，他也是从 facebook 离开，写了一篇文章说他未来的很多年都想要去把这个全脑框架能够做出来。它当然叫做一个宏观的架构了。

在这个宏观的架构里面，大模型更像是一个人脑里面的常识底座。他要为这个人脑去配置他的感知系统、他的记忆系统、他的行动的系统。但最重要的是这些不同的系统或者不同的脑区的加入，丰富了他作为人的别的维度。但中间需要有一个很核心的思维的系统来串联它的这些脑区，使得这个 A I 的思维可以符合它自己独特的特点。比方说说他是乐观的，他是悲观的，然后他的角色是什么？他主动想要给人类带来的东西是什么？都由这套思维去串联起他不同的信息和能力来呈现出来。

这是我看到的一个未来的 A I 的发展方向，就是以大模型的能力作为底座，同时设计一套宏观的脑启发的框架。然后借此把各种各样不同的 A I 的角色的能力，能够匹配到这样的一整套数字大脑的框架里面去。如果这件事情可以完成，我觉得刚才提到了很多就今天 ChatGPT 还做不到的东西，也许是可以做到的。比方说我们可以为每一个 A P P 都去配备一个他独特的 A I 的角色。然后他有自己很独特的个性，然后他在服务你或者陪伴你的时候，他是真正懂你的，然后他也会每天监督你的行为，甚至你跟他的交流可以直接让他在背后帮你完成很多的任务。乃至也许你不给他下任何的指令，他针对对你的了解和对于这个任务的了解，可以主动拥抱你在数字世界里面做一些工作。就像我们看到有一个科幻电影叫 her 一样。

这听起来有点可怕。

但他一定是善意的。比方说他做的事情是有限的。比如说一个健身教练，他可以帮你完成的就是跟健身有关关的内容，帮你去主动去安排课程，然后给你一些饮食的指导，而不是说当做一个人形的知识库，只是回答一些知识的问题。

当然它背后肯定会有一些安全的，像你提到的这些道德各种方面的一些风险。我觉得今天这个时代还没有完全准备好迎接他们的到来，所以我们也只能一步一步的去走。但如果说我们对于 A I 的推动，不仅把它当做一个信息和任务的工具来看，而是真的想把它们当做一个未来数字世界的一个完整的载体，跟人类非常接近的一种独特的数字存在。我觉得全脑模型可能会是我比较看好的一个未来的方向。当然它的成熟其实很大大程度上依赖于大模型的成熟，这个是我们在做这件事情的一个思路。我觉得这个赛道其实也可以关注一下，我觉得也非常 exciting。

你说到的全脑模型，它就是除了大模型，它还包括哪些其他的板块可以介绍一下吗？

首先我们是像刚才提到的，比方说我们可以为大模型配备它自己专门的记忆的系统。那么他在跟任何人一个人交流和服务的过程当中，他可能真的可以理解到这个人过去现在未来他的需求，而不用你每次都打字儿打给他。

个性化的。就类似于比如说我跟 ChatGPT 聊过什么他都记得，他可以把我以前的跟他的对话聊天记录调出来。

对，而且可以更加个性化，它可以总结这些聊天记录，了解到你是一个做播客的人。然后可能你每天最近烦恼的事情到底是怎么样提高你的做播客的制作的效率。它可以主动的来给你提供这样的功能。

第二比方说我们以后可能会希望他拥有一些更加多模态的感知，而不是完全通过这种方式去把文本吸纳进来。也许你希望他和你一样可以看到你周围的环境。也许你希望他再给你提供服务的时候，可以把互联网上各种各样多模态的服务，他的身体的动作。比如说一个健身教练，当你问到他一个动作该怎么做的时候，他不是给你一段描述，而是真的有一个他的身体给你做一个示范。

马斯克的人形机器人吗？

数字版的人形机器人或者叫虚拟人结合这个大脑。

还是在手机上的，只是说它可以是一个图片或者动画的展示。

或者说它可以作为一个中心，跟很多不同的其他的功能结合到一块儿。比方说你现在告诉他我什么事情该怎么做，他现在只是回答他的步骤，但也许这些步骤可以直接完成互联网上的一些操作。相当于就不只是给你信息的服务了，而是帮你做了执行。这些其实是全脑框架下要去解决的问题。

还有一个很重要的点就是全脑框架上面还会有一个叫做全局工作空间这样的一种全新的理论，就是认科学认为的大脑里面去整合这些大脑内部的不同的信息和他想要完成的任务的目标。会有一个很中心的注意力的机制，让他去选择在不同的情况下，我到底是应该去用我记忆里面的你来回答，还是说我直接帮你来完成服务，还是说像 ChatGPT 那样，我只是给你一个任务上的指导。那这个过程可能需要有一套更宏观的思维框架来调控一套注意力。机制来做。

你觉得这个时间要多少？

年老坤说需要十年，我觉得不需要那么久，我比较乐观。

十年就可以实现。我觉得很可怕，这个实现了，他太懂我了。

但他懂也是有限度的，懂，他毕竟不是每天跟你生活在一起，他还是在你跟他的这个交互的场景下发生的数据，他会更好的来理解来了解你。

所以你是相信通用人工智能是很有可能很快会实现的对。

其实这里面我稍微插一句，通用人工智能是一个过去的概念，它的这个定义比较模糊。我可以认为 ChatGPT 已经是属于通用人工智能的，因为它确实回答问题的能力相当通用。从我的角度来讲，更合适的一个词叫做 human level A I，就是人类级别的人工智能。当我们提人类级别的人工智能的时候，我们可能就会要求他有自己的情感，有自己的记忆，有自己的完整的感知，然后又能够干预这个世界的能力，或者说有一个自己真正的自我意识，然后可以思考，然后会成长。这些维度我觉得可能是未来 A I 的一个重点。但如果只是看它的通用性的话，其实大模型本身已经做得非常好了。

这次 OpenAI 发布 ChatGPT，很多人都非常关心跟嘲讽的一个问题，就是说 OpenAI 不 open。简单来说就是指 OpenAI 没有开源，因为你自己也会去做大模型的这件事情。然后也是 A I 方向的研究者，你觉得 OpenAI 应该开源吗？

对， opi 不 open 是一个一直以来大家在嘲讽的一个问题。其实 O N I 最早是一个非盈利的组织，就是整个架构也好，整个购也好。那个时候其实开源出来的 code，包括开源出来的模型是比较多，但是实在也不太一样。那个时候并不是现在这种大语言模型，这种 level 的模型。

然后我觉得整体上开源这个问题非常是一把，因为我看到还有像 state A I stable division 这些开源。其实 open I 我自己觉得在尽他所能去开源一些东西，包括你可以看到他们很多这种 interface 出来。其实如果具体的讲，你看到它的这些模型，每个版本出来，它并不是指开源最好的，或者说只开源对这种商业化最有利的模型。它其实是在开放一系列的模型的 A P I 出来，包括这个模型，比如说是 surprise 的这种 human label surprise 的翻译过的这个模型。另外一个比如说 R L reinforcement learning 去 tune 的模型，还是开源这些 interface 出来的一个原因是希望相关的一些研究员也能去做一些研究。但是为什么他不把整个模型全部开源出来，对吧？然后甚至有可能比如说数据也开源出来，我觉得这个本身也是非常难的。

这里整体上要从几个角度思考这个问题。第一个我觉得从学术的角度上，比如说我们就作为为这种研究员，从学术角度上，我认为开源肯定是促进发展，就是学术要往前发展。他肯定是 benefit from 这种非常开源的，然后你有更多 accessible，不管是 code 也好，或者模型也好，甚至资源也好。

那这种上面我觉得可能更加的促进学术的开源。原因很简单了，其实这些模型，这些技术，包括这些计算资源，现在整体上还是掌握在一些少数研究员的手上。比如说像 OpenAI 的一些研究员，或者说像大公司的一些研究员。虽然整体上他们做一个问题可以理解为它是一个概率问，也就是说它的成功的概率高一些，但是毕竟你也没法挡。就是说其实整个 research 整个 A I research commit 是非常庞大的一个。前几天还去参加那个会议，其实人是非常多的。因为那么多人，大家都集思广益，其实是能更好的推动这个学术的发展。从这个角度上在我看来是应该开源，但是 OpenAI 是还没有做。

其实有些别的考虑涉及到可能后面要讲到的是说这种 responsible A I 的角度。因为这个模型其实一定程度上大家还没有完全理解，他所能做的和所不能做的，也是一个不断的在发展的事情。比如说 OpenAI 今天把这个模型开源出来，那你总是没法挡住。有些人可能拿这个模型做一些奇怪的事情，对吧？或者说生成一些奇怪的内容去 post 到不同的这种互联网上。这个很多程度上有可能你 release，这是一个 action，这个 action 导致的这个结果是没法估量的。

但另外一个角度就是说我们要研究这个 responsible A I，或者说我们是希望这个模型能更加的为人类带来意。其实也是需要这方面的研究员去 access 他们的模型， access 他们的一些结果来提高。所以从这个 response V I 的角度，我觉得开不开源有点像双刃剑的感觉。我也不确定说带开源好还是不开源好。 I 你可以明显看到他们的 action 就是非常谨慎的，就是说没有去做完全开源这一件事情。

最后一个角度就是说其实 O B A I 在重新组织架构之后，它并不是一个完全的非盈利组织。如果我们纯从商业的角度上来，其实每个开源背后我觉得它都是需要有一个逻辑的。包括前一阵子你可以看到 stability A I 非常火对吧？ Stable division 这些东西就开源对他们来说其实有一个好处是，第一就他们非常自信？具备这个能力的，做出这个东西，把这个开源到大家的手上。但同时也是赚得了一波的 hip 或者是怎么样，这个估值也上升了不少。

这个开源的背后从商业的角度上要去计划好一些事情。比如说这个 I P 的问题怎么解决？比如说今天开源了这个模型，开源了这个 code。比如说另外一个公司拿过去做一些商业化或者什么，这个 I P 的问题怎么解决？包括整个回到这个组织架构怎么解决？比如说公司里面 V I 里面谁来后续跟进，不管是从 user 这边拿一些 feedback k 也好，或者说从开源社区一起去整合，做更好的下一个版本也好。

这里还有一个问题就是说其实我们有些时候也能看到一些例子。就是说一些公司比如说做一套东西开源出去，然后就人也走了， cold 也开源了，人也走了，又重新去做一套。对原有的公司其实从商业逻辑的角度并不是最好的一个 case，对吧？因为他们毕竟有很多前期的投入，好不容易做到今天这个地步，然后最后一开源，然后整个也散了，对原来的公司来讲也就很 discouraged。就是说再去做下一个更好的版本，再去有这样持续的投入。我觉得这些其实都是背后所需要考虑的一些因素。

就相当于谁都可以拿来用。然后我再基于你的在调试一个更好的方法，然后任何人都可以成立一家公司，对吧？

对，任何人可以成立一家公司，其他的公司可以拿着你的继续做。对于你一个公司来讲，比如尤其是这种大公司，那你这个公司里面的这个小 team 也有可能自己出去做，这也是有可能这些问题其实都要考虑好。

我觉得上一轮生成式 A 就是文字生成图片的这个领域的火爆，跟整个 stability 它的开源是有很大的关系的。就是因为它开源了，所以比如说像 mid journey 这些基于 stable diffusion 来做的模就火了。但是同时我也看到有一些非常不好的事情。就比如说还是会有公司去基于他们的开源模型，专门去做一些类似于小黄图之类的。因为人会有利益驱使，那也会在那个网络上传播特别不好的东西。

对，是的，这里刚好就看到两个逻辑，就是说一个是从商业的角度，另外一个从 responsible A I 的角度。其实 stable diffusion 开源出来来之后，对他们自己我觉得也是一个双刃剑。力出的话其实也显而易见。他们毕竟是第一个公司去开源这样一个事情，并且这个东西是属于有足够 quality 的。并不是我随随便便的草根的做一个软件，做一个模型就开源出去。他那个模型其实是结果还算是不错的。开源出去之后昨天赚了一波民生，对吧？

但创投圈可能也更加认可公司的这个能力，就大家都检验过，并不是说我们自己说自己好不好的地方，就是说有些公司可能就直接拿过去。其实我们能看到一些这样的公司，或者说你也可以注意到，就是在这个开源之后，突然就冒起来一波公司说自己也能做这个。我觉得这个可能是跟这个开源也不可分的。可能就拿了一些相关的，不管是 knowledge 也好，或者说直接拿了模型 find 也好，来做一些其他的商业化的一些东西。这个其实一定程度上稀释了 stable division 它本身能做的为这个市场带来的一些概率。

我不知道你知不知道一家公司叫 jasper 他之前是基于 GPT3 的 A P I 接口来做的一个通过文字或者规划的方式来给你生成一段类似于广告营销语，或者帮你写一篇论文，或者帮你写一个商业计划书，它是基于 G P3 的接口来做的。然后在上一轮的融资中还估值有 15亿，融了 1.05亿美元。我其实是在想像这种放在 GPT3 的架构或者 A P I 接口上来做的这种应用层的公司。那我们说现在有 GPT3.5 了，它是不是可以直接也把 jasper 这家公司给干趴下？这些公司它的优势是什么呢？你觉得做应用层有戏吗？

做应用层我觉得是完全有戏的。我自己觉得 jasper A I 这个公司做的还是非常不错的。在这里我觉得大家在做的东西其实不在一个各层次上。比如说像 GPT3，或者说这种 GPT3.5，甚至像我们刚才提到的这个 reinforcement，这个 human feedback k 类似于这种，其实我觉得还是在属于说做有些人可能叫做这个 A I infrared 面的一些技术上的一些创新。其实这个方法并不一定说只能应用在这些 dialog 上。或者说这种更 useful 的这个 chase。

然后 jasper 我觉得是做非常好的一件事情，就是他把整个垂直领域的这个生态想的比较清楚，然后应用在什么地方，大概做哪些场景。在每个场景下面，其实并不是说你直接拿一个 interface 来就可以做的。他是需要做一些有点像是这种雕花工艺的。在这上面对于某个应用场景做一些适配，做一些匹配。你如果看它的这个 demo 的话，它会有一些 template，这些 template 其实一定程度上也是他们的一些经验积累。比如说我听说有一个比较大的一些客户，就是说这种像出海的广告主，本身英文可能也没有那么好，然后可以用它来生成一些广告语。其实找这种场景，然后积累这些客户，甚至去积累这些客户的这种 feedback k 我们刚才讲到整个 ChatGPT 其实也是 learn from 这种 human feedback k。

他们有这种 feedback k 那有可能是 just for A I 能做的更好。因为他们有了这样一个生态，有了这样一个反馈的机制，知道自己是服务于什么，用户自己的定位非常清楚。对我觉得应用层是完全有机会，做 commercial 我觉得是有机会。

你刚刚提到了，就比如说说以前有一些出海的公司，他们英文也没有那么好。然后他们可以用 jasper 点 AI 来写一些广告的营销语。就我最开始理解 jasper 的应用场景，它除了可以帮这种市场营销人员去写比较好的这种英文广告语文案之外。其实还有一部分用户跟 grammy 的用户有一点像，就是英文没有那么好。然后我要写很多的这种英文文章的用户，这确实是一个非常好的应用场景。但同时我是在想，现在有了 ChatGPT 了，那这部分市场营销人员跟出海的公司是不是可以让 ChatGPT 来帮他们写呢？

一定程度上他们是完全可以试一下，然后有可能会稀释掉。比如说已有的 either grammy 或者说 just for I 其实你能看到这 GPT 我其实是试过，他有这种纠正语法的能力，你可以让他帮你改一改这段文字，然后确实会给你一个非常有意思的结果。后台可能包括一些生成文案，编程上也能做，但是因为我自己也不是这种专业的去切广告的或者怎么样。就是我自己觉得可能还是有一些用户的积累。像 jesper A I 如果他们自己能再去翻一套这样的一个模型，或者说 grandly 能用这些技术，能用大语言模型的技术，再去给他们现有的，比如说语言，或者说看到的这种用户经常出现的一些错误，我相信这个它其实能做的比 generic 的 ChatGPT 要做的更好的。

你是说他可以自己微调，那他如果没有开源的情况下。

它是可以微调的吗？他如果没有开源的情况下，他就不能微调。这就又涉及到另外一个问题，有一些公司是自己去拥有整个 n ten 的这么一套模型，还是说只能依赖于这个 interface。我相信其实很多公司如果只依赖于 open and interface，其实是非常危险的。所以我自己觉得这些公肯定是在做一些 planning，就是说能有一些自己的数据，然后能做一些自己的训练。我举一个非常简单的例子，就是说我今天 GPT3 或者 3.5 的接口还在这里，我明天突然把这个接口封掉了。因为其实没有任何，就是说我不一定得这个 interface。那我一封掉，那岂不是下一个的公司都没法搞了，对。

一下就没了对吧？所以 jasper 它到底是不是有 GPT3 的开源的底层的代码，这个是不知道的，还是没有相信 open a.

应该是没有 release 给他们。但是这个 GPT3 技术上还是大比较掌握的，还比较成熟的。然后有一些 open 的，包括比如说你放到那个之前 meta， meta 有一些比如说 O P T 就是 open 的开源出来的这种模型外面其实是有一些类似的模型的。前几天还在 linkin N K 上看到，对于每类 OpenAI 对应的模型，外面有什么已经可以用的这个模型。比如说有可能对图像生成，因为 jasper A I 其实最近也能做这个图像生成，那可能可以对应比如说 stable division reality 出来的这套模型。那可以基于这个，比如说有一个好的 warm start，自己的公司里面再去做一些 creation，再去成立一些小 lab，再做一些研发。

对，所以他还是必须有自己的模型，他如果没有的话，他是没有办法做微调的。如果他整个建立在只是 GPT3 的一个接口上，他就没有办法去做微调。除非比如说你刚刚提到的从 meta 弄一些 O P T 的模型来，然后他再基于这个才可以。

对我自己觉得是如果只基于 open 的 interface，尤其是 OpenAI。因为其实 OpenAI 它不是一个它开源这个 interface，不是说完全是为了这种 commercialize 或者说 cloud serving 这种。它不是一个 cloud 的 company，它可能更多的还是一个 research 的这种 company。就是说把这个 interface 开源出去，然后让大家去玩一玩，然后自己收集一些 t bank。其他的那个 human feedback k 里面是有一些 use 上传回来的一些 feedback k 然后能帮自己做更好的。

从他的这个逻辑上，比如说他觉得这个模型已经不够好了，已经没有必要再 maintain 这个 serving。因为他整个 serving 也是需要有一个 cost 在那边。他觉得比如说我今天开始想要把某一个版本的 GPT 的 interface 停掉，基于 interface 来说是非常危险。所以我相信不管是公司的创始人也好，或者说投资人也好，如果完全是依赖于这个，肯定是首先会有一些计划，就是说假设这个东西被会怎样。

我看之前像 OpenAI 的创始人 sam altman，他说大模型会成为平台与基建，真正的机会在于中间层，这个中间层应该怎么理解？

对，这个其实我也不记起来。说实话我觉得这里还有一个事情是这样子。当我们讲这个机会的时候，我们具体到底在讨论什么呢？首先如果我们看这个市场估值的话，其实我觉得很大一部分的市场估值就是在 OpenAI 自己本身，就整个市场对于他的在做的这么一套东西是非常看好的。所以他肯定是占一个头部的一个相当于市场估值。他也有一定的技术瓶颈在这边，但是他们也做相对来说是 open，虽然说没有完全 open 给你们。

所以从这个 company value 的角度，我觉得，不公安其实是处于一个非常好的 position。它其实相当于在做刚才你所提到的大模型的这个 nfa 层面，或者是偏基建层。然后不同的公司其实中间层和应用层我觉得都是有机会。如果从这个商业价值的角度上，当然如果我们还要继续往前去 push D I 的 front。那这个上面我觉得可能只有说往基础设施上去做，你才能有足够的空间去做这样的提高。

比如说做中间层，或者说做应用层的这些公司，其实我觉得这边的机会会少一些。因为有可能今天是一个大边模型，是通过这种 generated pretrail 的方式来做预训练的。可能明天这个模型里面又要 ebed 某些 components。比如说我们刚才也提到是不是这种 retrieval 的 components，或者说能把 web search 的这种东西引用过来。这个 components 我自己反而会觉得真正的机会，更长远的机会是在这些做基建上的。因为就是有了这些基建，有了这些平台，后面才会去催生一些中间层和应用层。

你可以看到 T T P T 它本身它没有想去特别赚钱的方式去 release 这个。但他如果哪一天想做，他其实是可以做的。他其实是在摸索一套更加 scalable 的方式去做这种应用。在我看来，比如说这种 ChatGPT 也好，或者说这种 web GPT 也好，本质上它其实能帮助用户解决很多问题。虽然他现在也是收费的，但是他其实并没有往挣钱的角度上去收费。我相信他的收费仅仅是为了希望能稍微 maintain 一下他 serving 的一些开销。

比如说像大理，大理我是听说 rumor 都是 public 的一些传言，就是说是为了 cover 他的那个搭理模型在 cloud 上 run 的开销。因为这样子他可能把这个 interface tenable 的 run 下去，才能去让用户也参与进来理解这些模型，然后能做什么，不能做什么，怎么提高，对吧？但是哪一天如果说他们有一些很好的 idea 来做这种应用层，其实是可以做的。我不觉得说我不应该不能做这件事情。

你觉得 OpenAI 它有可能或者它未来最大的收入会是怎么赚钱的？

我觉得还是从应用层上面会有更可观的商业价值。基建的话是相当于 cover 一部分现在已有的开销还没有做的。我觉得一个原因是因为我们需要找到一个非常 scalable 的方式去做应用。然后需要等这个基建足够完善，从一定程度上，虽然现在结果很好，但是我认为还是有可以提高的空间。包括我们刚才其实也讨论到不准确对吧？然是不是足够 safe，然后是不是足够有用。因为你刚才也提到有些话还比较中庸，那我是不是可以稍微加一两个字，我说表达你的观点？如果这些都能做的话，我觉得其实它是有这个价值在里面。

所以其实现在大家并不知道底层的大模型要怎么赚钱。但是当它足够完善的时候，它可能是很多方向。因为你刚刚也提到了，就是现在可能是这样，就是它的 A P I 接口的收费，它仅仅是覆盖它现在云上跑模型的一些成本而已。那未来如果说它的模型足够强大了，加入了用户交互，它会不会把价格涨上去？仅仅通过 A P I 接口赚钱，这个也是有可能的对吧？

这是有可能的。但我觉得这个不是最好的商业化的一条途径。作为 A P I 我觉得可能带来的这个收入还是比较。或者说我们如果看前面十年的很多公司，其实真正做 A P I 的公司，你也很难能找到几个。比如说像做人脸识别，或者说像什么，以前虽然是有了，就是说我 release 一个。 S D K 然后通过这个 S D K 收取费用什么，我自己觉得这个收入上还是比较难有一个质的改变。我觉得真正的可能有商业化价值的是一些应用层面。但是基于这个已经非常完善的这个基建，然后这个基建层能 enable 这个应用，已经到可以改变行业现状的一种状态。

我突然想到了，比如说整个应用起来了，他可能是比如说我向所有的这些创业公司收费。当应用层都挣到了钱，我向所有的创业公司收费，然后我的底层平台再来赚钱。

其实可以举一个另外一个例子，就听上去有点像 cloud 或者 cloud A I 我自己觉得不是最配得挣钱的一个方式，就把这些 A I 的技术都给输出出去。可能我们也能想象一些很多垂直的领域，比如说图像编辑。现在已有的公司下楼比，他可以去做这种软件的年化的这种定制，这种我觉得是真正的所谓的商业模型，就是说他每年向用户收取一个 subscribe 的这个费用，然后你可以去用他的整套软件。它上面不管是你是一个 professional 的用户，还是一个比如说平时就拍一下 vlog 的这种用户。那其实都是相当于这些软件的这些客户。那他又可以作为年收取的费用，相当于并不是一次性买这个软件。我觉得这些逻辑是需要在应用层面思考好的。然后如果仅仅是开源一个 interface，比如说你按每个字收多少钱，对我觉得这个不是最好的一个生态。

好，谢谢家辉，今天很精彩，谢谢。好，谢谢。这就是我们今天的节目，如果大家喜欢我们的节目，记得在你所收听的音频渠道来订阅。我们中国的听众可以在苹果播客、小宇宙、喜马拉雅、荔枝 F M、蜻蜓 F M 上来收听。我们。海外的听众可以通过苹果播客、亚马逊播客、谷歌播客，还有 spotify 来收听我们。感谢大家的收听，谢谢。

S3E93｜ChatGPT替代谷歌搜索？不，是降维打击｜AIGC特辑 01:16:56 Share

硅谷101

Deep Dive

Shownotes Transcript

S3E93｜ChatGPT替代谷歌搜索？不，是降维打击｜AIGC特辑