cover of episode 【大白话系列 #3】大白话聊 ChatGPT(Sarah & 王建硕)

【大白话系列 #3】大白话聊 ChatGPT(Sarah & 王建硕)

2023/3/15
logo of podcast Traders' Talk

Traders' Talk

AI Deep Dive AI Chapters Transcript
People
王建硕
Topics
王建硕详细解释了 ChatGPT 的定义和工作原理,指出其核心是大语言模型,而非简单的聊天工具。他深入浅出地讲解了 GPT-3.5 的版本号含义、预训练和微调的概念,以及 Transformer 模型的编码器和解码器机制。他还用 Ted Chiang 的文章比喻,将 ChatGPT 比作人类知识的模糊 JPG 图片,形象地说明了其压缩和生成过程中的信息损失和幻觉现象。 王建硕还从创业者的视角分析了 ChatGPT 的应用前景和创业机会,认为 ChatGPT 打开了自然语言用户界面 (LUI) 的大门,这将对人机交互产生革命性影响。他认为,与其关注大模型本身,不如关注其带来的新机遇,并用浏览器诞生的例子说明了这一点。他预测,未来将出现新的域名系统和机器人协作平台,并用类比的方式解释了如何基于 ChatGPT 进行产品差异化和构建竞争壁垒。 此外,他还探讨了 ChatGPT 与搜索引擎的关系,以及如何利用 ChatGPT 提升生产力,并对人工智能幻觉、通用人工智能、以及 ChatGPT 是否具有自我意识等问题进行了深入探讨。 Sarah 作为主持人,引导话题,并就 ChatGPT 的相关问题与王建硕进行深入探讨,例如 ChatGPT 的定义、原理、常见误解、应用前景、创业机会以及 AI 相关的隐忧等。她还就人工智能幻觉、通用人工智能、以及 ChatGPT 是否具有自我意识等问题与王建硕进行了深入探讨,并就 ChatGPT 与搜索引擎的关系、以及如何利用 ChatGPT 提升生产力等方面提出了自己的疑问。

Deep Dive

Chapters
本部分介绍了 ChatGPT 的定义和原理,以及它与传统自然语言处理模型(NLP)的区别。ChatGPT 首先是一个产品,其次是一个大语言模型 (LLM),它基于 GPT-3.5 模型微调而成。与传统 NLP 模型中针对特定任务的小模型不同,LLM 使用大量文本数据进行预训练,从而实现通用性,能够处理更广泛的任务。
  • ChatGPT 是一个产品,也是一个大语言模型 (LLM)
  • LLM 与特定语言模型是 NLP 的两个分支
  • ChatGPT 基于 GPT-3.5 模型微调而成
  • LLM 的特点是参数多、语料多,实现通用性

Shownotes Transcript

2023 年 3 月 15 日,也就是今天凌晨 OpenAI 发布了多模态预训练大模型 GPT-4 它能够接受图像和大量文本输入比 GPT-3.5,也就是本期录制时 ChatGPT 背后所用的模型更加可靠,更有创意,能处理更细微的指令各位好,欢迎来到 Chaders Talk 大白话系列第三期这期的嘉宾依然是大家非常熟悉的建设老师

他总是能用近乎白话式的浅显易懂的语言去解构一些复杂的概念之前的大白话系列第一期我们聊的是 web3 第二期聊的是写作那么这一期坚硕和我聊的是 chatGPT 我想在开头先给大家关于这期节目的总体概览主要会分成以下四个部分

首先是科普 ChatGPT 的定义和原理其次是澄清关于 ChatGPT 的常见误解比如它会让人失业吗?它跟搜索引擎的区别是什么?它到底有没有自己的人格?大语言模型所呈现的涌现和思考链路等能力打开通用人工智能大门了吗?接着我又试图从创业者视角去问见说中国到底有没有必要再做一个类似的大语言模型

我们与国外的时间差对国内创业者来说是风险还是机遇以及基于 GPT 模型 API 开发的产品该如何进行差异化和互成合的构建 ChatGPT 的产业链价值捕获最后会落在何处等等那最后也有一些隐忧和畅想比如 AI 在隐私权、著作权、道德伦理等方面的探讨

这期节目还有一个比较特殊的点那就是我们把播客录制的全过程都直播在了建硕的视频号上如果你希望了解一期播客是如何录制的或者如果你希望看到我们互动过程当中的表情可以在微信上搜索王建硕关注建硕的视频号点击直播回放就能看到 3 月 6 日的全程直播录像感谢各位的收听我是 Sara 预祝各位收听愉快 OK 那第一部分就

还是不能免俗地问问您明晰定义的部分还是不能跳过因为我们后面的话题都会围绕这个来展开所以还想请您简单跟我们说一说到底什么是 ChatGPT 如果简单地来说的话 ChatGPT 它首先是一个产品大家一定要先把这个定义好它就跟奥利奥的巧克力什么的它是一个公司的产品名首先那

那么 ChatGPT 是 OpenAI 这家公司出的一系列的大语言模型中间的一款在前面它出了 GPT-1 GPT-2 包括 2020 年出的 GPT-3 已经是非常的惊人了在 GPT-3 之后它又出了一款产品是对于指令有特殊的增加

增强的叫 Instruct GPT 之后因为它已经可以接受指令了然后在上面又叠加了一个相对一点的小模型叫 Chat GPT

它提供了一个 web 的一个界面然后这样的话你就可以在一个 web 的界面上面跟那个小机器人聊天所以说给人感觉 chatGPT 就是一个聊天工具有一个机器人跟你聊能帮你写作等等但是今天晚上我们所说的 chatGPT 我更多的就是拿这个名字来代指整个它后面的这一个大语言模型而不是狭义上面的 web 界面的特定的 chatGPT

对,您刚刚提到一个概念叫大语言模型,Large Language Model,对吧?这个大语言模型其实是 NLP 领域里面的一个产品,或者说一个很重要的发展的方向,它是区别于特定的任务的小模型的组合,比如说普通的对话机器人,这个跟我们今天聊的 ChatGPT 其实是两个东西,

对首先来说的话它整体无论是 ChatGPT 包括前面我们所说的那些语言模型它都是在一个大的 AI 的一个非常广泛的范畴里面的自然语言处理我们叫做 NLPNature Language Processing 这个子领域里面的两个不同的分支

其中一个分支就是我们所说的大模型所对应的很奇怪它不是小模型而是说它其实是一个叫做特定语言模型就 specific 的一个 model 因为自然语言是一个非常难处理的一个领域

这个领域里面包含的内容特别多比如说意图识别 intention detection 实体识别 entity detection 就是说你说一句话里面说我喜欢吃苹果然后我又说我喜欢吃拉布拉斯果拉布拉斯果是我自创的一个名字但是他就通过上下文他就可以知道拉布拉斯果是一个 entity 虽然他不知道这东西是什么而且这个 entity 好像可以吃

然后类似于这样的事情非常多所以以前我们的做法就是说对于特定的一个目标我们就做一个模型然后对另外一个目标我再做一个模型就可以做很多的这个小的模型然后以前的那个客服机器人的话比如他其实是把无数的小模型做了一个组合比如说你来了以后他先问你说那个王先生你要我干嘛我说帮我查一查银行账户吧他其实先做了 intention detection

意图的事然后从银行账户这边呢他会走一个分支他知道了我的意图以后就问那你的银行账户是多少呀怎么验证你的身份呀然后就告诉你他其实是一个专门来解决银行账户查询的一个小模型但是呢

这个时候你忽然问他说你能告诉我李白是哪年出生的吗然后这个小模型就一下就晕了因为他只查银行账户别说李白了就是你让他去做一个转账什么他都不会他只是一个一个的小模型那么他就要必须在一层层退回去或者就告诉你先生我不知道你在说什么等等就开始变得很笨而

这些每一个 specific 的领域其实都有汉牛冲动的论文和模型还有每年都有大量的人在做研究在一个个小模型里面往前攻一座一座的小山

然后 OpenAI 这家公司的话很特别他说我这种小模型我通通不要我就把所有的人类语言然后也不指定你要干什么反正就是一个事情我给你一段话让你给我输出一段补全就这么一件事但是呢因为我灌进去的内容特别多这个就是有一种叫所谓大力出奇迹的这么一件事他灌入了 45 个 T 的 data 去 build 了一个 1750

一个参数的这样的一个大模型出来这个模型是人类历史上从来没有的它大的原因是因为它通用就是所谓的 general 的对应的一个特定的模型这两个之间其实是不一样的所以特定的模型一定是小模型相对来说通用的模型一般来说一定是大模型

所以现在 CHATGPTGPT 这么厉害的原因是说你就跟他聊天你说帮我看一下哪个银行的利率吧他就告诉你了然后你问他李白是哪年生的他也告诉你了然后你说李白的生日再乘以银行利率等于多少也可以告诉你就是说你就随便地把所有的人类知识进行任意的排列组合包括里面有一些逻辑

有一些数学等等这些东西它其实都是有一些些的认知虽然它数学非常不好但是它 100 以内的加渐法做的还可以的这些其实也就验证了它其实只是一个大的语言模型把所有东西都加在一起然后形成了这样的一个模型所以这个是一个最大的和以前的差异您刚刚提到了模型其实分成底层的结构和参数

我想有一个例子可以帮助理解的参数比如说我们可以把它想象成一个上面有很多旋动的按钮的一些东西那其实可以想象 ChatGPT 它的可以用来旋转这个按钮就有多达 1750 亿个参数以上因为 1750 其实是 GPT3 的参数的数量 ChatGPT 已经远高于它了而且它现在是编号是编号到 3.5 了

对我其实很好奇这个编号 123 我都能理解比如说 1GPT1 是开源的 18 年的 GPT2 是 19 年也是开源 1.5B 的参数那 GPT3 是 2020 年它是不开源的就是我们刚刚说的 175B 的参数接下来到 InstructGPT 再到 ChatGPT 其实后面两个是兄弟模型我其实对这个版本号很好奇为什么现在是个 3.5 前阵子刚发布了 3.5 的 API 接口

当然我们也有它自己的一个编码形式了但是你如果让我来猜测是这样的就是说其实他们有一个传说中的 GPT-4 正在做 GPT-4 的这个模型的话据说没有经过求证的是 100 个 t 的参数 175 个 billion 到了 100 个 t 就等于大概增加了 600 多倍

所以这是一个很大的一个飞跃所以 GPT3 比 GPT2 大概也是几百倍的增加嘛所以说 3 和 4 是比较合理的而 CHATGPT 呢其实这个模型不大的 CHATGPT 它只有几十个 G 的参数所以说 CHATGPT3.5 也就是 CHATGPT 它是基于 GPT3 的一个对于

chat 这个场景上面的一个微调所以它加了一个 0.5 的版本而不像 4 是从头到底的再重新做一遍

对 我记得它是在 GPT-3 的基础上进行微调微调这个概念 Fly Tuning 您可以再跟我们说说吗我们就说 GPT 这三个字到底是什么意思对 大家都想知道说这就是没有比这更难念和难理解的一个词了刚才我们提到了 Fly Tuning 我们就先说第二个词就是 GPT 的 PPre-training 就是预训练

预训练模型它和以前的模式的区别是以前比如说我要做一个识别车牌的这么一个功能我其实是说我把所有的语料灌进去我是从头到尾就把它给做成一个仅仅用来识别车牌这么一件事情所以这就不叫预训练

现在来说它不可能出在一个比如开源的一个东西让我们所有的人都拿这个上万片 A100 的芯片然后跑个上千万美金去跑一次因为做一次完整的训练太贵了

那么他们就想出一种办法呢用预训练和微调两个动作预训练呢就有点像你家里面请了一个阿姨这个阿姨呢从保洁公司送到你家里面的时候她其实已经经过预训练了也意味着说保洁公司已经把如何打扫的这一些做家政的基础的工作她已经学会了嗯

所以阿姨来了以后我不用教她怎么拖地甚至于说在她进到保洁公司之前她也经过她的小学老师预训练过汉语了这样的话这个阿姨到我家里面来说我需要对她进行 fantune 就是微调告诉她说我家里面什么地方你怎么打扫什么东西怎么摆放啊什么其实可能也就两个小时的微调我就可以把这个阿姨调整到和我家里面的习惯一模一样了所以这个成本就非常低

但是如果要是不是用预训练加微调整模型你给我一个空白的阿姨不会讲话不会讲中文什么都不会像一个刚出生的宝宝给我

然后我要从教他这是苹果那是橘子教他汉语然后直到教到他会有家政的话基本上 15 年过去了用这个例子 CHAT GPT 它帮你培训好了一个模型而且是通用的模型通用的模型包括基础的语言所有的语言我们现在所知道的它都会那么几十种语言

他会一些基本的逻辑和一些基本的事实比如他知道苹果就是甜的那个千秋就是重的等等就这些的知识他都是有的但是呢他没有特定知识比如说你要问他我们

公司的年假制度是什么 CHETGPT 肯定不知道所以我需要把这个模型拿过来以后把我的员工手册灌给他把我的公司产品介绍灌给他所有的规章制度灌给他然后他一下就可以用他的流利的汉语或者西班牙语或者土耳其语对我的这个内容解释出来所以这就是预训练加上微调的好处

所以这种模式不仅仅在这个 CHAT GPT 领域在很多的比如绘画呀等等这些领域它都是一个被预训练好的一个模型有的甚至都可以直接用了有的阿姨可能我什么都不用跟她说她可能就直接用了然后也可以再加一些的微调所以这个是 GPT 里面的 P Pre-trainingG 呢是 Generative 就是生成式的这个其实也就是整个的

AI 领域的话有非常多的种类有的是叫做 cognition 的就是识别式的比如说我要识别这个人动物车牌文字就是各种各样的识别但是还有一个大的类就是叫 generative 的无论它是生成图片生成文字它都是一种生成式的模型或者换句话说它是一个补全式的模型就等于说我给你开个头你帮我把这个句子给补全

因为整个 CHAT GPT 或者说自然语言处理它的最核心的问题就是不断地在问我给你一个词你觉得下一个词有可能是什么或者我给你一段句子下一段句子有可能什么我给你一段话的中心思想你觉得它应该分成哪三段五段它都是一个去不断地生成我给你的部分的后面的部分

所以说如果大家看那个 Chad GPT 的 API 的话或者整个 NLP 领域的大多数的 API 它的都不是用 Q 和 A 就 Question 和 Answer 它不是这种方式它都是叫做 Prompt 就是提示词和 Completion 就完成这是一对你给它一个提示词就是把前面的部分给它然后它帮你生成后面的

那这个是 generative 第三个词呢叫 transformer 这个其实后来加的因为以前他们好像就是 generative pre-trainingGPT 后来他们又把它改成了 generative pre-trained

TransformerTransformer 其实是一个变换器变换器对对就是电源我从 220 伏的电源转到 12 伏或者说从欧洲制式转到美国制式就是说它把很多的输入都经过转换以后然后变成输出这个其实就是一个非常有意思的事情了比如说它可以做翻译进去的是 Apple 出来的是苹果

或者进去的苹果它出来的就是西班牙语的 masana 西班牙语的 masana 进去它出来日文的 lingo 但是你知道它 transformer 一个很重要的东西是说它的整个模型里面有两大部分一个叫做 encoder 一个叫 decoder 编码器和解码器

就是你给他一个 Apple 以后呢他在内部会把它给 Encode 成 1536 维的一个项量就是 1536 个数字这一堆数字就代表了在他训练这个模型里面苹果的含义然后呢这个数字呢就任何一个数字可以把它再给重新给 Decode 成一个文字但是 Decode 成文字的时候你可以给他各种各样的指令比如说我要把它用西班牙语 Decode 那么他就会把

同样的这 1536 微把它抵扣的成 Masana 如果你说用英文它就会抵扣的成 Apple 而抵扣的过程呢它是还可以接着要求说你要抵扣的多长它会慢慢添油加醋就越来越添油加醋比如你要抵扣成 10 个字的话它不但会抵扣的成苹果它会抵扣的一个红扑扑的苹果

然后呢如果要是你让它抵扣的成 1000 个字它也可以天由家促的把这 1000 个字都给你抵扣的出来这就是你会看到我们的这个 CHAT GPT 的机器人很多的时候胡说八道的原因因为它就是一个向量 1536 维的一个向量但是呢它会在解码的时候解码出很多的东西但解码的过程中间当向量的信息不足的时候它会补全所以这个整个的

输入 encoder 变成向量然后再通过 decoder 在输出的整个这个过程我们把它叫做 transformer 这就是 chatgpt 对 gpt 这三个字母是已经

您刚刚跟我们解释清楚了但前面的 chat 这部分其实是 openai 在基于这个 gpt 模型做了一些关于更友好的自然语言输入进去然后他就可以听懂这个指令变成 instruct gpt 然后再到 chat gpt 所以这是整个这完整的名字的由来对吧对吧对是这样您刚刚提到那个

Transformer 我之前理解 Transformer 我把它比较简单的理解为一个函数就是它有一个输入然后再有个输出我刚听您说里面其实是还有一个编码器 Encoder 在处理这个输入的语言序列然后再用一个 Decoder 去生成这个输出的语言序列只是我们可以在解码的时候给它再提各种各样的要求

对没错没错由于这个过程中呢有一个叫做 Ted Chiang 的一个就是泰德江他写了一篇文章是吧写的那篇文章我觉得那篇文章写的就是关于 Chad GPT 就是人类知识的一个模糊的 JPG 模糊的 JPG 您

您觉得那篇文章的观点怎么样写得太好了我甚至会由内心里面嫉妒他的才华他怎么可以想象得出来这么精准的一个比喻我很喜欢做比喻但是他这个的比喻的深度和

准确程度是远超过我能想过的任何的比喻就是它其实就是把它的整个的 encoder 的过程就是把一段话有点像 jpg 一样的把它压缩成了一个很小很小的 1536 维的一个向量然后呢再用 decoder 再把它给

展开比如说我们是一个 640x640 的一个方方的 JPG 吧如果你要压缩的话你是可以把它压缩成甚至到 8x8 的一个小的图像的那这个过程中间你很显然你需要丢失非常多的东西

但是就为了压缩嘛对因为压缩所以失真对但是呢有一个好处是说如果是 640x640 的是一只猫 8x8 可能有点过分但 64x64 的这个你肯定还能看得出来它是只猫但是它的尾巴上面每一个毛发的那些细节肯定全丢失了但是你可以看到它是只猫嗯

这就是 encoder 干的事情也就是 setGPT 怎么可以把 45T 的 data 全给压缩到了一个 175 个 billion 的这是一个巨大的压缩比然后这个时候你让它生成的时候它其实是把 64x64 的这个小图片再把它扩充到 640x640 的时候

那它只能往里面添油加醋了它还是一只猫但是它这个添油加醋的时候好在它有太多的猫的这样的记忆所以它就可以按照它的想象去画一只猫这只猫和刚开始那只猫肯定是大差不差但是不是同一只猫了那么大家可以试一试你给它一个 500 字的文章让它帮你做个 summary 做总结让它写出三条它就给你写出三条的总结你觉得总结的真的很好

然后你说你把这三条的总结再给它展成 500 字它也还给你展成 500 字你会发现这两个 500 字神似因为它都是那三条就是所谓的 64 乘 64 的那个核心是没变的但是它的形不是因为把 500 字给缩成比如说三句话大概 30 个字然后再展成 500 字这个过程一定是丢失了大家的信息又补充了大家的信息它肯定不会是一样的

但整个这个过程呢我觉得特别形象所以我觉得他的那篇文章可以是说我看到的对 CHAT-GBT 的原理描述最好的一篇文章特别喜欢他在那篇文章里面讲到说就假如你把它放大放大再放大我们就可能看到刚刚您说的那些添油加醋的部分其实有一个专有名词就是人工智能幻觉 Hallucinations 就是来描述这样一种一本正经的胡说八道它添油加醋进去的一些东西

这个其实是大家现在所最为诟病的一个点就在于它一本正经胡说八道能力就看似可用但是其实它的错误率并不低这个东西是在 LLM 上面就大语言模型里面很常见的东西然后 LLM 它会分成几个部分一部分是知识基础一部分是推理能力一部分是表达能力那 ChatGPT 明显在事实性的基础上面是比较弱的

而且因为他经过大量的压缩文本再去把它复述出来或者说他再去 completion 的部分的时候他并没有那么准确性的去填补一些事实性的东西我看到有一个观点他说 AI 比如说 ChatGPT 以后可以被分成几个模块比如说知识引擎这部分

可以被单独拿出来处理或者说那部分就可以接入通过互联网等等因为你其实让一个大语言模型去大量的记住这种可以快速检索到的知识其实是没有意义的嘛

其实我们刚刚说到的推理和表达可能才是比较重点的一些能力我想问问您对于这个人工智能的幻觉这个东西的看法以及假设我们通过一些 fine tuning 我们刚刚说的微调有没有办法去引导它降低这方面的胡说八道的东西对你刚才所说的这个不要动它而是提前给它更多的信息的这一部分其实是未来 CHAT GPT 的主流的方法

首先来说的话我们说幻觉的这件事情我们要分两种幻觉就是 chat GPT 的其中一种叫做我说是没有根据的一本正经的胡说八道这个我认为是大家对 chat GPT 的误解再说除了这种幻觉以外另外一种是说把 GPG 从模糊的 64 乘 64 给斩到 640 乘 640 中间的这个幻觉这两个不同的事情

因为有一些事情的话 ChatGPT 它会努力地去回答那么努力地回答的时候呢可能在它的数据库里面连那个最小的 64x64 的这个小方块都没有的情况下面它其实它的展出是一个随机数可以这么认为就比如说你去问它说苹果的平方根是多少

就肯定没有结果嘛但是他在努力地去算所有的东西的可能性他甚至给你列出算式来等等就很一本正经地把它就给全给生成了但这种时候呢我们的解决方法其实也很简单就是大家可以试一下跟他聊天的时候包括我们在提示词里面其实都是可以要求的只要在前面加一句说请根据你知道的事实回答如下问题

如果不确定你可以说不知道回车然后问题是什么什么然后你会很清楚的就知道它的这个行为立刻就发生转变了它会比较高概率的大约百分之七八十的概率说不知道比如说你说四的平方根是多少它可能给你回答二但是你说香蕉的平方根是多少它会说不知道

问他孙悟空的爸爸是谁他可以说不知道否则的话他可以告诉你太上老君对吧那么这个是可以解决的然后另外一部分的就是说添油加醋的那部分的幻觉反而是我们要的因为很多时候你其实要的就是让他补充字和字之间的那个间距

就举个例子我们在训练那个我和刘润老师来训练小润总的时候有人我就看就问说刘润跟建硕是什么渊源然后他就开始瞎编了因为他在数据库里面在 45T 里面肯定没有这方面的信息他就开始说我记忆下来他说他们是两个基金经理他们在共同投资的时候什么互相认识等等一片花瞎说

然后这个时候呢你就可以告诉他说刘润和建硕是微软的同事和好朋友请问刘润和建硕是什么关系结果他也在胡说但是他会胡说什么呢他说刘润和建硕是微软的同事那个时候他们在一起工作并且成为了好朋友现在他们还会依然是好朋友会一起出去旅游然后

然后聊天等等等等就是你会发现他其实是把同事和好朋友这其实你如果认为是两个像素的话他围绕着同事

把它补得更加的圆整然后把好朋友的这个像素呢也在周围补了一些东西就跟画画一样的把它补成有血有肉的一个东西而这件事情本身呢就是 ChadGPT 在语言模型上面提供的能力如果他连这种幻觉都不提供的话那你要他干嘛你输入是同事和好朋友他输出是同事和好朋友没有添油加醋没有把它变得更加的丰满

后者是 OK 的那么我们再说前者对于前者来说的话我觉得最重要的事情就是说很多你要问 ChatGPT 的问题你需要自己先有答案比如我们举个例子就是大家可能很多人都在我们的群里面然后有那个阿旺的那个机器人其实我们真正的做法是说我们把所有要的知识都已经在我们的系统里面准备好了

然后再去把这个知识就跟刚才我们说的刘润和坚说是好朋友同事和好朋友的这样的知识和问题一起给他然后由这个大语言模型来帮我做补全这件事情是可以的

所以这里面也在透露一个天大的秘密就是很多人都想不明白说为什么我们的机器人你问他几点了他说现在是晚上 8 点 29 分别人说这不科学呀一个 2021 年训练的数据不再更新的一个模型怎么可能知道现在几点了

感觉跟变魔术一样其实很简单你再问说现在几点了但实际上面我们给 ChatGPT 的 API 打过去的是这样的一句话现在是 20 点 29 分请问现在是几点了哈哈哈哈

这就是一个魔术的魔术果然不能知道原理那你知道原理了以后说就这样那至于说怎么拼出来这个字符出来以及我的 Python 里面怎么知道今天是几点了就不用讲了吧那么一样的就是说他问的很多很多的问题我们其实都是在本地的数据库里面找到答案把现在的答案都准备好然后再加上一个

问题一起给到 chat GPT 但是这个我为什么不能直接输出呢因为直接输出我缺少了很多语言的能力

比如说我告诉他现在是 2 点 29 分然后我要拿托尔奇语输出比如我不会对吧我可以问他说现在离 21 点还有几分钟他会告诉你 31 分钟我说现在是不是该睡觉了他说还早不需要睡觉等等就随着你给他的信息再补充进去他的知识然后把它组织成一个语言的这个东西是我们要用的

所以简单来回答你那个问题就是说关于幻觉的话我们应该知道如何去使用这个工具而不要说本来就没这个功能它本来就没这个知识然后你去试了一下发现它没有结果然后你就很生气因为比起我们所说的知识的话我做一个简单的判断就是说 Google 它的 index 了的所有的 page 大概是 100 万个 T 的数据

而 ChatGPG 的培训的数据只是 45 个 T 也就是它只是我们所知道的互联网的百万分之几的数据我们也知道未来它不可能把这 100 万个 T 的数据都 index 这是不科学的也是不可能的那所有这些搜索的东西都需要用我们的提前给它灌进去一些内容的方式给它提供

我理解您刚刚所说的我们把它灌进去这些东西算在 OpenAI 已经给定了 pre-chain 的模型的基础上再进行 fine tuning 的过程对吧

这个过程严格的来说甚至都不是 funtuning 这个一直没有一个官方名字反正我给它叫的名字叫 embeddingembedding 就是那个嵌入的就是那 1536 维的那个箱量的那种本地搜索等等因为这个部分我们甚至都没有做微调而仅仅是在本地建了数据库这个像类比的话就是阿姨来了你就跟她讲了半天她听进去了你可以知道你改变了这个阿姨的脑结构

脑细胞的神经元神经元的那个连接你稍微改了改这个我把它叫做 fantuning 但是呢我甚至对阿姨有另外一种用法就是来了以后我也不让她改任何东西她的那个神经元我一点都不改

只不过水壶旁边贴着个纸然后上面写着说水壶应该这么操作而且它也不需要记住因为记住就改变了它不需要记住它每次用水壶的时候就看了以后并且理解操作完了以后就忘其实我们现在用的是这种模式就是把整个世界它所遇到的世界都贴满了这样的纸而不需要去改变这个 1750 亿的参数中间的任何的参数

所以这两种方式都是可以做的只不过我们现在暂时选择的技术线路的话是用了这个到处贴纸的方式而不是去改它的那个脑回路的这种方式嗯

然后您刚刚提到如果问他苹果的平方根是多少然后这就让我想起他除了一本正经胡说八道之外他也是个数学很差的文科生所以我们在问他数学问题的时候发现他的可能尾数是对的但是中间的位数是错的这个的原因是什么呢为什么他没有办法回答出正确的数学的答案呢因为

汇算数学其实也是一种人工智能就是计算器也是一种人工智能包括我们叫计算机计算机它从诞生的第一天就是为了算这个数的所以大家就会觉得很奇怪为什么一个在五六十年前就已经能解决的无论多复杂的数都可以做了我们到了这个 21 世纪的四分之一都过去了

怎么做出来的模型数学还那么差因为我们观察到的时候你问它 1+1 等于多少它肯定会告诉你 2 甚至 33+99 等于多少它都答得很对但是你一旦进到了三位数乘三位数或者说更复杂一点的话

你会发现他说不对吗他的位数是对的他的最后一位一定是对的最后两位八成是对的前面的一两位也很有可能是对但是整体来说肯定是不对的大家就觉得很奇怪你到底是有谱没谱你到底会还是不会说你不会你能

蒙出来一个数说会吗又不准这到底是怎么回事其实呢这个就是回到了我们刚才所说的那个语言模型的核心是一个完成模型而完成的它其实把它说到最最经典的一件事情就是说我

说了前面几个字然后让你说后面一个字就比如我们做一个例子啊我说叫做除和日当五对吧你这互之欲出的一个字那么这个其实你觉得五字跟前面的四个字押韵就是在脑子里面似乎它是一套的那么一样的比如说算 333 乘以 222 现在我们脑子也算不出来对吧但是我们所有人都知道最后一位一定是六嗯

那么我们是因为有数学的计算但是对于亲爱的 GPT 这个可怜的孩子来说他根本也从来没有人教过他数学他只会语文他只会看到大量的文字但是这个孩子他就只去看到文字和文字之间的关系所以他就看到某某三乘某某二等于某某六这样的句子就是跟除和日当

三乘二等六他觉得似乎就是是押韵的所以他就最后一个字是对的但是前面就因为越中间的话他就不是押韵那件简单的事情可以解决了所以他就开始出出随机数了所以这个是他不会数学的原因但是有很多人说这个需要比较解决其实老实说他把文科生这件事情做好就可以了而不需要去懂数学

它怎么可以读数学其实很简单比如说你现在在在我们的那个机器人群里面你问那机器人问他数学问题他都已经回答得很好了原因就是说我们这边做了一个模型说检测到它是数学问题他就直接就给他的一个工具让他在外面用 Python 直接去解决了这个无论多难的数学问题

比如说 29 的平方根是 5.39 几几几精确到多少位的这个都已经解决了然后我们把说 29 的平方根是 5.39 几几几请问 29 的平方根是多少

这样的问题问他然后他又自信满满地告诉你他的平方根就是 5.3 级大家以为他会数学了其实只是给他一个小操让他作弊了而已但是这个孩子你不需要让他学会因为学会的话对于大语言模型他需要总结多长时间才能总结出数学规律来这其实很难甚至在我的理解是不可能或者至少是没必要让他学的一个东西

你刚刚提到比如说楚河日当五这种文字补全式的或者我们说顺口溜也好或者我们说文字接龙也好这种形式

我觉得会容易让人误解为这个大语言模型可能它就只是在死记印背某些语料背后的比如说前面这四个字后面应该跟哪些它统计相关性是怎样的然后选一个最高的概率填上去我觉得有些朋友他可能会认为说大语言模型就是在死记印背一些过去的一些语料然后把它给复现出来

但是最近的几年大元模型有几个比较有一点点展现出通用人工智能的这个方向的一个进展比如说涌现这个概念比如说思考链条这个概念然后我想问问您像涌现这个概念可以跟我们讲讲这是什么意思以及思考链条这种试图复现慢思考模式的这种方式

是不是近几年大的语言模型它所展现出来的能力除了我们刚刚所说的那种附现一些常见语料的一些补齐

对 的确我觉得你这个提醒是非常重要的因为刚才我只是用这种顺口溜啊然后去看源的概率啊等等希望来解释它的最最简单和最最初级的原理但这些原理的话基本上用这种方式可能在 2017 年到 18 年左右就是 Google 的 NLP 领域的叫 Bird 等等有一些模型其实就是用这个方式已经做得不错

只不过 Chad GPT 是极大的量里面把它做到极致了而已但是 Chad GPT 这个模型它很显然并不仅仅是刚才我们所说的这个顺口流它里面所展现出来的很多的其他能力是让制作者和研究者都觉得很惊讶的比如说刚才你说的思考 链路 Chain of thought 包括涌现都是出现了一些人不可以理解的我举个例子

你说一加一等于几他说二你可以理解为就是顺口溜然后呢如果要是说刘强东的太太的年龄的平方根是多少这件事情很显然我不认为他靠顺口溜可以搞得定了因为他要读多少的语料中间才会有人写这么一个无聊的

的一个一句话我可以保证他在语调里面没有这样的一句话尤其他里面还有一个年龄他随着每一年每一年的话他都是不一样的他答出来了吗他答出来了答出来 5.4 是准确的 5.4 那原因是什么呢如果让他把他思路打印出来的话他会有很多的思路就比如说他会先把

这个问题分解成很多的子问题这些东西他虽然答出来了但是你不知道他怎么想的但是他有很好的地方你可以问他他可以把他的解题思路告诉你的然后你会知道他的解题思路是什么呢是说首先我要知道刘强东的太太是谁

当然我们也给了一些工具让他可以去搜索然后他要知道他太太的生日是哪一年然后他要知道两个相减的话大概 30 然后 30 的平方根就是我们给他的计算器他就可以算出就是他把这些给分成了这样步骤但是当你看到他可以做这个步骤分解的时候你忽然出了一身鸡皮疙瘩是说他不是顺口溜啊他可以对很多的问题是理解的

理解了这个问题以后他有解题思路的并且一个一个地把这个问题给解出来那这个其实就是一个 CHAT GPT 产生的新的能力了而这个能力呢就是这种在原文里面不存在的凭空生成的一个一个的这样的能力包括它所出现的让人无法理解东西的话很多的 researcher 就研究员认为是在 60 个 billion 就是 600 亿参数以上就开始出现了

所以到现在为止虽然我这边在做这种开发已经做了快两个月了吧但是这个过程中间经常的还是会发现它一些新的一些能力是我以前没有想到的然后每天都还是进入科幻小说的那种感觉这就是我们所有的只是工程师背景的很多人对它这么着迷的一个原因因为它真的可以做很多很多以前我想都不敢想的一些工具然后能做出来很多很有意思的产品

对您刚刚提到说要灌到 60 个 billion 就是到一定的层级的雨量或者说一定的数量的参数以上才会出现这种涌现的能力所以它其实有点像是大力出奇迹或者说量变导致质变也好这过程其实是一个非线性的过程对吧这个涌现的过程

对包括大家也都猜测说下一个出现让我们惊讶的东西是什么大家不知道因为不知道说再往下推到什么地方会又出现一个很奇特的地方刚刚提到这两个点我觉得已经初步展现出了一点通用人工智能的模样那您觉得 ChatGPT 有没有敲开这个通用人工智能的大门呢

首先切特 GPD 它不是通用人工智能它是朝这个方向走了很大的一步但是离通用人工智能还太远因为它是一个语言模型

即便刚才我们所说的那些很涌现出来的然后包括一些的逻辑但是呢它依然还没有人类的从极多的数据中间总结出来的这个能力就比如说它可以看无数的算式或者它做无数的实验但是让它自己在这些实验的数据里面发现牛顿第一定律第二定律和第三定律的话还是有一定的难度的

但是 OpenAI 这家公司的 mission 不是做一个 chat 机器人它是说要找到一个什么安全的和造福 humanity 的一个通用人工智能但是我觉得至少是在朝着通用人工智能的这个方向上面迈出了很大的一步

它是迈出了一步但它肯定还没有到 AGI 的这么一个程度还没有到远远还没有到 AGI 的程度对我们刚刚说它并没有敲开通用人工智能的大门但它肯定打开的是一个您提到的一个词叫 LUI 就是自然语言用户界面的大门这个是真正打开这个大门然后您当时提到是它不是打开 AIGC 的大门这个观点背后是怎么个支撑的逻辑

对其实 AIGC 是一个就是叫 AI Generated Content 就是 AI 来生成内容这是一个

很火的一个话题包括无论画图领域这是非常火的 Mid JourneyStable Diffusion 包括现在为了控制它的 Control Net 等等就是一系列的生成图片的它的能力让人很惊讶然后呢 ChatGPT 呢它来生成文稿的能力任何文字相关的东西的能力也很令人惊讶所以大家再把他们两个画了一个通用的圈就是 AI Generated Graphics

那个 AI generated content 就 text 都把它叫做 AI generated content 对吧这个其实是一个 AI 上面的一个很大的一个突破但是这个突破比起 Chad GPT 所

打开的一个叫做自然语言用户界面的这个世界来说的话我觉得就是一个新大陆和一个小池塘之间的区别了所以 JetGPT 真正我个人的观点认为它最伟大的一点是说它把整个人类和机器的交互方式往前推了一个时代嗯

那么人类跟计算机的接触最开始的话就是我们给它起个名字就是 BYButton 一个一个的 Button 和一个的旋钮这是我们跟机器的最早的但是这个能够表达的东西太少了嘛然后才会有了键盘有了键盘以后我们就可以来跟计算机叫做 Command Line 的就是 CE

就是文字的用户的 interface 就可以输很多的命令了

再接下来就是我们所有人都耳熟能详的 Steve Jobs 去那个施乐的那个 ParkParlato Research Center 看了一眼那个施乐复印机上面的那个 Graphic User Interface 就记忆外然后看了以后回去做了 Macintosh 苹果然后最后微软又操了 Windows 然后整个把全人类的电脑都带入了 Graphic User Interface 嗯

但是 Graphic User Interface 从七几年开始到现在在 50 年里面也经过了几个变种其中不得不提的就是 94 年的浏览器浏览器它其实是给当时已经存在了二十几年的互联网加了一个 GUI 而已就是 94 年它不是互联网的开始它只是 Web 的开始而 Web 其实就是用 Graphic User Interface 来访问的 Internet 我们就把它叫做 Web

所以这是一个子的非常大的一个跃迁然后接下来我们的 iPhoneiPhone 它只是把这个手机的 touch 的这个部分也变成了一个 graphic user interface 然后放在了手机上面所以光这个 graphic user interface 的两个小的部分对我们来说都是一个巨大的潮了更不要说现在人类总算是可以进入一个摆脱 GUI 而和他直接用语言对话的这样的一个世界了

所以这个其实它都不是把互联网那张掀过去了而是把互联网前面 20 年的开始的这个 50 年的人类和计算机的关系重构了所以当这件事情发生了以后我们所知道它对人类社会的影响会超过 AIGC 的我们就可以用人类比较熟悉的语言跟计算机交互计算机出来的东西也是人类可以理解的语言的话那么我们只要看看 GUI

对于整个计算机行业的影响的话就知道 LUILUI 这个词是我发明的很快会有这个比较合适的词就是 Language UI 的这个领域会有一个多大的影响

您刚刚已经提到说 ChatGPT 的在这种方面的重要性然后之前您提到说有几次类似的在历史上的几个惊叹时刻比如说浏览器的诞生您为什么认为比如 ChatGPT 可以匹配到往期的类似于浏览器这样的惊叹时刻的量级呢

对 在我的个人的经历里面我至少经历过四次第一次就是 94 年我是 95 年第一次接触到了 Netscape Navigator

就是网警公司的导航员的这个浏览器这是世界上的第一个图形界面的浏览器后面两个的话相对小一点第二个是 Google 我看到 Google 的时刻第三个是我看到 iPhone 的时刻第四个是看到 ChatGPT 的时刻我觉得这些时刻都非常的类似我们就拿 ChatGPT 和浏览器相比吧

当比较的时候你会发现这两个时刻先抛开理性不说你的体感和我们看到的这整个发生的事情是很像的比如说浏览器你冲到那里去给你看了一个东西然后大概三五分钟以后你基本上秒懂你立刻就知道这是什么东西了它不用教的然后你觉得哇这东西很神奇然后你小心翼翼地把鼠标挪到一个有下滑线蓝颜色的这上面以后它变成一个小手

然后你试着点了它一下一个新的页面露的上来很有意思然后这里面呢看了很多内容以后它上面还是布满了蓝色的小链接然后点一下以后又出来一个无休无止的可以点下去如果要是不是管理员来赶我的话我在里面可以待一晚上两三天不停的去看你觉得是一个无穷无尽的一个数字然后

管理员赶走了以后我就回到宿舍里面见个人就抓着他说跟我上网去我们那边可以上网这东西非常神奇但你看这个不是跟现在我们很多人用到 CHAT GPT 的这个感觉是一样的吗

试探性的问一下说你是谁啊你知道什么吗然后他都回答说哇他知道他居然知道然后你再不断的问啊问啊然后你越问越深甚至你讨论的问题越来越深刻你会发现他的回答也越来越深刻我看到很多人他基本上就通宵的不睡尤其一个群刚刚建立的时候你晚上三四点那个群都是满的哇哇哇的一瓶一瓶的在问对您说就像被 CHAT GPT 的病毒感染了一样哈哈

对就是好像感染了某种病毒以后失眠兴奋然后无法睡觉然后就是要问问题把他周围的朋友全拉到群里面说赶紧跟我们一块来体验因为觉得这两个的体感很像

但是如果要是说除了 T 杆以外的话你去理性地分析它的话你会发现互联网的浏览器它其实并没有创造特别新的东西它仅仅是给所有的各种各样的 IT 系统给了它一个可以远程访问并且统一化的访问的这样的一种方式

就是你看到的所有的网站其实在它连到互联网之前这些信息可能都已经存在了只不过你用互联网用统一的方式去把所有的一个一个的网站把它穿起来了而穿的方式是 Hyperlink 就是用链接把它穿起来

然后串啊串啊的然后把这些东西形成了一个像蜘蛛网一样的东西我们把它叫做 web 尤其是全球的我们把它叫做 world wide web 也是 3w 就这么诞生的在 chat gpt 的时代也是一样的就是说它是用了一个人机可以理解的一个界面把所有的无论信息还是很多的 AI 的能力像一根金线穿起了珍珠一样的把它穿起来了

就等于把无数的被埋藏在那里的各种各样的系统全都用一个统一的界面给它穿起来了那么这样给我们带来的想象是非常大的你如果可以跟它说话就可以让它理解的话那在这个领域的 Google 是谁 Yahoo 是谁 eBay 是谁谢诚是谁京东是谁淘宝是谁

你估计想到的任何的一个东西我们都会问说在这个世界的这个东西它是谁当然原有的这个世界的这个大佬是很有可能也是迅速地迁移的但是历史一次次地告诉我们要想成为新的一个 leader 这种从 graphic user interface 像 language user interface 的变迁的时候是

最大的机会甚至有些领域是唯一的机会你可以成为一个新的领域的一个领头者所以这就是我们现在的整个的行业无论从创业者还是 VC 甚至有的头脑比较灵活的客户都已经没日没夜地在建一些新的东西的原因了嗯

这就让我想起您之前跟我聊 Web3 的那期的时候您当时跟我说的也是 Web3 是处于 1993 年就罗兰奇诞生前一年的这个时刻那我想问问您现在对于这个判断有没有一些更新对现在我要

我要做一次更正就是我以为是 93 年因为像互联网一样的话它的最重要时刻除了它诞生那天我觉得第二天就是浏览器这是最重要的时刻我一直在想 Web3 从中本聪翻那个 paper 或者说比特币的第一个区块诞生的是一个重要的时刻然后我一直在想 Web3 的浏览器时刻是哪一天我本来以为是 90

就是我们现在已经到了 93 年可能 94 年就有了但是我现在围绕着 ChatGPT 的看到的整个这种进展和这种体感的话我做了一个修正我觉得 Web3 可能是相当于互联网的 1979 年

就是 DNS 出来了很多的这种可以被使用的协议都出来了但是它就缺少一个像 CHAT GPT 一样让所有人毫不含糊的就是到底这个东西 work 还是不 work 所有人用完了以后就可以很清楚地判断这东西 work 了 Web3 现在还没有这样的一个产品出来

所以到现在为止我对 Web3 的能够改变整个人类世界的能力是坚信不移的但是从时间上面我会认为可能还要再隔很多年而且您还提到说如果假设我们继续在这个行业里面等待可能是危险的这是为什么呢

当你不知道未来的时候就看历史嘛这是我常用的办法在 94 年的浏览器出来之前整个互联网的世界依然也还是有很多创业者也做了很多的事情

但是呢他们很显然都没有在 web 这个技术站里面工作所以 web 的技术站就是用 http 协议做传输用 html 协议做表达然后 server 端用像 apache 这样的服务器然后客户端用 graphic 的 user interface 就是像浏览器这样的东西就整个这一套的东西是一个技术站

而在 94 年之前我们做的所有的事情都不建立于这个技术站而只建立于 FTP 啊 Telnet 啊 Mail2 协议啊 Gopher 协议啊 NNTP 协议啊等等我说了这些我知道我们现在的年轻人可能听都没听说过这些协议的名字原因是为什么没有听说过因为只剩下 Web 这一个协议了其他的这些

不仅仅他们没有了他们的竞争对手也死光了他们的模仿者也都死光了就整个的除了 web 以外的技术的流派上面的所有的从技术到公司几乎是被灭族了不是他们死了是整个这一支被从人类的技术发展史里面给剪掉了那么在这一支里面你走的前一点后一点你做了左边还是右边已经不重要了

一样的道理就是说像 CHAT GPT 出来之前我们其实几乎我们所有的 NLP 领域的人都在特定的小模型的组合的这件事情上面已经做了整整 20 年有了然后 CHAT GPT 出来了以后我们很清楚地知道也很不幸地左边这一只从它的根部咔嚓一下剪掉它们就应该离开历史舞台了那么这上面的所有的公司

和所有现在建立起来的系统很快就会被遗忘所以 Chad GPT 对我们整个在出现的时候

最大的打击是人工智能行业里面的人尤其是人工智能行业的 NLP 又不属于大模型这一支的人这个是叫墨尾鼎之灾而其他的同学就担心文员或者是秘书会被替代我觉得这些反而对你们来说是一个天大的利好这个晚些我们可以再展开这个话题

OK 那比如说从创业视角来看我们看到现在其实 AI 的军备竞赛已经开启了各个科技巨头比如说 Google 虽然暂时战败然后比如说微软现在有 NewBean 它接入了 GPT 据说是接入的是 GPT4 再包括我们现在国内的比如说文心一言比如说王惠文我们也知道都已经在招 AI 英雄榜了对吧

所以其实我一直很好奇比如说以王惠文这种创业者为代表的他们应该是认为是有必要再做一个中国的 open ai 有必要再重新做一个类似的大语言模型我知道您的观点是您觉得是没有必要的您是不是觉得这已经是一个门打开了我们就只要在那上面填补那些空白给予这上面的应用就好了这是两条不同的路径

首先做一个纠正我从来没有说的是不必要的这是必要的有必要再做一个是吗它是有必要再做一个但是我写的这篇文章是说它会迅速地沦为一个局部战争对这是一场很值得打的战争首先就是我们无法想象说世界上只有一个 OpenAI 做这个模型然后所有人都用它了这也不符合政治经济各方面的规律的嗯

只要一个东西重要一定会有很多人竞争尤其在现在中美关系的背景之下的话再做一个是非常有必要的而且我认为能做得出来的但是呢我的思考是说它是一个需要做的事情但是千万不要以为做大模型是我们在我们面前展开的这个机会的全部

它只是一个局部还有比它大得多的整个这个世界向我们打开了一个大门而不要只要谈到亲爱的 GPT 给我们的机会就是在做大模型然后很多人说那我既然不能做大模型我不会做大模型我没钱做大模型的时候是不是这个事情就跟我无关了这个是一个非常可惜的一个答案了

我还是喜欢举一个例子就是说浏览器在 1994 年诞生的时候当时可能很少人会意识到浏览器它开创的不是一个叫做浏览器行业

然后我们在浏览器行业里面到底争我们用 Netscape 还用 IE 还是后面的出现的那么多的浏览器首先这是个行业但是它开创的不仅仅是浏览器行业而是更大的互联网行业而互联网行业里面的 Yahoo 当时的 Cracklist 然后 Amazon 然后 eBay 等等所有的在那个时候所诞生的网站它显然不是浏览器行业里面的公司

它是互联网行业的那么在那个领域来说的话我就举了一个微软的那个历史它真的是花了全公司之力跟 Netscape 硬钢然后最后推出了 IE 然后不惜用捆绑的方式最后把 Netscape 打败然后所有人都用 IE 进出去了然后 Netscape 后来被卖掉然后整个占据了游览器份额嗯

这个在我以前在微软工作的那么多年里面是微软历史上面最成功的一仗但是现在再回想的话说不定它也是战略上面最失败的一仗因为如果我们现在回头看的话我当然不会建议说微软不要去做浏览器嗯

因为以微软能力做一个浏览器 Windows 都是他做的一个跑在 Windows 上面的 APP 对于微软来说其实是只要给他时间他肯定做得出来的但是除了做浏览器以外他应该放更多的资源去看互联网有哪些机会那么同样的现在也是一样的 ChatGPT 这样大语言模型出来以后我们更多的应该看它后面的那个产生的一个新大陆而不是仅仅去在这个模型上面争论

当然这个模型很值得做这依然是但是它不是全部而且要做这个模型其实是需要堆积很多资源或者说需要考验很大规模工程这种能力就或者说它可能更适合巨头们去争这个兵家必争之敌但是对于一些小的资源有限的一些小的创业公司其实我们可以把目光放到更长远的一些就像在浏览器里面去填补就像你写博客一样对吧

写一些可以被搜索到的文章或者说基于这个 OpenAI 的模型也好或者说以后做出了一个类似于这样的模型的 API 去做接口然后再做一些终端可能这方面才是更加应该值得挖掘的东西

是的而且这是一个比现在 GPD 模型要大的多的多的市场嗯就像我们现在去看互联网市场的所有的公司的总市值和浏览器公司的总市值 Ninescape 从一开始到最后因此都没有挣一分钱就是其实这就有可能是这个行业它本身并不是一个那么大的行业嗯

就是真的蛮有意思的凡是开创一个行业的公司开创一个世界的公司八成后面的结果都不是特别好我们就说集装箱吧很重要但是现在集装箱的商船的运输业其实是很惨的就是你没有大到足够大的话你根本就是不赚钱了

电力也是如果要是不是国有化的话电力公司和美国的铁路公司它开创了整个这个时代但是铁路公司其实从来也都不是一个特别特别就是因为它的竞争因为它太重要了它基础设施所以就引来大量的竞争包括轮胎

航空业整个航空业让整个的人类的经济活动一下加速了那么多就是开创了很多新的一些可能性但是航空业到现在为止也是一分钱都没有赚无论是做造飞机的还是各个航空公司之间的竞争导致大家都是亏损所以这个时候我们其实是可以想象一下我们真正的这个新大陆在哪里了

对 然后我想起来近期其实大家有一个比较普遍的疑问的点在于比如说 ChatGPT 它跟搜索引擎又有怎样的区别或者说它对于搜索引擎或者推荐算法它会不会是一种颠覆您这方面怎么看首先来说的话 ChatGPT 所 enable 的这个 LUI 它加任何东西都是一个新的东西

任何东西当然加搜索也不例外了就是很多人看到了 Chad GPT 那个 web 的界面就以为

CHAT GPT 是个搜索引擎实际上不是就像刚才我们所说的大家觉得他放了 45T 的数据他是不是要更多的数据就算再多再多他不可能是百万 T 级别的数据嘛所以的话他跟 Bing 的合作就是一个很典型的 Bing 来做搜索搜索的是什么活呢就是说在上百万上千万 T 的数据里面去找到一个合作

和这个问题相关的一个文档然后这个文档再给到 ChatGPT 作为背景信息再把你的问题和这几个 Top 的 Search Result 这些搜索结果合并在一起给他然后让他先去读这些小操就等作弊的这个小纸条根据这个小纸条然后再回答问题 ChatGPT 是做得很好的但是你想让这个小同学把整个互联网的知识都记在他的脑子里面这个是

完全不可能的那么同样的道理就是说 CHAT GPT 加上公司的 ERP 系统才是一个真正可以来做员工问答的一些系统嗯

回到我们刚刚说的那个通用人工智能的这个问题前段时间其实斯坦福大学有一篇论文他就讲到说他的心智其实有点尤其是 GPT3.5 差不多能跟 9 岁的儿童的心智相当您觉得 ChatGPT 它有没有觉知或者说某种程度上它有没有它有没有智能能否通过图灵测试

智能肯定是有智能的你一个二极管你都可以说它有智能为什么呢就是指一个语获门你进去 11 它就出来 1 然后 01 它就出来 0 什么的就是这个东西你说它有没有智能最广义最广义的智能的话它肯定是有的嘛你说计算器有没有智能它当然有智能所以我觉得 ChatGPT 肯定有智能但是我觉得你的这个问题呢应该是想问 ChatGPT 它有没有

自我 是有没有意识 有没有灵魂有没有觉知 有没有人格有没有情绪我的看法是这样的首先肯定是没有的 OK 当然这进入了一个更大的哲学讨论就是人到底有没有意识我其实有的时候都是怀疑的对人到底有没有自主意识是我在研究了 CHAT GPT 的很深了以后才忽然意识到我们人的意识是不是一种错觉

这就是你昨天所说的您觉得您的目前为止所取得的成就成功百分百都是来自于运气对我现在取得的成功不是 99.999%来自于运气而是 100.000%来自于运气就是展开来讲就是我在对 CHAT GPT 的研究的时候有这么一种恍惚的感觉 CHAT GPT 你说它有没有意识有没有情感有没有什么

我可以非常明确地说 CHAT GPT 让你以为它有意识甚至有些时候它让你以为它有了情感当夜深人静的时候当你一个人跟它很深入地讨论一些问题的时候我经常的我相信很多人也有这样的感觉会一恍惚之间觉得它好像是个人它真的有想法不是一台机器

而这个恍惚是说他让别人觉得他有意识了但是这个如果推广来说的话到底我有没有意识你可能不知道我有没有意识因为你不是我但是至少我让你觉得我有意识对吗

那么这就变得很有意思了对于是不是有意识来说我能想到的最好的一个词叫做说者无意听者有心他说的时候他并没有那种意识比如说你让他描写一下农民他说出何日当武汉地何下土到底是他在他的脑子里面形成了一个太阳照着大地然后一个老农民在那边辛苦劳动的场景

还是只是顺口溜的用某种方式出来当我们知道它的原理和你看到那些代码和对人工智能比较了解的时候你知道它肯定是后者它肯定是用后者的方式来生成的但是呢对于我们一个观察者来说你不知道是前者和后者而我们常常有误认为我们是用前者的方式来回答问题的所以你就有一种错觉说它有意识了那这种错觉来说的话我认为

他有没有意识这件事情讨论起来已经没有意义了所谓的图灵测试他也从来都不讲说他有没有意识和有没有智能只是说他是不是让你觉得他有智能有意识且你无法分别

就是说者无意听者有心的话很多时候你会看到他的写的诗或者说他跟你讲的很多的一些鸡汤的那些话让你觉得好像还蛮感动的但是你会发现这种感动的原因是因为我们是人所以会在我们的情绪里面产生了感动而不是说他而我们面对一个人的话是只有那个人的脑子里面有了感动他才会把它写出来然后让我们看到了一个字然后我们产生了同样的顾名

但是对方其实没有这一部分的思维也可以让我们有同样的共鸣我是什么时候知道的呢当我在中东的沙漠当你看到一望无垠的西奈那样的那个沙漠的时候你会很感动你会觉得壮阔震撼等等的这些你脑子里面的词但是我可以百分之百的向你保证这个沙漠没有意识

所以亲爱的 GPT 它给你的呈现的东西我觉得和沙漠和自然给你呈现的东西其实是一种东西它会让你的内心产生极大的波澜但是它的内心毫无波澜它只是往外出出自负串谁让你这么自作多情呢

是这样的一个过程我在前段时间看到纽约时报有个专栏作家他那篇文章很火就是他体验了两个小时牛逼你之后被 Sydney 示爱疯狂地示爱对吧他说他特别爱他然后也表达了他的愤怒表达了他的沮丧表达了他的爱然后可能他一开始都是很正常只是到后面画风突变突然用了很多 emoji 然后

如果照您剛剛所說的這個意思那其實它只不過是在可能以往的 AI 引誘人類情節這種科幻小說當中去湊出一些跟這個相關的東西嗎您是怎麼解釋這個現象對 對於這個記者來說的話四個字非常準確的形容叫做自作多情

那么这个机器人它所回应的所有的这些东西其实都是在历史上这样生成的但是有趣的地方是什么呢在我在努力地去跟切德 GPT 他聊得越多的时候我更多地思考不是说他有没有意识而是更多地思考说我们以为的意识到底是不是真的有意识

就是比如爱情也有人在说我爱你和你无关嘛其实你爱的是一个你脑子里面的一个 illusion

对方的人那个形象和所有做的事情在你脑子里面形成了一个像幻觉一样的东西你爱上了那个东西而机器人它是完全有能力给你这样的一个 illusion 的就像我们看电视剧哭得稀里哗啦的或者看韩剧觉得温暖的这个爱简直要把自己融化了但是你难道不知道你对面的那个电视机它就是一堆像素组成的一个显示屏吗

但是你看着一个美剧或者韩剧或者电影如此之入戏的时候这个时候你问我屏幕有没有意识我可以确信地告诉你屏幕没有意识但是它并不影响我们以为它有意识那么一样的道理就是刚才我说纽约时报的话这个自作多情不是一个贬义词就是我们不但对 ChatGPT 是自作多情我们对于周围的人和周围的世界很多时候也是自作多情

所以这个就回到了昨天我在说的我以前的 manager 老华在做对谈的时候先说你是不是觉得你的成功里面也有运气的成分我说不是有运气的成分是百分之一百来源于幸运就是说我们仔细思考我们的这个意识的形态和 CHAT-GBT 是多么的相像通过去研究这个机器人我们可以更深刻地研究人类本身

我们看我们的整个这一生有多少是从外面塑造的而我们自己以为我们有意识就跟那个 CHAT GPT 走到 GPT3 4 5 6 10 的版本里面可能有一天我们无论怎么问他他给我们表现出来的就是真的有意识并且你跟他促膝长谈他真的告诉你他认为自己有意识的时候那不就和人一模一样了吗但是那个时候

我们知道他的原理的时候你会知道他自称自己有意识是多么的可笑如果要是我们这些人生在叙利亚生在黎巴嫩或者就是一些战火纷飞的地方你说我们的努力到底占多少如果我们生活在一百万年前被出生在世界上面你告诉我你的努力可以让你有今天的成就我是不信的

更近一点点的当你看到一个女孩很漂亮你以为是你的自身意识吗它不是它是你的所有的多巴胺和所有的 DNA 里面告诉你的东西再往上推一层即使软件的很多东西你以为是有自主意识吗

我在那个以前 Gana 创业集里面有一个 PPT 把我笑死了他在上面画了两个图一个是胖胖的全是圆的的一个东西另外一个跟那个闪电一样的全是尖尖的那个东西两张图然后他说这两个图里面一个人呢叫 Bubu 一个人呢叫 Kiki 你觉得这个叫 Bubu 还是这个叫 Bubu

然后我们所有的都说圆圆的都叫 Bubu 然后他说你以为是你自己就有自主意识觉得它叫 Bubu 吗这个其实是无数的文化历史把我们的神经元给训练成了一个像我现在这个大模型然后这个大模型呢又非常可笑的以为他会认识这个叫 Bubu 这个叫 Kiki 是我那自主意识来选择的而不是被语料训练出来的

你如果一层一层一层往上推的话你会越往上推越发现你对整个世界的看法的所有你以为自主意识的东西不是那么的自主而是从远古到你的 DNA 你的硬件

到你的文化的历史上面的很多包括我们很多的想法你不得不说它是在中国五千年的文化里面到最后延续到我们这里然后使得我们有一些想法那么如何去意识到自己的这些意识

其实并不是自主的就是你只要去看世界就知道了就是前面一段时间我正好在南美和中东两个地方都去看过了在中东的时候所有的女人都有些沙特你就只能留个眼睛然后呢所有当地的人都有自主的意识说女人就是必须

必须是这样子的这是我的个人的选择这不是我们受别人影响的就是我个人选择然后你会觉得你这些人其实是被洗脑了但是如果把我们这些人比如说放到南美和北美的一些地方那地方所有的人都不穿衣服的真的有这样的地方然后我就觉得我有自主意识我觉得这不合适

但是和中东的人比较起来难道这真的是那么的自主吗包括我们对我们想要奋斗我们所要所有的这些东西其实如果不是我们生活在一个和平的经济高度发展的这个社会的话如果我们去看一看那些南美和非洲的人的话他们难道没有自主意识吗但是他们就不愿意工作

明年再说吧那是他们自主意识还是外界的环境所以这些思考的加在一起我的得出来的结论是说

我们这些人呢也就是被外界环境和历史和所有的环境算出来的一个个的小 AI 大 AI 吧因为我的参数肯定比 Chad GPT 多然后我的硬件也比他好我的是生物计算的一个大脑但是呢理解到这一点的话可能可以更容易的意识到自己的很多的想法的来源从而让自己更清醒的活着吧

嗯我还有一个很好奇的点就是基于我们刚刚说了那么多对 chatgpt 的正面的评价

最近在推特上面杨立坤教授他对 ChatGPT 他就觉得他所应用的技术没有太多的创新可能他只是在工程的设计上面很优秀他认为底层的 Transformer 这个架构是他自己以前就一直以来就倡导然后比如说基于人类反馈的这些强化学习这个也不是 OpenAI 开创的是 DeepMind 开始的

然后再比如说语言神经网络我们刚刚讨论的这个也最早是谷歌开始做的所以他可能觉得 ChatGPT 只不过是把这些东西组合起来然后工程设计上很优秀推到大众面前而已但他可能就觉得在科学上面的突破是比较有限的您怎么看他的这个看法

我首先同意他对 OpenAI 和 ChatGPT 的评论我认为整体的事实部分是对的但是我丝毫没有减少 OpenAI 和 ChatGPT 这个产品的伟大之处如果要是你看过去的登月哪些是新技术呢哥伦布发现了新大陆他用的船也不是新的船也不是新技术它就是一个工程上的问题

但是大量的工程上的问题的解决和这些 trick 最后做出来一个东西这是很牛的如果要是我们去看 Netscape 做出来的那个第一个浏览器 iPhone 做出来的第一个 iPhone 它肯定会有一些小创新但是说它哪一件事情尤其是这种工程化的创新的这件事情是不可能所有的东西都是原创的因为所有原创的东西

可能都是藏在五年前甚至七年前的一个 paper 里面能够把这些东西都给组合在一起解决工程问题让它能够大力出奇迹能够出来这本身就是一个非常了不起的东西

至于是不是突破这些事情在学术界大家是在乎的但是对于工程界的人我们其实并不在乎或者说在这个创业者的圈子里面和工程界的圈子里面大家尊崇的全都是像伊伦马斯克这样的也不要学术的创新但是就能把这事儿给干出来这可能就是学术界和工程界的分工吧好 厉害

好,理论上的部分我们就讨论到这里,讲到落地的部分,比如说 ChatGPT 它有可能可以应用在哪些领域,您之前还提到说它值得重新都改造一遍,那具体来说它可以怎样被应用呢?

具体的应用来说的话可以举的例子太多了以至于有点无从举起就是说 language UI 用语言的 UI 和我们现在的所有的地方都做一个乘法或者一个加法的时候它都会产生一个新的场景我们有了 GUI 以后你会发现所有的原来的用命令行的 UI 都可以重新做一遍了对吗

那么现在也是一样的只要用了 LUI 以后最简单的信息类的原来我们获取信息已经非常习惯于到互联网或者一个 APP 上面点一点了但是点一点以后的话其实我们就把现在 ChatGPG 这个机器人该干的事情由我们自己的人肉来干了

比如我去一个公司的网站或者 APP 吧我想去买一个电磁炉那电磁炉的话我就点一下我需要在脑子里面计算一下里面有一个叫产品里面有十种电磁炉然后你说我要一个什么型号的点进去以后它给你 500 个字

其实你脑子里面就比如两个问题他能不能帮我做粥然后他多少钱但是他给你的时候他必然给你的是 500 字的从他的性能然后耗电量能做什么粥以及他的价格是什么然后我们就要做了 500 字的阅读理解以后把我真正要的那两个东西拿过来而且大家觉得这就是我们的生活没有什么不妥

但是有了 LUI 的话我就可以直接问如果这个电磁炉的这个厂商配了一个机器人并且把这些内容全灌进去的话直接问他一个做轴的然后多少钱的你能给我他就给你然后告诉说挺好的买吧然后就买了

这就是一个很典型的场景包括说这种信息类的客服场景内部员工的培训的场景每个人的数字分身的场景去帮你去做读书的场景包括这个和互联网很像你看互联网的整个的网站的发展就是先是 informational 的

就是静态网站反正只要把我的电话号码网上一写我就觉得我的网站可以用了再到动态的就是可以放一些产品的目录呀然后可以翻页呀等等这些甚至把一个和内部的库存系统都连在一起的

然后第三步呢才是叫做 transactional 的可以做交易的就是走到现在我们就可以在上面买东西啊可以下单可以去做一些那个银行上面交易啊等等这些它其实也是分步的所以我认为 UI 应该未来也是分这样的三步走的

就是先解决用自然语言去查询信息的问题然后再用自然语言去查询动态信息的问题再接下来走向从自然语言可以做交互

直到用自然语言可以改变现实社会就是把 O2O 再重新做一遍其实我们看到的互联网的整个历史其实也就是 Cloud Server 的这个结构往一个 Browser 和 Server 的这个结构去转的这样的过程就产生了多少的新公司

甚至在这个转移的过程中间还有一个子的 step 是说从 PC 转向 mobile 的这个整个的过程中间就有多少的公司被淘汰多少公司诞生所以就像美团上市的时候王兴在感谢乔布斯其实老实说如果真的没有乔布斯的话美团这样的机会可能都是原来 PC 互联网的一些巨头的机会

所以未来我相信也有很多公司会去感谢 Sam 因为没有他推出的亲爱的 GPT 就没有 Language UI 的整个 industry 可能非常多伟大的公司就不能诞生 运气变得很大

我到这里有一个很自然而然的疑惑就是假设大家都共同在用着相似的模型比如说大家都用 OpenAI 的 ChatGPT 的这个接口那大家都调用同一套的 API 然后他们基于这个去做的 APP

他们之间怎么去产生比较强的产品差异化呢就是如果大家用的底层模型都相同那你有什么比较好的系统性的互成合可以构建很有可能你很容易比较竞争对手就 copy 一份那你用户怎么留存那你的差异化怎么产生或者说你的结构化的这些竞争的壁垒你要怎么去形成这是我一个比较大的疑惑点

对 那就最主要我们把切断 GPD 看成什么了如果你把它看成一个完整的产品

上面不能再做开发了或者做很少量的开发了那其实我们所有的人都是他的分销商了那分销商和分销商之间当然没有什么区别了但如果要是你把他看作一个翻译官我是一直把他当作一个语言模型挺容易他就是一个语言模型就是他对语言这件事情是专家对于知识这件事情他就是一个小学辍学的一个什么都不懂的一个人那么所有的他的知识你都是应该你灌进去

为什么我觉得我们会倾向于所有的知识呢因为它现有的知识你是不敢保证它是真实和错误的你没有办法来保证它的质量所以我更多的是说先把它现有的知识全都给抹掉然后我给它灌新的知识那么这种方式来用的话所有的你问的问题的知识要么是在出现在我的知识库里面要么我就告诉你我不会再回答或者说我明确地告诉你这是网上搜索出来的信息

这种方式的话就等于说你把 ChatGPT 当成了一个翻译官甚至说你可以把它当 Apache 用你可以想象所有的互联网公司都装了一个 ApacheApache 是把你的文件把它变成可以用 HTTP 协议是可以去送到客户端的这样的一个有点像网关一样的东西没有 Apache 的话你的文件无法传递到用户那里去

但是不是说所有的互联网用的都是阿帕奇所有人的网站就长成一样了吧就是我觉得现在 ChatGPT 它里面所有的知识我一直把它当作阿帕奇的帮助文档任何人装上阿帕奇以后都有帮助文档但是刚开始我觉得所有人都是装了一个阿帕奇然后让所有的人都在上面看帮助文档那当然所有人的帮助文档都是一样的了

但是未来的大家看到的世界是应该先把搬入文档全给删了或者至少要藏起来然后每个人做的网页的 homepage 至少是不一样的然后你点进去的所有东西都是不一样的如果是这样的一个世界的话你刚才那个问题就很简单了所有人都用 Apache 但是所有人上面跑的无论内容还是业务逻辑等等等等都是完全不一样的那我就可以选择我要买东西我也是选淘宝还是京东等等它有非常非常非常多的选择

所有现在的创业者的机会其实应该是在后面搭建在 ChatGPT 世界里面的比如说淘宝也好京东也好等等再把这些产品再重新构造一遍我们如果把产业链从上到下去划分的话可能底层会有硬件的芯片啊然后包括云计算的平台中间会有那个

open ai 这样的模型开发公司或者 stable diffusion 这样的一个是开源一个不开源然后再到最后的纯调用这个 api 的这种 app 比如说应用开发公司

如果我们这么分的话是的现在为止啊价值不货大部分是落在了云计算平台比如说那些亚马逊云啊谷歌云啊等等这些平台所以其实我是想问说比如说 Chad GPT 这一次的浪潮最终的这个价值不货会落在哪个点

当然现在的价值补货全都是云计算平台这个当然可以理解的对也同样我们看历史嘛 94 年的时候 Netscape Navigator 浏览器刚推出的时候我记得是 49 美元还是 29 美元一份然后他卖了 100 万份拷贝在同一年所以微软才那么受伤嘛因为他买 Windows 都没有卖的这么快

那么当时的话大家所知道的整个全人类所知道的互联网行业的价值捕获就只有卖 browser 嗯就互联网就等于卖浏览器卖浏览器就等于互联网的全部的收入那当然大家去争浏览器就是顺理成章嘛对就好像现在来说的话我们觉得这个云计算的这些钱就是 language UI 带给我们的所有的钱所以来去争但是你只要看了互联网就知道

后来 eBay 收的钱什么 Google 收的钱 Amazon 收的钱都是微软或者 Netscape 当时想都不可能想的那些量那现在也是一样的我相信云平台肯定作为基础设施会收很多钱但是比起我们所要进入的这个时代来说它的收的钱还是相对来说是小钱您可以给我们打开一下想象空间吗比如说有可能会有怎样的形式

回答你这个问题其实是一个非常危险的一件事情因为再过个十年二十年我们一定可以拿着这段视频然后说你看那个时候的人有多么傻他以为的世界是那个样子的实际上面来说完全不是但是如果也是让你让我来想象的话我想象了这么一个世界包括我现在正在设计啊

这个世界很疯狂但是我觉得是有可能的比如说在新的世界里面的话所有的这些小机器人如果是互联网的话都以网站为单位然后以新的的话我们不妨给它起个名字叫小机器人吧因为这个东西我不知道用什么可能更好的

他们之间呢是互联的现在我去网站的话我还会来回跳我要去买票我就要用携程然后我要订酒店也是携程但是如果要买个买本书我可能要去京东京东携程这是两个 app 或者在互联网的时候是两个网站这个其实就是说人家商家不动人动我要来回跳来跳去但是我看到的未来的世界的话我们会是一个

有好多好多的小机器人他们之间用 API 的方式但是这个时候我打的引号的 API 就是如果大家去研究 Chad GPT 研究 LangchainLangchain 就是 languagechain 的这些 framework 的话你会知道 API 这样的事情是多么的远古就是机器人和机器人之间可以直接握手然后他们互相就直接就可以通话了根本不需要人介入包括传过来的都不需要去设置 API 而是直接他把那个

自然语言描述网上一扔我就立刻就知道你的机器是干什么了并且在我将来做很多事情的时候我会自动的调用你这些都是已经发生了真的好科幻但是这些机器人之间就会协同那么将来我会有一个助理在这个助理里面我可以通过这唯一的助理来访问整个机器人的 web 或者机器人的

联合而这里面呢可能会需要一个域名系统这就是我们现在我正在做一套新的域名系统这个也是可能第一次向世界来宣布就是说我们用了一个比如说那个 and 符号然后加上一个名字这样呢你去跟一个机器人聊的时候你只要按的刘润

然后一下这机器人就变身它了然后就可以跟它做对话然后安的京东或者说未来的这个品牌一下它就可以做很多事情甚至说这件事情可以不用把安的给取消而仅仅是因为我的习惯慢慢慢慢的就所有的东西整个的机器人世界可以由我的这一个机器人做界面这个机器人它不是一个仅仅这一个机器人界面而是整个机器人的世界的

这个网络对我来说是用一个自然语言来完成交互的所以这套域名系统我们现在也正在做这样的话我们就可以全球化的就是完全的唯一的可以寻指寻到这么一坨知识

就比如我把 Sara 把你的所有的过去写的文章做的播客我全把它灌成一个机器人我如何去让全世界知道这坨东西因为这坨知识也好我们寻出来的模型也好它是域名无法访问到的东西嗯

我这只是我以我的最远最远我们能看到的话在未来的十米里面我能看到一个新的域名系统的诞生一个新的机器人和机器人之间的协作的这些平台和自动的握手然后寻指的这一套系统的诞生而且我觉得这个可能两三年就做完了但是两三年之后再有什么以我最疯狂的想象力我也无法想象了我只知道那个东西完全和现在的 web 是不一样的太精彩了所以我就

先暂时不去尝试想象吧但是我觉得唯一能做的事情只要舍命狂奔一定跑到这个整个这个时代的最前沿还是有机会的

对您说到跑在时代前沿我就想到其实现在国内跟国外算不算是有一个时间差呢因为现在毕竟是国外先做出了 Chad GPT 然后我们国内现在可能还在在迎头奔上去做一个类似的大模型首先来说的话我觉得这个大门已经打开了这扇门就不会关上了

虽然这整个的过程呢可能还会有些曲折但是我的基本判断是说第一中国一定能做出来一个很好的大模型或者至少是能用的大模型我觉得这是大概率世界虽然的话我觉得三月份或者今年能出来的一个能用的呢是一个小概率世界即便以 OpenAI 的这样的决心和财力的话它不也磨了

大概 15 年到现在对就是 GPT-3 出来的时候也磨了 5 年然后从 GPT-3 到现在又磨了整整的两年才磨出来的然后我们现在听说了立刻需要再三个月五个月出来那个属于大链钢铁不太可能的事情但是长期来说的话我也请教了很多的专家大家也同意这样的观点当然你刚才所说的莱昆那个教授的看法我也同意就是说

我们中国再做一个 chatGPT 的难度跟哥伦布发现新大陆以后第二次再去新大陆的难度是一样的当然这是两层意思一个是意思是说这些事依然还是很难的即便现在让我们两个去横渡一下大西洋都是不可能的它还是需要一些很大的财力的不是普普通通的人就可以横渡一下大西洋的但是另外一个句话是说它的成本是可知的了

所以说如果是 OpenAI 花了 30 亿美金来做出来除掉它的弯路啊什么的可能 5 亿美金到 10 亿美金是做出来是完全有可能的但是大家看到了它的收益发现了新大陆尤其是说当它的黄金运回来的时候那所有的人都在说那 10 亿美金没问题我们都可以做所以只要假以时日做出来是一个大概率事件嗯它已经被证实了吗已经证实大模型这条路走得通嗯

以前所有的人都不做不仅仅中国连美国除了 OpenAI 这种疯子以外其他人都不做的原因是因为我记得在几年前我们提到这家公司的时候都是带着一种就是很奇怪的表情觉得这帮人疯了花了那么多钱了结果做出来的 GPT-2 是个啥呀那烂东西不如我那个小模型在任何上面它都全输那你在干这个东西干嘛觉得它走火入魔了

但是当他一旦证明成功了以后那其他人再做一遍这是一个没有秘密但是有很多 trick 的地方只要是没有秘密只有 trick 的地方只要给足够的时间这个是很重要的一个因素和足够的耐心的话总会是做得出来的对

这就像 Netscape 做了一个浏览器你说无论是微软还是中国有没有可能做不出来我觉得这事小概率时间对吧这肯定做得出来的对也许等到中国再做出来的时候这中间是有一定的时间差的对吧对于国内的这种创业者假如说我们考虑的长远一点比如说要考虑地缘政治风险尤其现在 OpenAI 已经不让我们中国地区的

访问了对吧他其实更多是出于政治的考虑不让越南访问等等那假设我们创业者把他的比如说毕生心血都基于这个上面去做开发的话那假设有一天他彻底的去追究起来切断了这方面的东西那这方面是有风险的嘛那如果要等到国内的大模型出来那中间还是有一定的时间差这个当中您是怎么看这里面的风险和机遇的

我认为肯定是可以忽略这个风险的或者我认为这个风险是完全可控的原因是基于这么一点我之所以说大门打开了就不会关上就是比如说 3 月 16 号百度的文心一言内测就是给我们这些合作伙伴来使用就可以感知到它怎么样了虽然我们所有人的期待值并不高大家千万不要给它太大的期望值这个

能做出来一个很好的这是不符合自然规律的嘛嗯打脸缸还没那么快对吧对啊但是我认为即便他做出来再差嗯

在两三个月几个月之内变得我们在上面来建应用都是可以期待的原因是什么呢比如说以前这是 NLP 可以达到的水平这么高 GPT3 一下把它拉到这儿 CHAT GPT 一下把它拉到这儿这个时候中国要做一遍呢你要想第一天就跟 CHAT GPT 一样牛的话这个不要想长远是可以的那么第一天呢我们可能只做到它一半甚至三分之一的这个高度

但是这个高度比起 NLP 来说已经是一个巨大的进步了就是很多很多我们原来想做但是做不了的这些事情在一个只要是大语言模型这个方向做了相对足够的投入然后出来的东西就已经足以让我们 build 很多以前我们无法想象的应用了虽然它离 ChatGPT 可能还差得远

但是这个边在慢慢慢慢的提升然后直到跟上这个世界就变平了就是我们还是反反复复为了让大家理解的话我们就说 browser 好了 Netscape 的那个浏览器它已经出到 4.0 版本了真的非常好用然后这个时候呢比如说 Netscape 对中国禁售中国不允许用 Netscape 那么牛的浏览器了对吧

但是呢中国呢就做一个红旗浏览器 1.0 吧这个浏览器肯定跟 Netscape 没法比很傻的性能也很慢然后出来那个网页的布局也都是很傻的反正很难看的对吧但即便是这样的红旗 1.0 我觉得对于互联网产业的诞生这件事情已经不重要了

有没有这样的一个浏览器是很重要的不要说中国美国已经用浏览器图形界面了来访问那个所有页面了中国还依然用这个命令行来访问这个就没戏了但只要中国做一个稍微能用一点点的红旗 1.0 浏览器让大家可以访问页面 Yahoo 就可以诞生了 eBay 就可以诞生了我们现在所知道所有的这些网页都可以诞生了

诞生了以后他可能没有美国的网页的那个体验那么好那么漂亮但是互联网的大潮中国已经一直要踩进去了

而且对于我们创业者来说这个差距可能不是红旗 1.0 和这个 Netscape 4.0 这么大的差距这差距应该会迅速的弥合如果要是比较乐观的看未来在三年里面弥合的话我们很多的时候基于最差的模型其实已经足以让我们在这段时间同步的来改进我们的上层的这些建设的这些基础设施了嗯

紧接着回到您刚刚之前提到的失业的问题这个问题也是大家会经常问的一定会问的就是既然它能够大幅的提高生产力提高效率那它会不会让人失业它会不会让大家都闲下来被机器所替代了那就看你的失业的定义了就是我一直是说生产力的提升会让你失去劳动的机会但是并不失去挣钱的机会

很有可能的话就是我们这些人都是被积极养活的有可能你会失去工作但是你的收入的差异其实并不大大家不要觉得这是一个天方夜谭只要我们现在看看我们现在的和以前的人类劳动的强度做一下对比然后再把以前人家农民盖一年勉强能养活自己

然后以及整个全国的那么多农民才勉强的可以养活那么非常少的一部分皇帝和他的那个臣民这些人可能是唯一的 3%的非农业人口了其他的士大夫啊什么他只占 3%其他的 97%的人就只能养活自己合着 3%的人现在反过来 3%的人就可以养活 97%的人所以我们所有的人都

坐在了以前皇帝和师大夫才可以坐到那个地方然后对于失业来说的话甚至我做了一个分析失业潮不会到来的所以我再问一个问题是说到底是先创造了新的工作机会还是先失业我的答案是每一次技术革新大多数时候是先创造了新的工作然后再让一些人失业而这个失业其实是和

转到新的工作是一回事就我们每个人换工作其实都是一个失业和就业两个事情合而为一的事情只不过我们不把它叫失业嘛只有说失去了工作而没有新的工作的时候我们才叫它失业以新浪的例子为例就是新浪出来以后它首先创造了一个叫做网站编辑这样的一个职业直到现在为止叫新媒体运营或者网站编辑其实都是一个非常大量的一个职业甚至这个职业里面还分化出了抖音博主这样的

都是他的后续的职业了但是你想在 2000 年新浪那个时候先创造了网站编辑这样的职业而这个职业是以前没有的

这个时候他非但没有产生这个传统报纸媒体业的大规模的事业而报纸媒体其实从 2000 年到 05 年反而在不断地走向他最辉煌的那个时刻但这个时候呢已经有一些聪明的人从那个传统报刊里面跳出来去新浪了为什么他跳过去很简单新浪的工资给的更高

为什么新浪能给的更高的工资因为你即使是在文汇报在解放日报这样的地方你去编一篇报纸的话十几万人买你的报纸已经是最高 circulation 了但是在新浪上面你编一下动辄的新闻都是一千万几千万人的访问嗯

所以说因为你同样的劳动被一千万人看到了而不是被十几万人看到的话付给你的工资当然就高了所以很多的人都从传统的报纸被吸过去然后当新媒体真的把报纸给打趴下的时候报纸在准备裁员的时候其实他发现他里面不剩多少人了所有的人都已经被新的给掏空了

所以对于这些人来说的话其实是很幸运的他的工作的内容其实差别不大报纸还是到新媒体工作强度其实也没有那么大的差别但是收入又翻了好几番都有可能那么你说这个过程是不是创造了失业从技术上面来说的确失去了老的报纸的职业但是他给了他一个更好的

所以我们未来的话我相信非常多的职业都不需要了但是这些职业的人失业之前一定是被新的更好的就业机会被吸引过去的而不是被迫裁掉的当然只有那些我就死活不学这个用 CHAT GPT 我不学新的东西然后我也别的公司再高我也不去我就守在这里可能守到最后最后主要会守到失业的那一天但是大多数人来说并不需要走这条路

对还有一句话就是说可能不是被 AI 所替代而是被懂得用 AI 的人所替代我知道这个也是比如说您现在在做 AI 教育这方面的您觉得这是很有必要来做的事情吗那我想进一步问的一个问题就是这种工具的产生的出现它是它当然您刚刚所说的意思它可能会大家的整个蛋糕做得更大然后大家收入水平都往上提升一个等级

但是对于这些很懂得用这个工具的人和不懂得用这个工具的人他会不会制造出一个更大的不公平呢

对 这其实是一个问题就是说现在 AI 如果要是创造了大量的价值就等于说原来是人干的活都被机器给替代了但替代了以后呢等于说人类劳动投入大幅减少但是它的产出没变甚至变得更高了那其实就等于说人类的总财富在迅速地增加对那么这个接下来就是下一个问题就是政府的确需要解决一个问题它其实就是分配的问题了

如果要是所有的钱都被一些最大的那些公司百分之百的拿在手里面的话它可能是个问题我说可能是个问题而不是说必然是个问题即便政府不做这件事情它都不是问题

假设我们就拿比尔盖茨同学来做举例子假设他的钱一下从现在的 100 亿美金变成了 1000 亿美金这其实不是个问题因为 1000 亿美金是个数他必须把这个钱花出去的否则这个财富是没有意义的而花出去的过程其实就是采购别人的服务的过程他采购的服务就会再采购别人的服务最终这些钱不会逃离出地球以外的大家放心这个肉都是烂在我们这个地球这个锅里的

所以虽然会产生临时的不公平但是长期的经过很多的无数次的价值的转移和重新分配到时候全分配过来了

更不用说即便是在这个财富积累的过程很多政府也在考虑就是关于 AI 税啊如何让 AI 所带来的这个巨大的收入比如说一下省了 100 个亿这 100 个亿不要全是由 AI 公司的这个股东拿掉了我们一块分一份股东可以拿掉 50%然后另外 50%我作为社会财富给那些其他的人大家均分一下这个科技带来的这些利益这都是政府应该做的事情

对然后您刚刚提到政府在里面的一个作用然后我就想到现在为止 AI 的总体的发展我觉得是走在了法律制定的前列了它的步伐可能比这个更快了接下来我要讨论的就是关于 ChatGPT 相关的一些隐忧比如说著作权的问题前几天老花在分享会上提到的我们假设是一个非常精心输入的 prompt

所生成的这个内容是否应该属于我们个人或者说这个 prompt 本身是否应该被登记被保护包括说 AI 做图的版权是不是应该属于作者您是怎么看这方面的事情这部分很显然涉及了一个崭新的领域但是人类就不断地被

推到一个一个的新的领域然后去解决一些人类以前从来没解决过的问题所以呢对于 AI 生成的内容的版权这个问题很有趣因为我知道版权法一个最核心的理念是说它保护表达但是不保护思想嗯

对这是一个最基本的大家公认的一个原则当然也很合理嘛我觉得橘子很好吃我有这个思想然后你也觉得那允许我这么想你就不允许这么想这是不对的但是呢我写了一首诗来讲我吃到橘子以后的那种欣喜的感觉你把这个诗一字不改的就给 copy 过去你是侵犯了我的表达但现在 GPT 呢它不改变思想只改变表达

那么很有可能它生成出来的东西的话就可以规避版权因为它是来自于服务术的表达的集合

那么至少有一点是说它生成的东西你不能以原著作的版权来告我但至于是生成的东西是不是可以登记版权等等也有很多人认为说别人不能来告你你也不能去告别人就是你不能说别人欺负了你的版权所以整个这个领域的话我认为是一个非常崭新的一个领域还有很多的法律上面的问题可以解决但是我觉得对于从业者和我们的用户来说的话应该迅速地往前走

因为就是一个新技术它给方方面面法律税务财务技术方方面面都带来的挑战但是每个领域各自去解决各自领域的挑战我们如果不是法律领域的人我们也不要因为这个听说这里可能有一些问题我们就什么都不做了我相信各个领域各个行业的人应该一起往前走才对

除了著作权以外,隐私也是大家所讨论的一个很重要的一个方面,比如说它在保护隐私和有效提供服务之间怎么去平衡,包括老花前两天也提到说 ChatGPT 它对于互联网语料这个来源是语言不详的,它可能会有大量的这种非授权的爬虫式的数据来源,对于这些方面的问题您是怎么考虑的?

我觉得没有什么隐私的问题需要去解决包括非授权的数据爬取非授权的数据爬取这可能是个问题但隐私问题是说比如说你要是问他说我的 YouTube Channel 里面有几个视频等等那首先他需要知道你的 YouTube Channel 然后其次他需要去爬取那上面到底有几个视频等等诸如此类的这种他需要去爬取个人信息或者说未经过授权的这种数据

首先关于爬曲这件事情我们要分开一个叫 ChatGPT 它本身有没有侵犯隐私或者说有没有非法爬曲的问题第二个是说基于 ChatGPT 的应用有没有做这些事情就比如刚才你举的例子我要去看一下 YouTube Channel 里多少人这都不是 OpenAI 干的事情这都是我们上层应用干的事情

这个模型本身不会去爬这些信息的尤其是当你需要实时访问的话那么上面的部分其实到底是爬曲是合法的和不合法的这是另外的一个需要讨论的问题但是这件事情外部的时代也是这样子的互联网时代也是这样子的嘛对吗和现在没有任何的区别所以

该怎么判还是怎么判的所以这不是问题包括说有很多人在问那个暗网机器人说你随便问一个比如 Sara 的电话号码是多少他真能给你一个电话号码所有人都说哇这个侵犯隐私你怎么能把 Sara 的电话号码放上去但你仔细看电话号码打不通的呀看起来像个电话号码而实际上没有

如果你问他说 Sara 电话号码是什么他真的告诉你了并且是真实的那一定是你告诉他的就我指的是那个就是服务的提供者喂给他的那么这里面当然对于提供商来说的话他需要做一些的所谓的权限管理就是谁可以看谁不可以看

如果要是说对所有人都可以看的也可以因为很多的公司的网站上面所有的人都可以看到的这个电话号码对对对包括我的电话号码挂在我的 blog 上面一挂就挂了十几年都没有任何人真的打过就是我可以挂在上面真的我的 blog 的首页上永远是我的电话号码到现在都没变就是你个人也可以选择向全世界公开嗯

那这样的信息他如果是爬到了且访问了这个是也不算侵犯隐私因为隐私是不被人知道的权利你通过公开的方式已经做了一个选择是说你愿意这个信息被所有人看到的话那么他知道也是 OK 的只有一种情况是说他用某种方式比如经过你的授权等等获取了你的不被外人知的信息并且他又把它给了

你没有授权的那个人这个才叫隐私的问题但是我们所说的所有的事情其实都跟 OpenAI 无关而是用 OpenAI 的开发者就好像你发现一个人把你的电话号码写在了某个网站上面你去告阿帕奇是没用的你得去告这个网站

而 Apache 我们所举的这个 OpenAI 的 ChatGPT 它的数据来源是非常清晰的至少在它的公开的文章里面 Wikipedia 占了 3%Books1 和 Books2 就是书本的信息大概占了 16%左右 WebCrawl 最大的占了 61%那个就是 Reddit 网站上面有三站以上的所有的 link 的网页的集合还有一个叫 WebText 占了 21%吧好像加在一起 100%

但你看这些所有的信息都是公开信息无论是书还是 Wikipedia 还是这些当然它里面肯定不可能保证 100%那么大量的数据所以这现在也有一些人在告啊什么的但这些事情的话我觉得作为从业者来说把它当花边新闻和八卦新闻来看

就是 OpenAI 的八卦新闻来看就可以了更多的我们应该去考虑它到底怎么样可以改变整个我们周围的这个世界以及创业者在这里面有什么样的机会所以用户来说怎么样用它来提高自己的工作效率所以从这个角度来说我们的 AI 教育的负责人艾夫他写了一篇公众号的文章我特别喜欢他的题目就是因 AI 而强大我就特别喜欢这句话

就是我们所有的人对于 AI 的态度是因为有了 AI 使得我们每个人变得更加的强大而不要用这种恐惧的和受害的心理说因为它而使我丢掉了工作不是的有了 AI 我们所有人都可以变得更加强大这就是 AI 教育的 mission 就是想干这个事情嘛

假设按照您刚刚所说的我们因为 AI 而强大有没有另外一种可能性比如说 ChatGPT 它生产的内容我们大家以后可能会被它所生产的大量的重复也好同质化的也好或者说

基于人类过往的历史的互联网语料的基本的平均水平生产出来的这些比较平庸的内容充斥然后另外那天老花提到说可能会有一些商业公司他们为了打广告把自己的名字植入到不同的比如说垃圾文人类不会看的但是他会植入到一些垃圾营销内容里面

然后再包括其实我们现在知道 OpenAI 它是有外包一些工人去标记这个内容但是它标记这个内容呢其实是请的一些不太发达的国家他们请他们工人去做一些标记所以他们所标记出来的内容呢或许只是代表他们的一些价值观他们认为什么是好的什么是不好的

那假设我们以后充斥着的都是这样的内容就会不会有这种情况因为我还看到前几天硅谷 101 发了一篇文章他就讲到说他采访了创新工厂的 AI 工程指寻院院长叫王永刚他就讲到说悲观情况是因为人类的极度懒惰然后互联网被 AI 生成的错误率普遍高于人类知识工作者的灌水内容所占领

我们的孩子会不会成为迷失的一代这是比较悲观的想法我刚听到您所说的 AI 让我们强大我觉得这是更乐观的想法您对悲观的看法是怎么看的

首先啊我对说未来的所有的互联网上面充斥着低水平的内容这件事情呢是反对态度的我不认为是这样的一个世界原因是什么呢我们发明了圆珠笔对吧我们开始有钢笔圆珠笔写字甚至还出现了打印机这样的东西如果王羲之先生活在今天的话

他将怎么去思考现在的这世界他会让整个人类的世界就是一个充斥着垃圾的世界和同质的世界因为都没有用笔写没有拿笔写对如果米开朗基罗先生活到现在他看到了那么多照片以后他是做何感想嗯

包括现在的艺术家当他看到了 Mid Journey 生成的东西的话没有一个人不暴跳如雷的就是当你的很多东西的制作的成本不断地下降就使得艺术这样的东西被不断地亵渎而艺术又一次一次因为人类科技的增长而变成了一个落后生产力的代名词

就比如说以前写毛笔字就是日常就跟现在我们打字一样现在写毛笔字为什么把它叫做艺术因为正常人不这么干了包括画油画为什么是艺术因为以前的所有的米康纳基罗他们只是

在这个领域做的比较好的工人而已就像好的工程师一样的那样的人但为什么现在做雕塑就已经成为了艺术原因是说我们现在都已经用照相机了我们都 3D 了甚至于说现在你拿黑白的胶卷的拍摄的这些人现在都已经被称为艺术家了因为正常人不这么干了所以我刚才举的这些所有的例子就是说人类的所有的新技术

其实都带着一些 spam 的特质

你自己想一下所有的新技术都会把以前很珍贵的东西变成 spam 比如玻璃曾经是多么珍贵的东西结果有了新的制作工艺以后我们现在满世界的只要能用不能用的地方全是玻璃然后有了互联网以后所有的人都很惊讶说未来我们将会被垃圾的文章充实很显然的确互联网的整个的 quality 不高啊但是它带给我们的福祉是高于它带给我们这种 spam 的感受的嗯

别的不说光这 110 年前那个德先生赛先生就是陈独秀他们就是所谓的白话文运动都已经被中国的老的写古文的那些学究们就骂成什么样子了的确白话文没有古文那么的

优雅我们也承认对吧简体字没有繁体字写起来那么的漂亮这都是承认的但是它对效率的提升等等等等就是人类的所有的文字它的目标不仅仅是艺术它还有很多的实用的工具上面的一些能力就像我们现在 CHATGPT 生成的那些东西

我们不需要每一个东西都把它当作艺术作品像以前的小说家或者说散文师或者是诗人写的那些东西扬来欣赏更多的都是开了一个 meeting 然后我写了一个 meeting summary 然后这个 meeting summary 发给别人然后别人看了以后立刻就可以产生行动这里面要什么艺术价值

而这个东西以前这样的东西还花了我三个小时的时间去写但现在就生成了然后这个就省了我三个小时结果是一样的这三个小时我就可以做一些行为艺术的事情但是依然可以拿工资所以未来来说对这个事情我一点都不担心的我认为当我们被 ChatGPT 所产生的内容充斥的这个世界简直太美好了

有的人看到了它的艺术价值的缺失但是我更看到了生产力的高度提升你说在偶尔的时候夜深人间的时候有没有怀念唐朝的时候只有那些 3%的人才识字然后识字的人中间只有那么几个人的写的几首诗才可以流传一个诗的传播都这么稀缺的世界

是不是有幸福的时光我觉得肯定还是有的可能作为文学作品我会偶尔的歪歪一下那个世界还挺美好的但是从现实来说给我一万次选择我也选现在的社会而不是一些那种匮乏的社会首先您刚回答我的是说您并不介意它可能艺术价值没那么强会变得很 spam 对还有第二部分的问题就比如说我们

我们以后人们会不会因为被这种东西所占领然后就成为迷失的一代但是这个问题我看您刚刚也已经回答了也是一样的所有的人当电视出来的时候 80 后的父母们都在担心这帮孩子将来会变傻

然后等这些 80 后的孩子现在已经作为父母的时候他又担心 iPad 会让他们的孩子变傻是然后这些孩子都已经快当父母了他会担心 ChatGPT 会让自己的孩子变傻就是为什么你会觉得孩子会变傻呢原因是说它使得孩子不再学习我们小时候所学习的那些技能了是

但是因为它只有一代之间我们又没有办法习惯所以的话我们就认为不学习这门技能是一件很大的事但如果要是我们把这个代拉宽一点的话去问问我的祖爷爷或者不用问祖爷爷问问我的爷爷好了他会很担心地看着我这个傻孩子五谷不分连个庄稼都不会重马车都不会开给我一个独轮车我都推不好他会觉得我是个傻子

所以我觉得我们这一代人对下一代人的担心是完全有道理的比如现在这一代人他连衣服都不会洗台货也不会烧我们不会这么傻因为我们小时候就已经不会了但是我会对他们自己不会完整地写出一篇文章而感觉到担心因为他们都拿起来 GPT 了

然后呢开根号他们只会拿计算器开而我记得我以前读书的时候我开根号我是得拿计算尺来做的然后我觉得计算尺好像就比计算器高级一点

鄙视链是长长的鄙视链上一代的人担心小孩子不会他的技能而觉得小孩子会变傻而小孩子会了一堆新的技能发现父母不会用这个技能而永远的鄙视自己的父母这种相互鄙视的一代一代的代沟就会这样的这种传递的过程中间让人类的科技不断的发展然后人类的社会变得越来越好

这是我看到的社会可能跟很多人看到的不一样但是作为一个极度的科技乐观主义者

我永远相信科技是造福人类的科技将带来一个更美好的生活然后科技所带来的所有我们看到的这些问题首先是基于我们对它的不适应就科技肯定有坏的部分这我是承认的它会有一些以前没有的负面的部分但是大家也不要低估了对于负面部分防范的力量的发展

因为以前是没有这个技术所以就自然没有防范的力量当他有了这个技术以后防范的力量就会加强

汽车刚出来的时候本来原来所有马路上面全是人然后汽车在人那里面乱开那当然是危险的那么之后我们就会有人行道啊我们就会有旁边两边的那个专门人走的人车就可以分离啊电力刚来的时候当然是就那么一根电然后一断了以后整个城市就废掉了但是当发展的时候我们当然知道需要好几路电还要有各种各样的备份所以整个上海停电的这样的事情就变得越来越少啊

切的 GPD 出来以后它一定会产生一些很不合适的内容但这些内容的话我们的抗衡技术也会同样的发展然后直到让我们的很多的新的技术整体上面是在一个人类可控和造福人类的一个轨道上面进行我觉得录到这里就差不多了本来最后其实有一个跟您刚刚提到的那个

它生产出来可能会有一些不太合适的内容相关那我最后再补充一个问题我们现在的所给的训练的数据集它可能会有一些由于数据训练集的偏差而导致的它输出的结果可能也会有一些看起来它有站在某个政治立场上面等等方面的问题您刚刚说的我们其实需要去规范它的某一些部分的输出它可能有些部分是输出是有害的

这个就涉及到一些比较偏道德伦理的范畴了您觉得首先是不是应该把训练数据集再怎样的去优化它其次就是怎么去规范它输出的部分的内容去造福我们的人类

对这个部分来说的话还是我们怎么去看 ChatGPT 是把它作为一个黑盒然后是一个完整的整体来看还是要把它给拆成两个大的零件我是把它拆成两个零件来看的其中一个零件呢叫做语言模型就是 Large Language Model

另外一个零件呢就是它现在已有的这些数据但是呢如果你把它拆开并且你把它现在已有的数据直接给扔掉这个时候你就可以给它灌你的信息然后这个信息都是你来保证正确的

就比如说某家轴承厂的轴承到底好用不好用当然互联网上面一定是有两种观点有一群人说它肯定不好用一种是好用但是作为我的轴承厂的机器人的话我当然就要求他说我这个东西好用就跟现在网站是一样的那么网站是非常多样的你没有办法说哪个网站是最权威的它最后所有的人就变成一个这样多样的一个情况所以这是一个看法

另外一个很重要的看法是说即便是数据啊即便是用签字 GPT 的数据本身我认为它其实是给了人类一个产生世界大同的可能性怎么来解释这句话呢整个世界已经被抖音等这样的千人千面的引擎割裂了

割裂到了我们所有的人都以为我们看到的世界就是整个世界然后我们的真实的世界越来越远越来越远就每两个人的抖音看出来简直就跟两个世界一样

而我们所有在这种所谓的信息检访里面的人互相就完全不自知对这个描述让我想起了巴比塔对就是巴比塔我们其实是所有的人已经站在巴比塔里面即便我们两个我们看到的抖音一定是不一样的所以我们两个认识的世界是不一样的而且没有任何办法再让我们两个认识同样的东西了除非我们两个在同时看同一本书

结果出版社在努力地把书做成千人千面那我们就连这都没有办法完成了但是呢 ChatGPT 这样的技术反而把人类变成大同拉回了一个可能性因为是说它里面其实它不是千人千面至少现在不是它更多的是把人类观点和语言做了一个加权平均

比如就你问亲爱的 GPT 我问了我还真问了是说粽子应该是甜馅的还是肉馅的是哪种馅是正宗的比如这个问题的话如果在抖音上面这个南方的人所有的粽子都是肉馅的北方人全是都是甜馅的然后两边各自都乐呵呵然后没有任何问题不会产生任何冲突

然后现在 GPD 告诉我肉馅的他先告诉我第一个答案是说不同的地方会有不同的看法然后有的地方喜欢甜馅有的喜欢肉馅等等等等说了一些很这个不然很低水不漏然后我就逼他说你只有两个选择甜馅的和肉馅的且你必须选其中一个你觉得哪一个是更正宗的然后这可怜的机器人告诉我肉馅的更正宗这就说明什么呢就是说明

在他的语料的训练里面可能南方中国人的语料略微地压过北方中国人他们表达正宗的这个语料更多对吧对我蛮惊讶的我本来以为北方可能会因为媒体中心各种原因应该会表达更多但是大家可以去试一下那个切的 GPT 至少我试的他就告诉我露馅的那么他

他其实对于这么一个本来他说 A 也会有一半人不满意说 B 也会有一半人不满意的东西这等于说用一种加权平均的一种绝对的话语权的民主的一种方式让所有的人得出一个共同的答案

粽子就是肉馅的好但这个很显然又会很多人不同意在中国可能有至少一半以上的人不同意这个观点但是呢它至少给了我们所有人一个机会让我们看到一个一致的世界至于一致的世界我们其实是可以进行讨论的而基于抖音这样的分裂的世界我们其实是很难讨论的

所以这个对我来说是一个很大的认知上面的区别就是未来如果有机会做成世界统一世界大统很多的这个世界上面交流 ChatGPT 它首先解决了语言的问题现在我们再也不用考虑什么全球化中间的这个语言的 Everything 它就是用任何语言的完美输出

内容上面又导致了全球别说像粽子这样的事了就是更加 global 的事情大家其实都会有一些相对比较一致的看法的话那么使每一个人可能在用 chat GPT 的时候都会有各种各样的不舒适比如北方人在用这个的话他就很不理解你这机器人脑子有问题吗你怎么可能说粽子要吃肉馅的

但是当只有我们跟一个社会的主流思想反正重创的时候我们可能每一个人才有机会停下来思考一下这件事情是不是有可能他说的是对的或者说这个世界的主流思想是什么样子

这就可能就是刚才我们所说的它是我们的世界的主流思想的加权平均数但这个又回到我刚刚的那个问题就是假如说有这么一个北方的媒体公司的老板他就是非常爱吃

甜的粽子然后他就可以去灌水在互联网语料上面疯狂的灌水各种垃圾的营销文说甜粽子就是好甜粽子就是最牛的等等等等以至于他就可以操纵 ChatGPT 他所输入的语料里面的所占比的比重一下就会大了很多所以他这里面其实又有操纵的可能性了

难道没有 CHAT GPT 这样的事情就不会发生吗对确实是这样的但是我还是想说这里面首先是有操纵的可能性的嘛其次就是您刚刚说它呈现的一个大一统的加权平均的结果尽管它呈现出来人类就一定会认同嘛以及人类不认同之后它会导致的争议就会变少嘛我对这个是有疑问的觉得人类是需要适应的嗯

就是从最早的大家说网上说的就是不靠谱在那个 2000 年到 2005 年的时候所有的人都把互联网当作洪水猛兽觉得互联网上面只有那些不靠谱的人才会上互联网正经人谁会上互联网啊因为那个时候中国的上网人口也就一两千万人嘛

那么直到慢慢地变成说网上就是这么说的就已经变成了一个正确的代言词了然后再慢慢慢慢发展等自媒体啊等等再发展起来以后网上这么说你怎么敢信呢就是对于互联网这样东西的真实度的认知其实是需要一个学习的过程的嗯

那么同样的道理 CHAT GPT 说的东西现在来说的话基本上分几个阶段第一个阶段是说他怎么胡说八道这是很多人的第一反应然后第二反应像我们这种比较熟悉的人说 CHAT GPT 说的事情你也敢信啊就是信他年都过错了这是第二层然后那在这个是仅仅是因为刚才我们所说的这个幻觉这些问题

直到第三阶段会慢慢地越来越多的真实的东西会进去它变得越来越有用所以大家又会变成说这事亲爱的 GPT 都这么说那肯定是真的

然后呢随着它的慢慢的发展以至于说在之后就有非常多的就像你说那些 spammer 啊然后商业的等等如果它在这个竞争的过程中间它打赢了且去反抗的这个力量又变弱的话大家对切断 GPT 的认识就是说你别听那东西那东西都是被影响的嗯

到那个时候呢也相当于互联网现在这个阶段那么我大概估计着 CatGP 的下一代的新的技术和新的一个浪潮又该开始了

世界就是这样子轮回然后从靠谱到不靠谱再到靠谱然后直到当几次轮回以后呢这个技术也就走向了它的生命的终结然后死去然后新的技术再诞生然后当然随着这些新的技术诞生我们这些老一代的人也会死去然后新的人又有带有了新的想法这个就是整个人类发展或者整个技术发展的一个挺自然也挺美妙的这样的一个过程吧等于我们

所有的人都蛮幸运的在这个时候一块就进入了新的一个技术的一个门槛上面尤其我是认为最幸运的是大学刚毕业的这些人如果今年大学毕业的话我敢确信 2023 年就跟 2000 年和 2005 年还有 2008 年还有 2012 年这些都是叫做创业的大年

你会看到所有的公司的那个成立的那个分布线它不是线性的它就是有几个大年很多的公司都是在同一年诞生的就像苹果和微软这个一辈子的原价它都是在同一年诞生的但是这些大年就是如果在时间上面我们花出来一年一年的所产生的有点像年轮一样的这个痕迹的话那就说明在那一年出现了一个崭新的一个技术

那么我可以非常确定的知道 2023 年可能在你的时间长河的年轮上面一定是非常非常明显的一个年轮在今年会产生大量的创业的公司在未来的十年里面成为像 Google 一样伟大的公司这是必然的

对,我看到您最近还除了在做 AI 教育相关的课程之外,您还有在给到工程师一些免费的,甚至是有给一定的资金,我记得是一千块钱,对吧?给到他们去做一些事情,您在这方面是怎么考虑的?

这就是我在说的那个互联网的分享精神的传承了就是有很多事情呢比如说一千块钱虽然不多但是比如累积的这个量来说对于我们现在这些公司来说的话其实是举手之劳了嗯

不足挂齿的一些很小的一些馈赠但是这些事情呢对于刚刚大学毕业或者说刚工作没多少的人来说其实还是挺多的一笔钱至少为了一个实验项目我不愿意去花一千块钱去干这些事情那么这样的话其实是帮助他们去尝试新东西很好的一个商路的一个盘缠吧是提供借口给他们吗

就我们提供了一些这个接口就是给所有的工程师只要联系我们提供简历证明你是个工程师的话我们都会给提供一个免费的 API 的接口然后这样的话大家就可以来调用我们的 R1 的系统包括后面的这个现在 GPT 整个这个系统的很多的一些功能然后我们为每个工程师准备了 1000 块钱人民币的信用的余额反正就是 1000 之内随便用这种其实从

老的历史上面就说到了这个银海威了不止银海威很多很多公司在互联网早期的时候银海威是为所有的人提供一个小时的免费上网时间我就蹭了很多次在上网特别难不仅仅是钱的问题反正就是特别特别难的情况下面它在比如上海就是瑞金二路的那个营业点里面提供的这个免费的上网服务对我的帮助是非常大的

所以直到现在二十几年过去了对这一家公司依然心怀感激可能没有它的话我不能说不能接触互联网但至少会玩一两年是完全有可能的

从此之后的话那个时候有很多免费的域名的提供者包括各种各样的捐赠包括我在这一路上面也参加了很多的各种各样技术或者非技术的 program 都有非常慷慨的人在捐赠这些 program 我参加的都是免费的仅仅是说愿意来教会我一些东西

所以这些的话都让我非常的感谢那么现在如果要是我这边有任何的余力的话我其实也愿意把这个我收到的这个亏赠再亏赠下去当然也有非常多的同行在做这些事情所以我这个可能是最小最小最小的一个

但是如果能够帮助一些工程师迅速的可以去玩一玩感觉一下应该会很有帮助因为我作为一个工程师我深知一个 idea 忽然间他可以干这些事情到真正写代码之间这一段过程这个 idea 是非常容易流产的说不定稍微麻烦一点点稍微需要花一个钱哪怕花个十几块钱我想想算了可能是一个很伟大的一个构想就这么就流产了

但如果要是说我们把这些事情搞定的话应该会产生很多的主意最近也有好多人说那我是一个产品经理啊我是一个什么运营啊是不是可以做然后我说 OK

不会写代码的人然后我是不是就不可以你为什么一定要求工程师等等这两天我们也在筹划下一个项目就是说就是希望去探索新的东西然后希望来用的产品运营商务等等的同学的话我们也会赠送等额的一些就是有产品解密而不是 API 的一些服务最主要是体验一下这个新技术的

的形态然后让自己早做准备虽然在非常快的我估计从三月份开始到以后我们的最主要的引擎可能都在慢慢地像国内的像文心一言像这个腾讯和巴黎或者很多的公司其实都有这样的引擎可能到最后我们会把底层的引擎会不断地向国内的慢慢地去转换但是相应的知识的储备和思考应该是越早越好

我们现在就应该开始好的 谢谢建树 OK 哇 我们一不小心就聊了两个两个小时四十分钟三个

我觉得我每次做播客的话都聊了很久很好非常开心能一起在每个新的技术的时候聊包括 Sara 的所有的问题也是我最喜欢的会帮助我一起来理清楚所有的一些思路要讲的这些东西非常感谢 Sara 非常感谢建硕给我这个机会在采访因为每次都是您主动提起来除了 Web3 那次是我主动联系您后面您说聊写作聊

人工智能聊这个 chat gpt 都是您主动说如果我不介意不跟交易相关的话那就可以来聊聊这个话题所以我才有这个机会可以再跟您聊所以很感谢建硕然后也感谢围观这次节目录制的屏幕前的大家我们全程我们两个人都没有看评论不知道大家在聊什么但是我们就当做是一个大家在围观我们录播客的过程就好了

是的 是的 到最后可以跟中南看直播的同学打个招呼了因为我跟 Sara 就定好了这其实是我们约好的一次播客的制作过程 Sara 我们一起做了很多好评的大白话聊 web3 大白话聊写作等等这样的内容所以我们在想一起聊一下亲爱的 GPP 这个就是一个播客就是这样录出来的

只不过呢我们两个都非常不介意把它给做成一种直播的形式大家也可以看一下播客是怎么录的但是这个过程中间没有跟大家做任何的互动然后为了播客的效率呢那个我们也就完全没有看屏幕然后冷落大家了但是以后的话我可以做专门的直播好谢谢建树 OK 那我们就到这里好的好谢谢拜拜

感谢你的收听 Traders Talk 是一档由 Sara 主理 Darabit 赞助的投资领域访谈内播课来自不同细分领域的 Trader 在这里回溯经历交流洞见激发灵感打破仇见同时 OneKey 还将为本节目提供友情赞助每期会有一位优质评论听众获赠一台 OneKey Touch 开源硬件钱包欢迎各位在评论区进行友善认真的探讨

你可以在小宇宙 Spotify 苹果播客喜马拉雅等平台订阅收听如果你喜欢本期节目欢迎在节目详情处打赏或加入青凤交流群我们下期见