We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode GPT-4即将到来,新一代GPT意味着什么

GPT-4即将到来,新一代GPT意味着什么

2023/3/5
logo of podcast AI炼金术

AI炼金术

AI Deep Dive AI Chapters Transcript
#artificial intelligence and machine learning#ai market trends#ai chatbot impact#generative ai#agi discussion People
(
(未提及姓名)
任鑫
徐文浩
Topics
@徐文浩 :GPT-4最令人瞩目的是其32K上下文支持能力的提升。这意味着AI能够记住更长的对话和信息,这在实际应用中具有巨大潜力。例如,AI可以扮演公司员工的角色,理解公司信息并提供服务,而无需额外模型训练。这将大大降低AI应用的门槛,使非技术人员也能轻松创建AI产品。此外,GPT-4的上下文学习能力也得到了显著提升,无需微调模型即可根据示例直接给出答案,这将极大地提高效率。在实际应用中,我开发了一个小插件,利用ChatGPT自动生成电商产品英文标题、卖点和价格建议,这充分展现了GPT-4在内容生成方面的强大能力。 在模型训练方面,我发现ChatGPT的所谓“微调”并非重新训练基础模型,而是通过调整强化学习模型参数来实现特定任务的优化。这是一种高效的机器学习方法,能够在特定任务上快速提升模型性能,而无需大量标注数据。 同时,我也意识到,ChatGPT的回答质量取决于用户的提问方式和对模型的引导。通过设定角色和明确需求,可以提高ChatGPT的输出质量。此外,ChatGPT也可能出现错误信息,用户需谨慎使用,并学会有效地引导模型,才能发挥其最大潜力。 @任鑫 :ChatGPT的出现,类似于数据库和云计算的发展,正在成为一种基础设施,降低了技术门槛,使非技术人员也能更容易地创建AI产品。这将导致许多重复性、套路化的工作岗位被取代或效率大幅提升。 在商业应用方面,麦肯锡的框架将人类经济活动分为生产、交易和互动,而AI将对互动领域产生巨大冲击。大量的知识工作本质上是将信息从一种形式转换为另一种形式的“翻译”工作,而ChatGPT在这一领域表现出色,且具有24小时工作、无情绪波动等优势。 然而,利用AI技术开发产品也面临同质化竞争,需要考虑如何利用自身优势超越竞争对手。此外,AI的伦理挑战也是一个重要的议题,需要在技术发展的同时,关注其对社会的影响,并确保AI与人类利益一致。 在实际应用中,我发现ChatGPT可以用于总结YouTube视频内容,提高视频观看效率。通过修改ChatGPT的提示词,可以更有效地总结视频内容。此外,ChatGPT还可以用于多种场景,例如简历修改、工作申请、写作润色等,其应用潜力巨大。

Deep Dive

GPT-4时代:新机遇与商业生态位

我最近对GPT-4及其带来的机遇和挑战进行了深入思考。GPT-4最令人瞩目的,是其32K上下文支持能力的显著提升。这意味着AI能够记住更长的对话和信息,这在实际应用中具有巨大潜力。

想象一下:AI可以扮演公司员工的角色,深入理解公司内部信息,并根据这些信息提供定制化服务,而这一切无需额外模型训练。这将彻底改变AI应用的门槛,让非技术人员也能轻松创建AI产品。这就好比云计算和数据库的出现,极大地简化了应用开发,让IT能力不再是核心竞争力。商业竞争将回归本质:洞察市场和设计商业模式。

GPT-4的上下文学习能力也同样令人兴奋。它能够根据提供的示例直接给出答案,无需繁琐的模型微调,这将极大地提高效率。我亲身经历了这一点:我开发了一个小插件,利用ChatGPT自动生成电商产品英文标题、卖点和价格建议,整个过程高效便捷,堪称“30分钟学会编程,开掉公司一半人”。这充分展现了GPT-4在内容生成方面的强大能力。

在模型训练方面,我发现ChatGPT的“微调”并非对基础模型进行重新训练,而是通过调整强化学习模型的参数来优化特定任务。这是一种高效的机器学习方法,能够在特定任务上快速提升模型性能,而无需依赖大量标注数据。

然而,ChatGPT的回答质量并非一成不变。它很大程度上取决于用户的提问方式和对模型的引导。设定明确的角色和需求,能够显著提高ChatGPT的输出质量。同时,我们也必须意识到ChatGPT可能出现错误信息,需要谨慎使用,并学会有效引导模型,才能最大限度地发挥其潜力。

ChatGPT的应用场景远不止于此。我利用它总结YouTube视频内容,极大地提高了我的视频观看效率。通过修改提示词,可以更精准地控制总结内容。此外,ChatGPT还可以用于简历修改、工作申请、写作润色等多种场景,其应用潜力巨大。

麦肯锡将人类经济活动分为生产、交易和互动三个类别。AI,特别是ChatGPT,将对“互动”领域产生巨大冲击。大量的知识工作,本质上是将信息从一种形式转换为另一种形式的“翻译”工作,而ChatGPT在这方面表现出色。它能够24小时不间断工作,且不受情绪波动影响,这使其在许多领域具有显著优势。

然而,利用AI技术开发产品也面临着同质化竞争的挑战。我们需要思考如何利用自身优势,在激烈的竞争中脱颖而出。更重要的是,AI的伦理挑战不容忽视。我们需要在技术发展的同时,关注其对社会的影响,并确保AI与人类利益保持一致。 这需要我们对AI模型进行更严格的监管和引导,确保其发展方向符合人类的福祉。

总而言之,GPT-4及其后续模型的进化,将为我们带来前所未有的机遇。但同时,我们也必须谨慎地应对其带来的挑战,在技术进步与伦理责任之间取得平衡,才能真正释放AI的巨大潜力,构建一个更加美好的未来。

Chapters
GPT-4即将推出,其32K上下文支持将带来革命性变化。这将使AI能够记住更长的对话和信息,从而在商业场景中提供更定制化的服务,无需额外微调。同时,更强大的推理能力也意味着AI可以处理更复杂的逻辑问题。
  • GPT-4上下文支持提升至32K Tokens,相当于半本书的内容长度
  • AI能够记住更长时间内的信息,实现更个性化的服务
  • 更强大的推理能力,能够处理更复杂的逻辑问题

Shownotes Transcript

TrackGPT 之所以惊艳就是因为你不用调模型了对不对其实如果你现在不懂技术对你其实好事你现在也很有可能就可以分分钟就可以自己做一家 AI 公司然后做一个自己的 AI 小产品出来

其实我觉得这波的 AI 浪潮一定带来的一个结果是说人都用得了这个 AI 其实活是 Chad GPT 干的要让他干什么活呢其实是你用自然语言跟他表达的这样医疗啊像法律啊我觉得最大的第一个问题还不在于是说 AI 有没有能力做这个事情即使 AI 有能力做这个事情我们允不允许他做这个事情也会是个挑战吧

AI 煉金術這個節目歡迎大家過來好,那簡單其間這週主要聊什麼呢?這週聊四件事情然後第一個就是講一講說現在用 AI 所謂你會調用 OpenAI 的那個接口能不能創造競爭優勢

然后大致上是不行的那讲一讲为啥然后徐文浩呢也会演示一个程序说哎他简简单单的就用 openai 写了一个小程序就是让 chatgpt 帮忙做一个人工智能小软件你到底有多快多简单然后第三个呢徐文浩会讲一下说那个呃

GPT-4 因为大家现在都很关心嘛 GPT-4 到底意味着什么然后那这里面到底有什么机会最后我再来收个尾简单来讲今天就聊这些你先讲一下大家最关心的比如说 GPT-4 到底是个什么鬼都可以啊第一个我觉得大家可能也没有那么关心而且就是

我觉得是当时 GPT-3 刚出来的时候大家特别关注这个事情对 GPT-4 我记得当时也比较当时可能就一个月前 GPT 就是拆 GP 刚火的时候大家都说 GPT-4 有人说有现在不是 1750 亿参数的 GPT-3 有人说它有什么 100 万亿的参数各种各样的传闻和概念对吧然后反正就是

因为前一阵我们也是看到就是说海外有一些网络上大家其实放出来一些据说是 OpenAI 内部的一些资料说是他们接下来可以给头部的企业有这种

私有化部署的这个版本的这个这个 TRACK GPT 嘛然后里面因为我看到里面呢就是说本身它私有化部署价格啊什么这个我其实倒不是特别关注这个是啥概念呢就是二十几万美元这个什么私有化部署呀什么 100GPT4 它反正有一个版本好像是一百多万美元可以私有化部署一年吧

但是我看到里面有一个参数其实挺恐怖的就是里面参数写了一个就是说现在的 GPT 你如果用它的官方的接口或者 ChatGPT 你破解它的这个接口的话它大概是支持叫 8K 就 8000 个 Token 的上下文差不多就是说你一次可以往里灌连你扔给它的问题包括你历史的这些对话的内容加上它回来的这个内容差不多是 6000 个字 6000 个字是啥概念呢

6000 个英文单词 6000 个英文单词基本上是一个微信流行的万字长文对吧就它有这个能够接收万字长文级别的信息然后吐一个或者吐一个万字长文给你但是它里面有一个比较大的模型它列了一个数据说是有三万两千个头盔

这个是啥概念呢三万两千个 token 按照他自己官方文档说差不多就是三个单词叫四个 token 这个 token 有没有一个词因为他有时候一个单词他可能会拆成两个词比如 ice cream 他会拆成 ice 跟 cream 这个是为了让这个语义更清楚一点就是他让你知道 ice cream 他不是个单独的单词他有点冰有点奶对不对就是 saying 他是 say 加 ing 对不对是说而且是现在进行式

那 24000 个单词这个体量呢就差不多是半本小说的量就大家可能随便去随手去买一本这种小说英文的话大概是就这么一本吧正常一本书吧就薄的可能就是五万个单词厚的可能就是十万个单词这个意味着说我一下子说我可以灌好多好多数据给他就今天你用 TouchBT 你会用的时间久了你会有这样一个感觉就是叫前问后忘记就你一开始跟他聊什么

反正你可能随着对话越聊越长越聊越长一开始呢你会发现哎怎么聊到后来他前面东西都给忘了那特别是你的内容比较长的这个时候但是呢如果说你想一想就是说他能聊半本书就半本书内容他都不忘记这个其实就挺可怕的第二个就是他不仅是意味着说他能记住很短期内能记住很多东西第二个他能做比较复杂的推理嘛

你现在只能让他做小学应用数学题我们看了很多什么这种所谓的叫做上下文学习的能力思维链的能力你可以给他三个例子五个例子但是都是比较简单的这种逻辑推理但是你如果说这个长度可以拉特别长然后可以把半本书放进去其实你可以给特别复杂的思维逻辑在里面所以我觉得这个数据还是个挺神奇的因为以前看到说一个人一天大概是说 2000 句话吧

对吧那一句话你按照十个词那就是两万个词嘛那你现在是可能我能够把几天的数据都放在这个开 GPT 对吧让他来说模仿一下这个人那如果再往上上个数量级再往上上个数量级能够把你一年甚至一辈子的话都放在里面对吧就是

有很多人都在做这种项目就是叫做这个用 AI 模拟就是什么男友女友对不对这个现在其实做娱乐还可以对吧就是大家弄着玩效果可能还可以但如果你真的说能把这个几万个乃至几十万个词都放进去然后让他去模拟那就真的挺恐怖的就我觉得会跟真人一样就就即使是说他在技术原理上没有大的更新如果他这个数据规模

真的再上一个数量级甚至不是说这个模型上说他支持的我能够去推理的内容或者说我能够吐出来内容能够上一个数量级我觉得都就已经特别可怕了 OPAI 他们自己都说我们 XPS 这个模型特别厉害我们都不敢放出来

我觉得可能是真的就是说就是真的可能内部有些特别特别他倒不一定说技术原理上有多大突破但是效果上可能比现在更惊艳的东西其实就真的没有放出来所以我是比较期待这个事情的了解我听你讲倒是想到另外一方面你是想到说可以把人的一生记下来他就是一个就跟你谈恋爱他不会忘记三天前的你对吧这种就可以谈恋爱了

我其实想到另外一些东西我这两天在一个一个过海外的 AI 的产品然后就发现比如说有一个产品它是就叫做把 AI 变成你的 employee 变成你的员工什么叫做员工它得保持一致性然后它得懂你公司比如说它是一个 HR 员工它就先得把你公司的 HR 章程先给读了比如说我们年假有几天这种东西

所以现在如果他的上下文比如说只有 4000 个 4000 现在是好像扩了吧 4000 个 token 的话那么其实他如果读了 3800 个字是用来读 HR 手册的话他就只剩下 200 个字跟你说话了然后说了说两句他 3800 个字就忘了

但是如果有几万个字的话他其实是可以把一家公司的基本的情况他是可以读进去的他就现学然后现学现跟你聊然后其实他也是可以代表这家公司比如说我们这公司有没有年假然后我们公司到底能不能开 VPN 这些东西他都可以聊了所以就相当于说不需要说我专门训练一个模型只是临时就相当于每次帮他去洗脑对吧洗一些内容进去都有可能可以让人更像是一个就是

呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃呃

就是我们以前搞所有的所谓智能都是哎呀这个东西我得给他调个模型情感分析我给你调个模型内容主题我给你调个模型然后这个就你啥都得调个模型但是蔡志毕之所以惊艳包括大家就是因为大家说我不需要模型了就所谓的上下文学就说哎我给你一个段话然后我直接给你一些例子你就直接给我答案了就是说我已经内部可能已经蕴含了很多知识你给我一些例子我就能立刻给你

回答出来了这个能力他已经有了嘛那只是说原来因为我的这个上下文不能放太大那我能给你个五个例子八个例子就了不起了对不对

但是即使说我的能力没有强如果我能给你 100 个例子你是不是一下子就会比原来再更聪明一点我觉得就是说厉害的一点就是我不需要调模型因为我们一般讲比如说要 fine tune 我们要调模型但是我的理解是 ChatGPT 这么大一个模型它反正也是调不动的它也不会为了我去调

现在的他的文档里面 fine tune 到底是什么意思其实他肯定不是去真的去调模型的意思 fine tune 他怎么理解 fine tune 就是去调模型我觉得为什么允许我们去调一下不大可能 fine tune 它的逻辑是调模型的意思是说我再拿一些数据原来模型我有很多参数对不对 fine tune 是说但是这些参数是他根据

欧布埃自己收集的数据对吧他收集的这些书啊这些网上的帖子啊然后预训练一个模型对不对然后他又用了一些强化学习对不对就是说我标了一些数据说当用户问这个的时候我去回那个问题那你现在做 Find2 对吧你需要做的是说你是给他说提示词跟对应的回答你可以认为那是说他那个基础模型他不会把你去重新训练或者训练也没有什么意义但是后面的这个强化学习的模型他是可以再做调整的

因为他原来论文里说的强化学习这是我的假设我的推测假设可能不对就是说我的理解是原来强化学习的意思说你看你原来模型是这样的现在我给你一些例子别人这样问的时候你那样回答一下你现在这个模型它回答古诗词特别差对不对其实你今天用过这个 OpenAI 你会发现让他去做古诗词他第一个他也不懂押韵第二个他也

对中文的数据量比较少但是你说我接下来就希望他有比较强的古诗词能力你就可以灌很多古诗词的数据给他他的大的原来的基础模型训练这个能力还在但是会根据你给他的输入输出去微调

调完这个它的参数就会变了这个模型只有你自己能调用不会影响其他人调用这个模型但是它可能就有能力说接下来我回来的古诗词第一个我可能说运脚都没有问题了字数都没有问题了对不对问个问题比如说我教会了它古诗词你去调 OpenAI 的时候你用的古诗词会好吗

没有这是隔离的所以底层模型其实没有变它是在我这边相当于在上面再怎么多这一层是怎么多出来的怎么多它就是一样的你可以认为我把他原来的模型的参数复制一遍对不对然后把你这些数据灌进去那些参数说你按照这个把自己调一下再调一下可能旁边就有一个克隆好的模型

对不对但是上面有一些些参数是稍微有一些变化的那对应的你再去问他问题的时候他会根据变化后的参数给你答案那这个逻辑上其实就是回答答案就会根据你灌给的那个数据就不一样嘛因为微乔这个方式在传统的技学视觉也好或者自然语言以前你也用的很多

只是说呢我觉得有一个比较大的差别啊就是说视觉其实从那个很早之前大家就微调了微调的这个逻辑是什么呢是最原来我们继续学习的逻辑是什么呢是说我给你很多数据样本比如说我做情感分析对不对那我只有一万比如说我有三万条情感分析的这个数据两万五千训练个模型五千个我验证上没问题然后用这个模型为来预测未来所有的内容

但是在这个基础之上有一个缺点对不对就是三万条其实数据太少了很

很有可能你光用我这三万条模型去训练出来的很多时候呢这当中有很多数据其实你的内在联系你那个分辨不出来比如说这三万条里数据里比如说都是我们俩聊天所以经常可能会用到人心或者讯号对不对或者说我们家里有个宠物说经常有个比如说你养了一只狗小狗很可爱对不对那未来模型可能会觉得但里面有正面形有负面形反正这说到狗的时候是必然可爱的

那他就觉得小狗很可爱对不对那当明天有一个别人说小猫很可爱的时候他不一定能够判断出来他是正面情感还是负面情感跑过来再说小狗不可爱的时候比如流浪狗不可爱的时候他也可能分辨不出来他会觉得小狗很可爱那么预训练模型呢是说我拿好多好多数据我不管就是我也不管他是不是情感的问题

对不对我就把所有的数据都拿过来我能够学到语言之间的关系我把网上所有的文帖都拿过来那他大概就觉得小狗真可爱里面其实可爱才是正面的关系

那个同时呢小狗跟小猫之间是可能有点关系的就是它们都是小动物都是宠物对不对我们再拿这个数据呢但是那个数据出来它是它只是告诉你语言之间内在的内部的结构它其实不知道什么叫正面情感负面情感然后呢我们说再拿我们标好的这个数据去说语言的内部结构你已经有了根据这个内部结构你再去训练一个说分辨正面情感跟负面情感的模型然后呢它就能分辨正面跟负面情感了

但是我的这个三万个我自己标号的数据里可能没有什么小狗也没有什么鹅或者没有那些东西但是因为在整个语言结构里我知道什么狗猫什么大鹅都是家里养的宠物对不对那他过来他的判断能就会比较好所以这个是一个就拿一个大的模型做预训练学到语言的内部结构然后拿一些然后在一些小的任务上微调其实是一个很传统很有效的

就是我们以前的机器学习的逻辑也就是所谓人工智能的逻辑但是它不太智能你就很容易理解为什么就是你干点啥我说我都得标一堆数据干任何一个单独的人物我都得单独标一堆数据但是 OpenAI 现在给你 GPTC 这个东西说你干大部分时间你发现你不需要标数据你说情感分析你说你就直接告诉我是正面的还是负面就好了你不需要再拿一万条数据过来标对不对但是我们也得认识到就是说

他不可能在所有的任务上都做到最最好比如说他可能缺一些数据比如他缺一些古诗词的知识

对不对或者他没有针对这些数据专门经过特训对不对你可以认为微条呢就是在一个单独的任务上一个聪明的人他已经学了这个本科大学读过了什么高考刚刚参加完什么知识都会一点这个能力是很强的但是呢他有些常识呢你问他他不需要训练就可以但就是有些单独的就是特殊的知识他可能没有训练过

那微调你可以认为就是短期集训一下这个人本质没有变但是呢短期集训他在那个方面的能力就会一下子变强了因为他短时间挂了很多书就跟我们以前大学考试的时候通宵复习一样对不对但是呢他也会影响你在其他任职任务上的能力

你特训完了古诗词了你可能发现其他能力它可能是稍微变差一点了对不对你跟他说我们不讲古诗词我们讲讲现代文他可能能力可能会下降你大概是这么一个过程其实这个跟我们上面我提的那篇文章有点像其实就是以前教 AI 的时候像我们上一次创业的时候就相当于你在教一只猴子然后每次都要反复训练它现在你在教一个大学生这虽然都笨笨的但是这个笨法还不太一样你教只猴子真的太累了

但是教大学生的话你总归教两个月他就会干这个了会干那个了他的通识已经有了有常识然后我们之前也是把它比喻成说以前就好像你要自己搞一个网站你要自己加数据库自己搞服务器现在的话相当于说你就这个东西全部包给阿里云去搞就好了然后数据库你也不需要操心就好多事情你都不需要操心

但是以前的话其实都需要草型现在 AI 也像云像数据库一样就属于一个默认的基础设施了你就可以掉了但是我刚刚其实还是有点没太明白我们自己做 get 然后自己比如说我们是基于 TensorFlow 然后自己搭然后我们自己关数据给他然后调一个自己的模型

这个其实我是好理解的就是因为那整个那坨东西都在我自己手上在云上面我全在我们自己公司手里但现在呢我是觉得说它有比如说它是 1700 亿个参数还是怎么样嘛就我总觉得那个模型它不会因为我丢了一点东西进去它就有任何的变化呀

或者说他那个变化要不然就变在里面了我不是很理解他是怎么分层的能够分出来这一层光给我用我觉得就那个你刚刚举的那个例子我是能听懂的但是我觉得他实际上不可能是 copy 一个出来我就觉得很诡异就是他到底是怎么实现这件事情的

对就是你额外交出来它这个说实话就是说我还没有第一个是我虽然大概看了一下文档我知道它怎么调的对吧但是我也没有我还没有仔细研究过就是说我至少我目前看到它也没有公布说我这个 FindTune 实际上是干了什么什么它其实没有讲对不对但是我没有几种推测有几种可能性一种是说我其实把它拆成两个模型嘛

一个是说我原来的这种基础的语言模型我其实没有变然后我在语言上模型上再搭一层对不对再搭一层这种强化学习的模型那个强化学习的模型我就单独根据你给我的数据去做调整

实际是什么其实我们并不知道但是肯定跟现在你用的这种上下文学习的逻辑肯定是完全不同的它还是用了机器学习去调整了模型的参数的其实你去调整模型训练一下成本并不是特别高主要是说我觉得比较大的挑战是说如果我比如说我用了这个玩意儿之后

对不对那我每次调用我都可以调用一个自己的模型嘛那我调用那个自己的模型一直要把那个模型加载在我的这个服务器里不然它就会很慢对那感觉就是它的成本会很高嘛至少它给到的这个文档包括它里面所有的各种各样的参数其实都是在说明它的确是在做一个模型的 fine tune 就是模型的这个微调而不只是叫什么没有调模型只是给了它一些比如说这个叫 prompts 嘛就是提示语嘛

所以我觉得这个倒是不必怀疑说他不是因为你看他说你可以把 FindTune 跟这些什么 WeightBias 这些什么整合在一起然后他能够定 Epochs 就超参数比如说 Batch 的 Size

这些东西所以我觉得这个肯定是一个正常的模型的微调就是一个应该不是一个它新发明出来的概念了解了那再问你一个词我也没看明白到底什么意思 embedding 是干嘛的 embedding 就是这个是个传统的机器学习的名词我觉得大家不用去纠结它

叫干嘛你可以认为就是我把词变成向量我们可以认为这个世界上每一个单词都是完全不同的对不对你可以认为 dog 跟 cat 是不一样的对不对比如说但是呢你会发现词与词之间是有关系的对不对就比方说 king 跟 queen 他们都是一个是吧都是一个比方说一个皇帝加上一个性别对不对

king 跟 queen 可能就跟 male 跟 female 它们之间的关系是不是你可以认为是一个对称的关系对不对所以说我们在这个词上我们可以看到一个纬度这个纬度叫做性别对不对然后我们可能会和很多词之间都会有内在的联系比如说 say 跟 saying 跟 said

这三个词其实是三个不同的词但其实它们之间有关系它们关系是时态上的关系对不对所以一个词可能说还有一个维度叫做时态那有些词是没有时态的比如说 king queen 它是没有时态的那它在这个角度上它就可能没有参数没有任何含义但是有些词是有时态的那它有你可以说一个词有各种各样的角度的含义跟理解对不对那么我们去学语言的关系说如果我能不能说把一个词归纳成

300 个角度或者 500 个角度或者我们能不能把一句话归纳成 300 个角度或者 500 个角度对不对因为这样我能够把比如说长的句子也好短的句子也好或不同的词也好或者不同的语言也好它

它能够变成一个数学上的一个我们叫向量就是变成一个 500 维的一个东西每个东西都是个数字它你可以认为把原始的这个信息做了一点压缩你把它拆成 500 个数字肯定没有精确的表达每一个词你直观上来的清楚但是它用一个确定的长度对不对就是 500 维度的向量精确的长度去表示了这个

一个词或者一段话那么后面因为变成向量之后我们就可以用数学的方式去做处理了对吧那为什么叫 embedding 是因为很多时候机器学习的模型都是说最原始的我是把原始的数据灌进去然后通过这个 embedding 我们叫嵌入层把它变成一个向量然后后面再跟着其他的复杂的神经网络的结构所以它是嵌在这个模型中的某一层

对吧所以我们一般叫它 embedding 对吧那那个 1700 亿参数是说这个向量有 1700 亿位吗不是这个向量现在你可以去接口拿到其实只有 1700 多位这个只是从现在你拿到的是一个叫 transformer 的输出层就是最后输出的最后一层的输出结果

所以你认为内层的输出结果它是一个 1700 多位的项链中间它可能有很多层复杂的 transformer 结构叠在一起可能每一层的结构都有一个非常多的参数

所以这个模型的参数会比因为拿到最后的那个输出结果所以你可以认为它只是输出结果现在是其实没有那么多参数输出结果你用一下它的那个程序的接口它其实是如果没记错的话我们经常用的那些 embedding 就是几百维到一两千维吧

了解了说向量是不是标签我的理解是不是你标签是一个比较文科的弄法就是你标签和标签之间你没法算算数对吧但你向量啊指正啊相互之间是可以变啊叠啊成啊搞搞一堆它是它是可以算出来的对对对向量向量不是标签向量就是向量因为向量除了这个维度上有没有值还有值的大小对不对那比方说男女这个东西可能我们认为是一个维度但是

其实可能不一样就是你觉得不同的文章他的这个听起来的这个男性的气息是不一样的你说他的这个脸上是个求然大汉你觉得他肯定是个

对吧这个求然的这个男性程度肯定比面白无虚看上去传统意义上讲来要来的高啊我们不讲他对不对但是或者说我们说我我爱你跟我喜欢你那爱肯定比喜欢的程度要高一点对不对就所以我觉得说这个当中有很多的事情他最后会用一个数字来表示他不是个标签他只是就像我说 1700 多是不是一个词或者一段话只能从 1700 个角度理解他其实也不是因为

因为它这个是个数这个数可以从负无穷到正无穷虽然一般来讲我们一般都会把它 cap 到什么负 1 到 1 或者 0 到 1 之间这个 0 到 1 之间这个可以无限分割的对不对它能用一个数字能够补足很多很微小的差异其实如果你现在不懂技术对你其实好善

因为他其实第一步抢饭碗的是那些基础人的饭碗因为比如说早期你觉得会架机房这是一个很厉害的能力所以你们公司比如说没有这几个什么 IT 可以搞定机房就没法开公司是吧那现在的话有阿里云了那首先其实失业的是这些去帮你搞机房然后搞运维的人对吧

其实现在的话 AI 如果它这个能力越来越变成一个基础设施你掉两下就能用的话其实它对于那种所谓的搞技术的人的需求对于一家普通公司来讲是降低了你现在也很有可能就可以分分钟就可以自己做一家自己的 AI 公司然后做一个自己的 AI 小产品出来所以相对于非技术人士这其实是一个很大的

很大的福利因为他把那个你跟本来跟技术的人有这么长大的一个跨度就是你一定要学会这些东西一定要搞定这些东西你才能够开工但现在呢其实基础设施已经架到这里了你只需要稍微可能学两个小时就能开工了以前你要学两年那这个时候的话其实是有优势的

然后我们就直接进入到比较硬核的环节那个群众好你演示一下就是普通人可以怎么样快点就可以搞出一个自己的 AI 小产品他就自己好玩就随手做了一个就是周围有很多朋友都会面临一个问题就是说我们好像只能用 ChatGP 聊天对不对我能不能真的说我要提升效率我们介绍了各种各样的工具

但是我真的想要干点我们说了能够替代程序员这个靠谱对不对所以我就其实这个创意也不是我想其实是一个朋友他们做海外电商的然后他们自己说用 ChatGPT 其实打了一段文案说我们试一试说发现他的确能够帮我去想文案卖点比我去定价格我们就尝试说做了一个小插件这个小插件能干什么说

我们我知道国内有很多人卖东西说其实他进货也是从 1688 上进对不对然后他卖货是去亚马逊或者 eBay 这样的平台上卖那他可能有这种对吧标题但是你会发现其中有些标题其实不一定适合在这个

这个那我也想给他取个英文标题对吧比方说有些东西说哎我用翻译对不对我自动翻译这个当然你会发现里面有些翻译其实不适合对吧你看第一个里面这个叫一键待发对不对你直接把这标题往亚马逊上一贴

肯定就没人买了对不对你想一箭待发那我何必从你这买呢对不对那我其实就写了一个小程序我们写了一个红写了个红干什么呢说这个叫 AMZ Writer 我叫他叫给让亚马逊给我重新写文案对不对那后续呢我们会把这个程序免费的在公众号上给放出来啪

一下大家看到他就出来很多英文对不对不管你懂不懂英文你看第一个他说叫 Korean girls cartoon hair accessory set 就是对吧韩式的女孩的卡通的头发的什么 accessory set 就是套装对不对然后他有一些卖点什么 super cute and soft hair 我觉得他有些也是编的对吧他就会 high quality 对吧这个明显是他自己发明出来这里没写高质量但你写我觉得正常写卖点没什么问题对吧

然后右边还有一些价格对不对有一些价格范围对不对那这个程序我是怎么写的呢

这其实也不是我说我特别聪明是吧我说 OpenAI 你帮我写一下对不对来当然他写了不能一次直接运行我到 ChatBee 说我想写一个 Google Sheet 的 APP 脚本我说你要干一堆事情他啪就给我生成一堆代码然后这个代码他这里有一个 Google 注册里有一个叫 APP 脚本他一点就往里贴然后稍微改了一下其实还是调了一下

就好了就有提案了我其实还因为做了一些别的功能就好了就能用了对不对用法其实很简单我就找 GPT 我说请根据商品标题商品标题就是我在 Excel 里指定的标题说干三件事情写一个在适合在亚马逊上卖 20 个字英文以内的标题为他写 5 个在亚马逊上展示的卖点用英文写估计一下商品在然后返回结果用 JSON 三个字段分别是什么

然后之后我就把它解析一下就便利一下就啪就出来了这个结果我就出来了我们可以高级一点对不对我们能不能不要用英文我们用日文行不行对然后我们再重新所以那些程序其实是就是用来说连通 Google Sheets 和 ChatGPT 的然后

其实活是 Chad GPT 干的而且要让他干什么活呢其实是你用自然语言跟他表达的是的没错他的确有一些缺点我觉得是说明显他第一个他的日文的很好后面两个他看上去还像中文的对吧那我觉得这个可能我写的不太通顺我们改一下

好的,我给大家讲一个更生活化的例子就是我这两天大家平时用不用 YouTube 去看视频看视频的话会不会有的时候比如说你想学习 ChatGPT 上 YouTube 然后看一个视频好长好长的然后又看什么 ChatGPT 对什么 CAD 行业的理解然后什么能不能生成 3D 的 AI 的软件你可能会去看这样的一些视频但是经常看了 20 分钟会发现这个视频啥都没讲

所以最好的情况就是能够有一个插件它能够用中文告诉我们说这个视频讲啥的

然后我之前用过一个插件叫做 YouTube Summarization 然后我觉得不好用然后我最近就重新用了另外一个软件叫做 Glarity 它是一个 Crown 的插件就是我打开任何一个 YouTube 的页面它就会在旁边给我一段中文的解释然后就总结一下但是我也觉得它解释的不好然后我就打开了它的设置发现它就是掉了一下 GPT-3 或者 ChatGPT

然后他写的那句话叫做 summarize this text above 总结了一下上面然后的话我就想说那我就可以改你这句话我就把他那段话改成了用一到三句话总结一下上面这段文字因为他把整个视频的文字全部扒下来了丢给了 chatGPT 然后他问说你总结一下我就把他你总结一下改成了三段第一段叫做用一到三句话总结一下上面所有文字

然后第二个叫做这篇文字分为哪几个部分每个部分的主要观点是什么主要例子是什么有什么证据有什么行动向然后让他分块然后每一块告诉我到底是什么东西然后再跟他讲说最后你再 highlight 一下这篇上面这些文字当中有没有什么值得高价值的那个有新意有亮点的东西把它单独拎出来讲一下

所以我就分成了三段一段就是这段话什么意思然后这个视频讲什么的一个就是这个视频分哪几块每一块你按照我的结构告诉我说它是讲什么的最后你再把有新意的地方再拎出来告诉我是讲什么的然后用中文讲这样子的话你看一个英文视频的时候就会点一下然后它就蹦出来之后你就可以看到说它值不值得看什么的相当于我在编程但是我的编程是自然语言纯自然语言我就去改

所以徐文浩做的就是类似的这样一个事情对对对你看我改了一下对不对我们整活成功了这个就是为什么现在大家叫提示词工程你说我们刚才看他老师这个给我出中文对吧因为日文里面有很多中文汉字那我就提了个要求对吧你必须要包含平假名和片假名然后我再运行一下他啪整活一下你看这个是不是就更真了对不对你

你说的对就好像我在我那个里面也加入了一个说请用 500 到 700 字来说因为它之前总是太短了就你这边就加一个请用平假名偏假名相当于我们在用自然语言编程对对对我这个会放出来就是大家如果以后要做改造其实很简单对吧

就是你可以说这不是商品标题你可以说根据这个文章标题给我写一个比方说这个文章的概要介绍你也可以说根据这个文章标题帮我想想 SEO 的关键词是什么因为原来你用 Charge EPT 有一个缺点对吧就是你只能一条一条人肉搞我觉得这个在效率

空间当中使用这种浏览器插件呀或者 Excel 里的这种插件呀或者 Google Sheet 里这种插件呀其实挺好用的你也不需要懂太多的代码对吧你每天也会用对不对你可能你领导找你说哎呀我有很多资料要翻译都是商品那你把那东西整成表格网里一贴把这代码一改刷一下就出来了对不对就怎么用这个脚本我们到时候会在那个公众号里发一个详细的文章包括这个脚本代码也会给到大家啊

而且这个代码大家可以自己去写当然这个前提是大家可以自己找 ChatGPT 聊天让他说你有什么需求你提给他他会给你写的当然他写的可能有 bug 或者不一定能执行通过所以

你如果有一定的程序开发经验其实挺容易调的大概我写这个事情写加条让这个通过大概也就一两个小时吧那你就拥有了这样一个插件而且之后我要干什么我都不用改了对不对我只需要在里把这里描述改了我就能干了

但是如果你没有太多的程序经验我可以把代码给你我告诉大家反正你要改就改哪几个地方就好了这样就可以批量出活了比如说你其实是让 chatgpt 帮你想了 50 篇公众号你就必须一个跟他聊但现在你就可以说你出 50 个公众号的题目他把题目给你然后你把它贴到表里面然后你再把使用号那段文字改成说根据标题请出一篇公众号

他就帮你出 50 个公众号这样出你省的来来回回 50 遍你比方说你们可能是个文字编辑对不对你们要开选题会对不对你搞了 20 个选题然后你觉得 20 个选题重新取名字你只需要改这段描述就好了这个问题就解决了对吧你开发这个东西的话其实跟我这两天学会的另外一个工具可以结合起来用我这两天还学了一个我下次写一个教程就是那个 Browse

Browse 就是个 AI 版的按键精灵,它可以帮你去扒所有的网页比如说你想研究希腊神话,有一个网页上有一个列表把所有的希腊神话人物列出来了

然后的话你就可以让那个 Browse 去帮你把上面比如说有 5000 个希腊神话人物你就点两下交他一下说我要这几个参数然后他就自动帮你整成了一张 Excel 表把网页全部公共整整的拔下来然后拔完之后的话假设我想理解这 5000 个人物我就可以把那 5000 个名字导到你这个 sheet 里面

然后的话我让 chatgpt 说每个人给我两句话中文的简单介绍然后可以瞬间把这 5000 个人看一下甚至于我可以为这 5000 个人写中文的中文的文章了就是相当于扒一些原始数据然后过来然后让他重新生成其实都可以连起来做了对因为我觉得这一波的 AI 的浪潮它一定不是说我们又要找很可以找很多工程师来创业重新做个 app 它有很高的技术门槛

其实我觉得这波的 AI 浪潮一定带来的一个结果是说有些人叫人人都是程序员但是我觉得是人人都能用得了这个 AI 而不是说这个东西门槛特别高我得特别懂 AI 我得特别懂机器学我特别懂编程不是的对不对就是它让你真的第一次能够通过自然语言和大家来交互能够通过自然语言我只要把我的需求讲清楚这活就能给干了

而不是说我必须是个技术专家我才能把这个活给干了而且哪怕是提供产品的话其实很多时候你也只是需要说学会如何调用和组装这些 AI 的能力而不见得需要自己去做什么

我举个例子来讲就是比如说大家很少可能会想到说我要做一个我要什么学习 AI 但是大家可能会比如说明天要交个 PPT 是吧然后大家会想做个 PPT 有一家创业公司就叫做 Tume 就是做 PPT 的你只需要输一个标题给他他就把整个 PPT 给你做出来了然后包文字包配图包故事线啥都有

然后我试了几下就没有那么好用但是我想了一想说这个软件它已经融了 2000 多万美金然后我仔细看了一下我觉得它背后就掉了几个 API 它其实不用干什么事情你输出题目之后它先掉了一下肯定是掉 GPT-3 然后根据这个题目帮忙出个 PPT 大纲然后出来一个大纲然后他再把 PPT 大纲比如说 6 页然后他就每

每一页的话再让 chatgpt 相当于说出这一页的 PPT 应该讲什么然后就出来 6 页然后他应该还调了比如说可能是用 diffusion 或者用什么第三方的画图的服务然后在每页帮他配个图说这一页我的主题是你帮我画个图然后就拼了一个 PPT 出来了其实他不需要自己做那些底层技术我觉得他也没有写的比 chatgpt 好

就觉得大家学会怎么拼也是可以的对我觉得这个这是另外一个问题了就是说就现在的这些公司不管融资多少我觉得还是有一个同质化竞争的一个就是可能有 20 个公司都在做差不多的事情大家背后都用的都是 OpenAI 的这个提供的接口对吧然后这个我觉得是一个一个比较大的这么个挑战吧对所以我觉得最多的到后面很有可能你的真的竞争力就因为

你要考虑两种竞争在做产品的时候一方面是你要考虑我怎么用好 AI 这个工具然后我做出东西去欺负那些没有用 AI 的人然后就比如说我做了一个更好用的 PPT 对吧但是另外一方面你要想到还有一百个跟你一样用 AI 的人去挣在路上你要怎么你有什么传统的工程能力或者资源或者网络效应可以欺负另外 99 个人的问题

OK 我们现在今天就过了一下 GPT-4 到底有什么伟大影响然后又讲了一下说写了一段程序就放在这里好了想要这段代码的到时候就到公众号对吧到 AI 炼金术公众号上可以怎么拿

输入预约领取然后到时候会推送发送给大家会发送给大家因为我自己觉得还是挺好用的特别是批量的对吧我也不能用那个 ChaiGP 一次性的我就直接问 ChaiGP 了但是我要处理比如说 100 条数据我现在都用这种像 Excel 一样我贴一下然后改一下我的提示词然后让它批量帮我生成就好了对很方便很方便了解了

所以我觉得其实像我们刚刚讲的这种大规模的内容生成型的东西就是只要他是在重复劳动比如说你刚刚做的其实是根据一个产品名字我去想它的卖点对吧然后给他在亚马逊取标题然后写 description 这件事情如果现在肯定有很多的岗位在做这件事情然后他在做比如说一个人一天不管他是做 5 个还是做 500 个反正他这个工作其实相当于是

每一次都在重复比如说他在研究这个卖点然后研究好了怎么写什么的这种劳动的话其实大概率都会被 ChatGPT 极大的取代或者说至少说极大的帮助你提高效率帮助一部分人提高效率对如果你是搞研究的对不对

很艰深的那你没有问题就是说但是这种入门级的就是你本来想五个卖点可能也就一两分钟两三分钟你也就无非是套路化的这个事情我觉得现在就靠程序加 AR 就太容易被取代了因为就是所谓的标题党嘛对不对就一开始大家对标题党是很就是就第一个想出标题党的人一定是很厉害的但是

大部分去写标题的人都是看了一堆标题然后总结出了 20 个套路然后把所有的文章往这个套路里塞那这件事情未来就是机器就帮你做了对要不然你自己学会用机器要不然机器帮你做了帮你做了之后这份工就没了了解了

所以就是以前的话其实我们一直会以为说人工智能其实是取代第一就是体力劳动会先来但是现在看起来就是这种重复性套路性的所谓的知识工作其实也不是知识工作只是套路性的工作其实最先的会被取代但是 transformer 对吧它其实我觉得它现在看起来它最大的一个作用它其实是把 Atransform 成 B 的形式就是好多的内容

我知道他底层不是这个意思就是他的使用上面的话其实比如说你告诉他一个表格然后让他说你把换一种形式跟我讲一讲或者我给你一篇东西然后你去那边读了好多好多东西之后你把套路总结出来你按照这个套路帮我帮我 generate 一些新的东西出来

所以他其实从 X 到 Y 的这种变形的话其实很擅长的但其实我们的所谓的知识劳动章当中有大量的活其实就是这样的就是把一个东西你按照一定的套路加工成另外一个东西比如说根据一个标题然后你去看一看应该给他想点什么脉边

我称之为这叫翻译只是说带引号的翻译不是说最简单的你从中文翻英文必须一字不错无非是你把一些比如说标题就是给卖家看得懂的语言变成买家看得懂的语言你变成中国人看得懂的看成外国人看得懂你把业务看得懂的变成产品看得懂的你把我们比如说把编辑是把作者想表达的翻译成读者能听得进去的其实大家都在干这个事情

大量的知识工作都是在干这个事情是在麦肯锡的框架里面的话他会把人类的劳动分成三种一种是生产一种是交易一种是互动然后我们一般认为互动就比如说营业员给你聊两句这个叫互动但是其实比如说你刚刚讲的翻译它其实也是一种互动就是为了是 communicate

把一个标题改得更标题党一点这也是翻译然后一个律师给你提供法律建议对吧就是教你怎么样可以合理避税这也是一个翻译保险经纪人所以你会发现其实我们的工作当中甚至于你给老板的 PPT 对吧为什么这种内部 PPT 又不产生实际价值就是内部在不停的人和人之间的互动和翻译把

市场需求翻译到他能听懂什么的这种其实我们工作当中绝大部分是在做翻译做互动的活互动的活现在看起来的话就是 XGBT 为首的这一代的 AI 科技的做得很好了你就算觉得他做得不好你也得承认比如说你是 80 分的话他现在至少有 8 分是吧但是他每年每个月都在变得更厉害

我觉得他肯定不止 8 分对不对他肯定是 60 分总是有的对但我觉得另外一个很重要的是什么他能 24 小时不会有任何抱怨跟疲劳的来干这个活对不对你说我找个人写这个东西他可能甚至我觉得人真的集中注意力写的也很快比如说你专业的人

但大概率你的构造有一个缺点就是说你干连翻译一个小时你得歇一口气对不对然后你肯定会觉得很疲劳然后你会觉得厌倦你干两礼拜会跟老板说这太无聊了能不能让我干点高级的事情高级的事情本来就没有那么多对吧第二个是就是机器没有情绪这个我觉得是一个巨大的差别翻译的不好再帮我再来一次对不对然后翻译了十稿不行回到第一稿对吧你人肯定就已经崩溃这机器可是毫无压力是

所以一定要学会怎么样去用好它我再给大家看一个例子其实今天我是看别人的例子然后改造过来对大家感受一下就很多人对着 chat GPT 你就会说然后说句话然后他答的不好你就嫌弃他这是你不会用对吧对你就觉得这东西笨其实我觉得就是很好例子我说我们用 chat GPT 做翻译对不对

然后我们去翻译一个成语对不对叫水能载舟亦能覆舟对不对然后呢你看他第一句翻译就 water can carry the boatbut it can also capsize the boat 直白嘛但是你肯定没有这种啊中国成语的这个感觉那时候我说你这写的不好我说你是个我跟你设个人设吧你是个精通中外文化和文学的翻译家给一个更漂亮的翻译然后他说 water is a vehicle support

yet it can also be its undoing 我觉得还是不行不行能够再简洁一点他说 water can bear a boatbut can also capsize it 我想想说可能还是我讲的不够好我觉得诗嘛你要押韵你要尽量意义不要音译对不对就可能在英国的文化里不一定是讲船跟水的关系对不对

第二个呢你要押韵对不对对然后接下来我觉得就用了一些更简洁的英文对吧 Water vessels' allies of foeCan both carry and overthrow 对你一看这下押韵了对不对前后两句都是以欧结为然后他不是说先说前一句

先说负周再周负周他其实前后两段都是正反正反的这个关系对的对的他说他我解释一下就是说他说那个水可以是一个船的朋友也可以是敌人然后可以载他也可以把他搞翻但是他就用了一个很有韵律的一个节奏的就像是真的像诗一样的一个东西水能再周亦能负周就刚刚那段话读起来就是有这个韵律感在了

对所以大家就是不要觉得说哎呀这个 AI 是智障对吧也许只是因为你文化水平不太高这个 AI 觉得没有必要用这么高级的话来跟你沟通我因为我看到就你这个也是看到之前有个人有个人推荐一个 prompt 说请你就是你要他回答任何一个问题之前他都加这样一段就提示着说你是这个领域的专家

他世界领先的 leading expert in this industry 比方说请你用尽量怎么怎么样的语言把这个东西讲清楚你就会发现他就从讲车轱辘话跟你去讲这个领域中比较最新的研究结果发展是怎么样的还是说这个模型里蕴含了很多强大的知识跟能力

今天没有被挖掘出来是所以大家就用 ChatGPT 可以多跟他聊几遍然后刚刚徐光浩讲的那个方法的话就是比较常用的一个方法就是你催眠他你把他是谁你要讲清楚然后你也讲清楚自己是谁自己什么目的然后你的偏好在哪方面然后他给出来的结果就会越来越好

他虽然有点笨但是你多教几遍他就越来越聪明而且以后就你学会怎么跟他沟通交流之后他就便宜对吧效率高对吧对吧你可以其实你可以提更明确的要求你说我要求简洁传绳用意义还是直义要不要押韵对不对甚至我觉得大家都可以去试然后还有除了翻译以外还有好多好多场景比如说你可以你如果要找工作的话

第一个他可以帮你改改你的简历然后你如果你的简历你刚好要面试某家特定的公司你还可以把那家公司的要求把那个公司的 JD 发出来说你根据这个 JD 帮我把简历都改一遍这个也是可以的

然后你写完每一段话之后你让他可以帮你改一遍然后你写完英语之后也可以让他改一遍你写完中文也可以改一遍你写完任何的商业计划什么都可以跟他讲说你看看我有哪里做的不好的你提醒我一下然后比方说这个是我前一阵因为我最近也在补课因为有一段时间没有看我去在跟课程里的一些作业对不对然后我作业做不出来往里把代码一贴然后让他帮我解释跟补全外

万事不决都可以去问他一下对不对我想起来我前两天看到一个特别适合整活的我们一个整活是什么大家都看电影对不对看电影有一个事情很痛苦有一个电影特别长那你不知道在几分几秒去上厕所对不对你可能喝了可乐这个喝了咖啡然后你直接憋不住对不对那说

说你是一个电影专家你知道电影的哪些片段比较无聊请你告诉我所有哈利波特电影里比较无聊的时间段我可以在那个时间去上洗手间对他就告诉你这个电影每一部电影里哪些比较无聊他找的无聊都是那种就是没有什么情节可能就是没有什么刺激的镜头在我去看电影之前

我就可以在这个时间点去上厕所了你甚至可以提说我这个三分钟你可以找一个三分钟或者你可以提更多要求说必须在前第一个小时里面的所以我觉得说大家说能有什么用能不能是不是只能用翻译是不是只能用来写文章是不是只能问点问题

就取决于你能不能整活嘛所以大家要学会用就是取决于你能想到什么有意思的应用了解如果你就比如说因为一些特殊原因没有办法使用的话国内比如说在在我们的星球里面也可以直接加入 QQ 群可以可以跟机器人聊天也可以你去比如说像百姓网然后他们有那个 QQ 群和那个微信群里面也有机器人去聊天所以的话你

最好是能够直接去用 chatGPT 了如果实在不行的话呢你可以去跟国内的这种 QQ 和微信里面的那个机器人去聊他们背后很多接的是接的是 GPT-3 偶尔是 chatGPT 因为 chatGPT 不好掉所以的话呢大家去体验一下就都出来了因为你光听的话就是这个概念就有的时候真的就是就没那个体感你还是去玩一下

大家都可以试一下因为我觉得看起来他这个回答至少是真的虽然我没有拿打开哈利波特去看一遍因为我相信第一个是哈利波特还是个比较热门的电影网上肯定有很多讨论他的情节所以我觉得这个信息他应该是有的而且他说的像模像样的而且你如果担心的话你可以这样写对不对如果你不知道的话就说不知道他就会减少瞎编的概率对不对就是

这个我觉得大家就取决于诊回答可以去验诊但是我觉得一般来讲它对于你互联网上你觉得这个信息应该是能找到的但是很难找它其实应该信息是比较全的或者你不知道怎么找特别是英文世界的因为它毕竟它的训练数据里 99%都是英语中文的很多信息就是假的这个是会有存在这个问题所以我们也特别期待中文的大模型什么时候出来对吧就百度说 3 月 16 号就是我们都在说那天估计百度这个服务器肯定会被打爆差

ChatGPC 夫妻估计也会打爆因为肯定会有人干个什么事呢我觉得我们那天也可以干这么个事直播一场直播啥呢同样一个问题在两边问然后直播给大家看是什么结果对不对然后大家想问什么问题可以直接在这个直播间提问说我们觉得合适我们就打上去看两边比一下整体来讲是英文的结果跟效果还是会比中文好甚至有时候我会这样我中文回答之后问了一下他发现效果不好我说你先把我的问题给翻译成英文

然后我再重新贴回给他然后他用英文帮我回答一遍英文回答出来我有懒得看我说请你再用中文解释一遍我其实是个比较内向的人有很多问题也不好意思问朋友或者遇到问题喜欢自己研究对不对但现在就你问 Chad Gbc 毫无心理障碍

对不对反正我钱也付了然后有同学问差个鸡皮子会骗人吗有时候会骗人我给大家看例子他这个胡扯他不叫骗人他是个语言模型他就是把话说通的一个模型你不要拿他真的去查东西我觉得英文里你说不要编什么的效果中文他真的胡扯我一开始说诗词名我看一开始什么密州初烈什么赤壁怀谷我看着看着怎么来了个藤王格序对不对欺负你读书少

啥都列出来了我说你就不要扯藤王格序跟深深万代不是苏东坡写的一个是王博写的是一个李清照写的

对吧然后他继续胡扯说是苏氏写的我说苏氏不就是苏东坡吗就说是的在中文世界的知识上就是你觉得这个东西就是有事实的他有知识的他有可能会胡扯但是我觉得是一个是他的训练数据里英文知识的真的东西比较多对吧中文里面有很多虚假先传这个是有的这个我们要承认第二个是你可以用一些方式比如我说不清楚就说不知道你看他有时候就会说没有

因为我们知道他肯定是用了很多我们现在在使用这个 CHARGP 的数据进一步拿去做训练了你今天问他的问题明天

他肯定的回答已经不像所以他这个模型一直在调但是是不是他是怎么调的他会不会有个人工去标一下这个数据我们不知道也许他会有人去过滤一下数据其实你胡扯他就不会被列进去 notion 和 chai 的 gpt 哪个好其实是一家的东西他就背后其实接的都肯定都是 openai 的东西 notion 背后接的明显也是他们家的东西

所以的话我是感觉你如果是写东西的话呢用 notion 就比较顺一点但是现在看不出来哪个更好反正我自己使用体验上的话菜的 gpt 给我的那个回馈会更好更对一点然后但是你要方便的话在 notion 里面因为你敲一个空格它就直接 notion 就跳出来了嘛

所以在 notion 里面我会觉得他应该是做了一些提示词工程比如说我是什么人你写东西要什么方向写我觉得他应该做了一些这样的前期的东西做在里面比如说你就是个什么 professional writer 他可能写了理论上来讲 notion 应该是更好用的但是我实际用下来的话觉得 chat gpt 好像给我的

体感还更好一点我觉得还有一种可能性是因为英文中文的问题因为大部分我的写作还是用中文的然后中文他们都很烂都不咋地所以 notion 的实力可能没有那么方便发挥出来对我觉得大家可能有一个误解就觉得说 chatgpt 是个特别牛逼的 ai 其实任何行业都有比他牛逼的 ai 比如说在诊断什么方面其实都有专业的 ai 在做

但是这次有什么不同的地方其实是他比第一他比较听得懂人话第二他说出来的比较像人话对所以这点是比较不一样的所以你说比如说互联网医生其实早就在做了已经有很多的那个医疗方面的那个 AI 已经在大规模的大规模的在用了已经

只是说互联网上是不是这种跟你聊天的医生能不能直接改成机器人的话是不是一定要用 CHAT-GBT 这个还真不一定因为其实医疗在大部分的中小的病里面的话其实是它的所谓的临床路径是特别清晰的就是这个人多少岁他就应该先要做哪几个测试哪几个测试达到什么值就应该进哪个流程其实它的临床路径非常清晰

所以在这个时候的话其实就是不需要 chatgpt 这种东西哪怕它就是一个很机械的东西在大部分的病的所谓互联网这一层就是互联网能看的病这一层的话其实它都可以做得很好它跟 chatgpt 的发明关系不大所以的话我会觉得说就

他最大的帮助的话这一波浪潮主要是帮助说你说话你不管怎么说话他都听得懂以及他说出来的会更像人话跟你的问他的问题会更相关而不是像以前那个机器人互联网医生可能会比较死板一点对我的理解是这样

我觉得这个问题的核心逻辑是能做重大决策肯定第一个我觉得肯定能做现在有很多决策第一个是大家可能没有体感就是说现在大家去拍的这些废片包括 CT 就是 X 光其实都是先机器独片

它当然不是插 GPT 它是机器读片是视觉去读片这也是为什么说过去几年就是有大量的原来不太容易发现的这种肺部的节节其实片子里都发现出来了但是我觉得这个东西更大的挑战并不在于说 AI 能不能做决策对吧

有没有能力做决策就是 AI 有能力做决策我们就还回到一个伦理跟法律的问题但是你说 AI 出了这个事情谁背责任我包括我觉得像自动驾驶这个东西其实都是类似的问题它肯定有些地方它可能今天很蠢没有那么厉害

但是伦理问题其实挺难回答的它不像有些事情你说我 AI 比人好就立刻干你这客服 AI 比人好其实我公司内部我就能做决策因为最坏的情况就是无非是最坏情况是 AI 今天不靠谱骂了客户那我赔钱就好了但是有很多像这样医疗像法律我觉得最大的第一个问题还不在于是说 AI

AI 有没有能力做这个事情即使 AI 有能力做这个事情我们允不允许他做这个事情也会是个挑战这个也是我觉得就是 OpenAI 他们自己在研究的就是说就是企业社会叫 ESG 企业社会责任治理这样的一个问题就是包括他们提出我为什么 GPTC 一直不放出来他们给的理由是说我对这个世界负有责任我不能

我要想清楚了我这东西才能放出来它会对社会造成什么冲击所以我觉得这个是个比较大的一个话题研究领域比较关注的一个话题叫 scale oversight 本质上就是回答说我这个模型更厉害了就能力越来越强了对不对然后我的研究方向就是我这个东西放出来更大规模的模型会是怎么样的它是不是能够 alignment 跟人类的利益是一致的

因为 ChaiGPT 它自己放出来其实是做了一些叫强化学习的微调就是让它很多标数据就是不要骂粗话脏话对不对要有礼貌你会发现 ChaiGPT 特别有礼貌

恰吉比奇是个很有礼貌的机器人但本质上我觉得是大家做了很多在伦理层面的考虑的所以我觉得这个其实是很多事情能不能的一个挑战不在于它有没有一个能力这个能力我觉得我刚才说错了刚才不叫欧巴海叫 alignment 叫对齐对吧就是这个所谓的对齐就是说

怎么跟我人类对齐怎么让我们脆弱小脆弱的这个无知的人类对吧能够真的驾驭 AI 而不是最后被 AI 统治对吧大家科幻片都看过对吧但是呢我觉得此时此刻这个 AI 还没有那么强对不对第二个我觉得对大部分人来讲不是说 AI 已经太强了我用不了而是大家都还没有用起来好

好那我来说个尾那个就最后根据徐文浩的这两个一个就说 chatGPT 很有礼貌一个就是说那个科幻片里消灭未来给大家最后一个建议就是你跟 chatGPT 啥人工智能说话客气一点万一以后天网来了要把我们排队突突的时候他会记得这个人每次都说 please 都说 thank you 可能会把你往那个队伍的后面排一点好希望大家排队排到比较后面

要讲礼貌好了好了那今天这一期就到这里然后大家记得关注各种各种各样的账号好的那我们今天先到这里谢谢大家谢谢大家拜拜拜拜

so

i could have said to make it all stopit kills me how your mind can make you feelso worthless

We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Export Podcast Subscriptions