We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

E138｜如何用大模型提升学习效率？来自1100小时的深度使用体验

2024/1/26

硅谷101

AI Deep Dive AI Chapters Transcript

People

左

左斯琦

Topics

泓君：就大模型如何帮助学生提升学习效率进行了探讨，并对嘉宾左斯琦的学习方法进行了详细介绍。左斯琦：分享了利用ChatGPT、RAG、API等工具辅助学习的五个步骤，并分别从哲学、数学两个方向详细阐述了具体操作方法和经验，包括如何利用ChatGPT进行总结、全局理解、问题扩展、文献检索和信息整合等。同时，还分享了利用ChatGPT辅助编程开发小游戏和模拟与哲学家对话的经验，并对不同大模型软件（ChatGPT、Claude、Bard）进行了比较，最后展望了自我提升AI Agent的未来发展趋势。泓君：就大模型如何帮助学生提升学习效率进行了探讨，并对嘉宾左斯琦的学习方法进行了详细介绍，并就大模型的局限性、未来发展方向等问题与嘉宾进行了深入探讨。左斯琦：分享了利用ChatGPT、RAG、API等工具辅助学习的五个步骤，并分别从哲学、数学两个方向详细阐述了具体操作方法和经验，包括如何利用ChatGPT进行总结、全局理解、问题扩展、文献检索和信息整合等。同时，还分享了利用ChatGPT辅助编程开发小游戏和模拟与哲学家对话的经验，并对不同大模型软件（ChatGPT、Claude、Bard）进行了比较，最后展望了自我提升AI Agent的未来发展趋势，并对智商测试、人工智能是否有意识等问题发表了自己的哲学思考。

Deep Dive

Chapters

介绍了大模型在学生中的使用情况，并引出嘉宾Siqi，他分享了自己使用ChatGPT的学习方法和工具组合。

超过89%的学生使用ChatGPT完成家庭作业
48%的学生用ChatGPT完成小测验
53%的学生用ChatGPT写论文
22%的学生用ChatGPT生成论文大纲

Shownotes Transcript

欢迎收听硅谷 101，这是一档分享当下最新鲜的技术知识与思想的科技博客。我是红军。在大模型出来的时候，我自己是听说美国有很多的大学生，他们基本上都会把这个 ChatGPT 当成是工具来使用。所以其实我是一直在找能把 ChatGPT 用的非常好的人。今天跟我们在一起的嘉宾左思琪，他已经不是学生的一个身份了。他现在也在一家知名的科技大厂工作，而且马上要去大模型的组。但是他其实是在一个可以说是非常学生跟学霸的心态在学习，他现在已经在 ChatGPT 上学习了有 1100个小时，我非常好奇它是怎么使用的。 Hello, 思琪你好。嗨你好。

首先我想澄清一下，我统计了一下过去一年总的学习时间，也不是所有的时间都是在 ChatGPT 上。然后我就想介绍一下，我是从 2022年 11月左右在网上看到有这么一个很火的东西。然后我自己就试了一下，觉得确实很有趣。所以大概从那个时候开始就会经常的使用 ChatGPT。

2022年 11月应该就是 ChatGPT 刚刚发布的时候。所以你是相当于它一发布就开始一直在用。

一直用到现在。对，基本上可能每天就会用一段时间。

你会用它来做什么呢？就是我们之前有过一些简短的交流，比如说你会用它来学哲学，证明数学公式，甚至跟自己的讨论是总体上是这几个大的方向。

对，我会拿它学很多东西。因为我现在自己在上班之余，我也会上斯坦福的一些 graduate A I 相关的课。然后我也在上一些他的哲学课，自己也会看一些数学书，有时候也会看计算机相关的论文，这些的 ChatGPT 在这个上非常有用。然后我可以大概介绍一下我一般 workflow 如何用 ChatGPT 这个形式。一般来说我的第一步，我会把我想学的东西做一个简述，然后让我有全局的理解。

你是说在哲学方向还是在数学方向？

其实对于绝大部分的方向，这是一个比较通用的一个方法。在这里举一个例子，第一步先是会拿他把我想学的东西这个文本，他会告诉我在选举上他是应该怎么理解。理解之后我会把它记在一个 spread sheet，就是类似于像 excel 的一个表格里边。这是我学习和我生活，我很多东西都会用类似于 excel 的这个表来记下我所有的东西。第二步除了数学之外，想学想读的这个东西放在 audible 或者一个叫 speech fy 的这个软件里边。我会平常比如说在上下班和在吃饭的时候会去听它。

第三步我在听完了之后，我会再回到我的这个 spreadsheet 进行复习。这个可能通常会两三遍，就是第二步和第三步听，然后复习听复习可能会有两三遍的时间。我还用费办法对自己进行自问自答，看自己能不能理解这个概念和这个问题。第四步，所以我觉得我大概理解了之后，我会用 ChatGPT 来对自己提问题，就是类似于我有没有完全理解有哪些比较细节的东西。我没有想到我会让 ChatGPT 来读完这个文本，问我一些发散的问题或者是细节的问题，也可以问我一些可以延展到相关的问题或者领域，可以让我做一个下一个想学的东西。

第五步，我可能会用一个叫 reg 的东西，我不知道这个中文要怎么解释，相当于在用 GPT 来回答之前，让他先读一些数据库里存的一些相关的文档或者文件，让他的回答更精确，更准确。我会拿它来进行一些，比如说类似于研究和发现新的学习方向。比如说我会把我学习的一些论文，就是能找到的所有的论文，我自己写一些脚本，然后把它存在一个数据库里面。我在自己用 ChatGPT 的 A P I，我去让他回答我的问题的时候，先去读这些文献，然后让他给我更准确的回答和给我一些更好的想法。可能用的不是很多，但是前四步是我所有的学习都会用的一比较通用的一些用途。

我听起来你的整个的学习方法是用了超级多的软件跟组合的。比如说第一步你是有用 ChatGPT 做总结，然后寄到第二个软件叫做 spread sheet 上。第二步你会用两个听的软件， a deeble 跟 speech fy。第三步是继续又回到了 spread sheet 上，第四步是继续用 ChatGPT，第五步是用这个 reg 加 ChatGPT 的 A P I。感觉其实每一步基本上都是在善用软件。

对，因为我觉得过去的学习就相当于古埃及的那种金字塔，你可能需要很多的人力，你可以换算成自己的时间，然后去堆一些东西。但是现在的这些就相当于推土机，我觉得在做这些就相当于我自己在开着推土机去完成自己的工程，所以会感觉对自己有提高，所以才会用这些东西。

那我们举个例子，就比如说是哲学，当你用到这五步的时候，它有在事实上去加速你的学习或者加深你的理解吗？

是的，我可以举一个例子，比如说我有一个问题想问，这个就是我的刚才的第五步用 reg 和 A P I 就这么一个问题。我如果直接去问 google，我是很难很快得到一个非常细节的答案。就比如说我想知道有一个叫康夫 man 的一个哲学家，他说过比如说黑格尔是没有说过辩证法这么一个东西的，他觉得黑格尔本身是没有辩证法，但是当然大家都会觉得黑格尔就是辩证法，就是正反合这些东西。但是我就想我 conf man 本来到底是怎么想这个东西的。我就想知道有哪些文献，有哪些论文讲过这个东西。我的做法就是我刚才用那个 rag，我会把他们所有的这些东西都存到我的数据库里面。

Reg 我理解是你需要把这些历史上涉及到黑格尔的这些资料，比如说各种 P D F 网页文本都搜集来，先把这些东西存进去对吧？

对，存进去之后我问了这么一个问题，他就会从所有的这些文献文档里找出相关的这些文献。让 ChatGPT 先读一下这些文献，再给我做出这个答案。这样就比只用 ChatGPT 来回答它就会有更准确的答案，而且也会告诉我一些我需要学习的文献的方向有哪些。所以这个就可以大大提高我的学习和搜索能力，这个比我直接去 google 上，如果要花好几个小时，可能看很多东西，而且这个可能就几分钟之内就可以给我一个比较准确的答案。

但是你怎么找这些文献呢？找这些文献不也是整个做 search 跟搜资料的一个过程吗？

对这个文献的搜索确实是需要一些时间来准备。但是好处就是说你只需要把这些能找到的文献下载下来一次，就比如说几百篇、几千篇甚至很多，然后你之后可以无限的问他问题。但是如果按你平常的办法的话，比如说你想回答 100个问题，你需要把它全部自己读一遍。因为你每次可能读完文献之后，你想再回到那个文献，你已经忘了很多东西了，而且你已经忘了他的周围的那些相关的文字，在你的脑子里已经没有印象了。所以如果有这么一个系统，然后有一个能帮你从文献里找到关键东西的 ChatGPT，它就会非常的有效，可以大大的节省时间。

我还有一个问题，你把这些文献都放到 rag 里了，然后相当于 ChatGPT。它还是要基于你的这么大的一个数据样本量去做总结的。他现在的上传不是有一些什么 token 的限制吗？我不知道这个是怎么实现的对，因为我不太懂技术。

他不是把所有的文献都扔进去，它的第一步是先找出，比如说我问的这个问题， cofer. 第二个就是它的辩证法，它会把 cofer 和辩证法这些相关的文献，和我问题最关键的东西自动找出来。这个不是 ChatGPT 这一步结束之后，他会把最相关的这些文献让 ChatGPT 先读了之后再回到刚才那个问题。所以他只是把最相关的东西读了，而不是把所有的文献都读了。

相当于你只是把 chef man 说黑格有没有提到辩证法的这一条的。首先是把所有的文献都摘取出来，第二步是你把这些摘取的资料再放到 ChatGPT 里面，让 ChatGPT 来总结。

所以就比如说如果有一万篇这样的文档，他不需要读一万篇，他只需要读一两篇和我这个问题最相关的。再回答我这个问题。

我感觉这是一个高阶搜索，有没有觉得对它。

现在这个就相当于给 ChatGPT 装了一个人类知识库的翅膀，所以可以大大提高他的能力。

对，所以你最后的结论是什么？黑格尔有提过辩证法吗？

其实在学哲学这些东西，它都不是有一个固定的答案的。每个人都会有一个自己的想法，他其实目的就是你要找到更多的 perspective，我从这里就可以很快的得到。就比如说 whole gate 说了什么， Stanley rose 说了什么，还有比如说 pink cut 说了什么，就是其他的那些研究的人我可以很快的得到这些 perspective。他其实的目的不是说要得到像数学一样一个固定的一个答案。不过我觉得通过这个系统，他可以很快的给我想要的这些。

他会把所有的相关资料都给你。

对吧？对，这个是在你自己创建这个 rag 的时候，你可以去做这些事情。这些我已经做在我自己的系统里面。

你说到你使用 ChatGPT 的方法，我觉得给我了一点。比如说我们自己做这种深度新闻的一些小启发。其实很多时候就比如说我们要去写一个事情，它的细节，这个创业公司它怎么诞生之前，它的创始人说了些什么？跟其他几个创始人的关系，跟董事会的关系，特别是非常大的公司，其实互联网上可能有无数这样的资料。那是不是也可以用同样的方法去创建一个这样的资料库。同时问一个问题，把最后所有涉及这个问题的相关资料给列出来，然后让 ChatGPT 去总结。

是的，其实这个现在也在 GPT 的开发者大会之后的那一天，他已经有一个叫 GPT s 其实你可以把你相关所有的 P D F 创建一个新的叫 GPT s 的东西，上传进去之后，你就可以对这些文件问问题了。这个在 ChatGPT 已经有实现了这个功能。

那你还需要用 reg 的程序吗？还是说哲学它其实没有。

只是对于我想要用的这个具体的情况，切成多大多小的这个文本，我有自己的方法。 GPT s 做不到，他只能把整个的文件放进去。我是想具体细化到一小段，现在这个 GPT s 没有办法定制到那个样子。

相当于你自己做的这套方法，它是有更多的灵活性的那你觉得这个是在哲学方向吗？在数学方向呢？

我本科其实学的就是数学，然后我也非常喜欢做证明。举一些例子，就是我平常在学习的时候，比如说我有些证明题，我想要证明两个东西。比如说是等价的。如果自己平常去想的话，我看很多定理，看很多原来这个定理是什么，它之前的背景是什么，但是我用 ChatGPT 的好处就是，如果我有一些东西我确实是短时间内想不出来，我可以让他给我一些灵感，他并不是每次都可以做对。但是它的好处是它会自己列出它的每一步，每一步列出来之后，我可以去看他哪里有问题，然后我再去反问他，这么几次之后，他一般也会给我比较正确的答案。

我一般在这个的工作的流程是我先会写一个提示词，我就是说你是一个数学专家，这是第一句话。第二句话就是我们一步一步的想当然，这些都其实都是用英文，我现在在一个字一个字的翻译。这样的话 ChatGPT 在回答的时候，他就会真正的一步一步的把他的答案告诉我。我就会去看这个答案，这一步到这一步，下一步到下一步，哪一步之间是有幻化，就是他可能会胡说，或者是哪一步他有一个理论上的错误。

这个的好处是说什么呢？其实你想一想，平常你在学习东西的时候，你是被动学习。你有一堆内容，然后你在想怎么拿到这些内容里的结构。你在回答问题的时候，你是一个做题者的角度。你在发散式的搜索，这个可能会有用，那个可能会有用，然后你再尝试给出一个答案。

但是有了 ChatGPT 之后，你的这个角度发生了一个翻转，就有点像哲学上说是哥白尼式的翻转。比如说之前学习你是一个被动的接受者，现在我可以用 ChatGPT 来问我问题，然后我可以回答他。然后在做题的时候，我从做题去发散去挑战这个问题，变成了 ChatGPT 给我一个答案，我变成了一个老师，我要看他这里哪里有错误。这就给了一个更新的角度叫 perspective。这个就可以大大的提升我对这个东西的认知。因为我之前只是从一个方向去学习这个领域。当你给了一个新的角度之后，你可以看到之前看不到的很多东西。所以这个的话我觉得可以让我对这个知识的了解更细化，对整个的把握也会有很大的提升。我觉得他最大的原因倒不是他能给我正确和错误的答案，而是说这么一个知识理解的角度的转变。

然后你也经常会问 ChatGPT 问题，就是你跟他问问题的时候，其实也是为了看到他会给你一个什么角度的改变。

我问 ChatGPT 的问题的时候，其实我可以把学习想象成有时候你是攻击性的，就是相当于你要去挑战一个问题，想把它做出来。比如说这里我就问了一个问题，我想证明一个算子的空间和一个实数的空间它是等价的。我就问他这些，但是这次他的答案是对的。一般来说我就会看他这个 123456 哪一步会有问题。

经常的比如说我会在第二步或者第三步我就会发现问题。然后我就会去问他，你这个第二步你觉得是对的吗？会有什么问题？我的意思就是在这个过程中，我是一个审视者的角度。比如说我平常做题的时候，我是努力要自己想出这个 123456 的。但是我现在我是变成了老师，我要看他这个 123456 哪里会有问题。

然后在这个时候我的角度就发生了转变。我以前想这个东西的时候，我是在做一个搜索，哪些东西可以把这个问题解决出来，是一个挑战者。然后我现在变成了一个防守者，我要看挑战我的这个观点，他哪里有问题。挑战的时候你一般是发散思维，你是想的更多更广，防守的时候你想的是更细更深。所以如果平常只做这样挑战者的方法，你可能会漏掉很多细节。但是我有了这么一个给我更细的机会的时候，我可以把我的知识变得更全。方面的一个理解。

简单来说，其实你的角色就变了。你以前从一个学生的角色，现在变成了一个老师的角色。就是以前是别人出题你来做，现在是你出题 ChatGPT 来做，你来验证他的对错。

对但是因为你要做验证的时候，你自己需要有足够的理解。所以你在验证它的过程中，你自己有很多的成长，你会更细化的去想自己可能有哪些细节想都没有想清楚。

那会不会有他做错了你没看出来，或者你也不知道这个问题的答案。

如果你的完知道这个东西的时候，你一般你的学习不会学到很多。然后你完全不知道的时候，其实你也学不到很多，因为你实在不知道有什么可以学的。但是如果有一个东西你有一定的理解，但你又不能做到完全的正确和错误。但是有另外的一个人，他可能比你多懂一些，但也没有懂那么多。

或者水平差不多。你们可以相互切磋一下，对不对？

对，就是三个臭皮匠顶过诸葛亮，你们两个之间的互相质疑自己的假设，这么一个过程中就可以学到很多。所以这样的学生老师的角色不停的转换，你和 ChatGPT 不停转换的过程就有点像一个辩证的过程，就可以让你更快的全方面的了解这个东西。

所以在数学题上，你觉得你跟 ChatGPT 你们的水平到底怎么样？他真的是跟你差不多的水平吗？

我觉得你要说从整个的数学领域上，我懂得肯定是不如他多。他懂的东西那绝对是几千几万倍的比我多。只是说我现在在学的这一本书或者这一个东西，我可能能够学到可能跟他推理推的差不多的某些领域，然后我可以跟他一起学习。但有一些他根本没有一些了解，比如说比较非常细分的领域。如果有一些比如说 differential manual 什么那些就他可能没有训练过，那他可能确实是不会有人那样的能力。但是如果我只是想复习一些比较基础性的数学，就比如说线性代数这些东西是应该是没有。

任何问题的那现在综合来看， ChatGPT 它在数学方向，哪些方向它是处理的比较好的，哪些方向它是不太懂的。

我其实也没有拿他学一些别的领域。从 ChatGPT 开发的角度，他现在做的很好一件事情就是他知道把大语言模型和解决数学问题分开。因为我现在说的这些都是证明的问题。但他其实很多时候他需要的是计算的问题，你就需要这么一个正确的答案，你不能给我一堆证明就走了。在那个情况下，你现在可以用一些工具 ChatGPT 把你的问题，把你计划好，第一第二第三第四做什么。他把这个指令发给这一些工具，就比如说 world frame alpha，我不知道这个中文叫什么，然后他就可以把这个发给他之后，这个计算做的很好的这个工具就可以给出一个非常准的答案。我觉得这是一个非常智能的一个方面。

总体上来说，我记得之前其实你有提过一个数据，就是说给 ChatGPT 的数学证明题，它正对的概率大概就是 30%。

是的，对，可能也是看是什么样的题，看他的训练数据里面有没有或者类似的，他可能会正确率高一点。但是他一般是这样的，如果你可以找出他的错误之处在哪里，他自己可能通过几次的沟通之后，他自己最终给出正确答案的概率还是蛮大的。

就是说如果你帮他纠正的话，他自己也会像人一样，他会成长的很快。

对，他是会发现自己之前的错误在哪里，然后通过几次他会告诉你比较正确的答案，这是比较智能的。当然有一个问题就是如果他这个沟通的次数特别多，就超过五次六次之后他就会忘掉之前的东西。他在聊天窗口他会忘掉很久之前的东西。所以如果在个位数部署解决不了的问题，他确实之后也就一直解决不了的这。

是 5到6轮的沟通以后，他对前文的印象并不深刻，或者他会忽视上下文。

这可能是 ChatGPT 它自己的记忆的设计。但是如果你自己可以开发一个新的记忆的方法，用 A P I 来做的话，可能就会不一样。

这算是他软件在设计上的一个缺陷。

这个倒也不一定是缺陷。其实因为其实你平常的话，我觉得可能也不是那么需要记住所有的这些细节。如果我每一轮跟她的聊天，我都会发非常长的长文，让他帮我做长文，缩短这些东西。那可能过了很多之后，他确实也没有办法记住很久之前的这些长文，就可能也是实际上的这么一个问题。

你还要讲一下怎么样用 ChatGPT 自己给自己做讨论吗？

我会平常比如说想做一些 class project，就我上课的时候做的这些项目，或者我平常自己做着玩的这些项目。就比如说我刚才那个。研究的 rag 这些项目，我会有一个比较宏观的想法，我的点子非常多，但是我的缺点就是我很难把东西做得非常细化。我就会和 ChatGPT 去聊具体的细节，要怎么做这件事情。

我自己通过 ChatGPT 做的一个小游戏，我就是有这么一个想法，我就说我想用 ChatGPT 做一个可以来学习知识的一个游戏。这个游戏就是说你比如说想帮小朋友们来学东西，那怎么办呢？你可以把一些问题，就比如说世界地理知识或者世界历史知识变成一个问题答案的形式，让这个小朋友去操作这个小人。这个小人每次走到一个小猫旁边，这个小猫就会问他一个问题。这个问题回答对了，这个小人就得到奖励，回答错了就不给他奖励。就变成一个游戏化来学习的一个东西。

我就只有这么一个想法，但具体怎么做我一点都不知道，因为我没有做过任何前端的实现。最后就是把我想做的问 ChatGPT，让他告诉我细节哪一步怎么怎么做。然后我就按他说的一步一步的再去问他。我大概花了 10个小时左右，我就把整个这个东西做出来。因为我没有任何的经验。

是做出来的一款游戏。

对，这个游戏可能就比较简单。你能看到它就是有一个小人行走的系统，有一些小猫，这个小猫其实在游戏里是可以跳来跳去的，小人也是可以有一个地图系统。然后还有一个经验系统对，还有一个就是知识库系统。我做之前是不能想象我能这么快做出来的。虽然这个游戏看起来很简陋，但是它的学习到的东西还是挺多的。

我回头会把你的这个 P P T 放在我们的 show notes 当中。如果大家想看到你的这个游戏界面的话，应该也是可以看到的。这个游戏你做出来以后，它是在哪里运行的。就比如说它就是一个电脑的客户端可以玩的游戏。

它就是一个网页就可以打开。我自己之前在 github 上放过一段时间，后来就把它关掉了。但是如果想玩的话，我可以再把它打开。不过这个就是一个比较简单的，更像一个 demo，就可能用来做示例的一个东西。它并没有很多的细节，还是可以改进。比如说你拿它去在 steam 上去卖，这可能是很长的路。它只是一个第一版。

对我理解是第一版，就是仅仅是一个原型。所以是 ChatGPT 帮你写的代码，还是你自己也有写一部分。

我当时做这个的时候，我的想法就是说我要让自己纯粹做一个产品经理，我只是要做我实现的东西。我发现有问题，我让 ChatGPT 给我改。我虽然有一些代码我也会写，但是我非常主观的就是让自己尽量一行代码都不要写，只会做复制粘贴，只做这样的事情。可以说基本上所有的代码都是 ChatGPT 写。比如说有错了，我会让他告诉我要怎么改，然后按他说的去复制粘贴，自己不去干涉它这个写代码的过程。

所以基本上我就可以理解成，你跟 ChatGPT 玩了十小时，你有一个想法，他帮你实现了这个想法的雏形。

或者说不好听，就是我作为一个资本家或者去剥削了 Chat GPT10个小时。

当时用的是 ChatGPT 几？是四还是三？

当时是四刚出来的时候，这个可能是大概今年上半年或者是年终的时候，当时就是突然有这么一个想法，就去试了一个，大概一个周末左右就搞出来。

图形设计跟这个 U I 也是他做的。

这些图当时我是谷歌搜索出来的对，但是这些图要怎么在里边去来放置，这些都是问 ChatGPT.

所以你是有给他喂一些图的，然后让他去学习你这个图是怎么处理。对。

这些图其实倒也不是用来训练的，你只要告诉 ChatGPT 我有这些图，我想做这些事情，他就会帮你把代码写好，然后只需要把这些截图在哪里告诉他就好了。

所以现在比如说这个小人儿，他走到一个小猫或者一个小豆子旁边，在你的这个游戏中是真的会出现一些问题的。

对它会出现一个新的问答界面，我到时候也可以把那个问答界面放到这里，那也是另外一个系统。

你的问答大概都是一些什么样的问题呢？

这个问题是你可以自己去决定是什么。我当时放的就是一些世界地理的 TV，就是这种常识答辩这些问题，这个也是我当时按 ChatGPT 给我生成的那。

在你玩游戏的这个过程中，他有胡说八道吗？

这个倒也没有，因为当时我就是一次生成了一百多个。我看了一下，其实看起来还挺对的。

就是你还是会检查一下对不对？

对我大概会看了一下，确实看起来还挺对。

所以这个还是蛮受启发的。其实有了 ChatGPT 这个工具，只要你有一个想法，每个人都还是能写出自己的游戏来的。还有下面一个我想给你看。

你可以看下第八页做的另外一个。我就是突然有这么一个想法，我觉得好玩，我就试了一下。我想要 ChatGPT 去聊天，我想把一些比如说哲学家放到里边，我想跟他们去聊天。我尝试了很多的方法，比如说拿 facebook 开源的大模型去做一些微调，让这个模型说话很像尼采或者很像黑格尔。然后也试了很多比如说 reg 的方法，就让这个模型先读尼采和黑格尔的文档再做回答。这样的话保证每一个比如说黄色的回答，它都是像尼采这么想的，每一个绿色的回答都像黑格尔这么想的。我就需要问一个问题，我就可以让他们包括我自己，我们可以三个人一起讨论，就做这么一个聊天室。

然后我就是有这么一个想法，具体的细节怎么样，我也基本上不是那么懂。我也是像之前一样，就是我要达到这么一个需求，我把这个需求想清楚，我告诉 ChatGPT，你给我写写完之后有不对的地方我再让你改。这也是一个非常好玩的项目，那也是大概十几个小时多一点，可能因为我主要是后面的这些，如何让他们说话更像尼采，更像黑格尔，这个花的时间比较多。像他的这个聊天室可能就 1个小时左右。

就可以做出来。其实现在不是还有挺多这种什么 character 点 AI，还有各种模仿马斯克，模仿比尔盖茨，或者一些歌星歌手去说话的，或者角色扮演的这一类的 A I 软件。

我这个其实主要就是想自己做着好玩，我主要想学习一下，可能比较一下不同让 AI 说话更像这个人的方法。所以我自己做了一下，觉得确实还挺好玩的那你做。

这个事情的时候，你有觉得在 A I 生成不同的角色的时候，你生成的是哲学角色吗？也有可能是体育角色或者商业明星的角色。它的核心壁垒是什么呢？

我觉得是这样的，如果我要跟这个去聊天，就看我是想做什么。像我在这个时候，我的核心就是我想让他们之间聊天，聊出一些新的 idea。然后让我去想，我可能不是很在意他这个语言是不是更像人类，或者说它能不能和我建立足够的连接。但我觉得像普通的用户，如果用 character A I 的话，他可能想要的是那种情感上的连接。比如说得到一些慰藉这种东西。

我觉得在那种情况下，他除了要理解背后的人物，他可能要更多的理解这个用户他到底想要什么。所以我觉得可能从那个角度上，这些项目可能会比我这些要复杂的多。他的壁垒可能就在于首先他要理解背后的这个人到底有什么，他需要这些人的数据，可能要足够多的数据。再一个他又需要足够理解这个用户，可能还有一个就是他的反应可能要足够快，就是你不能让这个人等很久。所以我觉得这些都是一些可能比较重要的壁垒。

所以你的核心是你要让它呈现出更多的知识点，或者给你更多的灵感，能够让你学到新的东西。然后除了 ChatGPT，你用的时间非常早，就可以说你基本上是用了 GPT3.5GPT4。然后我知道其实你也是这个 cloud 的深度使用者，你觉得这几个大模型软件在使用上有什么区别吗？包括刚刚其实你也提到了，你用 lama 做过开发 cloud.

我倒也不是那么深度。我其实就是之前因为 GPT 文字字符数它有限制，它当时是我记得是 8000字，所以我没有办法放很多的词。可以看一下我提供的在第一页的例子。比如说我读一本书之前，我把整个的第一章，我想要它告诉我它宏观上它在说么这么一件事情之前，我不能把整个第一章扔到 ChatGPT 里面，所以我就需要让 a cloud 来告诉我这么一个宏观的点。但是后来 ChatGPT 有了 turbo 之后，这个问题就很好的解决了。

为什么我还是会用 ChatGPT 呢？就是因为我想要做的事情，我会想让它生成直接告诉我这么一个表格的形式，这样我可以粘贴到我的这个 spit，我的流程里面。但是我如果直接用 cloud，我自己试了一下，它这个效果是没有 ChatGPT 好的。所以我现在自己 create 了一个叫 GPT s 开发者大会之后出现的，自己定义了这么一个 prompt 文本的提示词。我就告诉他，你先把 summary 给我生成好。第二步你把你生成好的这个 summary 再变成一个 table，这样的话它就可以很好的完成这么一个任务。我在 cloud 去试的时候，它的效果确实没有这么好。

那 GPT 是有提供更多的工具或者开发者组件。它现在有。

一些功能，比如像我刚才说的数学，他知道你要去算东西的时候，它会自动调出那个工具来帮你算。你不用自己去把这个工具调出来，或者说他知道你问的这个问题模型调不出来。比如说你想问今天湾区的天气是怎么样？它就会去网上进行自动给你搜索，它不用你告诉他你去搜索一下，所以它这个现在就是非常的智能化。

还有一个是谷歌的 bar 的，这个你能聊吗？

我也没有参与过它的开发什么这些，但是就可能我自己平常通过上班的这些试过酒店和 GPT 还是有一定差距的。

所以你是稍微用的是比较少一点，对吧？就是没有用 GPT 跟 cloud 那么多。

对，说实诚一点，就是我的 GPT 已经付了钱，所以我要把它用到极致。

GPT 跟 cloud 的一个主要区别是不是说其实在 GPT3.5 没有升级到 4的时候， cloud 能支持的文本更长。但是等它升级了上去之后，其实 cloud 它就没有特别的优势了。

我觉得这个也是最近才有，就是在开发者大会之后，在之前的话 cloud 这个文本的长度还是大大超过 GPT4 的那。

你觉得 cloud 现在有什么事？就是你一定要用 cloud 的场景，而不是 GPT 的场景吗？

至少在现在我还没有发现，我现在基本上可能有一段时间没有用 cloud 了，我一般还是用 GPT4 比较多。

其实也很多例子了。我本来想问你要不要举一个例子，就是在 GPT4 升级之后，有哪些你之前做不到的事儿，现在做到了。

刚才说的 prompt 这个 workflow 就是提示词的流程。之前的话确实很大程度要自己每次都大概写一些这样的流程，一做什么，二做什么，三做什么，四做什么。现在你可以把它整合到一个叫 GPT s 的这样一个东西。它就相当于你自己平常每天可能需要重复做的一些东西，你就可以扔给这个 GPT s 就比如说很多人可能炒股吧，你想看财报，你想想你每次会看什么。你比如说先看看他的成长是叫 tiger，它大概每年成长多少。然后你要看看它的，比如说 ebit a 它的这个盈利 margin，然后你要看看它的现金流这些比如说你每次都在做一样的这些事情，你可以把它写到 G P T S 里边。就是说一先看这个，二看这个，三看这个。然后把这些告诉我之后，就可以直接上传这个财报，然后你就让他直接告诉你，你不用自己去看那些非常细节的东西。

那你觉得在整个使用这个 ChatGPT 的过程中，他有哪些做的还是没有人好的呢？

到现在为止，他绝大部分还是一个语言模型，它已经做的有一定智能了，就是他可能会懂一些比较基础的逻辑能力，但是就相对于比较复杂一点的逻辑能力，比如说你问他一些不在一个提示词里边，但是可能在多个对话中的。就比如说很久之前说了一个，然后过了一段时间你又回到刚才那个论点的时候，他是没有办法去把这些东西记清楚的。他没有中期的这个记忆能力，就是他长期的记忆能力你可以通过 rag 实现。然后短期的记忆能力他直接用语言模型就可以实现。但是可能稍微中期一点的这种记忆能力，他就可能没有办法搞得很清楚。

你刚刚其实有讲到，比如说你在做数学证明题的时候，你用几轮之后，这个数学证明你能感受到 ChatGPT 它的进步。那你自己是觉得他这个进步是基于你自己的交互页面，是你训练过他他的进步，还是整个模型它都有进步了。

我觉得 ChatGPT 它本身模型其实倒是有很多人说，可能从 G T4 出来一直到开发者大会之前，其实是在下降的。因为可能我也很能理解，就是 open I 其实这半年做的就要在降低这些成本，然后让更多的人可以用到它，这个我也是可以理解。但是我觉得他确实在功能上，尤其在开发者大会之后，这个提高确实是挺多的。比如说纹身图，然后很多工具还有 prompt flow 这些东西。我觉得在功能性上的提高，至少在开发者大会之前，模型的提高倒是没有那么多。

你刚刚提到模型的处理能力跟模型其实是在下降的这是。

很多人提供的数据点。然后有很多论文也都提到了这个东西。但是这个是在开发者大会之前，但是开发者大会之后，这个新的 GPT turbo 很多人说的它确实是比之前的那个模型有很大的提高。

Turbo 之前的 GPT4是下降的，但是 turbo 之后又有一个很大的提升。

对，出现了 turbo 之后是比之前是有一些。

提高的那我理解其实就是之前 GPT4 它下降的时候，它的逻辑是因为它要去降成本。 Turbo 再出来以后，它的模型如果说它的基础能力又有提升，我不知道他是不是用了更多的数据去训练。然后它的模型更大，那他怎么去同时避免降成本跟效果更好这件事情呢？就是这两件事情他是怎么做到的。

我觉得这些应该都是 OpenAI 的 trade secret，就是它的内部的提高的一些方法。最近这半年也有很多提升 L M 效率的这些论文也非常的多。我觉得在 open 内部肯定是有比这些大家都能看到的东西，可能更细节的一些优化。我的意思就是说他们至少在这半年做那些内部的一轮改进的时候，可能他们的优先级是提升它的效率和降低它的价格，而不是提醒模型的准确性。

刚刚其实你好几次提到了 OpenAI 的开发者大会。你觉得在这个开发者大会上发布的产品，你刚刚提到了有 GPT s 吗？还有什么产品是让你特别惊艳的？

我自己其实都还没有花很多时间去研究，但是我觉得他那个 assistant A P I 就是它的助理 A P I 对我来说，因为我其实很喜欢做一些类似于叫 A I agent，这个是我非常想做的一些东西。因为我自己对这种可以 self improving 的这种 agent 我是非常的感兴趣。当然在 OpenAI 现在我觉得它这个 A P I 是做不到 self improving 的这个 agent。但是如果它这个 assistant A P I 大家用的越来越多，可能就会推进更多的人来做这些东西。到时候整个这个市场上就可能会有很多多样性，而且有很多资本注入进来，有更多的是研究这个到时候可能去开发 self improving agent 的选择什么也会很多。这个可能就是真正能解决很多的问题。

因为现在的包括 OpenAI 开发的这个 prompt flow GPT s 它的问题就是它还是一个被定义好的一个。你要做 12345，他是没有办法很大程度上自己改进自己的。但如果这个 A I 它可以在大语言的架构下，比如说有自己的记有自己改进自己记忆，改进自己的这么一套的范式的话，我觉得它的智能性会大大提高。我觉得这些 assistant A P I 之后，如果大家都在用的话，确实可能会大大推进这么一个过程。

其实我有一个点不太懂，我觉得可能也是听众很迷惑的。就是大家都在提 A I agent，但是很多人都并不知道 agent 是什么，包括你说的这个 self improving 的这个 agent 就是自我提升的 A I agent 它是一个什么意思？你能不能举一个小例子来给大家简短的讲一下这个事情是什么？

就像现在大家都流行说 A G I 到底是什么？我觉得从我的理解，大家并没有一个非常确定的定义。但我的理解 itself improving agent 需要有什么？我觉得就首先他需要有自己的记忆，他有自己去规划的能力，他有自己逻辑的能力，他还有改变自己记忆的能力。 Agent 就像一个人一样，他有自我意识的一个人。

当然我觉得 self improving a 不一定要有意识。但是比如说他要像人平常在做事情的时候，他要通过自己的记忆，然后通过自己的决策能力，通过和外界进行反应。比如说使用工具或者对外界进行一些交互，然后来改变自己的记忆，而不断的发展这么一个个体。我觉得这个就是一个 self improving agent 的这么一个定义。

现在的这些 agent 它是只能完成一些比较固定的东西。你去帮我把这个文章的这里读一遍，把这些东西找出来。但如果有 self improving 的话，他可以自己主动可以去改自己有哪些可以改进提高的方法。就比如说你就可以告诉他一些更没有那么细节的东西，就没有那么 well define 确定的这么一个东西。就比如说现在你只能告诉他这个论文它有什么可以提高的方法，这个论文它有什么比之前的进步，这个论文它的实现用到了哪些库。你可以做一个 self improving 这么一个 agent 的话，那他可以比如说自己在读了很多论文之后，你就直接告诉他这个论文有什么可取之处。他通过之前对这么多论文的学习，他可以自己告诉你所有的东西，而不需要你去告诉他这些具体的 well 这些东西。这就是一个我能想到的比较简单的 use case。

我理解其实你现在在做的这些事情，包括你怎么用 ChatGPT 自己去学哲学、学数学，你自己还搭建了很多很多的工具。然后你要把所有的这些工具全都拼起来。有了 A I agent，其实你把整个的工作流告诉他，然后让他自己去执行。就是你只问问题就 OK 了，一切就结束了。

而且甚至如果他还可以自我改善的话，他可以自己改变自己的工作流。比如说我现在告诉他的工作流是建房子，你先把砖搬过来，再搭水泥，再搭木头。但是如果他自己可以学习，他有记忆，他发现其实我现在木头比现在砖头要好。他自己可以做 planning，然后他自己可以告诉自己，原来这样是更好的。这个就是一个可能比较智能的方向可以发展。对，这就是我觉得这个 self improving agent 希望可以达到的一个方法。

就是他可以去做执行了，然后他执行的时候还是带脑子的那从现在看啊，这些大模型发布的软件，包括他现在的整个的发布上，有没有什么是你特别想要他去提升或者改进的功能。但是还没有实现的。

因为我其实主要是想多学一点东西的。因为我是一个通过图像来学习的一个人，就是 visual thinker。我的想法就是如果有这么一个东西，就我把一本书告诉他他可以给我生成一个可以互动的思维导图。就比如说我给他一本数学书或者是物理书，甚至是哲学书，它直接可以把它宏观的这些点呈现给我。然后比如说点一下某一个宏观的点，它自动又到这个宏观点下面的这些点。他自己就有一个像你可以和他进行互动的一个学习的这个方法。这个对我来说会有很大的帮助。它可以建立比如说每个点之间的联系，这些现在的话我自己也在做，类似于这样，就是因为我其实比如说我把宏观的点变成一个表格。

这个应该是可以用工具实现的。

对，现在这个是可以实现。但是我自己其实试了很多，它最大的问题就是比如说第一层就是你生成了宏观点之后，你到第二层它可能还是可以的。但是你这个层数越多之后，它离原来的这个文本，它原来的这个概念，它就差的有点远了。它不是一次生成宏观到微观的这么一个系统，而且也不是非常的可以互动的这么一个东西。

就像你刚刚说到的，他其实进行到 5到6轮对话以后，它的上下文的理解能力就不太好了。那是不是生成思维导图也会有这样一个问题？其实你的思维导图再往下延到 5到6层的时候，他就做不下去了。

是的，因为他没有办法一次既做到非常宏观又做到非常细节，这个对他来说是一件很难的事情，就相当于就是既要都要。然后我觉得对于一个模型来说，它至少在现在这个还是很难。

然后我其实还在想思维导图的一个问题，就是思维导图它其实是有逻辑的，它的每一层就是每一个点包含哪些其他的知识点。有的一些思维导图它的逻辑是非常严密的。我不知道大模型它在真正的处理这种逻辑的问题，或者涉及到很多层的这种逻辑的问题，他的能力怎么样。

对他的逻辑并不是非常的严谨，包括让你很简单的做 summary 简述这些东西，他都会把一些层数搞错。比如说在第一层的点，第二层第三层，就第一层和第二层他可能会对，但他有时候会把二三层的点颠倒，这种东西他也是很难搞清楚。

我觉得还是非常有收获的。而且你刚刚说你自己学东西是用图像来学习的。我想到了爱因斯坦，爱因斯坦他的思维也是非常图像去处理问题的。你有做过智商测试吗？

我其实可能小时候我们会有一个什么留学生项目，我当时去新加坡读书，他们是有做过这些东西。我想说一点，其实就是这个智商测试就是从我个人的角度，它更像是一个为了区分大家而区分大家的一件事情。所以我不觉得智商测试会有非常大的对生活有什么有指引的作用。有人其实做了一个论文说其实智商测试的分数高，和它最相关的 coral most with ability to take I Q test。就说你的智商测试只和你做智商测试的能力有关，和其他的都没有很大的关系。

对，这个观点挺好的。

然后我们平常做的比如说 M B T I，比如说这个 I Q test，或者说看他的什么收入，他的职位这些东西其实是一种智力上的偷懒。因为我们的时间就这么多，和这个人能接触的时间也这么多，我们自己能思考的时间又这么多，我们就相当于给他一个最简单的标签，然后之后能找到这个人。但是这个东西它具体准不准，好不好，其实很难去分析。我觉得只能把这个作为一个工具主义的方法去想，具体它是好是坏。我觉得这是一个非常哲学，甚至是一个非常 ethics 的这么一个问题。

对你刚刚在提到这个的时候，我觉得整个观点都非常的棒，而且果然是学哲学的思维非常的辩证。既然讨论到这个话题了，我想稍微多讨论一点点。因为你也在学哲学，就是从哲学的角度你怎么看人工智能是不是有意识，以及由此而延伸来讨论的大家人是不是真的有意识的这个话题。因为其实最近我在做播客的时候，就有一个嘉宾，他说他越来越相信他，觉得人也是没有意识的。

我就想请问他认为的意识大概是什么样的？比如说人的哪些方面是反应或者不反应意识，我觉得这个东西是需要更多的解释清了。

其实我是在想人我们现在的所有的行为都是基于我们对过往的事情的记忆，我们对过往事情的一些机械反应，甚至是我们凭经验知道这件事情要怎么做的那机器现在从大模型的这个训练，它现在不也是这样子的吗？

我其实就想回答刚才那个问题，就是说我其实觉得这个角度是很好的，我们可能从实际生活经验的来角度来想的话，他能解决什么问题？我觉得比他这个有没有意识，我觉得这个问题本身是一个更好的问题。这样有没有意识和比如说有没有上帝，灵魂是不是不朽？我觉得这些他们都是有一种非常形而上的东西在里边。当哲学的 language turn 发生了之后，这些东西很多都变成了一些不是很有用的问题。

至少从我的角度康德就会发现，就有些东西就是你可以从正面说也可以，然后你换一个角度去说，他好像也可以很多形而上的东西，你去讨论他的时候，你自己会处在两个不同的语境中。就是你用一个方面说他有意识，你会发现他也说得通。你用另一方面说他没有意识，他好像也说得通。然后确实世界上很多东西你也是没有办法用足够的语言去定义它的。因为比如说你说任何一个东西什么是意识？你学东西去解释是意识的时候，你的这个解释你又可以问他，什么是 A B C，然后你就可以去问什么是 A 他又用 D 解释，你可以去问什么。你这么一直问下去，你什么东西都可以被解构的到什么都没有的这个程度。

但是我的意思这样当然是不好的。但是如果哪怕你给一个差不多大家能公认的这么一个定义，大家想去从两方辩证的时候，也都会在自己的语言世界里都能给出一个足够有解释力的答案。他其实举出这些非常形而上的这些东西，就会把世界把这些回答者分到不同的语言世界里边。所以其实有时候你并不是在回答，在讨论，你只是不同的语言世界在做一些解释，在做一些 clarification.

这个太有意思了。所以你觉得哲学它解决的本质问题是什么呢？或者哲学的本质是什么的？

我觉得就是 clarify question，把这个问题回答清楚。因为可能很久之前的时候，当时是没有科学，然后也没有形成语言学，但是很多东西都是混沌在一起的。哲学家他也是个物理学家，他也可以是说计算机学家、数学家。但是后来就有了科学之后，大家很明显的看到科学这个方法是可以解决生活中的问题的。与其就讨论比如说什么灵魂不朽，讨论什么上帝存在，就是这些可能非常形而上学的这些问题。他们发现可能我与其做这个，我不如去做积分，我不如去做动力结构，我去做人工智能的这个大数据，这些东西确实能解决生活中的很多问题。哲学可能最大的东西就是它可以让你把这个问题去想清楚，也不一定能想得很清楚，但是能让你 clarify 你到底想要的是什么。然后还有一个问题就是它可以给你更多的角度，更多的 perspective。

因为我一直也是理科教育成长，我只是在大学的时候读了几门哲学课。但我觉得就是我如果只是按纯理，可我就会有一个纯粹理性的这么一个想法。就是世界就是一个理性的金字塔式的这么一个结构。我只要顺着理性往上走，世界就存在这么一个理性的终点。我到那一点，我就可以把握整个全世界的知识世界，一切都会 make sense，没有什么理性不能解决的问题。

但是读了很多，比如说周末读了很多尼采，读了这些之后你就发现其实有另外一个角度，就是你可以不用这么去想，而且那么去想反而会是有害的。世界并不是存在这么一个纯粹的理性，甚至就有一个我看过很有意思的一个书，他就说如果你努力就成功，你的 career 有 advance，你就会有下一个可以追求的目标。更像是你小时候，你在上学的时候，你去了一年级就会有二年级，二年级就会有三年级。你题做对了就会拿 100分，你做的好就会有小红花，这就是一个很理性的系统。

但是当你长大了，你变成了成年人之后，这个世界不存在了。你没有这么一个熟悉的环境，你就要创造这么一个环境。于是你要在社会中找到这么一个存在的 career ladder，职场的阶梯你要找到在学术界也有这么一个阶梯，你要找到你住的什么房子，什么就是也有这个更好，这个车子更好什么的。你是一个没有长大的人，你就是为了回到你小时候这个熟悉的感觉，然后你给他冠一个理性的名字。所以其实有时候跳出来这么一个什么东西都存在一个解释，存在一个理性这么一个东西。反而其实让自己有一种解脱，可能回到这个现实中。然后像尼采说的那样，就是你做一个强大的人，来在这个非常 uncertain 的世界里边自己给自己做 decision，自己给自己做决定，而不是靠着所谓的这种理性而回到自己熟悉的这个小环境中。

对我觉得非常好的讨论。你做的事情是跨了非常多学科的，哲学、数学、计算机，包括现在跟大模型人工智能的各种交互。我其实还挺想问你觉得他们中间的共同点是什么？如果我们把这些跨学科都融合在一起，当然这个问题可能比较大。就可能有的时候你做一些小事情的时候，会有一些小的灵感。

从我自己来说，我也不是对这些领域都是咱们所谓高瞻远瞩，我只是一个对这些东西感兴趣，学这些东西也是纯粹为了自己觉得好玩开心，就是比较 curious 的这么一个 mind。我学这些本身，我觉得他们的唯一的共同点，对我来说就可能让我有一种很开心的感觉。我只能这么说，他们都是一种大家之前想过的问题，而且都是想过之后被大家接受的问题。就像这是一个可能历史主义的一个想法。就是说过去会有很多很多的想法，有很多很多的人类的讨论和结果，只有这些非常好的被大家能不断引述的留下来了。

那我自己去学的时候，我就能从中发现一种美感，而不是说一种逻辑，一种知识。我学会了它我就可以占领。比如说一个 letter 上的权力结构，我很多人可能会这么想，就觉得我学了这么多，我就可以变成一个很有权利的人，我会了这个我就可以变成 C T O，会了那个我可以做 C E O。我看这些东西不是一个给我一些能力，让我怎么样，而是像艺术一样，都是被人类多少年来筛选剩下来的，就非常美，非常容易被人能提及的。这些艺术品对我来说，我觉得是有共通的地方。

对我觉得讲的特别好，哲学跟艺术数学都很美，跟我做博客的初衷也比较像，就纯粹是因为这件事情很好玩。

对对对，我就觉得其实这样的话，从我的角度我也会觉得非常的有趣，非常的 fulfilling。学习这些而不去想那些非常标签性的一些东西，会让我的生活变得挺开心的。

挺好的，反正自己开心就行。谢谢思琪今天非常精彩的一期，对我们从大模型人工智能聊到了哲学还是很开心的。

好，谢谢。我的哲学理解也是属于刚刚开始学习的所以可能有很多也不是说的很对的地方，欢迎来指正好的。

好的，好，谢谢思琪。

好，谢谢。

这期节目的录制时间是在 2023年的 11月。跟思齐聊完之后，我也试了很多他说的功能，而且她有给我很多的使用的灵感。其实我们节目组内部一直都在讨论怎么样把这个生成式人工智能的技术来运用到我们的播客和视频的信息流中。如果大家感兴趣，我们可以单出一期，来聊聊我们自己的一些使用体验。欢迎大家持续的关注我们，这就是我们今天的节目。如果大家喜欢我们的节目，欢迎在你所收听的音频渠道来关注订阅我们喜马拉雅跟苹果的听众朋友，大家可以给我们打一个五星好评。

中国的听众可以通过苹果播客、小宇宙、喜马拉雅、蜻蜓 F M、荔枝 F M、网易云音乐来收听我们。美国的听众可以通过苹果播客、 spotify、 google podcast music 来收听我们。另外谷歌很快会关闭他们的 podcast 的服务，所以之后我们的播客也会转到 youtube music 上。欢迎大家能够在新的渠道来订阅我们，感谢大家的收听，谢谢。

E138｜如何用大模型提升学习效率？来自1100小时的深度使用体验 50:15 Share

硅谷101

Deep Dive

Shownotes Transcript

E138｜如何用大模型提升学习效率？来自1100小时的深度使用体验