We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

AI开发工具Cursor和Devin Deep Dive【中文】

2024/12/29

Mr. Valley's Knowledge Sharing Podcasts

AI Deep Dive AI Chapters Transcript

People

我

Topics

我：在体验了AI编程工具Devin和Cursor后，我发现它们在设计理念和使用体验上存在巨大差异。Devin更像是一个有计划、有章法、会学习和成长的实习生，而Cursor更像是一个严格执行指令的工具。Devin在处理复杂任务时，能够进行全局规划，制定高层计划，并根据执行结果不断调整策略；而Cursor则更擅长处理明确具体的小型任务，其迭代过程主要用于验证目标是否完成。在克隆网站的任务中，Devin展现出更强的抽象思考和计划制定能力，能够调用各种工具下载网站内容，观察网页模块，规划网页结构，再进行执行；而Cursor则直接生成网页，忽略了下载本地内容这一步骤，最终结果简化且细节缺失。 Devin和Cursor在工具使用灵活性上也有差异。Devin能够调用更多工具，例如浏览器、LLM等，处理更灵活的任务；而Cursor主要调用文件系统、代码生成和命令执行等Agent。在处理无明显规律的链接修复问题时，Devin通过LLM理解并修复问题，无需编程；而Cursor则力不从心。在CVPR文章信息抓取任务中，Cursor表现出色，快速编写爬虫完成任务；而Devin则选择低效的手工方式。 Devin强调知识和经验的总结和积累，会根据反馈自动生成知识，并应用于后续任务；而Cursor目前尚未具备此功能，但其机制已存在，未来有望实现。Devin在Prompt使用方面，需要明确定义成功的标准，这与Builder's Mindset课程观点一致。总而言之，Devin更适合处理复杂的软件工程项目，但运行速度慢，成本高；Cursor更适合处理轻量级任务，效率更高。Cursor更适合生成制品（artifact），例如图标、文档或图像；Devin更适合复杂的软件工程项目。

Deep Dive

Chapters

This chapter compares two AI programming tools, Cursor and Devin, highlighting their contrasting design philosophies and user experiences. Cursor excels at executing specific tasks, while Devin adopts a more comprehensive, systematic approach.

Cursor operates like a technician, efficiently executing instructions.
Devin functions more like a project manager, planning, executing, and adapting strategies.
Devin's flexibility allows it to handle more complex tasks, while Cursor is better suited for smaller, well-defined problems.

Shownotes Transcript

最近我冲了 500 美元一个月的 AI 编程工具 Devin 他号称是一个全能的实习生可以做很多传统的 AI 工具比如 Cursor 和 Windsurf 之类做不了的事情在使用了一段时间之后我确实感到了他和 Cursor 在设计理念和使用体验上有着巨大的不同要注意的是我这里说的 Cursor 不是传统的类似自动补全的 Co-Pilot

或者类似 Copilot Chat 那种通过自然语言来编程的工具这里的 Agent Cursor 指的是 Cursor 最近刚发布的 Agent 模式在 Cursor Composer 里面现在可以把模式从 Normal 切成 Agent 然后在里面提出需求接着 Cursor 就会调用各种工具来为你迭代的完成任务

整个体验和 Windsurf 极其类似因此这里所说的 Agent Cursor 已经是一种相当先进的以 Agent 的方式通过调用电脑上的各种工具多轮完成任务的一种产品形式总的来说我最明显的感受就是 Devin 的设计理念和目标与 Agent Cursor 非常不一样跟 Cursor 的交互更像是一个与工具的交互而 Devin 更像一个人

下面的三个方面都是围绕这个区别的局部执行 VS 全局规划从指令完成到流程主导在使用 Cursor 的过程中我有一个明显的感觉是他像是一个严格执行具体任务的技术员只要给他一个明确的指令他就可以快速执行输出结果但 David 则更像是一个更有章法的复杂系统或者说实习生

他会有着更完整的工作流程思维,会先制定一个高层计划,然后再细分步骤执行,验证成果。虽然 Devin 和 Cursor 都会有多轮迭代这个特性,但 Cursor 的迭代只是为了进行测试,来验证自己有没有完成目标。

而 Devin 则更像是一个职场老油条他会先列一个高层的计划然后一个个打勾在这个过程中还会不断地调整策略让你始终知道他做到哪一步了而且让你相信整个项目的进度也在他的掌握中这是一个非常有意思的区别而且也确实让 Devin 可以去完成更加复杂多变的任务提供更加系统的解决方案

比如,我们尝试了让两个 AI 都去克隆一个网站,Devin 在更高层的抽象思考和计划制定方面明显更强,他会知道先调用各种工具,把这个网站下载到本地,然后去观察每一个网页和模块的作用与样式,然后再着手规划网页结构,最后再着手执行。

但 Cursor 给人的感觉就是明显不是为了这种难度的工程设计的,它的第一次迭代没有想到要先把网站下载到本地,而是直接 hallucinate 了一个网页出来。然后,在明确被提醒先把网站内容爬下来之后,它又漏了很多重要的细节,做出来的网页只是一个非常简化的版本。

所以总的来说,二者的设计目的感觉是非常不一样的。Devin 的设计的时候,更像是把他当作一个有章法有计划的软件工程师来设计。而 Cursor 则更多的是一个帮助我们快速自动地解决一些明确的相对小的问题的工具。它们的第二个差别在于工具使用的灵活性上。

Cursor 能调用的 Agent 主要是文件系统、生成代码和执行命令。但是,Devin 可以调用更多的工具,比如说,他可以启动浏览器,用视觉能力来理解前端的内容,甚至可以做一些跟前端交互的自动化测试。他还可以调用自己的 LLM 对应实习生的大脑,可以用自己的脑力来完成一些相对独立的、更灵活的任务。

举个例子,我的 block 有一些链接需要修复这些链接错误的模式没有明显的规律因此,Cursor 在面对这种问题的时候就显得力不从心它没有办法从这些错误的链接中间总结出一些规律然后写一个程序来批量处理换言之,这个问题本身就不适合用编程来解决而需要更高层次的智能而 Devin 很好地解决了这个问题

他在整个过程中间没有使用任何编程,而就是打开一个个的文件,用他的 LLM 去理解,找到其中的问题所在,并且把它修复 PR 在这里。这个不同一方面佐证了在上一点中我们提到的章法的差异。另一方面也说明 Devin 拥有的这些更多样的能力,可以让他经过组合来完成更加复杂的任务。

但是,这种工具使用的灵活性也是一把双刃剑。比如,在另一个例子里,我让 Devin 和 Cursor 都去 CVPR 的网站上,把今年的 2000 篇文章的作者标题和 PDF 链接下载下来。Cursor 对于这种明确的需要编程的任务表现得一如既往的好。

他很快写了一个爬虫,解析了 CVPR 网站的内容,并且生成了最终的结果文件。但 David 则选择了另一条意外的手工路线。他首先打开浏览器,再用图像能力阅读了浏览器,阅读了第一页之后,给了我一个只有三篇论文的结果文件。

在被质问这只有三篇其他的呢以后他竟然再次选择用浏览器打开网页一页一页三篇三篇的输出这个流程真是让人哭笑不得从某种程度上来说也确实像在带一个勤奋但是没有经验的实习生只是从工具和完成任务的角度来说 Cursor 的稳定性和完成任务的能力在这里是更重要的 Prompt 与知识的动态成长

另一个相关的差别是他们对于知识的管理和迭代在 Devin 的使用中他非常强调知识和经验的总结和积累比如在上面的 CVPR 抓取的例子里我给了他一个反馈是你需要先看一下有多少个文章如果文章数量多的话你需要选择用程序来批处理

在我给了他这个 feedback 以后,他就自动生成一条知识,说下次如果在做网络抓取的时候,需要根据数据的规模来分情况处理。接着,当我又让他做一遍 CVPR 这个任务之后,他就没有再掉到同样的坑里了。这种动态迭代与进化的设计,让整个过程特别像带一个实习生。

包括我让 Devin onboard 一个新的 GitHub repo 的时候,也是我带着他一起去初始化这个 repo,安装各种依赖,以及教他怎么样跑各种测试,在什么情况下说明什么组件没有问题。带了一遍以后,他也把这些信息都转变成知识,再后来他也就可以非常熟练地处理我的 Blog repo 了。

这种动态进化的设计在 Cursor 上暂时还没有看到,但是我比较乐观,这个是 Cursor 很容易实现的。

现在,Cursor 已经可以使用,Cursor Rule 这样的文件来自定义每个工程特定的知识,所以,它的 Mechanism 是已经在那里的,只要接入一个整理知识的 Prompt 应该就可以了。多一句嘴,在 Prompt 方面,Devin 有一个文档,我感觉特别有帮助,他会教你什么样的 Prompt 在与 Devin 沟通的时候是最有效的。

比如,你需要明确定义成功的标准,比如要跑通某个测试,或者访问某个链接能对得上等等。这个和我们在 Builder's Mindset 课程里面的观点不谋而合,而且当你把同样的原则应用到使用 Cursor 的过程中间的时候,也会发现 Cursor 一下子也变得聪明了很多,可以自主验证有没有完成任务并且进行迭代。

正因为这三个设计和产品方面的区别,给我一个很明显的感受,Devin 设计出来就是为了像一个人一样,有章法,会成长,虽然不可控性更高。比如,有时候他会对着我一个 MD 文件发呆十分钟,我甚至怀疑他在后台偷偷玩手机,但是也更擅长做更复杂的项目。

相比之下,Cursor 是一个更直观的编程工具,你会知道它可能会掉什么坑里去,并且事先加以预防,但这个对 Devin 来说就更加困难一点,有时候甚至他掉坑里了,事后复盘都不太懂他为什么会犯这个错。

对于实际的使用来看,我目前会更倾向 Cursor,因为这两个工具所针对的场景其实相差很大。Devin 更强调对于软件工程进行复杂开发。比如,他一个月要 500 美元,而且跑起来也很慢,一个小项目跑个半小时几个小时很正常。但如果这个项目可以用 Cursor 来完成的话,他可能 5 分钟就跑完了。

所以 Cursor 更适合做一些更贴近生活、更轻量级的小任务。而且,我相信 Devin 的很多设计和经验,包括 Prompt Engineering 的技巧和迭代的思路,都可以被 Cursor 轻松实现。所以也许 Cursor 的竞争对手其实不是 Devin,而是 ChatGPT。

换言之,如果你想要的其实不是一个代码,而是一个 artifact,比如一个图标,一个文档,甚至一个 Photoshop 的图像,都可以用 Cursor 来做。只有当最终想要的 Deliverable 是一个复杂的软件工程的时候,Devon 才是一个更适合的工具。从我问你答到我问你做。在讨论 Agentic AI 之前,我想先讲两个小故事。

我在网上和别人聊天的时候想要比较一下亚马逊和谷歌最近五年的股票走势来佐证我的一个观点我先是上网搜索了有没有现成的比较和工具发现没有接着问了 ChatGPT 你能不能帮我寻找或者生成一个股价对比图他说做不到这时候我已经想着放弃了因为聊天的过程中不值当特别花个五分钟去专门做个图出来

最后,我死马当活马医,用了 Cursor 最新的 Agent 模式,就直接把要求丢给它,让它给我生成一张图,上面有谷歌和亚马逊最近 5 年的股价,同时把两个股票的起点对齐,这样方便我比较。结果没想到的是,Cursor 就开始全自动写程序,装依赖,debug,改程序,重新执行,然后在一分钟之内就给了我想要的图,如下图所示。

真是令我大受震撼。第二个例子是,我在做网页的过程中,需要把我的头像变成圆形,用美工的术语来说是加一个圆形的遮罩。有了上一次的经验,我这次就没有打开 Photoshop,或者问 ChatGPT 应该怎么操作 Photoshop,而是直接把图扔给了 Cursor,在它的 Agent Mode 里面描述了一下我想把图 PS 成什么样的形状。

Cursor 吭哧吭哧鼓到出来一个我看不懂的命令行,然后自己安装依赖,出了一张图,但是他把这个圆形的大小弄错了,所以我跟他提了一下这个反馈,他又自己调用命令行搞清楚了这个图的大小应该是多少,然后就给了我一张正确的图。

这两个例子对我的触动蛮大的,原因是它体现了一种非常根本的使用 AI 的思路的变化。如果我们看上古时期的 AI 产品,比如一年前的 ChatGPT 和 Cloud 的话,它的使用模式是我问你答,我们有什么不知道的东西会去咨询它。这是为什么那个时候的很多文章会把 ChatGPT 和 Google 进行对比。

但是在 2023 年底的时候,至少对于马农来说,我们使用 AI 的方式很大程度上变成了 Co-Pilot,也就是我问你写。我们对 AI 的期待不仅是告诉我一些事情,而且是帮我写一些代码,然后我跑这个代码来执行别的任务。但是在上面的这两个例子里面,我对 AI 期待的输出已经不是代码了,而是一个实际的任务,或者说 Artifact。

它可能是一篇文档可能是一个 Photoshop 的图片可能是一个数据可视化的图表换言之这个使用 AI 的模式变成了我问你做这个变化是十分根本的因为不论是我问你答还是我问你写 AI 都只是完成任务的中间步骤而已在搜集完资料之后我要自己做判断

在搜集完程序之后,我要自己把它调通,组织 debug,让它正确运行。还要把结果给整理一下,才能为我所用,交付我所承担的工作。但是我问你做,则打通了所有的中间步骤,让 AI 端到端的完成了整个任务,真正的交付了我们最终想要的东西。比如,当我想要这个图的时候,我不用去帮 AI 拆解,去哪个网站找数据,怎么画图。

而直接就可以期待 AI 就会把这个图给我,我贴到聊天框里就可以了。类似的,当我想要 Photoshop 一张图的时候,我也不用去向 AI 学习应当如何使用 Photoshop。

而是直接就期待它就会给我最终的成果我传到网上就行了这是一个相当本质的变化能让我们真的把精力集中在那些充满不确定更有难度需要我们的思考和创造能力的地方而不用花费大量的精力来做执行和拆解方面的工作而这个变化又会进一步推高我们工作的天花板让我们可以做到以前做不到的事情

Agentic AI 的核心特质使用工具与多步决策而从我说你答到我说你写到我说你做的变化则是由 Agentic AI 引发的在具体探讨 Agent AI 的更多细节之前我想先解释一下我对什么是 Agent AI 的理解这个词在互联网上哪怕是 AI 圈子里都是比较混乱的

大家比较公认的定义是,一个能完成特定任务的 AI 就可以叫做 Agent。

但这个定义其实非常笼统,也有很大的歧义。比如,我做一个 GPT,通过 Prompt 的方式,教他五行周易,让他能算命。这是符合完成一个特定任务的定义的,但很难支撑我们上面所提到的场景。类似的,我们把 AI 接入公司内部的知识库,让它进行 REC,从而实现客服智能机器人这样一个产品。

它因为有了公司内部的知识,和公开的 GPT 是不一样的,因此它能完成一个独特的特定任务,也算是 agent。但同样,它也没办法支撑我们上面的我问你做的场景。我还可以举出很多例子,比如 Fantune 之后的模型,比如用特定格式输出的模型等等。

但是,他们都没有触及我觉得最核心的两点,一个是使用工具,一个是多步决策能力。使用工具比较好理解,比如 AI 的一个老大难问题,就是没办法做精确的数学计算。

但如果我们给他一个计算器的工具在做数学计算的时候不用他自己生成下一个 token 的能力来做计算而是通过调用计算器来做计算这就可以完美的补足他数学计算不精确的短板

类似的,对互联网的搜索工具,对公司内部数据库进行 Query 的工具,都可以极大的改善 AI 能力的短板,让它实现之前做不到,甚至可能长期都做不到的事情。比如知道今天早上的新闻,毕竟我们不太可能把训练一个 LLM 的时间从几个月缩短到几个小时。

因此,一个 AI 只有拥有了使用工具的能力,才能更好地适应多样的任务需求,让自己可以对世界产生嘴炮之外的现实影响。那多不决策是什么意思呢?

我们传统的 AI,它的推理过程是回合制的。比如,你问它一个问题,它回你一个答案,接下来它就等着你做下一步的指示。即使是拥有工具调用能力的 AI,比如 OpenWebUI,也是类似的工作模式。

俗话叫踢一脚动一下但如果你用过 Agented Cursor 或者 Devin 就会发现他们的工作模式是走一步看一步从回合制变成了及时战略制比如他会先执行一个命令如果这个命令成功了他就停下来了等待你的下一步指示但如果这个命令失败了他就会根据返回的错误信息进行进一步的修改与调试

直到命令成功为止因此从回合的角度来看它的一个回合中可以包含多个指令并且指令的数量是不确定的是根据工具调用的结果动态决定的这种多步决策的能力也是让 Agentic AI 有用的一个重要因素 Agentic AI 的基本技术架构

既然 Agentic AI 这么有用,如果我们想要做一个类似 Agentic Cursor 这样的工具来适配我们自己的工作流的话,应该怎么做呢?

首先,这仍然是一个非常新而且高速发展的领域所以遗憾的是现在并没有一个成熟的框架或者库来保证只要你跟着这个框架或者库走就能够做出来一个很好的东西但是我觉得它们的基本脉络仍然是有迹可循的要想搭建一个 Agentic AI 系统关键有四个方面调用工具的 LLM 从语言输出到现实影响

LLM 本身需要有调用工具的能力现代的 LLM 不论是币源的 GPT Cloud 3.5 还是开源的 Lama 3.2 都有相当好的调用工具的能力同时又考虑到从头训练一个大语言模型对绝大部分公司来说都是超出能力了所以这一部分我们简单略过明确成功标准为 AI 划定任务终点与检查标准

这个 agent 系统需要有一个明确的成功的标准或者停机的指令比如我们给 AI 交代一个任务我有一个文件里面有 5000 个数据型你帮我转换一下格式当你跟 AI 交代你成功的标准是输出的文件也要有 5000 行而且不能有闹的时候与不跟他说这个标准相比他完成任务的质量可能会天差地别

这个其实不是 AI 本身的挑战,当我们给下属交代任务的时候,往往也有类似的问题。当我们把完成任务的标准定得很清晰的时候,下属或者 AI 就可以自查并且自己迭代,它对任务的完成度和符合我们期望的概率就会大很多。

而当我们没有交代清楚这个标准的时候,即使 AI 或者下属有多不决策的能力,也会退化成踢一脚动一下,随便弄个东西交个差就等你检查了。比如最多保证它的程序可以跑通,或者没有语法错误,但是浪费了很多它本来明明可以做到的潜力。

同时,在思考如何向 AI 交代完成任务的标准的过程中,这也会逼着我们思考一个问题,AI 有没有合适的工具来检验它的任务有没有完成?如果没有的话,我们可能第一步得先让 AI 做一个这样的工具出来。

工具描述与标准化为 agent 建立清晰的能力接口我们需要有一种机制来跟 AI 明确地描述它有哪些工具每个工具分别是做什么的它的输入输出是什么 AI 可以以怎样的方式调用

这部分工业界还没有一个成熟的标准,有一些企业在试图推一些开放性的标准,比如 Enthropic 的 Model Context Protocol 。你只要把你的工具用这种协议描述出来,支持这个协议的 AI 就可以调用你的工具。当大家都使用同一种标准的时候,互相协作配合就会简单很多。

当然,现在还是 Agentic AI 发展的早期,就算不支持这个 Enthropic 倡导的协议,我们也有很多其他的标准,比如 Open Web UI 也有自己的协议,甚至我们也可以自己定义一个私有协议都可以。Orchestrator,多步执行与并行策略的中控台。

虽然说到 Agentic AI,网上大多数文章主要在描述 Agent Orchestrator 这个组件,但它可能是确定性最高的一个部分。

这个 Orchestrator 会维持一个多步决策的工作流,它会根据我们布置的任务调用来决定需要使用什么工具,以及根据 LLM 的回应,真的去掉这个工具,并且把结果返回给 LLM,然后再进行下一步的推理。它可能还会实现一些并行等等功能,来加速整个推理的过程。

这方面业界也有了一些工具比如 Microsoft 有个 Autogen 但是目前也没有一个非常成熟统一的库或者框架当 AI 从我问你答巧然转向我说你做我们每个人的角色与心态都需要重新定位在这样一种全新的人机协作模式中我们的核心价值是什么

我们又该如何为自身和公司提前布局?当 AI 已经不再单纯嘴炮,而是真的能干活的时候,我们终于可以,而且也必须把更多精力投入到创造性思考、策略布局以及对未知领域的探索中。毕竟,机械化的重复与实现细节将被 AI 轻松接管,而真正的价值将来自于对问题本质的理解。

或许你可以在自己的下一个项目中加入这样的 Agentic 工具了哪怕只是先从一个小任务开始用 Cursor 来进行数据可视化的助手自动格式转换或是快速圆形设计在这样 Build 的过程中你会逐渐发现自己的角色正从一个执行者转向引导者和策划者从一个苦于细枝末节的搬砖工转向善于利用 AI 能力的老板

而这就是 Builder's Mindset 的魅力在做完上篇介绍的 Cursor 魔改之后将 Agentic AI 用我说你做的模式进行使用已经成为了我对 AI 利用的主要方式而这又进一步启发我有没有可能把 Cursor 或者类似的编辑器作为使用 AI 的通用入口呢?

这么想主要是来自于两个观察一个是在我们把 AI 作为 consultant 来使用的时候很多时候我们还是需要大量的复制粘贴而这样的操作在 Cursor 内部是非常自然的只要点击 Apply 它就会将 AI 回答的内容插入到我们正在写作的文档里所以从用户工作流的角度来说 Cursor 其实反而是一个更自然的界面

从另一个角度来说,AI 作为 consultant 还有一个致命的缺陷,就是至少在目前的 AI 产品里,大家和搜索引擎结合的体验都不太好。不论是 ChatGPT 的 Search,还是 Proplexity,或者是 Po 的 WebSearchBot,他们干的事情一般都是简单浏览一下前几个结果就草草给出答案。

虽然这对于单轮的 AI 问答来说可能还可以忍,但是在用惯了 Agentic AI 以后,我们自然而然就会期待 AI 有更好的完成任务的质量,比如往下翻更多的结果,或者迭代几轮关键字,最终给我一个系统性的汇总。

很多时候为了回答的质量我是愿意等下去的而这件事其实很适合 Cursor 这样的 Agentic AI 来做于是我就开始进行了一系列实验来探索 Cursor 到底有没有可能取代 ChatGPT 或者 Cloud AI 作为我们使用 AI 的通用入口在经过了一些简单的尝试之后我对实验的结果非常欣喜

下面我就简单介绍一下 Cursor 可以如何被用来完成各项常见的 AI 任务尤其是传统的非 agent 类型的 AI 应用并且比较一下它的优劣势对于最简单的常识性的问答我们可以直接在 Cursor Chat 里面输入问题来得到答案这一点和传统的 AI 并没有分别有一个相对细节的优势是

我们可以在同一个界面里直接调用 OpenAI,Enthropic,甚至是我们自己本机的私有 AI 来进行问答。但在此之外,有一个非常大的好处是,正因为 Cursor 是一个编辑器,所以我们可以非常方便地把问答的结果收集起来,沉淀下来,变成一个可以复用的文档。

编辑器还带来另一个好处,就是当我们在进行与文本相关的任务的时候,它甚至有一些相当奇妙的用法,比如在下面的这个例子里,我想把我的中文版的博客翻译成英文,那直接在 Cursor Chat 里面提出要求之后,它就会给我一个英文版本的文章,点击 Apply 之后,Cursor 会自动将中英文文档进行对比,高亮出其中的差别。

但有意思的是,因为我们的译文和原文的结构是完全一样的,在经过对比之后,这天然就形成了一段中文一段英文的对比图形界面。在上面,我们可以直接对英文进行非常直观的修改,最后 accept 再复制就可以完成翻译了。虽然我相信这不是 Cursor 设计的本意,但是整个工作流程异常的便捷自然。

Cursor 有一个功能是针对一个很大的代码库,也能精准地找到相关的函数,并且用它的信息来帮助撰写代码。对于非开发性质的问答来说,这天然就是一个 RED 引擎。当我们在问答窗口不是使用回车,而是使用 Command 加回车来发出问题的时候。

它会首先在当前的文件加下做一轮搜索并且在文本框下面显示出排在前面的文档和相关度最后使用这些信息构建提示词完成最终的生成这些中间结果都是可以在界面上展开并且查看的

而且,这个功能不仅在 Chat 里可以使用,它也可以作为 Agentic AI 的一部来使用。这是因为搜索这个功能也是 Cursor Composer 可以调用的一个 Agent Tool。我把我所有的 Blog 文章放在了当前文件夹下,然后问了 Cursor 一个相当复杂的问题。我问他在 ChatGPT 发布后的这两年时间里,作者也就是我对 AI 的观点和态度发生了哪些变化。

Cursor 的回答非常惊艳,他首先自己组织了一些关键字,然后用这些关键字做了 retrieval,结果看上去都挺靠谱的。接下来,他针对这些文章进行了总结和对比,给出了相当有深度的回答。所以,即便是对于非开发性质的任务,Cursor 也可以非常自然地和私有文档进行结合以及问答。

而且,相比于单纯的对话性质的聊天界面,Cursor 天然就可以把这些新生成的 Insights 进一步沉淀成新的文档,在后来的搜索中继续使用,这就形成了一个知识闭环。这种附用性和知识探索沉淀和新增的能力,对于知识管理来说是非常重要的。

因此,如果你使用 Obsidian 之类的软件来进行知识管理的话,也不妨使用 Cursor 来增加知识检索和管理的效率。搜索另一个意外的好用的用法是把 Cursor 当作一个搜索引擎来用。

考虑到 Cursor 自己并不支持上网搜索,能做到这一点主要是依赖于这个工具优秀的扩展性。如我们在上一篇《魔改 Cursor》的文章中提到的,我们可以给它写一个小爬虫工具,进行搜索和网页内容抓取,然后在 Cursor Rules 这个文件里叙述这两个工具的用法,就等于给它拓展了上网搜索和浏览的功能。

而且,我做了几个或简单或复杂的尝试,他的回答一如既往的惊艳比如我问他 OpenAI 最近有什么新闻,他准确地从搜索的结果中梳理出了 12 天连续直播的相关结果并且提到昨天 OpenAI 把 OE 这个模型在 API 中间 release 了紧接着我就追问了,OE 不是早就出来了吗?

他又通过搜索之后可以知道 OE 之前发布的是 OE Preview 是一个历史的版本在昨天发布的版本是正式版花费的用来思考的 Token 少了 60%而我用类似的关键字在 GPT 中间搜索的时候则得不到这么惊艳的结果比如 GPT 给出的结果还在说 OpenAI 发布了最新的模型 GPT-4O 还活在上古时代

另一个惊艳的例子是我突然想要复刻一个叫做北京浮生记的小众游戏但是不记得它的游戏细节了再问了 Cursor Agent 它不仅进行了搜索而且进行了多轮关键字迭代最终生成了一个相当完整的游戏报告我放在了这里因为工具和 Cursor Rules 中间的 Prompt 都是我们自己写的这里面的定制性非常高

比如,你可以让它一下看前 20 个结果,而不仅仅是局限于前三五个结果,或者你可以在 Prompt 中间指定,当搜索编程相关的内容的时候,即使我输入的是中文关键字,你也要先用英文来搜索。这些灵活的定制性,让它能实现的服务质量非常高。

此外,在整个使用 Cursor 的过程中间,我们也可以通过提示词来实现定制化和个性化记忆。比如,你希望它用中文来回答,或者某种特定的话题要搜索某个网站,或者你有一个特殊的资料库,里面是你在聊天中经常用到的链接等等,都可以以提示词的方式,或者以 Add 某个文档的方式,动态地集中给它。

他会额外的使用这些信息来进行回答因此他也是一个可以成长可以调教的私人助理但是 Cursor 直到目前为止仍然没有一个可以通过程序来调用的 API 他自己也不提供移动端因此我们上面所说的所有操作都是在电脑上完成的但是我觉得尤其对能够干活的 Agentic AI 有一个移动客户端尤其重要

毕竟跟 Agentic AI 进行交互,往往只需要通过口述或者聊天就可以。这让很多以前我们必须要做到电脑前面才能干的活,一下子在手机端都可以做了。因此,这个是把 Cursor 作为 AI 的通用入口的用法,目前的一个相当大的局限。让我们看看未来有没有厂商,能够及早意识到 Agentic AI 在移动端的重要性,把这一点加以补足吧。

但好消息是,经过我们的这些尝试和比如 MCP 这类的标准协议的发展,其实现在把这些功能给实现出来也并不是很难。

AI开发工具Cursor和Devin Deep Dive【中文】 33:13 Share

Mr. Valley's Knowledge Sharing Podcasts

Deep Dive

Shownotes Transcript

AI开发工具Cursor和Devin Deep Dive【中文】