科技不是少数人的专利,欢迎来到揭秘科技这两天国内 AI 圈最火的莫非是 Manus 了但这一次的出圈和以往的不太一样这次在国内出圈之后呢,不但没有炸形海外科技论坛和社交媒体让硅谷无眠
而且在国内的声浪也马上出现了两极化一方面有声音继续造势说下一个 DeepSeek 出现了另外一方面有了邀请码体验过的人反馈也是一言难尽网上也因此多了一种声浪甚至出现了一篇著名的文章说想并肩 DeepSeek 不能靠自嗨和邀请码有业内人士对这些不好的产品反馈给出了相对中正又幽默的解释
说总是接到一堆莫名其妙的任务靠着颤颤巍巍的推理模型去做规划然后又试图从网络垃圾堆里爬出一些有价值的东西还要防止自己的记忆被撑破最后还要用并不衬手的工具去交作业你知道他有多努力吗这期节目我们不会去深究 Mainness 到底好不好这种营销方式是否合适我们来讲清楚 Mainness 到底是什么
和 DeepSeek 这样的大模型又有什么不同?Mainless 提供了哪些服务?Mainless 是 AI 智能体吗?智能体又是个什么?实现智能体很难吗?Mainless 有护城河吗?Mainless 能成为下一个 DeepSeek 吗?这期节目就把这些个问题一一都说清楚首先 Mainless 它是一个中国团队开发的只通过了一部全英文的宣传片来发布的没有邀请码就用不了的一个 AI Agent 的产品
官方称他为全球首个通用的 AI agent 有媒体说,Manas 这么说就仿佛 OpenAI 的 Operator 和 Anthropic 的 Cloud 都不曾经存在过一样过去这么些年呢,也或许是我们的遥遥领先也或许是有其他的原因我们和国外渐行渐远东西方之间的信息差越来越大一些媒体在虚视的时候似乎就当西方已经不存在了
言归正传关于 Manus 官方网站是这么定义的他说 Manus 是一个通用的人工智能代理能够将思维与行动相结合他不仅仅是思考他还能交付结果 Manus 在工作和生活中的各种任务都表现出色能够在你休息的时候完成一切所以从这段描述当中可以看得出来官方认为 Manus 是一个通用的人工智能代理
人工智能代理英文是 AI agent 是在大模型火了之后最近一两年的一个概念今年一月份 OpenAI 也推出了自己的第一个人工智能代理 OpenAI Operator 那什么是人工智能代理呢 TPT 给出的解释是人工智能代理 AI agent 是一种能够自主感知环境决策并执行任务的智能系统它通常具备以下几个核心的能力
第一是感知,Perception,通过传感器,API 或数据输入获取外部信息比如读取文本,识别语音,获取图像等等第二个重要的核心能力叫做决策,Reasoning and Planning 是基于算法、规则或者是大模型的推理信息制定出行动计划,比如去优化路线,生成内容,编写代码等等第三个重要的核心能力是执行,Action and Automation
通过 API、机器人或者是软件接口来执行任务比如去控制智能设备、自动回复邮件、操作软件等等人工智能代理第四个重要的核心能力是反馈学习 Learning and Adaptation 部分 AI 代理具备自学习的能力可以根据用户的反馈不断的优化自身的行为提高工作效率和准确度
听到这里你是不是会想自动驾驶系统是不是就是一个人工智能代理呢是的自动驾驶系统本质上就是一个人工智能代理而且是一个极其复杂的自主代理因为它不仅能够感知环境还能自主决策和执行操作人形机器人也是一个人工智能代理而且它是一个更加复杂的物理世界中的人工智能代理
因为它结合了感知、决策、执行和环境的互动,类似于自动驾驶系统,但机器人的能力不仅限在二维的交通环境当中去导航,它更可以在更复杂的三维环境中完成各种任务。
从这个 GPT 的解释里和举例里面可以看得出来人工智能代理最重要的特点是在感知之后能够自主决策并且自主去执行任务并且能够根据反馈来再学习人工智能代理完全不需要人类干预或者是交互虽然人工智能代理的目标是实现高度的自主性但并不是完全不需要人类的干预或者是交互实际上绝大多数的人工智能代理
包括自动驾驶系统人形机器人等等都可能在一定的特定的情境下需要人类干预或者是协作许多场景当中的人工智能代理需要人类的干预比方说模型的更新与维护人工智能代理的训练模型可能会随着时间的推移变得不再有效需要定期进行更新和优化这通常需要数据科学家或者是工程师的帮助处理不确定的情况
当人工智能代理遇到无法处理的复杂情况或未被训练过的异常事件的时候他们可能需要人工干预来进行调整或者是解释这跟一个徒弟在跟师傅学技能的时候的过程是一样第三个场景就是在道德和伦理问题面前在一些涉及伦理决策的场景比如说自动驾驶事务当中的决策
人工干预可能是必要的尤其是当前的 AI 系统面临无法明确解决的道德困境的时候 GPT 还额外特意的指出像 Mainnet 这样的人工智能代理属于通用人工智能代理因为它可以处理广泛的任务涵盖工作和生活的多个领域并不仅仅是提供建议而是能够直接去执行这些任务
那我又问了 GPT,Mainless 这个通用代理和 OpenAI 的 Operator 有什么区别吗?GPT 说,Mainless 是一个通用人工智能代理,不仅限于某个特定的领域,而 OpenAI 的 Operator 是专门为大模型交互而设计的一个工具,用于增强人机交互。Operator 的主要作用是通过自动化的方式与多个 OpenAI 自己的模型进行对接,从而帮助用户完成任务。
OpenAI 的官网上也给出了 operator 的功能以及它是如何工作的详细的解释 OpenAI 的 agent operator 是一个可以上网为用户执行任务的代理它使用自己的浏览器能够查看网页并通过输入点击滚动与网页进行交互 operator 由一种名为计算机使用代理 Computer Using Agent CUA 的一个新的达摩型来驱动
这个 CUA 模型结合了 GPT-4O 的视觉能力和通过强化学习来获得的更加高级的推理能力专门训练用于与图形用户界面来进行交互的这些场景即人们在屏幕上看到的按钮菜单文本框等等 OpenAI 的 operator 可以像人一样看见网页上的内容并且进行交互动作看见的动作主要是通过计算机视觉
这个交互是通过使用鼠标和键盘等所有人类的操作因此它能够直接在互联网上进行操作而无需依赖于特定的 API 集成如果 operator 遇到了挑战或者是错误它可以利用自身的推理能力进行纠正而当它陷入困境需要帮助的时候它就会把控制权交给用户确保整个的过程顺畅并且具有协调性
用户要想开始使用 operator 只需要在这个 gpt 里面去描述想要完成的任务 operator 就能够处理其他的工作了用户可以随时接管对浏览器的控制遇到那些个需要登录需要填支付信息这种敏感信息的时候 operator 会把这个任务交给主动请求交给用户来接管那说完了 operator 是怎么工作的我们再来看看 minus 是如何工作如何实现的可惜的是
Mainnet 的官网并没有像 OpenAI 那样给出对 Mainnet 给出任何详细的介绍或者解释但这并不妨碍网上的一些个技术大神们给出一些个分解 AI 方面的一个著名的博主宝玉不仅给出了拆解还画出了 Mainnet 的结构图宝玉说
Mainos 主要有这么几个模块首先它有一个虚拟机安装了 Chrome 浏览器用来访问网页看起来这个操作是和 OpenAI 的 operator 很类似的除此之外 Mainos 还有一个任务规划器它根据用户输入的具体的任务请求把用户的任务拆成一个 To-Do List 推测是用了 Anthropic Cloud 的大模型
因为这一步很重要必须要求模型有很强的推理能力第三个重要的模块就是任务执行调度器任务执行调度器就根据第二步里面生成的 to-do list 上的任务清单逐一的去执行执行的过程就是去选择世界上最合适的一个 AI agent 也就是说去选择外界的最合适的一个人工智能代理
由于这部的重点是在外界的人工智能代理的选择上所以不需要能力太强的模型这部可以用开源模型比方说阿里的签问稍微微调一下就可以用了第四部是各种执行不同类型任务的人工智能代理 Mindus 它内置了很多的人工智能代理比如最复杂的应该是类似于 OpenAI Operator 的网页浏览的 agent
还有根据特定的 API 去检索特定数据的 agent 每一个 agent 在任务完成之后呢都会把任务的结果再写回到前面的这个虚拟机里面那第五步呢就是任务汇总生成器了当每一个子任务完成之后任务调整器就会通知任务汇总生成器把这个 to do list 里面所有的任务的生成的结果汇总整理成最终的结果
根据任务的要求可能是一份调研报告可能是一个网页的程序由于这一步需要有极强的推理和语言能力所以必须要有一个很强的模型所以这里面猜测仍然是用的 Anthropic Cloud
第五步的汇总生成记忆的步骤是非常必要的根据我的了解在多智能体的场景里面一个重要的问题就是错误的放大效应比如第一个 agent 它返回的错误率是 20%第二个 agent 返回的结果的错误率如果也是 20%这样三个 agent 累积在一起准确率就会下降到
只有大概 50%的左右就是 0.8%80%乘以 80%再乘以 80%那多个智能体是怎么解决这个问题的呢 minus 就用了这种 to do list 的方式在把结果汇总确保每个子任务都完成最后来合成这基本上就是 minus 主要的工作原理了所以能够从这个过程当中也能够看得出来真正制约它能力的
还是在于模型的能力和他所调用的其他的人工智能代理的能力而人工智能代理的能力也受制于他们想相应的使用的大模型的能力那 Mainos 的护身盒在哪里呢宝义认为说如果是像他这样的一个伪专业人士也能大致分析出他的技术实现那么是不是其他的团队也可以马上去山寨一个出来
对于现在的 AI 产品来说护称核基本上就这么几个点第一是模型加算力第二是数据第三是用户体验所以未来对于 minus 或者是这类的产品来说想形成自己的护称核不仅仅是要在用户产品体验上创新还需要有用户数据上的沉淀把这种数据变成是一种飞轮效应用这种基于用户的数据用户实际使用的数据来做出来更等用户的体验
再用这种更等用户的体验来吸引更多的用户来使用从目前网上体验过 Manus 的用户反馈来看目前的用户体验还远远没有达到人而满意的程度这一点也非常容易理解因为从 Manus 的结构上来看它的能力严重依赖于它所使用的外界的模型和代理的能力算力本身靠钱就能解决但这样的体验呢
当下的这个用户体验但并不妨碍 Mainnet 去持续的收集数据未来能够基于用户的数据做出更等用户的体验用更等用户的体验来吸引更多的用户来使用网上又有另外一个跟这个数据飞轮效应相关的但是更加有趣的观点叫做生态卡位讲的是科技公司们都喜欢先推出产品先不要去在乎产品是不是够完美甚至连是不是完善都不用去考虑
不要等要先发布先占住这个生态位然后不断的去迭代不断的去提升能力就能够做得越来越好这个做法是不是听起来也比较熟悉呢大家仔细想一下我们熟悉的我们熟知的很多的科技产品大多数的公司都是这样的营销的方法先吸引来用户想尽办法去留住这些用户形成口碑然后再把这些用户数据沉淀下来进一步提升用户体验
以后随着模型能力的升级,一起更新迭代,就能慢慢地形成自己的护城河,很难被其他精品超越了。虽然这一轮的 Mainus 的出圈并没有形成一个中国团队让鬼谷无眠的效果,但也没有消耗 DeepSeek 给中国 AI 带来的正向价值。客观地说,实实在在的,生态卡位成功了。从 Mainus 的产品架构和用户体验来看,它确实还处于相对来说比较早的阶段。
但它的意义不仅仅在于一个 AI 代理产品的出现更重要的是它代表了国内 AI 创新的又一次探索就像 DeepSeek 让大家看到了中国大模型的潜力一样 Mainnet 是让 AI Agent 的这个概念进入到了更多人的视野中当然 AI Agent 这个赛道也刚刚开始 Mainnet 是未来能不能真正的形成自己的护身活甚至成为一个全球领先的通用 AI 代理还需要时间去验证但有一点可以确定
AI 代理并不是一个拼营销就能成功的领域真正的竞争力最终还是要回归到产品能力和用户体验无论如何 Mainness 这次的出圈已经成功地站住了 AI 代理赛道章中的一席之地未来它是否能够凭借数据飞轮和不断优化的用户体验真正地实现突破让我们拭目以待感谢收听欢迎订阅与关注我们下期再会