这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

2025-03-07 0 113
几乎在昨晚苹果发布新品的同时,整个科技圈却被一个名为 Manus 的产品刷屏了。

这是全球首款真正意义上的通用 AI Agent,从官网展示的案例可以看到,它能够独立思考、规划并执行复杂任务,直接交付完整成果。

比起 Claude 的 Computer use 等同样能操作多任务,或者能帮你点外卖订酒店的 Agent, Manus 可以覆盖更多领域和达成更高的执行质量。

Manus 在权威的 GAIA 基准测试中创下新纪录, 性能远超 OpenAI 的同类产品。

而 Manus 这个名字来自拉丁语,Mens et Manus,就是 mind and hand,即手脑并用。这也是麻省理工学院的校训,以此鼓励学生将创意落地为实际成果。

创始人肖弘在 Manus 发布的前几个小时,在即刻平台上发文「高潮来临」,并分享了莎士比亚的一段书摘:

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

很难现在就判定 Manus 的诞生就是 AGI 的里程碑,但它很有可能将让 Agent (智能体)时代真的进入「高潮时刻」。

Manus 体验申请链接 👇:
https://manus.im/invitation

筛简历、选房炒股,Manus 真会「干活」?

官方宣称,Manus 不仅仅是一个只会聊天的对话式 AI 工具,而是一个真正的自主智能体(Agent)。

当其他 AI 可能只停留在生成想法的阶段,而 Manus 能够独立思考并采取行动。官方将其视为人机协作的新范式,甚至可能是通向 AGI 的一个窗口。

与 Manus 同步出圈的还有一段长达四分钟的演示 demo。在这些案例中,Manus 完全自主地完成从规划到执行的全流程,展示了真正的 Agent 能力,而非简单的助手功能。

比方说,首先从一个常见的人力资源任务——筛选简历开始。

演示一开始就放了个大招,官方向 Manus 发送了一个包含 10 份简历的压缩文件,Manus 能像专业招聘人员一样高效工作。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

它会先解压文件,然后逐页浏览每份简历,并记录重要信息。Manus 还能异步处理文件,这意味着你可以随时关闭电脑,等任务完成后,它会通知你。

当然,在这个过程中,你也可以随时给它新的指令。

接着,继续向 Manus 上传 5 份简历。在认真阅读了所有 15 份简历后,Manus 给出了排名建议,并提供了候选人资料和评估标准作为参考。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

这还没完,我们还可以让 Manus 生成电子表格。

由于 Manus 具有知识和记忆能力,所以下次执行类似任务时,它会直接以电子表格的形式交付结果。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

另一个演示案例中,结合家庭收入情况和孩子的上学要求,让 Manus 在纽约筛选一个安全、犯罪率低的社区,并购买符合标准的房产。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

面对这类复杂任务,Manus 同样是有条不紊地将其拆解为多个步骤,并创建详细的待办清单。

  • 搜索并阅读关于纽约最安全社区的文章。
  • 研究纽约的中学情况。
  • 编写 Python 程序来计算预算。
  • 基于预算,在房地产网站上筛选合适的房源。
  • 整合所有信息,撰写详细报告并整理相关资料

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

转场到第三个案例,Manus 摇身一变成了专业的股票分析师。

让其分析英伟达、迈威尔科技,以及台积电在过去 3 年的股票价格之间的相关性,Manus 可以通过 API 访问权威数据源。在验证数据后,它开始编写用于数据分析和可视化的代码。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

在完成数据分析和可视化后,Manus 也能基于这些数据创建一个网站。经用户的授权后,还能将网站部署至线上,并提供了一个可供分享的链接。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

X 网友 @DavidAIinchina 也体验到了 Manus,并给出了极高的评价——「令人难以置信的用例」。

官方表示,以上展示的内容仅仅是 Manus 能力的冰一角。

在用于评估通用 AI 助手在解决现实世界问题方面的能力的 GAIA 基准测试中,Manus 在所有三个难度级别上都达到了 SOTA 水平。

为了确保结果的可重复性,Manus 使用与其正式版本完全一致的配置进行评测。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

除了基准测试,Manus 还在 Upwork 和 Fiverr 等平台上解决真实世界的问题,并在 Kaggle 竞赛中证明了自己的实力。

而这一切都离不开优秀的开源社区,因此官方也希望能回馈社区。

Manus 采用多重签名(multisig)系统,由多个独立模型驱动。今年晚些时候,官方将计划开源其中的一些模型,特别是 Manus的推理(postering)部分。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

中国团队、两款爆品、百万用户

那么这款震撼业界的产品背后是谁?

据悉,Manus AI 背后的创始人肖弘是是华中科技大学软件工程专业 2015 届校友。

毕业后,他连续创业,2015 年创立夜莺科技,推出「壹伴助手」和「微伴助手」,服务超 200 万 B 端用户,获腾讯、真格基金等投资。

萦绕在肖弘身上的还有一个更鲜明的 AI 产品——Monica。

这是一款号称 All-in-One 的 AI 助手,最初以浏览器插件的形式推出。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

通过集成主流大模型(如 Claude 3.5、DeepSeek 等),Monica 提供聊天、翻译、文案处理等功能,用户可通过自然语言创建定制化工具,并共享至工具广场。

Monica 同样是早期以海外市场为主,用户规模破百万,成为 AI 插件领域头部产品。

今年 2 月份,Monica 的中文版(monica.cn)已开启内测,目前免费向国内用户开放。该版本基于DeepSeek R1 和 V3 模型打造,具备深度推理思考能力,并支持记忆功能和实时联网搜索。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

Manus 的技术哲学:less structure more intelligence

Manus 奉行的技术理念与主流也有些不同,是 「less structure more intelligence.」(更少的结构,更多的智能)

他们认为,当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实时,computer use、deep research、coding agent 等能力会自然涌现,无需被设计为特定的产品功能。

作为大力出奇迹的代表之一,GPT-4-Turbo 在 GAIA 公开排行榜上的平均成绩不到 7%,即使是使用复杂多智能体系统的解决方案也仅达到 40%。Manus 的表现可以说是「遥遥领先」。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

创始人肖弘在最近在和张小珺的访谈中,他也提前谈到了当时还未发布的 Agent 产品 Manus 。

「看上去它确实应该就是一个 chatbot,这是很符合大家想象的,同时在应用侧却很复杂,和 Monica 不一样,光用好不同模型就挺复杂。」

肖弘还将目前 AI 应用分为两类:一是填补主要应用产品的空档的不足,二是为特定场景提供独特解决方案的应用,比如 Perplexity (提供联网搜索功能) 和 Monica (浏览器插件形态) 都属于此类,它们填补了现有产品留下的空白。

而模型驱动的新场景这类应用,主要出现在图片和视频领域,直接由模型技术的进步驱动。像 Pika 和 Runway 等产品利用模型能力创造了新的应用场景。

有用户调侃 Manus 是「极致的套壳就是牛逼」,实际上肖弘并不忌讳让用户知道自己的产品用的是别人的模型。早在去年,他就把 Monica 比作消费电子产品,并把 ChatGPT 的 Logo 打在官网。

人机交互新时代已来,但别急着把 Manus 捧上 AGI 神坛

APPSO 在 2024 年年初曾作出一个预测:大模型将成为智能手机新的操作系统,自然用户界面(Natural user interface, NUI )将逐步替代现有的图形用户界面(GUI)。

而实现这种新交互的重要入口,就是 Agent 。

去年我们在很多手机的发布会上都看到类似的案例。 vivo 发布会展示可以 AI 订餐的 「Phone GPT」,华为鸿蒙的小艺和意图框架,还是荣耀的 YOYO 智能体,以及智谱的 AutoGLM,核心都是一样的:

让 AI 模仿人类的 Plan-Do-Check-Act(计划-执行-检查-行动)循环 ,从而像人类那样去操作设备。

智谱 AI CEO 张鹏之前提到,目前的 Agent 能力更像是在用户和应用之间,增加一个智能的调度层,链接所有应用甚至是所有设备。

这可以看做是大模型通用操作系统 LLM-OS的一种雏形,将对人机交互形式产生极大的影响。OpenAI 创始成员、AI 技术大牛 Andrej Karpathy 也曾多次谈到大语言模型操作系统(LLM OS)。

他认为大模型某种程度来说就是一种新的计算机和操作系统,它可以连接各种软件和硬件,以及所有模态信息组成的外设,并通过函数调用执行各种任务。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

传统操作系统中,你需要围绕 CPU 构建一堆外设,比如鼠标和键盘、磁盘存储、以及缓存空间等。

而在 LLM OS 中,大模型本身就是中央处理器。I/O 外设也不再是鼠标和键盘,因为 LLM 可以兼容更多模态的数据输入和输出。同时大模型调用的外部工具也将从传统软件升级为智能体工具。

其中跨应用的操作是非常关键的一环,这意味着 Agent 能实现更加复杂的自主连贯操作,也可能走向真正的商业化落地。至于各家互联网公司提供的服务能否打通,可能是未来实现这种交互最大的障碍。

不过现在很多 AI 助手实现代操作的方式,实际上是调用手机的无障碍功能 (accessibility features) 的权限,来控制屏幕点击。

Manus 的出现,意味着 Agent 模式下的 AI 能够理解需求后独立工作,直到任务完成。这无疑是人机交互领域的一大步,它让我们看到了 AI 从工具向伙伴转变的潜力。

这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

但要说我们已经一只脚迈入了 AGI 大门,也还为时尚早。肖弘自己也提到,早期的 Agent 更像是「功能机」,需要不断迭代和完善。目前的 Agent 仍需依赖于模型能力的提升,以及更完善的虚拟环境支持,才能真正胜任各种长尾任务。

如果类比智能驾驶,大概也相当于从 L2 级升级到 L3 级的辅助驾驶。虽然 Manus 在 GAIA 基准测试中表现出色,但这并不意味着它已具备通用人工智能的全部特征。通往 AGI 的道路依然漫长,需要解决模型能力、自主学习、任务泛化等多重挑战。

但因为有了 Manus 在自主性与通用性上的突破,通往 AGI 的大航海中,又多了一颗照亮我们的星。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

光谷在线 互联网 这个中国叫 Manus 的AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜 https://www.ovzcn.com/news/internet/3239.html

常见问题

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务