Tldr

Claude Managed Agents 是一套托管智能体编排框架:你只需定义 Agent 模板(模型、系统提示词、工具、技能、MCP),框架和基础设施全部由 Anthropic 提供。三个核心概念:Agent(配置)、Environment(沙箱模板)、Session(具体执行)

简而言之——Claude Managed Agents 是一个预构建、可配置的智能体框架(agent harness),运行在托管基础设施之上。你只需将智能体定义为一个模板——工具、技能、文件/代码仓库等等,框架和基础设施全部为你准备好。整个系统的设计目标,是跟上 Claude 快速增长的智能水平,并支持长周期任务。以下是一些有用的链接:

  • Claude 博客:使用模式和客户案例
  • 工程博客:Claude Managed Agents 的设计思路
  • 文档:入门指南、快速开始、CLI 和 SDK 概览

为什么要做 Claude Managed Agents

Claude 的 Messages API 是直接通往模型的入口:接收消息,返回内容块。基于 Messages API 构建的智能体需要一套框架,将 Claude 的工具调用路由到对应的处理器并管理上下文。这带来了几个挑战:

  • 框架需要跟上 Claude 的进化 ——我之前写过一篇博客,聊的是如何利用 Claude API 原语来构建智能体,处理工具编排和上下文管理。但智能体框架中总会编码一些关于”Claude 做不到什么”的假设。随着 Claude 能力不断增强,这些假设逐渐过时,反而成为瓶颈,制约 Claude 的发挥。框架需要持续更新,才能跟上 Claude 的步伐。
  • Claude 的运行时间越来越长 ——Claude 的任务时间跨度正在指数级增长,在 METR 基准测试(衡量 AI 智能体自主完成任务能力的基准)上已超过 10 个人类工时。这对智能体周围的基础设施提出了更高要求:安全可靠,能抵御长周期运行中的基础设施故障,并支持规模化扩展(例如扩展到多个智能体团队)。

解决这些挑战至关重要——未来的 Claude 将在数天、数周甚至数月的时间跨度内,持续攻克人类面临的重大挑战。Claude Agent SDK 是第一步,提供了一套出色的通用智能体框架。Claude Managed Agents 则是下一步:一套自带编排框架和托管基础设施的系统,在 Claude 预期的工作时间跨度内提供安全、可靠的执行保障。

如何开始

最简单的上手方式是使用我们开源的 claude-api 技能,在 Claude Code 中开箱即用。安装最新版 Claude Code,运行以下子命令即可完成入门引导。我对技能这种引导新功能的方式非常期待,自己也已经大量使用:

$ claude update
$ claude
/claude-api managed-agents-onboarding

也可以参阅我们的文档通过 SDK 或 CLI 快速上手,或者在 Claude Console 中直接进行原型开发。

使用场景

在我们的 Claude 博客上可以看到很多有趣的案例。以下是我在这些案例和自己的实践中观察到的常见模式:

  • 事件触发型:某个服务触发 Managed Agent 执行任务。例如,系统标记了一个 bug,Managed Agent 自动编写补丁并提交 PR。从标记到行动,全程无需人工介入。
  • 定时调度型:Managed Agent 按计划执行任务。比如我和很多人都用这种模式生成每日简报(例如汇总 X 或 GitHub 的动态,看看一组智能体正在做什么)。下图是我使用的 X 动态每日简报示例。

  • 即发即忘型(fire-and-forget):由人类触发 Managed Agent 执行任务。例如通过 Slack 或 Teams 分配任务,然后收到交付物(电子表格、幻灯片、应用程序)。
  • 长周期任务:长时间运行的任务是我认为 Managed Agents 特别有价值的领域。我 fork 了 @karpathy 的 auto-research 仓库来探索这个方向,尝试了几种不同的思路。比如最近我把 @_chenglou 出色的 pretext 库拿过来,让一个 Managed Agent 探索如何将它应用到我们的工程博客内容上。

核心概念

上手之前,有三个核心概念需要理解:

  • Agent(智能体) —— 一个版本化的配置,承载智能体的身份信息:模型、系统提示词、工具、技能、MCP 服务器等。创建一次,通过 ID 引用。
  • Environment(环境) —— 一个模板,描述如何为智能体工具配置运行沙箱——例如运行时类型、网络策略和软件包配置。
  • Session(会话) —— 一次有状态的运行,使用预先创建的智能体配置和环境。它从环境模板配置一个全新的沙箱,挂载每次运行所需的资源(文件、GitHub 仓库),并将认证信息存储在安全保险库中(如 MCP 凭证)。

可以这样理解:Agent 是一份配置,Environment 是描述代码执行沙箱的模板,Session 就是每一次具体的执行。一个 Agent 可以有多个 Session。

使用方式

参见文档

  • SDK —— 面向代码:在应用中导入,在运行时驱动会话。六种语言已支持 Managed Agents:Python、TypeScript、Java、Go、Ruby、PHP。
  • CLI —— 面向终端:每一个 API 资源(agents、environments、sessions、vaults、skills、files)都暴露为子命令。
  • 常见模式 —— CLI 做初始设置,SDK 做运行时调用。Agent 模板是持久化的:创建一次,存储起来(例如存为包含模型、系统提示词、工具、MCP 服务器、技能的 YAML 文件放在 git 中),然后在部署流水线中通过 CLI 应用。

工作原理

我和 @mc_anthropic@gcemaj@jkeatn 一起撰写了一篇 Anthropic 工程博客文章,分享了构建 Claude Managed Agents 的过程。我们在文中分享的一个核心心得是:构建能够跟上 Claude 智能增长的智能体,本质上是一个基础设施挑战,而非单纯的框架设计问题。

基于这一认知,我们没有去设计某一种特定的智能体框架——我们预期框架会持续演进。相反,我们将”大脑”(Claude 及其框架)与”双手”(执行操作的沙箱和工具)以及”会话”(会话事件日志)解耦开来。

每一部分都成为一个独立的接口,彼此尽量少做假设,各自可以独立地失败或被替换。我们在文章中分享了这种设计如何赋予系统可靠性、安全性和灵活性——未来可以方便地接入新的框架、沙箱或会话存储基础设施。

总结

我对那些探索多智能体编排或长周期任务的项目充满期待。我之前写过的一个痛点是,让智能体框架跟上模型能力的演进实在太难了。Claude Managed Agents 为你接管了框架和基础设施,让你可以在 Claude API 中以智能体为全新的核心原语,自由探索更多可能。

相关笔记