
Tldr
Claude Managed Agents 是一套托管智能体编排框架:你只需定义 Agent 模板(模型、系统提示词、工具、技能、MCP),框架和基础设施全部由 Anthropic 提供。三个核心概念:Agent(配置)、Environment(沙箱模板)、Session(具体执行)。
简而言之——Claude Managed Agents 是一个预构建、可配置的智能体框架(agent harness),运行在托管基础设施之上。你只需将智能体定义为一个模板——工具、技能、文件/代码仓库等等,框架和基础设施全部为你准备好。整个系统的设计目标,是跟上 Claude 快速增长的智能水平,并支持长周期任务。以下是一些有用的链接:
为什么要做 Claude Managed Agents
Claude 的 Messages API 是直接通往模型的入口:接收消息,返回内容块。基于 Messages API 构建的智能体需要一套框架,将 Claude 的工具调用路由到对应的处理器并管理上下文。这带来了几个挑战:
- 框架需要跟上 Claude 的进化 ——我之前写过一篇博客,聊的是如何利用 Claude API 原语来构建智能体,处理工具编排和上下文管理。但智能体框架中总会编码一些关于”Claude 做不到什么”的假设。随着 Claude 能力不断增强,这些假设逐渐过时,反而成为瓶颈,制约 Claude 的发挥。框架需要持续更新,才能跟上 Claude 的步伐。
- Claude 的运行时间越来越长 ——Claude 的任务时间跨度正在指数级增长,在 METR 基准测试(衡量 AI 智能体自主完成任务能力的基准)上已超过 10 个人类工时。这对智能体周围的基础设施提出了更高要求:安全可靠,能抵御长周期运行中的基础设施故障,并支持规模化扩展(例如扩展到多个智能体团队)。
解决这些挑战至关重要——未来的 Claude 将在数天、数周甚至数月的时间跨度内,持续攻克人类面临的重大挑战。Claude Agent SDK 是第一步,提供了一套出色的通用智能体框架。Claude Managed Agents 则是下一步:一套自带编排框架和托管基础设施的系统,在 Claude 预期的工作时间跨度内提供安全、可靠的执行保障。
如何开始
最简单的上手方式是使用我们开源的 claude-api 技能,在 Claude Code 中开箱即用。安装最新版 Claude Code,运行以下子命令即可完成入门引导。我对技能这种引导新功能的方式非常期待,自己也已经大量使用:
$ claude update
$ claude
/claude-api managed-agents-onboarding也可以参阅我们的文档通过 SDK 或 CLI 快速上手,或者在 Claude Console 中直接进行原型开发。
使用场景
在我们的 Claude 博客上可以看到很多有趣的案例。以下是我在这些案例和自己的实践中观察到的常见模式:
- 事件触发型:某个服务触发 Managed Agent 执行任务。例如,系统标记了一个 bug,Managed Agent 自动编写补丁并提交 PR。从标记到行动,全程无需人工介入。
- 定时调度型:Managed Agent 按计划执行任务。比如我和很多人都用这种模式生成每日简报(例如汇总 X 或 GitHub 的动态,看看一组智能体正在做什么)。下图是我使用的 X 动态每日简报示例。

- 即发即忘型(fire-and-forget):由人类触发 Managed Agent 执行任务。例如通过 Slack 或 Teams 分配任务,然后收到交付物(电子表格、幻灯片、应用程序)。
- 长周期任务:长时间运行的任务是我认为 Managed Agents 特别有价值的领域。我 fork 了 @karpathy 的 auto-research 仓库来探索这个方向,尝试了几种不同的思路。比如最近我把 @_chenglou 出色的 pretext 库拿过来,让一个 Managed Agent 探索如何将它应用到我们的工程博客内容上。
核心概念
上手之前,有三个核心概念需要理解:
- Agent(智能体) —— 一个版本化的配置,承载智能体的身份信息:模型、系统提示词、工具、技能、MCP 服务器等。创建一次,通过 ID 引用。
- Environment(环境) —— 一个模板,描述如何为智能体工具配置运行沙箱——例如运行时类型、网络策略和软件包配置。
- Session(会话) —— 一次有状态的运行,使用预先创建的智能体配置和环境。它从环境模板配置一个全新的沙箱,挂载每次运行所需的资源(文件、GitHub 仓库),并将认证信息存储在安全保险库中(如 MCP 凭证)。
可以这样理解:Agent 是一份配置,Environment 是描述代码执行沙箱的模板,Session 就是每一次具体的执行。一个 Agent 可以有多个 Session。
使用方式
参见文档:
- SDK —— 面向代码:在应用中导入,在运行时驱动会话。六种语言已支持 Managed Agents:Python、TypeScript、Java、Go、Ruby、PHP。
- CLI —— 面向终端:每一个 API 资源(agents、environments、sessions、vaults、skills、files)都暴露为子命令。
- 常见模式 —— CLI 做初始设置,SDK 做运行时调用。Agent 模板是持久化的:创建一次,存储起来(例如存为包含模型、系统提示词、工具、MCP 服务器、技能的 YAML 文件放在 git 中),然后在部署流水线中通过 CLI 应用。
工作原理
我和 @mc_anthropic、@gcemaj、@jkeatn 一起撰写了一篇 Anthropic 工程博客文章,分享了构建 Claude Managed Agents 的过程。我们在文中分享的一个核心心得是:构建能够跟上 Claude 智能增长的智能体,本质上是一个基础设施挑战,而非单纯的框架设计问题。

基于这一认知,我们没有去设计某一种特定的智能体框架——我们预期框架会持续演进。相反,我们将”大脑”(Claude 及其框架)与”双手”(执行操作的沙箱和工具)以及”会话”(会话事件日志)解耦开来。
每一部分都成为一个独立的接口,彼此尽量少做假设,各自可以独立地失败或被替换。我们在文章中分享了这种设计如何赋予系统可靠性、安全性和灵活性——未来可以方便地接入新的框架、沙箱或会话存储基础设施。
总结
我对那些探索多智能体编排或长周期任务的项目充满期待。我之前写过的一个痛点是,让智能体框架跟上模型能力的演进实在太难了。Claude Managed Agents 为你接管了框架和基础设施,让你可以在 Claude API 中以智能体为全新的核心原语,自由探索更多可能。