Anthropic Agent新基建入门基础教程(非常详细),收藏这一篇就够了!

张开发
2026/5/27 14:33:17 15 分钟阅读
Anthropic Agent新基建入门基础教程(非常详细),收藏这一篇就够了!
一句话讲清楚Anthropic 于 2026 年 4 月 8 日正式推出 Claude Managed Agents 公开测试版——一套完全托管的 Agent 构建与部署 API 套件通过将 Claude 的大脑控制器逻辑与双手沙箱执行环境解耦让开发者从原型到生产上线的时间从数月压缩到数天。Agent 基础设施的操作系统时刻大模型能力的竞争正在让位于另一个问题谁能让 Agent 安全、可靠地在生产环境中长时间跑起来。构建一个能用的 Agent 并不难难的是让它可以交付给用户。沙箱安全、状态持久化、权限控制、上下文管理、断线恢复、工具调用路由——这些工程细节加起来往往比模型调用本身耗费更多时间。Anthropic 把这些问题打包成了一个产品Claude Managed Agents。它的工程设计思路来自一个经典类比操作系统是如何为尚未被想象到的程序设计的Unix 的答案是把硬件虚拟化成两个稳定抽象——进程和文件。read()不关心底层是 1970 年代的磁盘还是现代 SSD 接口不变实现自由迭代。Claude Managed Agents 借鉴了同样的哲学把 Agent 的各个组件抽象成了稳定接口——Session 会话、 Harness 控制器、 Sandbox 沙箱——接口保持稳定底层实现随着模型能力的提升而自由进化。核心洞察 Harness 里藏着会过时的假设Anthropic 工程团队在长期运行 Agent 的过程中发现了一个反直觉的问题Harness 控制器编码了关于模型能力不足的假设而这些假设会随着模型升级而过时。具体案例 Claude Sonnet 4.5 在上下文窗口接近上限时会出现一种被称为上下文焦虑 Context Anxiety 的行为——它会过早地结束任务。工程团队为此在 Harness 中添加了上下文重置机制。但当相同的 Harness 被应用到 Claude Opus 4.5 时这个行为消失了。重置机制变成了死代码。这背后是 Rich Sutton 著名的 Bitter Lesson 苦涩的教训http://www.incompleteideas.net/IncIdeas/BitterLesson.html基于人类先验知识构建的假设最终会被规模化的学习超越。与其不断修补 Harness 来弥补模型短板不如设计一套足够稳定的接口让 Harness 可以在不破坏上层应用的情况下自由替换。这就是 Managed Agents 架构的出发点。三个核心抽象 Session 、 Harness 、 SandboxManaged Agents 把 Agent 的组件虚拟化成三个核心抽象组件定义设计原则Session 会话所有已发生事件的追加式日志持久化、可查询跨 Harness 存活Harness 控制器调用 Claude 并将工具调用路由到基础设施的循环无状态、可替换Sandbox 沙箱Claude 运行代码和编辑文件的执行环境按需创建用完即弃“We’re opinionated about the shape of these interfaces, not about what runs behind them.”我们对接口的形态有主见对接口背后的实现没有偏见。架构演进从宠物到牛群初代设计的问题最初的架构把 Session 、 Harness 、 Sandbox 全部塞进一个容器——像养宠物 Pet 一样对待每个容器精心维护出问题就手动修复。这带来了一系列工程噩梦•单点故障容器崩溃 整个会话丢失•调试困难 Harness bug 、网络丢包、容器下线的症状完全一样无从区分•安全与调试的矛盾工程师需要进入容器调试但容器里有用户数据•扩展受限客户要求在其 VPC 内运行时必须做网络对等解耦大脑离开沙箱新架构的核心一步Harness 大脑不再驻留在容器内而是通过统一接口调用容器execute(name, input) → string这让容器变成了牛群 Cattle 可替换、可重建。容器死亡 Harness 捕获为工具调用错误返回给 Claude Claude 决定是否重试。新容器通过标准配方按需重建provision({resources})不再需要修复失败的容器直接替换。Harness 本身也成了牛群Harness 同样变成了无状态的 Cattle 。三个关键接口wake(sessionId) // 启动新 HarnessgetSession(id) // 读取事件日志emitEvent(id, event) // 持久化记录事件Harness 崩溃时无需恢复状态——新 Harness 通过wake()唤醒读取 Session 日志从最后一个事件恢复执行。运行期间通过emitEvent()保持事件持久化。会话 ≠ 上下文窗口这是 Managed Agents 最值得关注的设计之一。长时间运行的 Agent 任务经常超出 Claude 的上下文窗口。常见的应对手段——压缩、裁剪、记忆工具——都涉及不可逆决策你在丢弃信息的那一刻并不知道这些信息在未来是否有用。Managed Agents 的 Session 提供了另一种思路将上下文窗口与会话状态彻底分离。Session 是一个存活在上下文窗口之外的持久对象支持按位置切片查询getEvents() // 允许从任意位置读取事件流•从上次停止的位置继续•回退到特定时刻之前的几个事件•在特定操作前重新加载相关上下文谁来管理上下文是 Harness 的事——包括提高 Prompt Cache 命中率的上下文组织策略。 Session 只保证历史记录持久可查。这种关注点分离为未来不同模型的上下文工程需求预留了充足的空间。多大脑、多双手真正的规模化性能的关键跃升解耦之前每个 Agent 需要独占一个容器 TTFT Time-to-First-Token 首 Token 延迟被容器启动时间拖累严重。解耦之后 Harness 不需要容器就能运行容器仅在工具调用时按需创建。实测效果p50 TTFT 下降约 60%p95 TTFT 下降超过 90%任意工具任意配置每个双手都实现同一个接口execute(name, input) → stringHarness 不知道沙箱是容器、手机还是任何其他设备。支持Bash 、文件操作、网页搜索等内置工具任何 MCP 服务器自定义工具没有任何双手与特定大脑耦合大脑之间可以传递双手。安全架构凭证永远不接触模型Prompt Injection 提示注入在 Agent 场景下是严重威胁。原有的耦合架构中 Claude 生成的不可信代码与凭证在同一容器内——攻击者只需说服 Claude 读取自己的环境变量就能获取 Token 并生成任意新会话。Managed Agents 提供了两种凭证隔离模式Auth 捆绑资源模式适用于 Git 操作在沙箱初始化时用 Token 克隆仓库将 Token 写入本地 git remote 配置之后的 push/pull 操作不需要 Claude 接触任何 Token 。Vault 代理模式适用于自定义工具/MCP OAuth Token 存储在安全 Vault 中 Claude 通过专用代理调用工具代理用 Session 关联的 Token 从 Vault 取出凭证调用外部服务。核心原则 Harness 永远不知道任何凭证。API 核心接口一览Managed Agents 目前处于公开测试版所有端点需要携带 Beta 请求头managed-agents-2026-04-01 SDK 会自动设置。四个核心概念概念描述Agent模型、系统提示、工具、 MCP 服务器和技能的集合定义Environment预配置的容器模板包、网络访问等Session在环境中运行的 Agent 实例Events应用与 Agent 之间交换的消息工作流程创建 Agent → 创建 Environment → 启动 Session → 发送事件 → 通过 SSE 接收流式响应。内置工具支持 Bash 、文件操作、网页搜索和 MCP 服务器。定价按消费计费标准 Claude Platform token 费率外加$0.08 / 会话小时活跃运行时间。速率限制创建类端点 60 次/分钟读取类端点 600 次/分钟。谁在用真实的生产验证Anthropic 在发布时同步公布了多个标杆客户的使用情况Notion将 Managed Agents 集成到工作区工程师可以提交代码知识工作者可以生成网站和演示文稿数十个任务可以并行运行。“用户可以委托开放式复杂任务——从编码到生成幻灯片和电子表格——而无需离开 Notion 。”Rakuten在产品、销售、营销和财务领域部署了企业 Agent 集成 Slack 和 Teams 每个专业 Agent 在一周内完成部署。Sentry将调试 Agent Seer 与 Claude 驱动的补丁编写 Agent 配对实现了从标记 Bug 到可审查 PR 的一站式闭环。“客户现在可以从根因分析直接到 Agent 编写修复并打开 PR 。”Atlassian在数周内而非数月构建了直接集成到 Jira 工作流的开发者 Agent 。“Managed Agents 处理了沙箱、会话和范围权限等困难部分这意味着我们的工程师可以花更少时间在基础设施上。”Vibecode用 Managed Agents 作为默认集成用户启动基础设施的速度提升了至少10 倍——“之前可能需要数周或数月现在只需几行代码”。元 Harness 为尚未存在的 Harness 设计接口Anthropic 工程博客中有一段话把这个产品的本质说得很清楚“Managed Agents 是一个元 Harness——对 Claude 未来需要的特定 Harness 没有偏见提供通用接口支持多种 Harness 。”它对接口有主见 Claude 需要操作状态、执行计算。它对实现无偏见不假设大脑或双手的数量和位置。这种设计哲学让它既能支持 Claude Code 通用 Harness 也能支持任务特定 Harness 更能支持尚未被想到的 Harness——就像 Unix 当年为尚未被想象的程序设计了read()和write()一样。Agent 基础设施的操作系统时刻也许就是现在。研究预览功能需申请以下功能目前处于研究预览阶段需要单独申请访问权限•Outcomes 结果定义开发者定义目标和成功标准 Claude 自评估并迭代直到达成•Multi-agent 多代理协调 Agent 可以启动并指挥其他 Agent 以并行化复杂工作•Memory 记忆跨会话的持久记忆能力学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章