链接核验：2026-06-11 · Wine & Chord

AI Agent 阅读路线：从上下文到 Harness 的六条机制路径

这不是一份按公司名堆链接的清单。AI Agent 的公开资料已经多到足够让人迷路： OpenAI 讲 Codex、Agents SDK、沙箱和 harness；Anthropic 讲 effective agents、 context engineering、skills、sandboxing 和 managed agents；Cursor 讲 cloud agents、 CursorBench 和产品 harness。真正要读懂的是它们背后的工程边界。

AI Agent 阅读路线封面图：六条机制路径进入 agent loop，再经过 eval 与交付路径输出 — 先把资料放进六条机制路径，再回头看具体模型和产品发布，才不容易被单个 benchmark 或营销词牵着走。

阅读契约

本页回答一个问题：想系统学习 AI Agent，应该先建立哪些工程坐标？读完后，你应该能把一篇资料放进 context、team、runtime、learning、measurement、harness 六条线，并能说明它证明了哪个 contract、暴露了哪个边界、留下了什么可复核证据。

一、实践压力：为什么不能只收藏链接

1.1 真实问题：Agent 失败常常不是“模型不会”

做 coding agent 或业务 agent 时，失败经常发生在模型之外：上下文塞进了过期信息，工具输出没有过滤，沙箱权限过宽，长任务没有 checkpoint， eval 只看最终答案，没有记录轨迹。Anthropic 在 Demystifying evals for AI agents 里强调 agent eval 要覆盖带工具、会修改环境的多轮过程；Cursor 在 harness 迭代复盘里把提示、工具、UI、反馈和训练数据放进同一条产品闭环。它们讨论的不是“再换一个模型”，而是如何让模型处在一个可控系统里。

1.2 六个明确问题

本轮模型真正看见了什么，哪些状态留在外部 artifact 或 memory 里？
什么时候该拆 subagent，拆出去的上下文、工具和输出如何回收？
代码执行、浏览器、文件、网络、凭证和人工确认的边界在哪里？
一次失败后的经验怎样变成 rule、skill、memory 或训练信号，而不是新的噪声？
agent eval 衡量的是一次 answer，还是包含环境、预算、随机性和 $\mathrm{pass@}k$ 的 trajectory 分布？
harness 怎样把 prompt、tools、state machine、checkpoint、review 和 deploy 接成可交付路径？

1.3 主论点：先读边界，再读能力

本文的主论点是：Agent 资料的阅读顺序应该是 public contract first。先看公开 API、文档和产品承诺允许什么，再看实现或论文如何组织机制，最后才比较模型能力。这也是 Building effective agents 的基本气质：优先使用可解释、可组合的 workflow 和 agent 模式，只在任务需要时增加复杂性。

二、心智模型：Agent 是运行系统

2.1 系统清单：模型只是其中一个部件

如果把 agent 只理解成“会调用工具的大模型”，后面的资料会全部糊在一起。更稳的入口是把它写成系统清单：

\mathrm{Agent}=\mathrm{Model}+\mathrm{Context}+\mathrm{Tools}+\mathrm{Runtime}+\mathrm{State}+\mathrm{Policy}+\mathrm{Eval}+\mathrm{Human}

这个式子不是数学定理，而是阅读检查表。OpenAI 的 Agents SDK 文档强调 instructions、tools、handoffs、guardrails 和 tracing；Codex 文档把 AGENTS.md、 sandbox、subagents、skills 放进开发工作流；这些都说明 agent 是模型与运行时的组合。

2.2 ReAct 的边界：经典循环，不是现代产品全图

ReAct 给了一个重要范式：reasoning、action、observation 可以交替推进。但现代产品 agent 还需要沙箱、权限、状态持久化、恢复、评测、人工门禁和交付路径。所以 ReAct 应该作为行动循环的经典论文来读，而不是把所有 tool-using agent 的来源都简化成 ReAct。

2.3 阅读地图：从问题线走到机制线

AI Agent 阅读总览图：六条问题线汇入 agent runtime loop，再经过评测和交付路径输出 — 六条线不是分类标签，而是每篇资料应该回答的工程问题：状态、协作、执行、学习、测量和交付。

三、Provider 与公司契约

Provider 与产品契约图：三条公开契约路径分别约束上下文、运行时、评测和产品反馈 — 先读公开 contract，再解释实现选择；不要从模型名倒推运行时能力。

3.1 OpenAI：Codex、Agents SDK、AGENTS.md 与 sandbox

OpenAI 这条线适合从 Practical guide to building agents 入门，然后接 Agents SDK、 Sandbox Agents 和 Codex changelog。 Coding agent 方向重点看 Codex agent loop、 Codex harness 和 Symphony。它们共同回答：agent loop 怎样被产品化，工具、沙箱、任务编排和验证如何接入工程交付。

3.2 Anthropic：简单模式、context、sandbox、skills 与 managed agents

Anthropic 的工程博客更像一套 runtime 课程。 Building effective agents 先区分 workflow 与 agent； Effective context engineering 讨论 notes、retrieval、tool-result filtering、compaction 和 context reset； Claude Code sandboxing 与 Agent Skills 则把执行边界和可复用经验放到前台。

3.3 Cursor：环境、harness 与真实使用信号

Cursor 的资料更偏产品系统。Cloud agent lessons 把 agent 能力和开发环境、持久执行、会话状态联系起来； Continually improving our agent harness 解释真实反馈如何推动提示、工具和训练数据；CursorBench 则提醒读者，模型质量在产品环境里要看真实编辑轨迹，而不只是离线题分。

四、六条机制路径

4.1 Context：有限工作集怎样装箱

Context 工作集机制图：多类外部状态经过检索、过滤、压缩和重置进入模型可见窗口 — Context engineering 的核心不是塞更多 token，而是决定哪些 token 进入本轮 model-visible view。

读 context 时要分清五类东西：对话历史、任务状态、项目规则、外部知识、工具结果。Anthropic 的 context engineering 文章把它们拆成 notes、retrieval、filtering、compaction、reset； OpenAI Codex 的 AGENTS.md 文档和 Cursor 的 Rules 都说明，长期规则应该可审计、可版本化，而不是每轮临时拼接。

读什么

先读 Anthropic context engineering，再读 MemGPT 的 working memory / archival memory 类比；如果关注 coding agent，再接 Codex loop、AGENTS.md、prompt caching 与 conversation state。

不要误读

不要把 memory、RAG、summary、rules、skills 都叫“上下文越多越好”。它们的风险不同：摘要会偏移，检索会漏召回，规则会污染前缀，工具输出会带来注入。

4.2 Team：什么时候拆 subagent

Team 子智能体边界图：orchestrator 拆出独立工作区，回收 artifact、review 和 verification — Subagent 的价值不是更多聊天，而是上下文隔离、工具隔离和 artifact 回收。

多智能体适合搜索空间宽、资料源分散、角色能力差异明显或需要独立评审的任务。Anthropic 的 multi-agent research system 和 OpenAI Codex 的 subagents 文档都把关键点放在任务边界、上下文隔离和输出回收上，而不是简单增加“代理数量”。

读什么

先读 Anthropic 的 orchestrator-workers / evaluator-optimizer 模式，再读 Codex subagents、Symphony 和 AutoGen、CAMEL、MetaGPT 等早期论文。

不要误读

拆 subagent 不是并行化仪式。没有共享仓库、锁、任务板、测试、日志和合并协议，多 agent 会把通信成本和一致性风险放大。

4.3 Runtime：代码执行与沙箱边界

Runtime 沙箱边界图：执行环境被文件、网络、凭证、资源、审计和人工确认层层约束 — Runtime 是 agent 接触世界的方式；沙箱是它自主行动的边界。

代码执行是 agent 能力的一部分。OpenAI 的 Codex sandboxing 和 Sandbox Agents 讲 provider-managed execution；Anthropic 的 Code execution with MCP 和 Claude Code sandboxing 讲工具、MCP 与本地边界。共同点是：filesystem、network、credentials、resource limits、audit 和 human confirmation 必须显式。

读什么

先读 Codex sandbox 与 Anthropic Claude Code sandboxing，再读 CodeAct 和 OpenHands 这类代码行动论文。

不要误读

沙箱不是容器品牌。容器、VM、OS sandbox、远端 workspace、provider-managed sandbox 都只是实现；真正要审的是可见边界和失败吸收能力。

4.4 Learning：经验怎样沉淀

Learning 闭环图：trace、reflection、rule、skill、memory、eval gate、rollout feedback 和 rollback 形成可验证学习资产 — 反思只有进入可验证资产，才算 learning；否则只是把噪声写得更长。

自进化至少有四层：单次任务里的自我修正，跨任务的记忆与规则，可复用技能库，以及训练数据或模型权重的长期闭环。 Anthropic 的 Agent Skills 和 OpenAI Codex 的 skills 文档都说明，经验要变成有触发条件、依赖、测试和版本边界的资产。

读什么

论文从 Reflexion、Self-Refine、Voyager 读起，再看 Cursor 的 harness 反馈闭环。

不要误读

不要把“写一段反思”当成 self-evolution。没有检索、验证、淘汰、回滚和负反馈处理的反思，会变成新的上下文污染。

4.5 Measurement：评的是轨迹，不是答案

Measurement 轨迹评测图：任务、环境、工具、预算、随机性、人工复核和安全评分共同决定结果 — Agent eval 的单位是 trajectory：任务、环境、工具、预算、随机性和评分器一起进入结果。

Anthropic 的 eval 文章和 infrastructure noise 文章都提醒：同一个模型在不同机器、依赖缓存、网络条件和时间限制下不是同一场考试。 SWE-bench、Terminal-Bench、tau-bench、AgentDojo 这些 benchmark 要和环境、预算、污染、重试策略一起读。报告指标时，不要只写最高分；要写样本数、预算、重试、 $\mathrm{pass@}k$ 、成本、延迟和安全回归。

读什么

先读 Demystifying evals、infrastructure noise 和 CursorBench，再读 SWE-bench、Terminal-Bench、tau-bench、AgentDojo。

不要误读

Leaderboard 是观测入口，不是上线结论。生产 eval 还要覆盖恢复能力、越权、安全、用户体验、成本和人工复核样本。

4.6 Harness：把能力接成交付路径

Harness 交付路径图：任务进入 context builder、policy gate、agent loop、tool router、checkpoint、tests、human gate 和 release — 同一个模型，放进不同 harness，会变成不同 agent。

Harness 是把模型变成可交付系统的运行时层。OpenAI 的 Harness engineering 讨论 AGENTS.md、架构可读性、review loop、merge 和垃圾回收；Cursor 的 harness 文章展示产品如何围绕真实反馈持续改进。 12-Factor Agents 的规则也指向同一件事：应用应该拥有 context、prompts、control flow、state、tools 和 failure gates。

读什么

先读 OpenAI Codex harness、Harness engineering 和 Cursor harness，再用 12-Factor Agents 检查自己的应用是否把控制流外包给黑箱。

不要误读

不要把 harness 当胶水代码。它决定输入怎样组装、工具怎样暴露、状态怎样持久化、失败怎样恢复、结果怎样验证。

五、对照表：把资料放回工程坐标

5.1 四层对照

阅读层	先问什么	代表来源	常见误判
Provider / API contract	公开接口允许什么，哪些只是服务端内部？	OpenAI Agents SDK、Codex docs；Anthropic Claude Code docs；Cursor Rules	把发布新闻里的产品能力当成稳定 API。
Runtime / harness	谁持有状态，谁执行命令，谁审批越界？	Codex loop、Sandbox Agents、Managed Agents、Cursor cloud agents	只比较模型，不比较工具和运行时。
Mechanism / source pattern	context、tools、subagents、skills、evals 在链路中怎样流动？	Context engineering、Agent Skills、Cursor harness、12-Factor Agents	把所有机制都叫 memory 或 prompt。
Measurement / operation	成功率、成本、延迟、安全、恢复和人工复核怎样一起报告？	SWE-bench、Terminal-Bench、tau-bench、AgentDojo、CursorBench	用一次 leaderboard 分数替代上线判断。

5.2 选择规则

一篇资料值得放进这份书单，至少要回答一个可验证问题：状态在哪里、边界在哪里、恢复在哪里、测量在哪里。只展示“多个 agent 互相聊天”的 demo，如果没有环境、协议、验证和回滚，只能算灵感材料，不能算工程资料。

六、常见误读

6.1 六个陷阱

把 agent 等同于 autonomous。 Anthropic 的分类更稳：workflow 与 agent 都是 agentic system，差别在控制流由代码预设还是由 LLM 动态决定。
把 ReAct 当作完整架构。 ReAct 是行动循环的经典论文，不包含现代产品所需的沙箱、权限、状态、恢复、评测和发布路径。
把长上下文当作免维护。 长窗口仍有 attention budget、context rot、缓存、成本和噪声问题。
把 subagent 当作并行聊天。 subagent 的核心是隔离上下文、工具和输出 artifact。
把 sandbox 当成容器品牌。 沙箱是执行边界，具体可以是 OS sandbox、container、VM、remote workspace 或 provider-managed sandbox。
把 self-evolution 当成写总结。 没有验证、版本、回滚和淘汰机制的反思，会变成新的上下文污染。

七、可迁移规则

7.1 八条规则

先确定 agent 的状态边界，再讨论 prompt。
把动态事实放在可替换层，把长期规则放在可审计文件或配置里。
任何 subagent 都必须有输入契约、工具契约、输出 artifact 和合并规则。
沙箱默认收紧文件、网络、凭证和资源；例外通过 approval 或 rule 表达。
把工具输出当成不可信输入处理，保留 receipt 和可复核 trace。
把经验沉淀成 rule、skill 或 eval 前，先写触发条件和反例。
评测报告必须同时写任务分布、环境、预算、重试、成本、延迟和安全边界。
Harness 要允许模型升级，但不要让模型升级改写状态机、权限模型和发布门禁。

八、References

8.1 公司与文档

OpenAI: A practical guide to building agents、Agents SDK、Sandbox Agents、Codex changelog。
OpenAI Codex: Unrolling the Codex agent loop、Unlocking the Codex harness、Harness engineering、Symphony。
OpenAI Codex docs: AGENTS.md、Sandbox、Subagents、Agent Skills。
Anthropic: Building effective agents、Effective context engineering for AI agents、Demystifying evals for AI agents。
Anthropic Claude Code and harness: Claude Code sandboxing、Code execution with MCP、Agent Skills、Managed Agents。
Cursor: What we’ve learned building cloud agents、Continually improving our agent harness、CursorBench、Rules。

AI Agent 阅读路线：从上下文到 Harness 的六条机制路径

一、实践压力：为什么不能只收藏链接

1.1 真实问题：Agent 失败常常不是“模型不会”

1.2 六个明确问题

1.3 主论点：先读边界，再读能力

二、心智模型：Agent 是运行系统

2.1 系统清单：模型只是其中一个部件

2.2 ReAct 的边界：经典循环，不是现代产品全图

2.3 阅读地图：从问题线走到机制线

三、Provider 与公司契约

3.1 OpenAI：Codex、Agents SDK、AGENTS.md 与 sandbox

3.2 Anthropic：简单模式、context、sandbox、skills 与 managed agents

3.3 Cursor：环境、harness 与真实使用信号

四、六条机制路径

4.1 Context：有限工作集怎样装箱

读什么

不要误读

4.2 Team：什么时候拆 subagent

读什么

不要误读

4.3 Runtime：代码执行与沙箱边界

读什么

不要误读

4.4 Learning：经验怎样沉淀

读什么

不要误读

4.5 Measurement：评的是轨迹，不是答案

读什么

不要误读

4.6 Harness：把能力接成交付路径

读什么

不要误读

五、对照表：把资料放回工程坐标

5.1 四层对照

5.2 选择规则

六、常见误读

6.1 六个陷阱

七、可迁移规则

7.1 八条规则

八、References

8.1 公司与文档

8.2 论文与基准