#解读

共 6 篇文章

从 Ralph Loop 到 /goal：Codex vs Claude Code

2026/05/20 33 分钟

OpenAI 和 Anthropic 在两周内先后把 /goal 装进了自家 coding agent。本文从状态、判定、控制、预算四个角度对比两家实现的不同。

AI Agent Codex Claude 解读

OpenAI Symphony 解读：用 Issue Tracker 重新定义 Agent 编排

2026/05/04 15 分钟

Issue 不是会话的替代品，是更接近工作本身的工作单元。OpenAI 开源的 Symphony 把 Linear 当编排层，三个月内让部分团队的 PR 增量达到 500%。本文解读它的核心设计、SPEC.md 的思路、以及对软件工程范式的影响。

AI Agent OpenAI Codex 解读

Responses API 的 WebSocket 改造：如何让 Agent 工作流提速 40%

2026/04/24 9 分钟

解读 OpenAI 工程博客的 Responses API WebSocket 设计：为什么 HTTPS 请求会成为瓶颈、WebSocket 持久连接如何消除冗余开销、以及在保持 API 兼容性的同时实现 40% 端到端延迟优化的工程决策。

AI Agent OpenAI 解读

给 Agent 写评估：Anthropic Evals 方法论解读

2026/04/23 19 分钟

解读 Anthropic 工程博客的 Agent 评估方法论：为什么 Agent 比传统软件更难测、三类评分器如何组合、不同 Agent 类型的测试差异，以及从 0 到 1 构建一套可靠 eval 的关键决策。

AI Agent Anthropic 解读

Managed Agents 设计解读：如何让 Agent 系统不被模型迭代淘汰

2026/04/10 12 分钟

解读 Anthropic 工程博客文章，探讨如何通过虚拟化 agent 核心组件（session、harness、sandbox），设计出一个能适应模型能力持续提升的 agent 系统架构。

AI Agent Anthropic 解读

Harness 设计解读：Anthropic 如何让 Agent 自主完成六小时全栈开发

2026/03/27 15 分钟

解读 Anthropic 工程师分享的多 Agent 架构实践：为什么单个 Agent 做不好长任务，如何借鉴 GAN 的思路设计生成-评估分离架构，以及模型变强之后 harness 应该怎么演化。

AI Agent Anthropic 解读