A Course on Building Agents

学会设计工程化一个 AI Agent

从能力设计到生产交付,一门问题驱动的 AI Agent 工程公开课。两条主线:把 Agent 当产品来设计,把 Agent 当系统来交付。

AAgent 产品与能力设计6 讲

以 L3 五维能力为主轴,技术地基五层做底座。讲「怎么设计与评估一个 Agent」。

BAgent 工程地基6 讲

Harness、Gateway、上下文工程、评测、框架选型。讲「怎么让 Agent 可靠地跑起来」。

CHarness 工程7 讲

让 Agent 可靠地跑完长任务的工程方法论。以 walkinglabs《Harness Engineering》为骨架,融合一套真实项目里跑出来的实战做法。

DAgent 设计模式(21 式)5 讲

Google《Agentic Design Patterns》21 个核心模式的中文精炼。一本「遇到这类问题用哪个套路」的模式食谱,补全前三个模块的盲区。

EContext Engineering 上下文工程7 讲

模型每轮实际看到的上下文怎么拼、怎么省、怎么验。以 7 层次为主轴,把 CE 从「读过方法论」练成「能拆、能埋点、能算账」。

第 0 讲

为什么模型这一轮看到的,从来不是你写的那段 prompt

模型每轮收到的上下文,是框架替你拼出来的一整坨;先让七层 100% 可见,才谈得上优化。

第 1 讲

为什么你读到的那份 prompt 文件,常常不是模型真正收到的 system

一条 system message 往往由多源拼成;规则该写文件还是写代码,看作用域、优先级、健壮性三连。

第 2 讲

为什么模型这一轮的输出,不该让它「既要念又要解析」

一段输出该说人话还是吐 JSON,唯一判据是「给谁消费」;工具该 eager 还是 deferred,看延迟红线乘以 tool 数量。

第 3 讲

为什么记忆「注进去了」,模型却用错了

记忆该不该注、注多少、注错了怎么办——七维透镜做决策,三层分工避免重复灌,相反本能让你别把记忆当圣旨。

第 4 讲

为什么对话历史会在你看不见的地方悄悄涨到爆

对话历史每轮在悄悄变长,多半是框架替你托管的,代码里看不见——只有实测增长曲线才照得出它离上限多远。

第 5 讲

为什么静态前缀打了 cache 标记,还是每轮重新付费

cache 是前缀逐字节匹配,差一字节后面全废;打标记不等于缓存,先数 token 过没过模型阈值。

第 6 讲

为什么你说的「优化生效了」,不拿日志根本没人信

cache 命中、上下文瘦身、压缩生效——每一句声称都得能用 usage 日志还原;没观测的优化只是玄学。

实战示例3 篇

用框架拆解真实 Agent 产品