记忆与状态
Agent 多轮执行时,除了 当前 LLM 上下文 外,往往还需要 结构化记忆(事实、偏好、任务进度)与 可恢复状态(中断后续跑)。
分层直觉
| 层级 | 内容 | 典型载体 |
|---|---|---|
| 工作记忆 | 本轮 Plan、中间结论、工具原始返回 | 消息列表 / state dict |
| 短期会话记忆 | 多轮用户目标、已确认约束 | 摘要 + 滑动窗口 |
| 长期记忆 | 用户画像、项目事实 | 向量库 + RAG、KV 存储 |
常见问题
- 上下文爆炸:对历史做 滚动摘要 或 按主题检索 再拼进 prompt。
- 陈旧事实:长期记忆需 版本 / TTL / 来源,避免永远记住错误结论。
- 多会话隔离:
session_id/tenant_id做硬隔离,防串台。
与 LangGraph
Checkpoint 可把图状态持久化,支持 人机协同、重试、回溯;详见 LangGraph 与 RAG(用检索当「外部记忆」)。