记忆与状态

→ 返回 AI Agent

Agent 多轮执行时，除了 当前 LLM 上下文 外，往往还需要 结构化记忆（事实、偏好、任务进度）与 可恢复状态（中断后续跑）。

分层直觉

层级	内容	典型载体
工作记忆	本轮 Plan、中间结论、工具原始返回	消息列表 / state dict
短期会话记忆	多轮用户目标、已确认约束	摘要 + 滑动窗口
长期记忆	用户画像、项目事实	向量库 + RAG、KV 存储

常见问题

上下文爆炸：对历史做 滚动摘要 或 按主题检索 再拼进 prompt。
陈旧事实：长期记忆需 版本 / TTL / 来源，避免永远记住错误结论。
多会话隔离：session_id / tenant_id 做硬隔离，防串台。

与 LangGraph

Checkpoint 可把图状态持久化，支持 人机协同、重试、回溯；详见 LangGraph 与 RAG（用检索当「外部记忆」）。

相关文档