持久化 (Persistence)

持久化是 LangGraph 一切高级能力的基石。没有持久化，就没有中断恢复、时间旅行、记忆系统和容错能力。

前端类比：先建立直觉

如果你是前端开发者，可以这样快速映射：

前端概念	LangGraph 概念	说明
`sessionStorage`	Thread	一次会话的隔离上下文
`localStorage`	Memory Store	跨会话的持久数据
Redux persist + snapshot	Checkpoint	每一步的完整状态快照
Redux DevTools	`get_state_history`	可以回溯任意历史状态

LangGraph 原生语义：持久化层由 Checkpointer（负责 checkpoint 读写）和 Store（负责跨线程长期记忆）两个组件共同构成。Checkpointer 在每个 superstep（超步）结束后自动写入 checkpoint，Store 则按 namespace 组织的 key-value 对提供长期存储。

🔗 Persistence 官方概念文档

0. 核心概念区分（必须搞清楚）

必须深刻理解，不能跳过：以下概念经常被混淆，但它们的职责完全不同。混淆它们是持久化设计最常见的问题来源。

概念	职责	生命周期	前端类比
Checkpoint	某个 thread 在某个 superstep 的完整状态快照	随 thread 存在	Redux 的 state snapshot
Checkpointer	checkpoint 的读写引擎（InMemory/SQLite/Postgres）	随进程存在	Redux persist 的 storage engine
thread_id	一次会话的唯一标识，所有 checkpoint 归属于它	业务控制	sessionStorage 的 session key
Store	跨线程的长期 key-value 存储（用户偏好、知识积累）	持久	localStorage / IndexedDB
业务数据库	你的应用自己的数据库（订单、用户、业务数据）	持久	你的 REST API 后端数据库

关键区分：

Checkpoint vs Store：Checkpoint 是 thread 内的短期状态快照（会话级），Store 是跨 thread 的长期记忆（持久级）。不要把业务数据塞进 checkpoint，也不要把对话上下文塞进 Store。
Store vs 业务数据库：Store 是 LangGraph 管理的记忆存储，不是你的业务数据库。订单数据放业务数据库，用户偏好放 Store，对话上下文放 checkpoint。
短期线程状态 vs 长期记忆：同一 thread 的多轮对话上下文 = 短期（checkpoint 中）；跨 thread 的用户画像/知识积累 = 长期（Store 中）。

1. Threads（线程）

什么是 Thread

Thread 是 LangGraph 中一次独立会话的标识。每个 thread 拥有自己的 checkpoint 序列，彼此完全隔离。

python

# 通过 configurable 中的 thread_id 区分不同会话
config_user_a = {"configurable": {"thread_id": "user-a-session-1"}}
config_user_b = {"configurable": {"thread_id": "user-b-session-1"}}

# 同一个编译好的 graph，不同 thread 完全独立
graph.invoke({"messages": [{"role": "user", "content": "你好"}]}, config_user_a)
graph.invoke({"messages": [{"role": "user", "content": "hello"}]}, config_user_b)

前端类比

Thread 类似于前端中给每个用户创建独立的 sessionStorage 命名空间。每个 thread_id 就像一个独立的浏览器标签页--标签页之间互不干扰。

LangGraph 原生语义：thread_id 是字符串类型的唯一标识符，通常由业务层生成（如 UUID）。它作为 configurable 的一部分传入 invoke / stream 调用。所有 checkpoint 都归属于某个 thread。

生产建议

python

import uuid

def create_thread_config(user_id: str, session_id: str | None = None):
    """为每个用户会话创建稳定的 thread 配置"""
    tid = session_id or f"{user_id}-{uuid.uuid4().hex[:8]}"
    return {"configurable": {"thread_id": tid}}

2. Checkpoints（检查点）

核心概念

Checkpoint 是某个 thread 在某个执行步骤的完整状态快照。LangGraph 在每个 superstep 结束后自动创建 checkpoint。

每个 checkpoint 包含：

state：该时刻的完整状态数据
metadata：执行元信息（来源节点、步骤号等）
checkpoint_id：唯一标识符
parent_config：指向前一个 checkpoint 的引用（形成链表）

四大操作

`get_state` - 查看当前状态

python

from langgraph.graph import StateGraph, START, END
from langgraph.checkpoint.memory import InMemorySaver
from typing import Annotated, TypedDict
from operator import add

class State(TypedDict):
    foo: str
    bar: Annotated[list[str], add]

def node_a(state: State):
    return {"foo": "a", "bar": ["a"]}

def node_b(state: State):
    return {"foo": "b", "bar": ["b"]}

workflow = StateGraph(State)
workflow.add_node(node_a)
workflow.add_node(node_b)
workflow.add_edge(START, "node_a")
workflow.add_edge("node_a", "node_b")
workflow.add_edge("node_b", END)

checkpointer = InMemorySaver()
graph = workflow.compile(checkpointer=checkpointer)

config = {"configurable": {"thread_id": "demo-1"}}
graph.invoke({"foo": "", "bar": []}, config)

# 查看最新状态
snapshot = graph.get_state(config)
print(snapshot.values)   # {'foo': 'b', 'bar': ['a', 'b']}
print(snapshot.next)     # () - 已执行完毕

`get_state_history` - 查看历史轨迹

python

# 遍历所有历史 checkpoint（从新到旧）
for state in graph.get_state_history(config):
    print(f"Step {state.metadata.get('step')}: {state.values}")
    print(f"  checkpoint_id: {state.config['configurable']['checkpoint_id']}")
    print(f"  next nodes: {state.next}")
    print()

这就像 Redux DevTools 中的 action 历史列表--你能看到每一步状态是如何变化的。

`replay` - 回放执行

python

# 从特定 checkpoint 回放
target_config = {
    "configurable": {
        "thread_id": "demo-1",
        "checkpoint_id": "0c62ca34-ac19-445d-bbb0-5b4984975b2a"
    }
}

# LangGraph 会智能地：
# 1. 重用已执行过的 checkpoint（不重新计算）
# 2. 从该 checkpoint 之后继续执行
result = graph.invoke(None, config=target_config)

`update_state` - 修改状态并分叉

python

# 在指定 checkpoint 上注入修改，创建新的分支
graph.update_state(
    config,
    values={"foo": "manually_fixed"},
    as_node="node_a"  # 伪装成某个节点的输出
)

# 此时 get_state 会返回修改后的新状态
# 后续 invoke 会从这个修改点继续执行

前端类比：这等价于在 Redux DevTools 中手动 dispatch 一个 action 修改 state，然后让应用从修改后的 state 继续运行。

3. Memory Store

基础概念

Memory Store 是 LangGraph 提供的跨线程持久化存储。如果说 Checkpoint 是"一次会话内的状态快照"，那 Store 就是"跨会话的长期记忆数据库"。🔗 Memory Store API 参考

前端类比：Checkpoint 相当于 sessionStorage（会话级），Store 相当于 IndexedDB（持久级）。

基础用法

python

from langgraph.store.memory import InMemoryStore

# 创建 store 实例
store = InMemoryStore()

# 写入数据：namespace 是元组，key 是字符串
store.put(
    namespace=("users", "alice"),
    key="preferences",
    value={"theme": "dark", "language": "zh-CN"}
)

# 读取数据
item = store.get(namespace=("users", "alice"), key="preferences")
print(item.value)  # {"theme": "dark", "language": "zh-CN"}

# 搜索 namespace 下的所有 key
items = store.search(namespace=("users", "alice"))
for item in items:
    print(f"{item.key}: {item.value}")

语义搜索

Store 支持基于向量的语义搜索，适合存储和检索非结构化记忆：

python

from langgraph.store.memory import InMemoryStore

# 配置嵌入模型以启用语义搜索
store = InMemoryStore(
    index={
        "embed": "openai:text-embedding-3-small",
        "dims": 1536,
        "fields": ["text"],  # 对哪些字段建索引
    }
)

# 存入记忆
store.put(("memories", "alice"), "mem-1", {"text": "我喜欢用 TypeScript 开发"})
store.put(("memories", "alice"), "mem-2", {"text": "我最近在学习 LangGraph"})
store.put(("memories", "alice"), "mem-3", {"text": "我家有一只猫叫小橘"})

# 语义搜索
results = store.search(
    namespace=("memories", "alice"),
    query="编程语言偏好",
    limit=2
)
for r in results:
    print(f"[score={r.score:.2f}] {r.value['text']}")
# 输出可能：
# [score=0.89] 我喜欢用 TypeScript 开发
# [score=0.72] 我最近在学习 LangGraph

在 LangGraph 节点中使用 Store

在节点中通过 store: BaseStore 参数注入访问 Store（推荐方式）：

python

from langgraph.graph import StateGraph, MessagesState, START, END
from langgraph.checkpoint.memory import InMemorySaver
from langgraph.store.memory import InMemoryStore
from langgraph.store.base import BaseStore

store = InMemoryStore()
checkpointer = InMemorySaver()

def save_memory(state: MessagesState, store: BaseStore):
    """节点内通过 store 参数访问长期记忆"""
    last_msg = state["messages"][-1]
    store.put(
        namespace=("conversation_facts",),
        key=f"fact-{len(state['messages'])}",
        value={"content": last_msg.content}
    )
    return state

def retrieve_memory(state: MessagesState, store: BaseStore):
    """节点内检索长期记忆"""
    facts = store.search(namespace=("conversation_facts",), limit=5)
    context = "\n".join(f.value["content"] for f in facts)
    # 将记忆注入到后续处理...
    return state

builder = StateGraph(MessagesState)
builder.add_node(retrieve_memory)
builder.add_node(save_memory)
builder.add_edge(START, "retrieve_memory")
builder.add_edge("retrieve_memory", "save_memory")
builder.add_edge("save_memory", END)

# 同时传入 checkpointer 和 store
graph = builder.compile(checkpointer=checkpointer, store=store)

节点注入方式：在节点函数签名中声明 store: BaseStore 参数，LangGraph 运行时自动注入。这是官方推荐的标准方式。

4. Checkpointer 库

LangGraph 提供多个 Checkpointer 实现，选择取决于你的环境：

InMemorySaver - 开发/测试

python

from langgraph.checkpoint.memory import InMemorySaver

checkpointer = InMemorySaver()
graph = workflow.compile(checkpointer=checkpointer)

进程结束即丢失
零外部依赖
适合本地开发和单元测试

SqliteSaver - 单机持久化

python

import sqlite3
from langgraph.checkpoint.sqlite import SqliteSaver

# 基础用法
conn = sqlite3.connect("checkpoints.db")
checkpointer = SqliteSaver(conn)
graph = workflow.compile(checkpointer=checkpointer)

适合小规模服务 / 单体应用
需要 pip install langgraph-checkpoint-sqlite

PostgresSaver - 生产推荐

python

import os
from langgraph.checkpoint.postgres import PostgresSaver

DB_URI = os.environ["DATABASE_URL"]

# 同步用法：from_conn_string 上下文管理器 + .setup()
with PostgresSaver.from_conn_string(DB_URI) as checkpointer:
    # 首次使用时调用 .setup() 创建数据库表
    checkpointer.setup()
    graph = workflow.compile(checkpointer=checkpointer)
    # ...使用 graph

# 异步用法
from langgraph.checkpoint.postgres.aio import AsyncPostgresSaver

async with AsyncPostgresSaver.from_conn_string(DB_URI) as checkpointer:
    checkpointer.setup()  # 首次也需要 setup
    graph = workflow.compile(checkpointer=checkpointer)
    # ...使用 graph

需要 pip install langgraph-checkpoint-postgres
支持连接池、并发读写
生产环境首选
首次使用必须调用 .setup() 创建数据库表结构

安全：LANGGRAPH_STRICT_MSGPACK

Checkpointer 在反序列化 checkpoint 时可能执行任意代码。生产环境中，务必启用严格反序列化模式：

bash

# 在环境变量中设置
export LANGGRAPH_STRICT_MSGPACK=true

这会限制 msgpack 反序列化只允许已知的安全模块，防止恶意 checkpoint 数据执行任意代码。详见 langgraph-checkpoint 安全说明。

选型对照表

Checkpointer	持久性	并发	适用场景
`InMemorySaver`	无	单进程	开发/测试
`SqliteSaver`	文件级	单进程	小规模/单体
`PostgresSaver`	数据库级	多进程	生产环境

5. Checkpointer 接口

自定义 Checkpointer 接口

如果内置实现不满足需求，可以实现 BaseCheckpointSaver 接口：

python

from langgraph.checkpoint.base import BaseCheckpointSaver

class MyCustomCheckpointer(BaseCheckpointSaver):
    """自定义 checkpointer 需要实现以下方法"""

    def get_tuple(self, config):
        """根据 config 获取 checkpoint 元组"""
        ...

    def put(self, config, checkpoint, metadata, new_versions):
        """写入 checkpoint"""
        ...

    def list(self, config, *, filter=None, before=None, limit=None):
        """列出 checkpoint 历史"""
        ...

    def put_writes(self, config, writes, task_id):
        """写入中间写操作（用于 pending writes）"""
        ...

    def delete_thread(self, config):
        """删除 thread 的所有 checkpoint"""
        ...

    def get_next_version(self, current, channel):
        """获取 channel 的下一个版本号"""
        ...

需进一步核实

本页早期版本曾展示 EncryptedSerializer（from langgraph.checkpoint.serde.encrypted import EncryptedSerializer）和 Runtime[AppContext] 注入 / context_schema= 在 StateGraph 上的用法。这些 API 在当前官方文档（docs.langchain.com）中未作为主线推荐，可靠性需进一步核实。如果你需要加密 checkpoint 或 context_schema 能力，请先查阅最新官方文档和 API Reference 确认可用性，不要直接使用本页示例。

6. 持久化支撑的能力全景

Human-in-the-Loop (HITL)

持久化使得 interrupt() 可以暂停执行--因为当前状态被保存在 checkpoint 中，用户审批后可以用 Command(resume=...) 恢复执行。没有持久化，中断后状态就丢失了。

Memory

短期记忆：自动存储在 checkpoint 中（同一 thread 的多轮对话上下文）
长期记忆：存储在 Store 中（跨 thread 的用户偏好、知识积累）

Time Travel

因为每一步都有 checkpoint，你可以：

回溯到任意历史步骤查看当时的状态
从历史步骤创建新的分支（fork）
修改某个历史状态后重新执行

容错

如果进程崩溃或 LLM 调用超时，只要有 checkpoint，就能从最后成功的步骤恢复执行，而不需要从头开始。详见容错与控制。

7. Checkpoint 生命周期

要点回顾

概念	一句话
Thread	一次会话的唯一标识，所有 checkpoint 归属于它
Checkpoint	superstep 结束时的完整状态快照（短期状态）
Store	跨 thread 的长期 key-value 存储（长期记忆）
Checkpointer	checkpoint 的读写引擎，可选内存/SQLite/Postgres
thread_id	会话隔离标识，业务层生成
业务数据库	你的应用自己的数据库，与 LangGraph 持久化层分开
LANGGRAPH_STRICT_MSGPACK	安全选项，限制反序列化范围

先修与下一步

先修：快速开始 | Graph API 基础
下一步：Durable Execution | Interrupts (HITL) | Time Travel | Memory 记忆系统 | 容错与控制

持久化 (Persistence) ​

前端类比：先建立直觉 ​

0. 核心概念区分（必须搞清楚） ​

1. Threads（线程） ​

什么是 Thread ​

前端类比 ​

生产建议 ​

2. Checkpoints（检查点） ​

核心概念 ​

四大操作 ​

get_state - 查看当前状态 ​

get_state_history - 查看历史轨迹 ​

replay - 回放执行 ​

update_state - 修改状态并分叉 ​

3. Memory Store ​

基础概念 ​

基础用法 ​

语义搜索 ​

在 LangGraph 节点中使用 Store ​

4. Checkpointer 库 ​

InMemorySaver - 开发/测试 ​

SqliteSaver - 单机持久化 ​

PostgresSaver - 生产推荐 ​

安全：LANGGRAPH_STRICT_MSGPACK ​

选型对照表 ​

5. Checkpointer 接口 ​

自定义 Checkpointer 接口 ​

6. 持久化支撑的能力全景 ​

Human-in-the-Loop (HITL) ​

Memory ​

Time Travel ​

容错 ​

7. Checkpoint 生命周期 ​

要点回顾 ​

先修与下一步 ​

持久化 (Persistence)

前端类比：先建立直觉

0. 核心概念区分（必须搞清楚）

1. Threads（线程）

什么是 Thread

前端类比

生产建议

2. Checkpoints（检查点）

核心概念

四大操作

`get_state` - 查看当前状态

`get_state_history` - 查看历史轨迹

`replay` - 回放执行

`update_state` - 修改状态并分叉

3. Memory Store

基础概念

基础用法

语义搜索

在 LangGraph 节点中使用 Store

4. Checkpointer 库

InMemorySaver - 开发/测试

SqliteSaver - 单机持久化

PostgresSaver - 生产推荐

安全：LANGGRAPH_STRICT_MSGPACK

选型对照表

5. Checkpointer 接口

自定义 Checkpointer 接口

6. 持久化支撑的能力全景

Human-in-the-Loop (HITL)

Memory

Time Travel

容错

7. Checkpoint 生命周期

要点回顾

先修与下一步