---
title: "Agent 记忆存储方案深度洞察"
source_url: https://mp.weixin.qq.com/s/v-vSF-VrIIWd2BPSRy_zZA
source: wechat
author: Frank / Q马Q马
published: 2026-06-02
ingested: 2026-06-02
type: raw-archive
tags: [wechat, agent-memory, six-schools, wiki-compile, raw-data, quantumtransf-debate, hermes-agent, mnemon, letta, mem0, mcp]
sha256: 0593729efe13d0d3e3a4ef313d5942dc045d05548cbe3d8f0e21a35903e20aa9
---

# Agent 记忆存储方案深度洞察

> 原文讨论来自 Twitter @QuantumTransf，围绕 ai-memory 项目的 Wiki 编译模式与原始数据直存模式的争论展开。

## 一条推文引发的争论

最近，AI 编码 Agent 的记忆方案在社区引发热议。@QuantumTransf 对 ai-memory 项目提出了尖锐质疑：

> 我没明白为什么要把 agent session 编译成 wiki。原始 session 本来就是结构化数据——messages、tool calls、tool results、files、subagents。直接放进 SQLite，就已经是一个很强的结构。而把它先总结成 markdown page，反而引入了一个不必要的中间实体：信息被压扁，因果链和引用关系要靠后续重建。
> 
> 对 agent 来说，这不应该首先是给人浏览的知识库，而更应该是一个可查询的工作历史数据库。
> 
> "若无必要，勿增实体"

这个质疑触及了 Agent 记忆领域最核心的设计分歧。我们调研了 GitHub 上数十个项目和最新行业实践，以下是完整的技术洞察。

## 当前主流方案全景

| 流派 | 代表项目 | 核心思路 |
|------|---------|---------|
| 向量记忆层 | mem0ai (57K⭐) | 通用记忆层，LLM 提取 + 存储 + 检索事实 |
| Wiki 编译派 | ai-memory (467⭐) | Session → LLM 总结 → Markdown wiki，Git 版本控制 |
| 知识图谱派 | mnemon (322⭐) | 从对话中提取实体关系构建知识图谱 |
| 会话历史派 | Letta/MemGPT | 完整 session 存储，支持 archival recall |
| 原始数据派 | obelisk, Hermes | 原始结构化数据直存 SQLite |
| 仿生记忆派 | Anamnesis | 情景/语义/程序记忆 + 遗忘曲线 |

## 记忆分层模型：行业共识

所有成熟的 Agent 记忆系统，都不约而同地采用了类似人类认知的分层架构：

- **持久记忆层**：
  - **语义记忆**：事实、决策、约定，无衰减，永久保留
  - **程序记忆**：技能、习惯，频率衰减，不常用则淡化
- **工作记忆层**：当前 session 的对话缓冲，session 结束后归档或丢弃

ai-memory 的 M8 策略给出了精确的衰减函数：

```python
score = salience · exp(-λΔt) + σ · log(1+access_count) · exp(-μ · days_since_access)
```

## 核心争论：信息压缩 vs 信息保真

行业正在从"二选一"走向**分层压缩**——**不是选 A 还是选 B，而是保留原始数据的同时，按需生成多个压缩层级**。

| 对比维度 | Wiki 编译模式 | 原始数据直存 |
|---------|--------------|------------|
| 人类可读性 | 极佳，Markdown 可浏览 | 差，需查询工具 |
| 信息保真度 | 有损，LLM 总结会丢失细节 | 无损，保留完整因果链 |
| 跨 Agent 互操作 | 任何能读 Markdown 的 Agent 都能理解 | 需标准化查询协议 |
| 存储成本 | 总结后体积小 | 原始数据量大 |
| 因果链追踪 | 需事后重建 | 天然保留完整时间线 |

## 检索策略演进

Agent 记忆的检索能力经历了五代演进：

1. 关键词搜索（FTS5 / BM25）
2. 向量相似度（embedding + cosine）
3. 混合检索（FTS5 + 向量并行）
4. 知识图谱邻居（图遍历 + 关系推理）
5. **RRF 融合**（当前最佳）

RRF 融合公式：

```python
score = Σ(1 / (k + rank_i))  # k 通常取 60
```

将 FTS5 关键词结果、向量相似度结果、知识图谱邻居结果通过倒数排名融合。这比单一检索方式效果好得多，因为不同检索策略捕捉的是不同的相关性信号。

## 前沿趋势

### 知识图谱记忆

从对话中自动提取实体关系——人物、决策、技术栈、依赖。支持关系推理："这个决策影响了哪些模块？"难点在于提取准确性和图谱维护成本。

### 多 Agent 共享记忆

FlockMem 等探索轻量级本地优先的集体记忆总线，让团队多个 Agent 共享项目上下文，避免每个 Agent 重复学习。

### MCP 成为标准接口

Model Context Protocol 正在成为跨 Agent 记忆的**标准接口层**。ai-memory 提供 14 个 MCP 工具，让任何支持 MCP 的客户端都能查询记忆。这是互操作性的关键一步。

### 零 LLM 模式

ai-memory 支持无 LLM 的 FTS5 搜索 + 规则总结。趋势很明显：LLM 是优化项，不是必需项。基础记忆功能应该不依赖 LLM 就能工作。

## 对 Hermes Agent 的启示

Hermes 当前已经实现了原始数据派的核心能力：

- SQLite 存储完整 session，带 FTS5 搜索
- 轨迹保存

**可能的增强方向**：

- **短期**：增加记忆衰减策略，自动管理旧 session 权重
- **长期**：按需生成 Markdown 摘要层——可选，不替代原始数据

**核心原则**：

> 保留原始结构化数据作为唯一真相源，其他表达层（wiki、图谱、向量）都是可选的派生视图。

## 总结判断

| 维度 | 当前状态 | 未来 1-2 年 |
|------|---------|------------|
| 存储介质 | SQLite + 向量 DB | SQLite 为主，向量可选 |
| 记忆分层 | 3-4 层模型共识 | 更精细的衰减/巩固策略 |
| 互操作性 | MCP 正在崛起 | MCP 成为标准接口 |
| 检索策略 | RRF 融合最佳 | RRF + 图谱推理 + 时间衰减加权 |
| LLM 依赖 | 强依赖 LLM 总结 | 零 LLM 模式 + LLM 增强双轨 |