--- title: karpathy-llm-wiki-v2-2026 source_url: https://mp.weixin.qq.com/s/D1-sKka_lm58FTi_F8xuow publish_date: 2026-05-07 tags: [wechat, article, openai, gpt, rag, llm] review_value: 7 review_confidence: 7 review_recommendation: neutral sha256: 247ec24a4cfd024aea78a56d363e29ead0f6ae912fb6ba3284197c2e28152ec6 --- 你用AI处理过的知识,为什么全都"留不下"?先说个场景,你肯定不陌生。拿到一篇几十页的行业报告,丢给 ChatGPT,让它帮你提炼要点。聊了二十分钟,观点梳理得清清楚楚,甚至还有自己的分析。你满意地关掉对话框。第二天,想引用其中一个数据点。打开新的对话窗口,重新上传报告,重新提问——一切从头来过。上周聊过的那个精彩洞察?没了。上个月让 AI 帮你对比过的那三篇论文?也得重新来。这个问题困扰我很久了。直到上个月,Karpathy 发了一条长推,把这件事讲透了。 从"临时搜一搜"到"持续积累"的转变 一、问题的根源:你让AI当搜索引擎用了 目前绝大多数人用AI处理文档的方式,本质上都是RAG——不管你知不知道这个词。RAG(Retrieval-Augmented Generation)翻译成人话就是:你扔一堆文件进去,AI 每次提问时从文件里翻找相关片段,然后拼个答案给你。ChatGPT 的文件上传是 RAG,Google 的 NotebookLM 是 RAG,企业里搭的大部分知识库方案也是 RAG。能用吗?能用。但有个要命的问题——知识没积累。 二、Karpathy 的思路:别搜了,让AI帮你"编"一套百科全书 Andrej Karpathy——OpenAI 联合创始成员、前特斯拉 AI 总监——给了一个完全不同的思路。他说的其实很简单:与其让 AI 每次临时翻书找答案,不如让它像一位全职的百科全书编辑,持续地阅读你喂给它的资料,提炼、整合、交叉引用,维护一部专属于你的知识库。这个方案叫 LLM Wiki。消息出来 48 小时,GitHub 星标破了 5000。 三层结构 整个系统分成三层,说白了就是三个文件夹: - 底层:原始资料库——你收集的论文、报告、文章、笔记,原封不动放在那里。AI 只读不改,这些文件是你的"原件"。 - 中层:Wiki 知识库——AI 帮你生成的结构化笔记。摘要、概念解释、人物档案、对比分析、时间线,全部用 Markdown 写好,互相链接。这一层 AI 全权负责写和维护,你只管看。 - 顶层:规则配置——一份"操作手册",告诉 AI 你的 Wiki 该怎么组织、用什么格式、更新时该遵守什么流程。 日常就三件事 搭好这三层之后,你日常只需要做三个动作: - 喂资料:扔一篇新论文给 AI,它会读完,跟你讨论要点,然后自动在 Wiki 里新建摘要页、更新相关概念页、补充交叉引用。一篇资料进来,可能触发十几个页面的更新。 - 提问:直接对着 Wiki 问。AI 不用再去翻原始文档了,因为关键信息已经被编译好了。更重要的是,好的答案本身也会被存进 Wiki。你让它做的一次对比分析、你发现的一个关联,全都会沉淀下来。这就是"复利效应"——你的每次提问都在让知识库变得更丰富。 - 体检:定期让 AI 给 Wiki 做一次"健康检查":有没有自相矛盾的页面?有没有过时的结论?有没有创建了但没人链接的"孤岛"页面?有没有重要概念还没建专页? 听起来不就是 Obsidian + AI 吗?形式上有点像,但本质区别在于**"谁来维护"**。你自己用 Obsidian 建知识库,维护负担会随着页面数量指数增长——更新链接、保持摘要最新、标注矛盾——这些都是让人崩溃的苦力活。Karpathy 方案的核心是:这些活全部交给 AI。你只管选材料、问问题、做判断。 三、V2 来了:不只是"记住更多",而是学会"遗忘" V1 火了之后,大量开发者开始实战。很快,一个真实的问题浮出水面——知识库越大,噪音越多。V2 的五个核心升级方向: 升级一:每条知识都有了"保质期" V2 给每条知识打了一个"置信度分数",根据三个因素动态调整:这信息从哪儿来的?有多少独立来源佐证了这个结论?这信息多久了?越新的信息初始分数越高,但经典理论衰减极慢。 升级二:模仿人脑的四层记忆 V2 把知识分成了四层,完全对标人类大脑的记忆机制: - 层级人脑类比系统里是什么留存策略工作记忆你正在读的这句话当前对话的即时上下文会话结束即释放情节记忆昨天午饭吃了什么压缩后的对话摘要定期压缩归档语义记忆你知道水在100度沸腾核心事实和知识节点长期保留程序记忆你会骑自行车沉淀的分析模板和工作流几乎永久 升级三:知识之间有了"关系标签" V2 引入了带类型的关系。系统能记录"A 导致了 B"、"C 与 D 存在方法论冲突"、"E 是 F 的改进版本"这种语义关系。通过关系链路去探索,AI 能发现关键词搜索根本碰不到的隐藏关联。 升级四:三种搜索一起上 BM25 关键词搜索 + 向量语义搜索 + 图谱遍历,三路结果综合排序。 升级五:AI 自己管理知识库 - 自动遗忘:长期没人提、没被引用的知识条目会慢慢降权。但不同类型衰减速度不一样——架构决策衰减很慢(影响深远),临时 bug 记录衰减很快(很快就修好了或被替代了)。 - 自动维护:设好规则之后,系统会自动从指定信息源抓取新内容、自动压缩过长的对话记录、定时清理冗余页面。 - 智能调解:当新信息和旧知识打起来的时候,AI 不再只是冷冰冰地标注"此处存在冲突",而是主动分析两边的权威度和时效性,给你一个倾向性建议。 实践者都在怎么用? LLM Wiki 发布不到一个月,已经有不少值得一试的实现方案: - OpenKB——能处理长文档和图片,适合做研究型知识库 - Sage-Wiki——Go 语言写的,一个二进制文件就能跑 - Obsidian 插件版——直接在 Obsidian 里用 - Axiom Wiki——命令行爱好者的选择 一个有意思的现象:很多实践者不约而同地提到了同一个感受:"查询输出归档回 Wiki 的那一刻,知识库才真正开始复利增长。" 说点更本质的东西: 人脑的聪明之处,恰恰在于它知道该忘记什么。V2 的置信度评分和分层记忆,本质上就是在用工程手段复刻这个过程。 Karpathy 在原文里还提到了一个细节:1945 年万尼瓦尔·布什的一篇论文,构想了 Memex,一个能自动关联所有知识条目的私人知识机器。布什想了这个东西 80 年,一直没实现。不是技术做不到,而是没人愿意当那个"维护员"。现在 AI 愿意了。它不会烦,不会忘,不会因为维护了 200 个页面的交叉引用就辞职。