--- title: "从Prompt、Context到Harness,工程的三次进化与终局之战" authors: - 李伟山 platform: 高可用架构 url: https://mp.weixin.qq.com/s/1lqMtE3HjXkbNlPDYhgXyw original_title: "从Prompt、Context到Harness,工程的三次进化与终局之战" source: prompt-context-harness-three-evolutions-tencent cover: [] tags: - Prompt Engineering - Context Engineering - Harness Engineering - RAG - CLAUDE.md - AI Engineering - 工程范式 - 腾讯云开发者 publish_date: 2026-05-27 updated_date: 2026-05-27 score: 49 scored_by: MiniMax-M2.7 v: 7 c: 7 sha256: c96dcba7544472b5887c0ee3b00b4d8a295dc786918b99389e7009d95bcef11a --- # 从Prompt、Context到Harness,工程的三次进化与终局之战 ## 引言 OpenAI 内部 3-7 人小团队,在五个月内让 AI 生成了将近 100 万行生产级别代码。全程没有一个工程师亲手写过一行业务逻辑代码。 三个关键概念:Prompt Engineering、Context Engineering、Harness Engineering。 ## 第一进化:Prompt Engineering ### 核心本质 LLM 底层逻辑是一个极其擅长续写的系统。给它一段输入,它预测接下来最有可能出现的内容,不断生成,直到任务完成。**最有可能出现 ≠ 你真正想要的**。加约束的过程就是 Prompt Engineering。 ### 武器库 GPT 早期炙手可热的技巧:Few-shot、Chain-of-Thought、Role Prompting、Output Formatting 等。 ### 繁荣与衰退 GPT-3 时代需要精心设计的少样本提示才能完成稍复杂任务。GPT-4/Claude 3 时代,模型语言理解能力足够强后,写好 Prompt 的边际效益显著降低。 更深层问题浮现:即使模型听懂了你的话,它依然可能给出错误答案——因为它根本不知道一些关键信息,这就是上下文。 ## 第二进化:Context Engineering ### 核心比喻:失忆症患者困境 思想实验:雇一位全世界最聪明的助理,但记忆只有 7 秒。每次会面重新从零开始。你会在每次见面前把关键信息整理成一份简报递给他。 **这个准备简报的过程,就是 Context Engineering。** LLM 本质就是这位金鱼助理——每次对话,能看到的信息被严格限制在上下文窗口(Context Window)之内,窗口外的一切它一无所知。 ### 上下文窗口的层次 一个完整的 LLM 上下文通常包含: - System Prompt - User Context - Retrieval Context (RAG) - Conversation History 每层都至关重要,却又都在争夺有限的 Token 空间。 ### RAG:让模型按需取用知识 传统做法把所有知识写进 System Prompt → 空间爆满,模型不知道看哪里,输出质量反而下降。 RAG(Retrieval-Augmented Generation)让模型按需取用知识。 ## 第三进化:Harness Engineering (完整内容需进一步提取,本文快照不完整) Harness Engineering 是将前两者融合的工程化框架,包括 CLAUDE.md、Hooks、Skills、MCP Servers、Subagents、Repo Map 等机制。 ## 结语:三者融合 当 Prompt Engineering + Context Engineering + Harness Engineering 三者融合,AI 工程师的终极形态是什么?