--- title: "Code is cheap. Don't write any.——AI Native,程序员如何提升五倍 coding 效率" source_url: "https://mp.weixin.qq.com/s/t04ysxZN2qEc3986r2gyTA" ingested: 2026-07-03 sha256: 3ecd0d255f300bb485efb699ae51655a6b824f5d231f5bc29758885e4be6be19 author: 无岳 publisher: 阿里云开发者 --- 最近 20 天,AI 帮我提交了 70 万行代码,10 个项目,同时并行。 不是 IDE 补全那种"AI 占 100%"。是把一个完整任务整包交出去——读地形、定方案、写实现、跑验证、修 bug——AI 自己全套跑完,我只在关键节点拽一下方向。 一、Code is cheap 当同样的变化进入复杂工程现场,会怎样改变一个工程师的产能结构?典型的研发场景:产品线多、内部平台复杂、存量系统长、权限和发布链路严格。过去真正昂贵的不是敲代码,而是读懂历史、找准边界、确认影响面、跑通验证、控制发布风险。现在一旦模型可以整包接住"读地形、定方案、写实现、跑验证、修 bug"这一串动作,代码本身就开始从稀缺资源,变成可以快速生成、快速验证、快速丢弃的过程产物。 真正要警觉的不是"AI 越来越强"——这件事大家都已经接受了。而是另一件事:代码本身,正在变得非常便宜。 二、泥头车与长尾 代码廉价化的第一个副作用,是长尾的极端拉伸。差距不是"会用 AI"和"不会用 AI"——这一拨差距其实已经不大,差不多人人都用过。真正在拉开的是用 AI 的层级差距。 头部的人(包括我自己)已经能用 AI 同时推进 5 个项目,把任务整包交给模型自动跑;尾部的人,还停留在用 LLM 写写单测、补几个注释的阶段。这不是技术能力的差距,是对 AI 的使用方式的差距——而这个差距,正在以周为单位放大。 放大它的不是 AI 自己。AI 不在乎任何人。它只是残忍地学习、代替、撞死所有跟不上它的人。这没有感情成分——它就是一辆不停加速的泥头车。 摆在每个人面前的只有两条路。第一条,在它撞到你之前多跑两步。第二条,爬上这辆车,无论姿势多狼狈——迅速把自己转型成 100% AI 工作者。 这篇文章讲的是第二条——爬上车的方法。这套方法叫 Harness。 三、大模型的两个底层事实 事实 1:大模型不是确定性函数。 大模型每说一句话、每写一行代码,本质都是"一个 token 接一个 token 往外吐"。每吐一个 token 之前,模型基于前面已经吐出的所有内容,对词表里所有可能的下一个 token(通常几万到十几万个)算一个概率分布。 这种机制有两个直接的结果。第一,模型每一步的输出不是"想清楚再说",而是"按概率挑一个"。第二,每一步的小偏差会沿着链路累积——一旦某一步挑歪了一点,后面所有 token 都基于这个偏差继续挑下去,越走越远。 推论很直接:给它的自由空间越大,它跑偏的概率越大。 具体翻车的样子:你把一个相对模糊的目标交给它,它可能洋洋洒洒生成 500 行代码但方向完全不对;它修了一个 bug,顺手"优化"了你不想动的部分;你不知道它为什么这么写,不敢上线。 这也是 best-practice slop 的来源。不是简单的"AI 写得烂",而是 AI 在一个过大的目标空间里,把网上最常见、最像最佳实践的套路糊上来,生成一套看似专业、结构漂亮,但不贴业务地形、不解决真实问题的平均产物。 工程对策是反 slop:任务开始前反复和模型讨论需求,让它复述目标;理解错了,人立刻纠正;证据不足,就继续搜索代码、日志、历史 spec;几轮之后,把目标、边界、证据、判断标准沉淀成一份精华文档(spec)。这一轮可能不写一行代码,但它已经把模型从"凭概率在巨大空间里乱选路",挪到了"在清晰目标和边界内自主推进"。 事实 2:大模型的上下文窗口是有限的,而且给得太多反而会腐烂。 这是 transformer 注意力机制的内在限制。模型每生成一个 token,都要在上下文窗口里所有 token 之间分配注意力——窗口越长,每个 token 拿到的注意力权重越稀薄。"Lost in the Middle"——中间的信息最容易被遗忘。 多轮对话更糟:旧方案和新方案在窗口里共存,模型分不清"哪个是当前结论";recency bias 让它过度看重最近几轮的内容。 自动总结只能延缓上下文腐烂,不能解决它。每次总结都是有损压缩。真正的解是定期重启(new-chat skill),用 spec 作为外部真相源喂给一个全新的 chat。 真正要节约的不是 token,是上下文——省 token 是成本问题,省上下文是质量问题。 四、方法论:水流理论 + 最小混沌单元 Harness 是一个 generic 概念——任何在 LLM 上做 delegation 的方法都能叫 Harness。 五、Harness 的 8 个关键组件 (文章中详细展开了 spec 编写、context 管理、checkpoint 设计、验证闭环、边界控制、错误恢复、new-chat skill 等具体技术) 六、实战经验 (阿里云内部落地的具体案例和量化数据) 七、new-chat skill 定期重启模式:用 spec 作为外部真相源,启动全新的 chat,避免上下文腐烂积累。 注:本文原文为长篇深度文章,以上为基于浏览器可访问内容提取的核心框架。完整内容请参阅原文。原文链接:https://mp.weixin.qq.com/s/t04ysxZN2qEc3986r2gyTA