---
title: Karpathy × Boris 访谈：Software 3.0 时代编程完整地图
source_url: https://mp.weixin.qq.com/s/e1vrUYcGE6RToVkl_HcXZQ
publish_date: 2026-05-07
tags: [wechat, article, claude, gpt, agent, harness, rag, coding, llm, openclaw, gemini]
review_value: 7
review_confidence: 7
review_recommendation: neutral
sha256: ea554189cb0c8c9c6c1a764506295e79b0edadfd19af7fb008dff4c79bb9d476
---
# Karpathy × Boris 访谈：Software 3.0 时代编程完整地图
- URL: https://mp.weixin.qq.com/s/e1vrUYcGE6RToVkl_HcXZQ
- Author: 微信编译版，原型为 Boris (Claude Code创始人) + Karpathy (前Tesla AI) YouTube访谈
- Date: 2026-05
- Length: 3674 chars (微信版)
- SHA256: b7f08a9221689ae53f18651567d97f1e5110931bc8978d41d50159b7513e3810
- Score: Value=8 × Confidence=8 = 64
## 微信正文
Boris表示在Claude Code刚内测的时候，自己只有10%的代码是用它写的。但是，从去年5月Opus4出来之后，Claude Code的增长曲线开始起飞，从4到4.5到4.6到4.7，每次模型更新，都在用户增长上疯狂体现。
他承认，Claude Code可能是一次违背PMF的赌注，但这也算是一个新的模式：为还不存在的模型提前建好harness。
对他个人而言，编程的时代已经结束了。
## Karpathy：Software 3.0
Karpathy讲他之前做了一个叫Menu Gen的项目。功能很简单，拍菜单照片，AI帮你生成每道菜大概长什么样。他用vibe coding搭了一个完整应用，部署到Vercel，OCR识别菜名，调图像生成模型。
但是很快他发现，有人做了一个更直接的版本。把照片丢给Google Gemini，让Nanobanana在像素层面直接把菜品图渲染到原始菜单上。输入一张图，输出一张图，中间不需要任何传统应用逻辑。
Karpathy看完意识到，自己做的整个Menu Gen其实已经过时了。那个App理论上不该存在。
他把这个现象拉到一个更大的框架。LLM就是一种新的计算机。传统代码是Software 1.0，训练神经网络得到的权重是Software 2.0，Prompting是Software 3.0。你往上下文窗口里塞什么，就等于你在编程。
另一个很具体的例子是OpenClaw的安装方式。以前的工具安装，可能是shell脚本，但是OpenClaw是一段文字说明。把文档扔给你的Agent，Agent自己读环境，自己判断，自己在循环里debug，最后自己就装好了。
现在我们要思考的是该给agent哪一段文字。
大家不要只关注「编程更快了」。更关键的变化是，更广义的信息处理正在变得可自动化。以前代码处理的是结构化数据，但现在你可以把一批文档丢进去，让模型重新编译这些信息，产出全新的知识结构。这些是以前根本不可能做的事。
## 锯齿状智能
模型的能力非常不均匀，像锯齿。在代码、数学这些高度可验证的领域，几乎比所有人类都厉害。但是一旦脱离这个范围，就可能看起来很蠢。
原因有两层。一是训练方法，最先进的大模型用强化学习调出来的，答案对了就加分，代码恰好是最容易验证对不对的东西。二是实验室自己关注什么，哪些任务经济价值高就往分布里猛塞，代码是最典型的例子。
Karpathy还举了一个说明问题的细节，GPT-3.5到GPT-4，模型下国际象棋突然变强，当时很多人以为是智能整体提升的副作用。但更可能的原因是预训练数据里被额外加了大量棋谱。实验室决定放什么进去，你就得到什么样的能力分布。
Karpathy说模型不是动物，是幽灵。动物有内在动机、好奇心、自我驱动。模型只是由数据和奖励函数塑形出来的锯齿状实体。你冲它发火不会让它更努力，鼓励它也不会让它更有斗志。它就是统计模拟电路。
而只有理解了这一点，用起来才会更准。
## 人在这个体系里干什么
Boris说，他的角色变成了调度。他关心的是循环怎么跑起来，Agent之间的依赖怎么自动解决，CI怎么自己维护。执行全部交出去了。
Karpathy说，人必须负责specification，必须负责plan。他说自己其实不太喜欢那些所谓的plan mode。因为他觉得更关键的是你得和agent一起把一份非常细的spec设计出来，然后让agent填充实现。人负责大框架和约束条件，agent负责填空。
他给了一个很具体的例子。Menu Gen里，agent用Stripe支付邮箱去匹配Google登录邮箱来分配credits。但一个人完全可能两边用不同邮箱。这种「邮箱不是用户ID」的设计判断，agent做不了。
但是具体的执行细节可以交出去了。比如PyTorch里是keepdims还是keepdim，是dim还是axis，这些不需要记了。
但人对底层原理的理解不能丢，tensor的storage和view是怎么回事，什么时候在无意义地拷贝内存，这些得自己知道。
Karpathy还引用了一句让他隔两天就想起一次的话：
> **你可以外包思考，但你不能外包理解。**
## 面试、护城河、创业机会
两人都提到了面试方式要变。
如果还在让候选人刷算法题、解puzzle，筛选的是上一代工程能力。Karpathy给了一个具体的case，比如让候选人做一个Twitter clone，功能完整、安全性高，然后用十个Codex或Claude实例去攻击他部署的网站，看能不能打穿。谁在这种环境下撑住了，谁才是这个时代的工程师。
Boris从团队角度说了一个已经在发生的变化。Claude Code团队里，工程经理、产品经理、设计师、数据科学家、财务、用户研究员，所有人都在写代码。不是因为他们都是程序员，是因为写代码不再需要专业程序员了。
当写代码成本降100倍，切换成本在AI面前不堪一击，模型可以轻松把数据从一个平台迁到另一个。流程效力也在贬值，模型擅长理顺工作流。但网络效应、规模经济、垄断资源依然有效。他的判断，未来10年能颠覆现有市场的初创公司会增加10倍。
Karpathy给创业者的建议更具体。别追大模型的逃逸速度，去造你自己的RL环境。可验证性决定了哪些领域会被率先攻破，很多价值极高的RL环境还没被开发出来。如果你能在某个垂直领域构建出足够好的强化学习环境和数据集，就能吃到巨大的杠杆红利。
但是他说这话时笑了一下，「我不方便把答案直接讲透。」
## 写在最后
Boris引用了一个历史。在1400年代欧洲只有10%的人识字。印刷机发明后50年，出版的文献超过之前一千年的总和。书的成本降了100倍。最终全球识字率升到70%。但作家这个职业依然存在。
编程正在经历同样的事。未来每个人都会编程，就像现在每个人都能读写。但这是说工程师消失了。是说这个角色的核心能力从「写代码」变成了「知道该让AI写什么、以及什么条件绝对不能省」。
执行层的天花板已经被模型捅穿了。
但是又因为模型的锯齿状智能。人在很多地方还不能松手。
这就是2026年编程这件事的完整地图。
**执行交给模型。方向留给人。**
## 原始链接
- Boris原始视频：https://www.youtube.com/watch?v=SlGRN8jh2RI
- Karpathy原始视频：https://www.youtube.com/watch?v=96jN2OCOfLs