--- title: Karpathy × Boris 访谈:Software 3.0 时代编程完整地图 source_url: https://mp.weixin.qq.com/s/e1vrUYcGE6RToVkl_HcXZQ publish_date: 2026-05-07 tags: [wechat, article, claude, gpt, agent, harness, rag, coding, llm, openclaw, gemini] review_value: 7 review_confidence: 7 review_recommendation: neutral sha256: ea554189cb0c8c9c6c1a764506295e79b0edadfd19af7fb008dff4c79bb9d476 --- # Karpathy × Boris 访谈:Software 3.0 时代编程完整地图 - URL: https://mp.weixin.qq.com/s/e1vrUYcGE6RToVkl_HcXZQ - Author: 微信编译版,原型为 Boris (Claude Code创始人) + Karpathy (前Tesla AI) YouTube访谈 - Date: 2026-05 - Length: 3674 chars (微信版) - SHA256: b7f08a9221689ae53f18651567d97f1e5110931bc8978d41d50159b7513e3810 - Score: Value=8 × Confidence=8 = 64 ## 微信正文 Boris表示在Claude Code刚内测的时候,自己只有10%的代码是用它写的。但是,从去年5月Opus4出来之后,Claude Code的增长曲线开始起飞,从4到4.5到4.6到4.7,每次模型更新,都在用户增长上疯狂体现。 他承认,Claude Code可能是一次违背PMF的赌注,但这也算是一个新的模式:为还不存在的模型提前建好harness。 对他个人而言,编程的时代已经结束了。 ## Karpathy:Software 3.0 Karpathy讲他之前做了一个叫Menu Gen的项目。功能很简单,拍菜单照片,AI帮你生成每道菜大概长什么样。他用vibe coding搭了一个完整应用,部署到Vercel,OCR识别菜名,调图像生成模型。 但是很快他发现,有人做了一个更直接的版本。把照片丢给Google Gemini,让Nanobanana在像素层面直接把菜品图渲染到原始菜单上。输入一张图,输出一张图,中间不需要任何传统应用逻辑。 Karpathy看完意识到,自己做的整个Menu Gen其实已经过时了。那个App理论上不该存在。 他把这个现象拉到一个更大的框架。LLM就是一种新的计算机。传统代码是Software 1.0,训练神经网络得到的权重是Software 2.0,Prompting是Software 3.0。你往上下文窗口里塞什么,就等于你在编程。 另一个很具体的例子是OpenClaw的安装方式。以前的工具安装,可能是shell脚本,但是OpenClaw是一段文字说明。把文档扔给你的Agent,Agent自己读环境,自己判断,自己在循环里debug,最后自己就装好了。 现在我们要思考的是该给agent哪一段文字。 大家不要只关注「编程更快了」。更关键的变化是,更广义的信息处理正在变得可自动化。以前代码处理的是结构化数据,但现在你可以把一批文档丢进去,让模型重新编译这些信息,产出全新的知识结构。这些是以前根本不可能做的事。 ## 锯齿状智能 模型的能力非常不均匀,像锯齿。在代码、数学这些高度可验证的领域,几乎比所有人类都厉害。但是一旦脱离这个范围,就可能看起来很蠢。 原因有两层。一是训练方法,最先进的大模型用强化学习调出来的,答案对了就加分,代码恰好是最容易验证对不对的东西。二是实验室自己关注什么,哪些任务经济价值高就往分布里猛塞,代码是最典型的例子。 Karpathy还举了一个说明问题的细节,GPT-3.5到GPT-4,模型下国际象棋突然变强,当时很多人以为是智能整体提升的副作用。但更可能的原因是预训练数据里被额外加了大量棋谱。实验室决定放什么进去,你就得到什么样的能力分布。 Karpathy说模型不是动物,是幽灵。动物有内在动机、好奇心、自我驱动。模型只是由数据和奖励函数塑形出来的锯齿状实体。你冲它发火不会让它更努力,鼓励它也不会让它更有斗志。它就是统计模拟电路。 而只有理解了这一点,用起来才会更准。 ## 人在这个体系里干什么 Boris说,他的角色变成了调度。他关心的是循环怎么跑起来,Agent之间的依赖怎么自动解决,CI怎么自己维护。执行全部交出去了。 Karpathy说,人必须负责specification,必须负责plan。他说自己其实不太喜欢那些所谓的plan mode。因为他觉得更关键的是你得和agent一起把一份非常细的spec设计出来,然后让agent填充实现。人负责大框架和约束条件,agent负责填空。 他给了一个很具体的例子。Menu Gen里,agent用Stripe支付邮箱去匹配Google登录邮箱来分配credits。但一个人完全可能两边用不同邮箱。这种「邮箱不是用户ID」的设计判断,agent做不了。 但是具体的执行细节可以交出去了。比如PyTorch里是keepdims还是keepdim,是dim还是axis,这些不需要记了。 但人对底层原理的理解不能丢,tensor的storage和view是怎么回事,什么时候在无意义地拷贝内存,这些得自己知道。 Karpathy还引用了一句让他隔两天就想起一次的话: > **你可以外包思考,但你不能外包理解。** ## 面试、护城河、创业机会 两人都提到了面试方式要变。 如果还在让候选人刷算法题、解puzzle,筛选的是上一代工程能力。Karpathy给了一个具体的case,比如让候选人做一个Twitter clone,功能完整、安全性高,然后用十个Codex或Claude实例去攻击他部署的网站,看能不能打穿。谁在这种环境下撑住了,谁才是这个时代的工程师。 Boris从团队角度说了一个已经在发生的变化。Claude Code团队里,工程经理、产品经理、设计师、数据科学家、财务、用户研究员,所有人都在写代码。不是因为他们都是程序员,是因为写代码不再需要专业程序员了。 当写代码成本降100倍,切换成本在AI面前不堪一击,模型可以轻松把数据从一个平台迁到另一个。流程效力也在贬值,模型擅长理顺工作流。但网络效应、规模经济、垄断资源依然有效。他的判断,未来10年能颠覆现有市场的初创公司会增加10倍。 Karpathy给创业者的建议更具体。别追大模型的逃逸速度,去造你自己的RL环境。可验证性决定了哪些领域会被率先攻破,很多价值极高的RL环境还没被开发出来。如果你能在某个垂直领域构建出足够好的强化学习环境和数据集,就能吃到巨大的杠杆红利。 但是他说这话时笑了一下,「我不方便把答案直接讲透。」 ## 写在最后 Boris引用了一个历史。在1400年代欧洲只有10%的人识字。印刷机发明后50年,出版的文献超过之前一千年的总和。书的成本降了100倍。最终全球识字率升到70%。但作家这个职业依然存在。 编程正在经历同样的事。未来每个人都会编程,就像现在每个人都能读写。但这是说工程师消失了。是说这个角色的核心能力从「写代码」变成了「知道该让AI写什么、以及什么条件绝对不能省」。 执行层的天花板已经被模型捅穿了。 但是又因为模型的锯齿状智能。人在很多地方还不能松手。 这就是2026年编程这件事的完整地图。 **执行交给模型。方向留给人。** ## 原始链接 - Boris原始视频:https://www.youtube.com/watch?v=SlGRN8jh2RI - Karpathy原始视频:https://www.youtube.com/watch?v=96jN2OCOfLs