--- title: 软件,Agent 才是主用户:Foundation Capital Agent 时代六条洞察 source_url: https://mp.weixin.qq.com/s/35FkS3AIhm336Fl2Chfc1w publish_date: 2026-05-08 tags: [wechat, article, claude, gpt, agent, harness, openclaw] review_value: 7 review_confidence: 7 review_recommendation: neutral ingested: 2026-05-16 sha256: b3b7265b13378b967c475b6cbf4495e019b503cc6ed5d7862a1044c4875fd60b --- # 软件,Agent 才是主用户:Foundation Capital Agent 时代六条洞察 > 来源:Ashu Garg(Foundation Capital),Software, meet your new user: agents,2026年5月7日 > 原文:https://x.com/ashugarg/status/2052112226178465792 > 背景:Foundation Capital 年度投资人大会炉边对谈,嘉宾:Turing CEO Jonathan Siddharth、Arize CPO Aparna Dhinakaran ## 数据先说话 | 指标 | 数据 | |------|------| | AI Agent 任务时长(METR 50%成功率)| **2小时 → 12小时以上**(过去一年) | | Claude Code GitHub 提交占比 | **4%**(发布仅一年多) | | OpenClaw GitHub 星标超 Linux 里程碑 | **3个月**(Linux 用了15年) | | Claude Opus 4.6 | 可完成"多 RFC 实现复杂协议"级别任务 | 这些不是预测,是已经发生的事实。 ## 第三个拐点:长程 Agent 时刻 Ashu Garg 把过去三年 AI 进展总结为三个拐点: | 拐点 | 时间 | 核心意义 | |------|------|---------| | ChatGPT 时刻 | 2022年底 | 预训练+RLHF 证明语言模型可做通用交互界面 | | o1 时刻 | 2024年 | 推理时算力作为第二套独立扩展定律 | | **长程 Agent 时刻** | **现在(进行中)** | 模型自主制定计划、采取行动、从失败中恢复、持续执行直到任务完成,无需人类每步介入 | **1991年 PC / 2000年互联网类比**:认知几乎普遍,采用正在指数增长,但绝大多数定义品类的产品和更深层工作方式重构仍然在前面的路上。这是一个还没结束的比赛,而不是已经错过的列车。 ## 洞察一:把 Agent 当主用户来构建 **核心原则**:Agent 优先,人类其次。 **Turing 的实践**:知识型工作起点不是人类分配任务给 AI,而是 Agent 先发起、先执行,人类在需要判断的节点介入验证、调整方向和输入上下文。 **Aparna 看到的工程以外的转变**:在 Arize,营销团队开展工作前先启动 Agent 做初步研究和内容草稿。内部通信工具、CRM、监控平台都已连接到 Agent 体系。 **根本性转变**:当软件的主要操作者是 Agent 而不是人时,设计要求根本性改变: - **清晰的编程接口**优先于漂亮的可视化界面 - **可预测的系统状态**优先于丰富的交互体验 **对创始人的直接意义**:如果产品没有清晰的编程接口、不能被 Agent 调用、不符合 Agent 的工作方式——那它还是为旧世界构建的。Agent 将成为杠杆率最高的用户。 ## 洞察二:模型要可插拔,不要微调 **Jonathan 和 Aparna 都明确站在"不微调阵营"**。 **Aparna 的直接经验**:为成本优化而持续维护微调模型所消耗的工程师工时,通常超过微调本身能节省的成本;每当基础模型有重大更新时,微调工作往往需要重做。 **经验法则**:模型应该是"可插拔的"——整个工程体系的设计应该允许在一天内把底层模型换成另一个前沿模型,而不需要大规模重构。外层的"运行框架"(harness)对底层运行的是哪组权重保持不可知。 **框架(harness)的本质**:用户和模型之间的工程层,负责路由、记忆、验证和多步工作的编排。框架里很大一部分是常规软件工程——无论底层运行的是哪个模型,基于规则的决策都必须做出。 **重要推论**:今天在框架层面的积累,比任何押注于特定模型或微调配方的投入都更持久。模型每几个月就会被更好的版本替换,但框架里沉淀的关于业务流程和判断规则的工程知识不会。 ## 洞察三:上下文图谱是你真正的护城河 **Foundation Capital 提出的"上下文图谱"(Context Graph)概念**:描述公司在 Agent 时代真正拥有的专有资产。 **光有数据还不够**:关键在于数据在各个系统之间被导航和协调以支撑决策的方式: - 那些细微的判断调用("这种情况我们通常会例外处理") - 那些跨系统的隐性规则("这类客户需要先过财务再过法务") - 那些无法在任何单一系统文档里找到但深藏在有经验员工头脑里的知识 **上下文图谱捕获**:发生了什么、为什么这么决定、结果如何。随着公司每一次决策的积累,它变得越来越有价值,也越来越难以被竞争对手从零复制。 **Aparna 的具体例子**:想知道哪些用户在以某种特定方式使用产品,以及如何吸引更多这样的用户——这个问题过去需要产品、市场、销售各自从自己的系统拉取数据,手工拼接,可能需要几天。Agent 越来越能独立完成这种跨系统拼接,把几天压缩成几分钟——但前提是它能访问这些底层系统和上下文,且系统对 Agent 是可寻址的、接口是清晰的。 **目前大多数企业的现状**:数据和流程存在于互相隔离的工具孤岛里,只有懂业务的人知道去哪里找、怎么整合。让这种决策底座对 Agent 可寻址,是"无聊但关键"的组织性基础工作,也是真正构建护城河的地方。 ## 洞察四:反馈循环才是产品 **Jonathan 的评估**:AI 对财富500强企业实际运营的可量化影响"几乎四舍五入到零"——即使在最先进的企业客户中,迄今为止 AI 对损益表的实际影响也相当有限。认知和行动之间存在巨大落差。 **Aparna 的诊断**:根本原因不是模型能力不够,而是部署质量太差。大多数企业:把 Agent 上线,让它跑,然后等问题出现再处理。缺少的是把 Agent 作为"需要被管理的系统"来运营的体系——持续监控、失败归因、改进迭代。 **从 Agent 身上获得最大价值的企业**:用对待新员工的方式对待 Agent: 1. 完整的入职流程(明确告知应该做什么、不应该做什么、遇到不确定时升级给谁) 2. 持续的反馈机制(对每一次失败做记录和分析) 3. 一个真正投入提升 Agent 表现的负责人 **Aparna 对 Arize 的愿景**:平台最终将主要由 Agent 使用——Agent 消费自己的可观测性数据,识别自身失败点,自动生成评估用例,并自主发布下一次迭代。**自我改进的闭环,本身就是产品,而且是比任何静态功能都更持久的竞争优势。** **待解决问题**:Agent 的身份与权限体系——当 Agent 在企业系统里采取行动时,它用什么身份认证?被允许访问什么、执行什么操作?执行有影响的操作后谁来负责? ## 洞察五:知识工作变成与 Agent 的持续关系 **基本单位的根本改变**:从孤立的一次性对话 → 人类与 Agent 之间的持续关系。 **Jonathan 对三年后的想象**:Agent 持续运行数月甚至更长时间——拥有持续身份、不断积累工作上下文。它们会调用工具、协调其他专用 Agent,并在需要价值判断或关键授权时主动把人类纳入循环。 **人类的角色转变**:从"执行工作" → "设定方向、提供判断、验证结果"。人类是"处于循环中的人类"——不是被排除在外,而是被放大。 **新的产品设计问题**(目前没有成熟答案): - 当 Agent 已持续运行数月,人如何进行有意义的"签到"而不必从头理解历史? - 当一个人同时拥有数百个 Agent 时,"收件箱"和优先级体系如何运作? - 当大部分工作由 Agent 完成时,管理者如何审查并为结果负责? - 委托"全天候不间断工作的员工"时,授权边界和问责机制如何设计? ## AI 不会触及的领域 **Aparna**:招聘、维护公司文化、企业销售——那种只有两个人在同一个房间里才能建立的信任,那种源于共同经历和长期相处形成的关系底座,是 Agent 无法复制的。 **Jonathan**:销售、招聘、以及其他以建立人际关系本身为核心产品的角色。 **真正留给人类的**: - 构建什么、与谁一起构建 - 公司在这个世界上代表什么 - 这些判断需要的是价值观和志向,而不是任务执行能力 ## 核心结论 先行者在范式转型时代的优势比任何时候都更大。Agent 时代的机会窗口远比许多人意识到的要宽——这是一场还没结束的比赛,而不是已经错过的列车。创始人将管理由数百个 Agent 组成的公司,一个小团队能完成的工作量将超出以往任何认知边界。 --- *评审:Value 8 × Confidence 8 = 64 ✅ PASS | ★★★★* *入库时间:2026-05-08*