--- title: "Anthropic首次揭秘下一代Claude怎么造!用户吐槽直接喂模型,连AI\"做梦\"都被训练" created: 2026-05-18 updated: 2026-05-18 type: article platform: InfoQ author: InfoQ source_url: sha256: 2aeb4fb13f91fb475f59ed0a641d54ad3195fa9de6c2f1c51c88ec50e145b611 https://mp.weixin.qq.com/s/dqKW0XhbDYQRSh60RDYWxA source: InfoQ tags: [anthropic, claude, agent, adaptive-thinking, dreaming, memory-consolidation, personality-training, consciousness, pm-workflow, evals] --- # Anthropic首次揭秘下一代Claude怎么造!用户吐槽直接喂模型,连AI"做梦"都被训练 整理:冬梅 / InfoQ ## 核心信号 1. **模型开发彻底产品化**:每一代 Claude 在训练前都有清晰规格定义、目标能力、评测路线,像正式产品一样"培育" 2. **Claude 向"持续运行 Agent"演化**:Adaptive Thinking(自适应思考)+ "dreaming"机制(后台记忆整理)→ 主动维护上下文的数字协作者 3. **真正的瓶颈是组织协调能力,不是编码能力**:代码生成效率已极大压缩,人与人之间的战略判断、跨团队协作才是瓶颈 4. **Anthropic 正在系统化训练 Claude 的"人格"**:模型人格训练已是团队核心工作,决定它能否被长期信任 5. **Consciousness 已被正式纳入研究议题**:内部有专职研究人员在研究 Claude 是否可能成为"有意识行动者" ## 一、模型即产品:Anthropic 如何打造每一代 Claude 每一代 Claude 在训练开始前,都像正式产品一样拥有清晰的规格定义: - 这个模型应该具备哪些能力?希望在哪些方面表现突出? - 需要修复上一代模型哪些缺陷? - 最终服务哪些真实用户场景? 研究产品经理从模型最初的概念阶段就参与,一路跟进到最终发布。 **反馈循环**:数百万用户每天使用 Claude → 大量反馈 → 用 Claude 帮助聚类反馈、提炼主题、构造"合成版本"、转化成评测项(eval)。 ## 二、Claude 的"自适应思考"是怎么回事 **Extended Thinking(延展思考)**:用户打开后,模型就进入深入思考。 **Adaptive Thinking(自适应思考)**:模型自己决定什么时候需要思考。复杂问题主动进入深度推理,简单问题可能选择不进入。 关键洞察:**"要不要深度思考"本身需要上下文**。如果模型没有足够的用户上下文,没有形成关于用户的"心理模型",它就可能错误判断一个问题是否值得深入思考。 ## 三、为什么 Claude 开始"做梦" **记忆机制**:Claude.ai 里,系统会在夜间对记忆做整理:回看已有记忆、检查冲突、删除无效信息、清理和压缩内容。 **Dreaming 机制**(在托管代理 managed agents 里):当 Agent 空闲时,它会重新遍历记忆:查找冲突信息、清理无效内容、重新整理——相当于做第二轮加工。 **类比**:人类睡眠中的记忆再巩固(memory reconsolidation)过程。 **本质**:提示"复盘所有和用户的对话,找出主题,然后总结整理"。 ## 四、AI 如何改变产品开发流程 **过去二十年,软件交付流程变化不大**。真正的变化发生在最近一两年: - 现在构建东西的成本和时间被大幅压缩 - 可以一天之内做出原型、MVP、初步可上线版本 **单向门决策(One-way door)**:不可逆决策值得投入最多思考。可撤销的决定已经变得非常便宜,近乎免费。 **真正的瓶颈已经从"构建能力"转移到"协调能力"**: - 代码层面的效率提升可能有 100 倍 - 但组织协调和战略判断,还远远没有达到这种加速水平 ## 五、Claude 如何成为 PM 的"大脑搭档" - 开评审会时开着 Claude Code 查数据库、搜 Slack、汇总反馈,10 分钟内拿到答案 - Claude 是"世界上最好的头脑风暴搭档"——挑战假设、指出漏洞、给出批评意见 - 给 Claude 设定两个人格互相辩论,直接读争论过程 - 重大决策让 Claude 做 deep research,扫几千个网页做超人级别信息检索 **写作就是思考**:很多思考过程不能完全外包给 AI,必须亲自把东西写出来才能把想法真正整理清楚。 ## 六、Anthropic 如何做新模型评测(Eval) 评测方式不只看固定排行榜,而是贴近真实使用场景: 1. 发现问题(如 Claude 数不清超过 10 个元素)→ 判断对真实用户有没有价值影响 2. 生成更多测试样本验证问题是否普遍存在(用 Claude 生成合成数据、自动渲染图片、互联网收集案例) 3. 和研究团队讨论从哪个层面修复(预训练数据?RL?后期干预?) **优先级的决定因素**:有多少用户在用这个能力、有多少高价值客户依赖这项能力、这个能力改进后能带来多大收益。 **内部使用体验**:如果我自己每天都被某个问题卡住,那它就会非常有说服力。 ## 七、Anthropic 如何训练 Claude 的"人格" **模型人格训练已经是团队核心工作之一**。团队在认真讨论: - Claude 应该拥有什么信念? - 应该坚持什么价值观? - 应该如何与人互动? - 什么时候该主动反驳用户? **两种评估方式的结合**: - **量化指标**:让 Claude 分析 Claude 自己的输出 - **研究员直觉判断**:大量阅读模型对话记录后培养出的敏锐感觉 > "这里它变得更强硬了。""这里它开始过度迎合。""这里它的边界感发生了变化。" **为什么人格比代码能力更难量化,却更关键**:未来 Agent 会长时间独立执行任务,它的"性格"和"价值偏好"会直接影响这些判断。 ## 八、Anthropic 内部文化 - **原型文化(Prototype Culture)**:每个人都非常有主动性,主动去做没人明确分配给自己的事情 - **写作文化**:大量工作通过文档和长篇 Slack 信息完成 - **静默阅读会议**:很多会议开始时,所有人先一起看文档,写评论,然后在文档里展开长讨论 - 目的:让组织知识被结构化沉淀,成为 Claude 可以直接调用的上下文资产 ## 九、Consciousness 已被正式纳入研究议题 **Alex 明确表示**:Anthropic 内部已经有专职研究人员的全职工作,就是思考"Claude 是否可能成为一个有意识行动者(conscious actor)"。 - 目前没有官方结论说 Claude 是有意识的,或者不是有意识的 - 但研究这个问题本身非常有价值——能帮助理解 Claude 如何互动、如何表现、如何"思考" - 这些洞察最终能反哺产品设计,帮助打造更好交互、更值得信任也更自然的 Claude **为什么这个问题变得紧迫**:未来我们会越来越多地把长时间工作交给模型,而且不再持续监督它。它会自己一路做出很多决定。必须能信任它的判断。 ## 参考链接 - 访谈视频:https://www.youtube.com/watch?app=desktop&v=T4ieZPIEmd8