---

title: "Anthropic首次揭秘下一代Claude怎么造！用户吐槽直接喂模型，连AI\"做梦\"都被训练"
created: 2026-05-18
updated: 2026-05-18
type: article
platform: InfoQ
author: InfoQ
source_url:
sha256: 2aeb4fb13f91fb475f59ed0a641d54ad3195fa9de6c2f1c51c88ec50e145b611 https://mp.weixin.qq.com/s/dqKW0XhbDYQRSh60RDYWxA
source: InfoQ
tags: [anthropic, claude, agent, adaptive-thinking, dreaming, memory-consolidation, personality-training, consciousness, pm-workflow, evals]

---
# Anthropic首次揭秘下一代Claude怎么造！用户吐槽直接喂模型，连AI"做梦"都被训练
整理：冬梅 / InfoQ
## 核心信号
1. **模型开发彻底产品化**：每一代 Claude 在训练前都有清晰规格定义、目标能力、评测路线，像正式产品一样"培育"
2. **Claude 向"持续运行 Agent"演化**：Adaptive Thinking（自适应思考）+ "dreaming"机制（后台记忆整理）→ 主动维护上下文的数字协作者
3. **真正的瓶颈是组织协调能力，不是编码能力**：代码生成效率已极大压缩，人与人之间的战略判断、跨团队协作才是瓶颈
4. **Anthropic 正在系统化训练 Claude 的"人格"**：模型人格训练已是团队核心工作，决定它能否被长期信任
5. **Consciousness 已被正式纳入研究议题**：内部有专职研究人员在研究 Claude 是否可能成为"有意识行动者"
## 一、模型即产品：Anthropic 如何打造每一代 Claude
每一代 Claude 在训练开始前，都像正式产品一样拥有清晰的规格定义：
- 这个模型应该具备哪些能力？希望在哪些方面表现突出？
- 需要修复上一代模型哪些缺陷？
- 最终服务哪些真实用户场景？
研究产品经理从模型最初的概念阶段就参与，一路跟进到最终发布。
**反馈循环**：数百万用户每天使用 Claude → 大量反馈 → 用 Claude 帮助聚类反馈、提炼主题、构造"合成版本"、转化成评测项（eval）。
## 二、Claude 的"自适应思考"是怎么回事
**Extended Thinking（延展思考）**：用户打开后，模型就进入深入思考。
**Adaptive Thinking（自适应思考）**：模型自己决定什么时候需要思考。复杂问题主动进入深度推理，简单问题可能选择不进入。
关键洞察：**"要不要深度思考"本身需要上下文**。如果模型没有足够的用户上下文，没有形成关于用户的"心理模型"，它就可能错误判断一个问题是否值得深入思考。
## 三、为什么 Claude 开始"做梦"
**记忆机制**：Claude.ai 里，系统会在夜间对记忆做整理：回看已有记忆、检查冲突、删除无效信息、清理和压缩内容。
**Dreaming 机制**（在托管代理 managed agents 里）：当 Agent 空闲时，它会重新遍历记忆：查找冲突信息、清理无效内容、重新整理——相当于做第二轮加工。
**类比**：人类睡眠中的记忆再巩固（memory reconsolidation）过程。
**本质**：提示"复盘所有和用户的对话，找出主题，然后总结整理"。
## 四、AI 如何改变产品开发流程
**过去二十年，软件交付流程变化不大**。真正的变化发生在最近一两年：
- 现在构建东西的成本和时间被大幅压缩
- 可以一天之内做出原型、MVP、初步可上线版本
**单向门决策（One-way door）**：不可逆决策值得投入最多思考。可撤销的决定已经变得非常便宜，近乎免费。
**真正的瓶颈已经从"构建能力"转移到"协调能力"**：
- 代码层面的效率提升可能有 100 倍
- 但组织协调和战略判断，还远远没有达到这种加速水平
## 五、Claude 如何成为 PM 的"大脑搭档"
- 开评审会时开着 Claude Code 查数据库、搜 Slack、汇总反馈，10 分钟内拿到答案
- Claude 是"世界上最好的头脑风暴搭档"——挑战假设、指出漏洞、给出批评意见
- 给 Claude 设定两个人格互相辩论，直接读争论过程
- 重大决策让 Claude 做 deep research，扫几千个网页做超人级别信息检索
**写作就是思考**：很多思考过程不能完全外包给 AI，必须亲自把东西写出来才能把想法真正整理清楚。
## 六、Anthropic 如何做新模型评测（Eval）
评测方式不只看固定排行榜，而是贴近真实使用场景：
1. 发现问题（如 Claude 数不清超过 10 个元素）→ 判断对真实用户有没有价值影响
2. 生成更多测试样本验证问题是否普遍存在（用 Claude 生成合成数据、自动渲染图片、互联网收集案例）
3. 和研究团队讨论从哪个层面修复（预训练数据？RL？后期干预？）
**优先级的决定因素**：有多少用户在用这个能力、有多少高价值客户依赖这项能力、这个能力改进后能带来多大收益。
**内部使用体验**：如果我自己每天都被某个问题卡住，那它就会非常有说服力。
## 七、Anthropic 如何训练 Claude 的"人格"
**模型人格训练已经是团队核心工作之一**。团队在认真讨论：
- Claude 应该拥有什么信念？
- 应该坚持什么价值观？
- 应该如何与人互动？
- 什么时候该主动反驳用户？
**两种评估方式的结合**：
- **量化指标**：让 Claude 分析 Claude 自己的输出
- **研究员直觉判断**：大量阅读模型对话记录后培养出的敏锐感觉
> "这里它变得更强硬了。""这里它开始过度迎合。""这里它的边界感发生了变化。"
**为什么人格比代码能力更难量化，却更关键**：未来 Agent 会长时间独立执行任务，它的"性格"和"价值偏好"会直接影响这些判断。
## 八、Anthropic 内部文化
- **原型文化（Prototype Culture）**：每个人都非常有主动性，主动去做没人明确分配给自己的事情
- **写作文化**：大量工作通过文档和长篇 Slack 信息完成
- **静默阅读会议**：很多会议开始时，所有人先一起看文档，写评论，然后在文档里展开长讨论
  - 目的：让组织知识被结构化沉淀，成为 Claude 可以直接调用的上下文资产
## 九、Consciousness 已被正式纳入研究议题
**Alex 明确表示**：Anthropic 内部已经有专职研究人员的全职工作，就是思考"Claude 是否可能成为一个有意识行动者（conscious actor）"。
- 目前没有官方结论说 Claude 是有意识的，或者不是有意识的
- 但研究这个问题本身非常有价值——能帮助理解 Claude 如何互动、如何表现、如何"思考"
- 这些洞察最终能反哺产品设计，帮助打造更好交互、更值得信任也更自然的 Claude
**为什么这个问题变得紧迫**：未来我们会越来越多地把长时间工作交给模型，而且不再持续监督它。它会自己一路做出很多决定。必须能信任它的判断。
## 参考链接
- 访谈视频：https://www.youtube.com/watch?app=desktop&v=T4ieZPIEmd8