---
title: 独家对话罗福莉：AI范式已然巨变！
source_url: https://mp.weixin.qq.com/s/zqnJuv5OVsNGEefM7RguqQ
publish_date: 2026-05-02
tags: [wechat, article, claude, deepseek, agent, openclaw]
review_value: 7
review_confidence: 7
review_recommendation: neutral
ingested: 2026-05-16
sha256: 775c207f1d8a75291650ce99f605b03bc5c1164282f2fd8ad5df11edb4c47257
---
# 独家对话罗福莉：AI范式已然巨变！
> 作者：张小珺，语言即世界
> 发布：2026年4月24日
> 来源：https://mp.weixin.qq.com/s/zqnJuv5OVsNGEefM7RguqQ
> SHA256：f58e39be0a45fb542904492bac59cba1564577f40a1100bcb00506e0f42936ba
## 核心摘要
张小珺对罗福莉（小米大模型团队负责人，前阿里达摩院/DeepSeek）的独家访谈。核心内容：①OpenClaw三天体验：初排斥→凌晨2-6点震惊→发现框架可弥补模型短板→激发群体智能；②Chat→Agent时代范式转移：Pre-train主导转Post-train/RL scaling主导，GPU配比从3:5:1变为3:1:1；③"1T入场券"论：接近Claude Opus 4.6需1T基座；④Agent框架弥补中下层模型短板；⑤Skills作为新数据形态（预训练无法获得的internal信息）；⑥平权文化有利创新；⑦MiMo-V2系列设计逻辑（Hybrid Attention/MPT）；⑧开源框架催化的群体智能。
## 关键观点
### 范式转移
- Agent时代Post-train/RL scaling是核心，Pre-train重要性相对下降
- 范式转移比技术突破更根本："上一个时代的成功并不意味着下一个时代的领先"
- GPU配比从3:5:1（Pre-train:SFT:RLHF）变为3:1:1
### OpenClaw的意义
- 三天体验：排斥→震惊→发现框架弥补模型短板→激发群体智能
- 框架可弥补中下层模型能力："一个好的框架，可以让7B模型做到12B的事"
- 开源社区进步速度决定一切："目前还没有看到一个比OpenClaw开源社区进步更快的框架"
### 技术判断
- MTP vs MLA：MLA适合Chat时代但不适合Agent（被计算bound卡住），MTP可加速推理
- Long Context是Agent时代的核心：成本够低、速度够快，才能把一兆做到十兆甚至100兆
- 1T入场券：要接近Claude Opus 4.6水平，需要1T以上参数的基座模型
### Skills as 新数据形态
- Skills是预训练无法获得的internal信息（"脑子里想的"）
- 个人沉淀的判断标准、经验、偏好是真正的个人资产
- 平权文化有利于创新
### MiMo-V2系列
- Pro：理解和认知
- Omni：多模态感知
- TTS：声音表达
- 框架是协调层，模型是智能的中枢，两层交融才能达到类人智能
## 文章正文
（全文约16000字，分三段提取，此处仅存核心摘要+关键观点，详细全文见微信原文）