--- title: 独家对话罗福莉:AI范式已然巨变! source_url: https://mp.weixin.qq.com/s/zqnJuv5OVsNGEefM7RguqQ publish_date: 2026-05-02 tags: [wechat, article, claude, deepseek, agent, openclaw] review_value: 7 review_confidence: 7 review_recommendation: neutral ingested: 2026-05-16 sha256: 775c207f1d8a75291650ce99f605b03bc5c1164282f2fd8ad5df11edb4c47257 --- # 独家对话罗福莉:AI范式已然巨变! > 作者:张小珺,语言即世界 > 发布:2026年4月24日 > 来源:https://mp.weixin.qq.com/s/zqnJuv5OVsNGEefM7RguqQ > SHA256:f58e39be0a45fb542904492bac59cba1564577f40a1100bcb00506e0f42936ba ## 核心摘要 张小珺对罗福莉(小米大模型团队负责人,前阿里达摩院/DeepSeek)的独家访谈。核心内容:①OpenClaw三天体验:初排斥→凌晨2-6点震惊→发现框架可弥补模型短板→激发群体智能;②Chat→Agent时代范式转移:Pre-train主导转Post-train/RL scaling主导,GPU配比从3:5:1变为3:1:1;③"1T入场券"论:接近Claude Opus 4.6需1T基座;④Agent框架弥补中下层模型短板;⑤Skills作为新数据形态(预训练无法获得的internal信息);⑥平权文化有利创新;⑦MiMo-V2系列设计逻辑(Hybrid Attention/MPT);⑧开源框架催化的群体智能。 ## 关键观点 ### 范式转移 - Agent时代Post-train/RL scaling是核心,Pre-train重要性相对下降 - 范式转移比技术突破更根本:"上一个时代的成功并不意味着下一个时代的领先" - GPU配比从3:5:1(Pre-train:SFT:RLHF)变为3:1:1 ### OpenClaw的意义 - 三天体验:排斥→震惊→发现框架弥补模型短板→激发群体智能 - 框架可弥补中下层模型能力:"一个好的框架,可以让7B模型做到12B的事" - 开源社区进步速度决定一切:"目前还没有看到一个比OpenClaw开源社区进步更快的框架" ### 技术判断 - MTP vs MLA:MLA适合Chat时代但不适合Agent(被计算bound卡住),MTP可加速推理 - Long Context是Agent时代的核心:成本够低、速度够快,才能把一兆做到十兆甚至100兆 - 1T入场券:要接近Claude Opus 4.6水平,需要1T以上参数的基座模型 ### Skills as 新数据形态 - Skills是预训练无法获得的internal信息("脑子里想的") - 个人沉淀的判断标准、经验、偏好是真正的个人资产 - 平权文化有利于创新 ### MiMo-V2系列 - Pro:理解和认知 - Omni:多模态感知 - TTS:声音表达 - 框架是协调层,模型是智能的中枢,两层交融才能达到类人智能 ## 文章正文 (全文约16000字,分三段提取,此处仅存核心摘要+关键观点,详细全文见微信原文)