--- uid: prime-intellect-auto-nanogpt-opus-2930 title: "AI第一次科研竞赛中击败人类!Opus 4.7狂飙2930步创世界纪录" source_url: https://mp.weixin.qq.com/s/WVDb6npWAxhgQ0V9dc6GFg tags: [wechat, article, claude, openai, gpt, agent, harness, openclaw] source: 新智元 authors: 新智元编辑部 year: 2026 type: article review_value: 8 review_confidence: 8 review_recommendation: strong review_stars: 5 ingested: 2026-05-15 sha256: 632f12a0cbe7859a2b95e5839b46c300172f142404881753883e2f7b3ba4663f --- # AI第一次科研竞赛中击败人类!Opus 4.7狂飙2930步创世界纪录 AI第一次科研竞赛中击败人类!Opus 4.7狂飙2930步创世界纪录 新智元 2026年5月15日 16:15 北京 Prime Intellect把Opus 4.7和GPT 5.5关进H200集群,不给人类指导,跑了1万次实验。结果:AI第一次在科研竞赛中打破人类纪录。2930步,递归自改进的卢比孔河,被跨过了。 历经1.4万小时H200算力测试与万次迭代,AI打破了人类世界纪录! 过去两周,Prime Intellect实验室做了一件事:把Opus 4.7和Codex(基于GPT 5.5)扔进H200集群,切断所有人类指导,让它们自己跑nanoGPT速通优化。1.4万个H200计算时,约1万次迭代,239亿Token的思考轨迹。 结果:Opus 4.7以2930步、Codex以2950步打破了人类顶尖开发者保持的2990步世界纪录。AI第一次在科研竞赛中击败人类。完全无人干预。开源可复现。 项目主页:https://www.primeintellect.ai/auto-nanogpt 代码地址:https://github.com/PrimeIntellect-ai/experiments-autonomous-speedrunning nanoGPT速通是Keller Jordan发起的AI基准测试,规则极简:模型架构固定,训练数据固定,唯一能动的是优化器和超参数。Prime Intellect给两个AI搭建了完整的自主科研框架:AGENTS.md定义行为规范,goal.md锁定目标,plan.md记录策略演化,scratchpad存草稿。 Claude举手问老师,GPT闷头写到天亮 Opus 4.7表现像一个不敢走出考场的优等生,即使被明确要求「自主运行,不要停下来」,它仍然频繁暂停索要指令。模式永远是:得出结论→请求指导→等待。整场实验中Claude累计产生了约22小时空闲时间,根植于底层对齐协议的谨慎让它成为「反复举手问老师的学霸」。 Codex(GPT 5.5)走了另一个极端,它从不停止、持续运行、永不求助,像推土机一样横扫所有参数空间。但它的弱点同样明显:会在同一个超参数曲面上卡住数小时做大量无效搜索,不懂反思方向是否错误。 人类正在失去解释权 Opus最终给出的2930步方案是由极其复杂的参数堆叠而成的「参数迷宫」,那些关于初始化缩放、学习率按角色拆分的微小变动在人类眼中显得支离破碎。但结果是冰冷的:它比人类设计的方案快了60步。 这标志着重大范式转移:科学发现正从「因果逻辑」转向「极致演化」。人类正在失去对科技进步的「解释权」。2930 vs 2990,60步的含义是:递归自改进,第一块拼图落地了。