---
uid: prime-intellect-auto-nanogpt-opus-2930
title: "AI第一次科研竞赛中击败人类！Opus 4.7狂飙2930步创世界纪录"
source_url: https://mp.weixin.qq.com/s/WVDb6npWAxhgQ0V9dc6GFg
tags: [wechat, article, claude, openai, gpt, agent, harness, openclaw]
source: 新智元
authors: 新智元编辑部
year: 2026
type: article
review_value: 8
review_confidence: 8
review_recommendation: strong
review_stars: 5
ingested: 2026-05-15
sha256: 632f12a0cbe7859a2b95e5839b46c300172f142404881753883e2f7b3ba4663f
---
# AI第一次科研竞赛中击败人类！Opus 4.7狂飙2930步创世界纪录
AI第一次科研竞赛中击败人类！Opus 4.7狂飙2930步创世界纪录
新智元 2026年5月15日 16:15 北京
Prime Intellect把Opus 4.7和GPT 5.5关进H200集群，不给人类指导，跑了1万次实验。结果：AI第一次在科研竞赛中打破人类纪录。2930步，递归自改进的卢比孔河，被跨过了。
历经1.4万小时H200算力测试与万次迭代，AI打破了人类世界纪录！
过去两周，Prime Intellect实验室做了一件事：把Opus 4.7和Codex（基于GPT 5.5）扔进H200集群，切断所有人类指导，让它们自己跑nanoGPT速通优化。1.4万个H200计算时，约1万次迭代，239亿Token的思考轨迹。
结果：Opus 4.7以2930步、Codex以2950步打破了人类顶尖开发者保持的2990步世界纪录。AI第一次在科研竞赛中击败人类。完全无人干预。开源可复现。
项目主页：https://www.primeintellect.ai/auto-nanogpt
代码地址：https://github.com/PrimeIntellect-ai/experiments-autonomous-speedrunning
nanoGPT速通是Keller Jordan发起的AI基准测试，规则极简：模型架构固定，训练数据固定，唯一能动的是优化器和超参数。Prime Intellect给两个AI搭建了完整的自主科研框架：AGENTS.md定义行为规范，goal.md锁定目标，plan.md记录策略演化，scratchpad存草稿。
Claude举手问老师，GPT闷头写到天亮
Opus 4.7表现像一个不敢走出考场的优等生，即使被明确要求「自主运行，不要停下来」，它仍然频繁暂停索要指令。模式永远是：得出结论→请求指导→等待。整场实验中Claude累计产生了约22小时空闲时间，根植于底层对齐协议的谨慎让它成为「反复举手问老师的学霸」。
Codex（GPT 5.5）走了另一个极端，它从不停止、持续运行、永不求助，像推土机一样横扫所有参数空间。但它的弱点同样明显：会在同一个超参数曲面上卡住数小时做大量无效搜索，不懂反思方向是否错误。
人类正在失去解释权
Opus最终给出的2930步方案是由极其复杂的参数堆叠而成的「参数迷宫」，那些关于初始化缩放、学习率按角色拆分的微小变动在人类眼中显得支离破碎。但结果是冰冷的：它比人类设计的方案快了60步。
这标志着重大范式转移：科学发现正从「因果逻辑」转向「极致演化」。人类正在失去对科技进步的「解释权」。2930 vs 2990，60步的含义是：递归自改进，第一块拼图落地了。