--- title: "登上Nature子刊!Meta脑机接口重大阶段性进展,超高实时解码准确率" source_url: "https://mp.weixin.qq.com/s/g7-FOyTr32DRTF1V4WsRxA" ingested: 2026-07-01 sha256: 556b9cc3a5bc6afccaa6ed5338f2b597d01edc4c7b06a2bbbe41c15ff573f95c --- --- title: 登上Nature子刊!Meta脑机接口重大阶段性进展,超高实时解码准确率 source: wechat url: https://mp.weixin.qq.com/s/g7-FOyTr32DRTF1V4WsRxA mp_name: 机器之心 publish_date: 2026-06-30 --- # 登上Nature子刊!Meta脑机接口重大阶段性进展,超高实时解码准确率 **来源**: 机器之心 **发布日期**: 2026-06-30 **原文链接**: https://mp.weixin.qq.com/s/g7-FOyTr32DRTF1V4WsRxA --- 编辑|冷猫 脑机接口这个领域似乎已经沉寂许久了。 在脑机接口这块,最出名的应该就是马斯克搞的 Neralink 了。但我们都知道,脑机接口分为两类,侵入式的和非侵入式的。简单来说,侵入式是需要做手术的,而非侵入式不用。 侵入式路线以 Neuralink 为代表,通过将微电极阵列直接植入皮层,信号质量极高,已展示超过 90% 的解码准确率。2025 至 2026 年间已有多位瘫痪患者完成植入并用意念控制电脑。今年 3 月,中国也有侵入式脑机接口产品获批上市。但侵入式方案的代价是手术,也限制了适用人群。 非侵入式路线通过头皮外的传感器采集大脑活动,无需动刀。安全性高、理论上可大规模部署。然而信号穿过颅骨和脑脊液后严重衰减,空间分辨率远逊于皮层内电极。但正是由于外置采集,解码能力就非常弱,目前仍然处于基本不可用的状态。 而这一次,是 Meta 达到了非侵入式脑到文本解码器研究的下一个重大里程碑:Brain2Qwerty v2 。 同样地,Meta 去年发布的 Brain2Qwerty v1 版本, 登上了 Nature Neuroscience 。 - 论文链接:https://www.nature.com/articles/s41593-026-02303-2 Brain2Qwerty v2 是性能最高的端到端流程,能够从原始脑信号中 实时解码句子 。它 超越了字符级解码 ,能够解码单词和语义,从而提高整体沟通的准确性。 v1 在 2025 年公开,核心能力是从 MEG 脑磁信号中逐字符解码打字内容,最优表现是字符错误率(CER)约 32%。 v2 换了解码粒度。它不再逐字母拼凑,而是一步到位输出整句话。根据 Meta 公开的数据, 9 名被试的平均词准确率达到 61%,最优被试为 78% ,其中超过一半句子的解码偏差控制在一个单词以内。 - 论文链接:https://ai.meta.com/research/publications/accurate-decoding-of-natural-sentences-from-non-invasive-brain-recordings/ 技术架构 Meta 研究团队发布 Brain2Qwerty v2。这是目前性能最高的端到端非侵入式脑信号解码系统,能够从连续的脑活动中实时解码完整句子,其准确率已经接近此前只有依赖开颅植入脑机接口才能达到的水平。 为了加速神经科学研究的发展,研究团队正式开源 Brain2Qwerty v1 和 v2 的全部训练代码。同时,合作伙伴 —— 西班牙巴斯克认知、大脑与语言中心(BCBL)—— 也同步开放了 Brain2Qwerty v1 的数据集。 - 开源链接: https://github.com/facebookresearch/brain2qwerty - 数据集链接: https://huggingface.co/datasets/bcbl190626/SpanishBCBL - 博客链接: https://ai.meta.com/blog/brain2qwerty-brain-ai-human-communication/ 我们相信,这项研究有望真正改善数百万因脑损伤而失去交流能力患者的生活。此前,立体定向脑电图(Stereo-EEG,SEEG)和皮层脑电图(ECoG)等侵入式技术已经证明,通过神经假体采集脑信号并结合 AI 解码,可以恢复患者的语言交流能力。然而,这类方案需要脑部手术,难以大规模推广。相比之下,我们提出的非侵入式方案,有望填补这一空白。 在 Brain2Qwerty v2 的训练过程中,我们收集了 9 名志愿者约 22,000 句输入数据。每位参与者佩戴脑磁图(MEG)设备,在主动键盘输入过程中连续记录约 10 小时的脑活动。 与传统依赖人工设计神经事件检测流程的方法不同,Brain2Qwerty v2 采用端到端深度学习框架,直接从原始脑信号中学习并完成文本解码。 Brain2Qwerty v1 的核心思路是:根据在 BCBL 采集的 MEG 脑活动模式预测键盘敲击(keystrokes)。但该方法存在一个关键限制 —— 它依赖每一次按键的精确时间,因此无法实现实时解码。Brain2Qwerty v2 则突破了这一限制,可以直接从连续的脑活动信号中生成完整句子。 新模型由三个层级模块构成,协同提升对 “字母 — 单词 — 句子” 的解码能力: - MEG 信号首先输入 Conformer 模块(用于字符级检测) - 随后进入 Aligner(用于构建词级嵌入) - 最后由大语言模型(LLM)重建完整句子 整条流水线分为 Brain Encoder 和 NeuroLLM 两块。 B rain Enc oder : 负责将原始 MEG 波形压缩为字符级神经特征序列。底层用 BrainModule 做空间通道融合(Fourier 编码传感器坐标 → learnable 映射到 270 个虚拟通道 → per-subject affine 补偿个体差异),中层用 4 层扩张卷积(hidden 1,500)提特征并做 4 倍时间下采样,顶层用 4 层 Conformer(dim 1,024,4 heads)建模长程时序依赖。整体以 CTC loss 做字符级监督,在下采样后和 Conformer 后各挂一个 CTC head 联合训练,确保浅层也能获得有效梯度。 研究团队还将大语言模型针对神经数据进行了微调,使模型能够利用语言的语义上下文,在噪声较大的脑信号与连贯自然语言之间建立联系,从而显著提升解码质量。 NeuroLLM: 在 Encoder 输出之上接 Qwen3-4B(LoRA rank 128),将神经特征转化为自然语言句子。连接方式是:用 CTC 输出中的空格位置将 Conformer 特征切分为词级片段,各自 mean-pool 后过 MLP 得到「神经词嵌入」;训练时用 SigLIP 对比损失(Hard DTW 对齐 + sigmoid BCE)将其拉向 LLM 词嵌入空间。推理时 LLM 同时接收 CTC 解码文本和 MEG 嵌入两路输入(训练中对两路各做 10% 随机置零,增强鲁棒性),beam search(beam 16)生成最终句子。 此外,研究人员还引入了 AI Agent,对整个解码流程进行自动探索和优化;最终采用的训练配置,则由工程师进行人工筛选和确认。 超参数搜索由 3 个独立的 AI coding agent(Cursor + Claude Opus 4.6 驱动)并发执行。每个 agent 被分配一个 git worktree,可读写代码和提交 SLURM 训练任务。每 agent 10 轮,每轮恰好 50 个训练 job,总计 1,500 次实验。agent 之间严格隔离,只能看到自己分支的结果。工程师从三个 agent 的最终配置中手动选择最优。 最终结果显示,Brain2Qwerty v2 已能够从高度噪声的脑信号中恢复出语义连贯的完整句子。 模型平均单词准确率达到 61%,相比此前其他非侵入式脑信号解码方法约 8% 的单词准确率,实现了大幅提升。对于表现最佳的一位参与者,模型的单词准确率更是达到 78%;其中,超过一半的句子在解码时仅出现 1 个单词或更少的错误。 仍有挑战 在该方法真正应用于临床之前,仍有两个主要挑战: - 解码精度仍不 足以支持 日常使用 :当前模型仍存在较多单词级或字符级错误,难以直接用于实际沟通场景。 研究团队还发现,模型的解码准确率会随着训练数据规模增加而呈近似对数线性(log-linear)增长。这意味着,目前与侵入式脑机接口之间剩余的性能差距,未来有望仅通过持续扩大训练数据规模进一步缩小,而无需依赖新的模型架构。 - 设备限制较大 :本研究所使用的 MEG 系统体积庞大、成本高昂,普通患者难以接触。 当前实验用的 MEG 设备体积占据一整间屋子,依赖 SQUID 和液氦冷却,运行环境必须做磁屏蔽。这套系统造价数百万美元,离床旁使用都有距离,更别提日常佩戴。新一代基于 OPM 的便携 MEG 正在研发中,有望将尺寸压缩到头盔级别,但目前仍在早期阶段。 团队表示,希望通过开放研究的方式,加快人类对神经系统疾病的识别、诊断与治疗,让神经科学的发展速度不再受限于各自封闭的研究体系。 © THE END 转载请联系本公众号获得授权 投稿或寻求报道:liyazhou@jiqizhixin.com