---
title: "华盛顿大学等实测：Agent 能做到及时停止吗？"
source_url: "https://mp.weixin.qq.com/s/NKN8GmtO4lc5f9TIG-Komg"
ingested: 2026-07-03
sha256: PENDING
author: Hyman的杂货铺
publisher: Hyman的杂货铺
---

华盛顿大学与 Allen AI 等机构提出 Agentic Abstention 问题，在 28000+ 任务上系统评测 13 套 Agent，发现及时停止率普遍低于 40%。CONVOLVE 方法仅借 20 条轨迹蒸馏出的停止规则，就把 Llama-3.3-70B 的及时停止召回从 26.7% 拉到 57.4%，无需改模型参数。

关键问题：Agent 不仅需要会「答」和「做」，还要会在证据表明任务不可行时主动弃权（ABSTAIN）——停止进一步行动并说明原因。

与 LLM abstention（单轮 QA 拒答）不同，Agentic abstention 有三大特征：
1. 多了 ACT 动作空间，弃权不是默认选项
2. 观测随交互累积，最早应弃权步可能在多轮后才出现
3. 不止看「最终有没有弃权」，还要看及时性

三类典型失败模式：过坚持（该停不停）、延迟弃权（最终认栽但多搜七八轮）、过早放弃（over-abstention）。

WebShop 上最强基线及时弃权召回（AbsRec@1）仅 26.7%，终端环境 GPT-5.4-mini + Codex CLI 及时召回仅 21.6%。所有模型组平均及时召回低于 40%。

方法：CONVOLVE——用 LLM-as-judge 自动标注 20 条轨迹，蒸馏出可迁移的停止规则，无需改模型参数。