--- title: "五块钱如何花三天..." source: wechat url: https://mp.weixin.qq.com/s/ddwgM_jm1kD9JZyEK4ZTuw ingest_date: 2026-07-04 vxc: 64 stars: 4 sha256: 3cb6a7044f827fad5d831770d32db5b0ccaa3242715d73d90f547dbfa51e9b5c --- # 五块钱如何花三天... horsley,一位腾讯应用开发高级工程师 从token 焦虑到系统化治理,horsley这次想分享的不是几个省 token 小技巧,而是额度收紧后,团队怎样更稳定、更可持续地使用 Agent。 要真正管住 Token 成本,不能只靠临时节流,关键是先把这四件事看清楚: 一,真正的问题是浪费不可见 很多 token 不是花在难题上,而是花在黑盒里的绕路上。尤其在 IDE vibe 里,外部只看到结果,却看不到 agent 有没有选错模型、反复读旧上下文、工具失败后重试,或因为环境问题绕远路。 所以第一步不是让每个人更克制,而是先把浪费看清楚。 常见的四类浪费: (1)任务和模型不匹配:低复杂度任务也默认上顶级模型。 (2)上下文越来越厚:长对话里旧信息、工具输出、历史判断不断累积。 (3)工具和 MCP 太吵:日志、测试、命令输出里大量噪音被原样塞进上下文。 (4)失败反复重来:依赖缺失、参数错误、工具失败导致 agent 一轮轮尝试。 这些单次看都不大,但每天反复发生,就会成为账单上的大头。 二,值得花和该治理要分开 复杂设计、关键判断、疑难排障、探索新 workflow,这些 token 花得值,因为它们换来真实进展。 真正该治理的是模型错配、上下文膨胀、工具噪音和失败重试这些低质量消耗。 三,个人经验&平台能力 现在很多节省方式都靠个人经验:谁知道该用便宜模型,谁记得哪个 prompt 稳,谁的机器工具链更顺。但换个人、换机器、换一轮会话,经验就容易归零。团队不能长期靠个人自觉控成本。 长期看,省 token 应该从个人技巧变成系统能力。平台至少要做到:过程可见,能看到 tool call、失败重试和 token 花费位置;经验可沉淀,记录任务适合什么模型、prompt、skill;实验可回放,在同一状态下比较不同方案;环境可统一,减少本地差异带来的绕路。 四,两个启发 caveman 说明输出也是上下文,少寒暄、少复述、结论优先,可以减少后续语言垃圾。 RTK 说明工具输出不该原样喂给模型,而应先过滤、聚合、截断和去重。 它们共同证明:真正有效的 token 优化,不靠人临场克制,而要做进 workflow。 最后共识 先把不同浪费拆开看,再承认只靠个人兜底不可持续,最后再把可观测、经验沉淀、模型分层和工具治理做成平台能力。这样,Token 成本管理才不是一场临时省钱运动,而是一次真正的工程化治理。 五块钱未必能花三天,但至少要让每一块钱花得更明白。 **来源**: 腾讯技术工程 **发布日期**: 2026-07-01 **原文链接**: https://mp.weixin.qq.com/s/ddwgM_jm1kD9JZyEK4ZTuw --- 知道了 取消 允许 取消 允许 取消 允许 × 分析 微信扫一扫可打开此内容, 使用完整服务 : , , , , , , , , , , , , 。 视频 小程序 赞 ,轻点两下取消赞 在看 ,轻点两下取消在看 分享 留言 收藏 听过