---
title: "五块钱如何花三天..."
source: wechat
url: https://mp.weixin.qq.com/s/ddwgM_jm1kD9JZyEK4ZTuw
ingest_date: 2026-07-04
vxc: 64
stars: 4
sha256: 3cb6a7044f827fad5d831770d32db5b0ccaa3242715d73d90f547dbfa51e9b5c
---

# 五块钱如何花三天...


horsley，一位腾讯应用开发高级工程师

从token 焦虑到系统化治理，horsley这次想分享的不是几个省 token 小技巧，而是额度收紧后，团队怎样更稳定、更可持续地使用 Agent。

要真正管住 Token 成本，不能只靠临时节流，关键是先把这四件事看清楚：


一，真正的问题是浪费不可见
很多 token 不是花在难题上，而是花在黑盒里的绕路上。尤其在 IDE vibe 里，外部只看到结果，却看不到 agent 有没有选错模型、反复读旧上下文、工具失败后重试，或因为环境问题绕远路。

所以第一步不是让每个人更克制，而是先把浪费看清楚。

常见的四类浪费：
（1）任务和模型不匹配：低复杂度任务也默认上顶级模型。
（2）上下文越来越厚：长对话里旧信息、工具输出、历史判断不断累积。
（3）工具和 MCP 太吵：日志、测试、命令输出里大量噪音被原样塞进上下文。
（4）失败反复重来：依赖缺失、参数错误、工具失败导致 agent 一轮轮尝试。

这些单次看都不大，但每天反复发生，就会成为账单上的大头。


二，值得花和该治理要分开
复杂设计、关键判断、疑难排障、探索新 workflow，这些 token 花得值，因为它们换来真实进展。
真正该治理的是模型错配、上下文膨胀、工具噪音和失败重试这些低质量消耗。


三，个人经验&平台能力
现在很多节省方式都靠个人经验：谁知道该用便宜模型，谁记得哪个 prompt 稳，谁的机器工具链更顺。但换个人、换机器、换一轮会话，经验就容易归零。团队不能长期靠个人自觉控成本。

长期看，省 token 应该从个人技巧变成系统能力。平台至少要做到：过程可见，能看到 tool call、失败重试和 token 花费位置；经验可沉淀，记录任务适合什么模型、prompt、skill；实验可回放，在同一状态下比较不同方案；环境可统一，减少本地差异带来的绕路。


四，两个启发
caveman 说明输出也是上下文，少寒暄、少复述、结论优先，可以减少后续语言垃圾。
RTK 说明工具输出不该原样喂给模型，而应先过滤、聚合、截断和去重。
它们共同证明：真正有效的 token 优化，不靠人临场克制，而要做进 workflow。


最后共识
先把不同浪费拆开看，再承认只靠个人兜底不可持续，最后再把可观测、经验沉淀、模型分层和工具治理做成平台能力。这样，Token 成本管理才不是一场临时省钱运动，而是一次真正的工程化治理。

五块钱未必能花三天，但至少要让每一块钱花得更明白。

**来源**: 腾讯技术工程

**发布日期**: 2026-07-01

**原文链接**: https://mp.weixin.qq.com/s/ddwgM_jm1kD9JZyEK4ZTuw

---

知道了

取消
允许
取消
允许
取消
允许

×

分析

微信扫一扫可打开此内容， 

 使用完整服务

：
，
，
，
，
，
，
，
，
，
，
，
，
。
视频
小程序
赞
，轻点两下取消赞
在看
，轻点两下取消在看
分享
留言
收藏
听过