---
title: "快手AgentX：推荐系统开始自我迭代"
source_url: "https://mp.weixin.qq.com/s/h2PgHllv8MvF4phC8uSPUQ"
ingested: 2026-07-03
sha256: ad39e0242bad5d47f5c81bc1676103aa3a2765b5a73acbf5458925d9d8aeb764
author: 快手技术
publisher: 快手技术
---

过去十年，推荐系统的主线一直是把「建模」和「工程」做到更强。但在工业推荐真正的日常迭代里，最硬的瓶颈并不只在模型，而在研发生产方式本身。

快手 AgentX 团队发布技术报告《AgentX: Towards Agent-Driven Self-Iteration of Industrial Recommender Systems》，提出并验证了一套面向工业推荐系统的 Agent 驱动研发闭环。

AgentX 四阶段架构：

1. Brainstorm Agent：综合历史实验、系统架构、数据分析和外部论文，把目标收敛成有优先级、有证据、有边界的候选方案。每个方案说明目标指标、实现位置、所需信号、预期机制、风险和验证方式。

2. Developing Agent：通过仓库知识库、特征 schema 查询、DSL 检查、C++ 语法检查、dryrun 验证等工具，把代码生成约束在真实仓库和平台规则内。支持论文复现、模块消融和跨论文结构组合。

3. Evaluation Agent：负责安全部署、流量分桶、参数冲突检查、指标读取和 guardrail veto。成功和失败都资产化——成功成为 playbook，失败沉淀为反例和剪枝规则。

4. Harness Evolution (SGPO)：Semantic-Gradient-based Prompt Optimization——从历史轨迹中找出 Agent 工作方式的缺陷，转化为子 Agent 的局部 harness 更新，通过旧版与新版在同一批 replay 任务上的配对评估决定是否接纳。

核心数据（快手 App 真实部署，3 个 AgentX worker）：
- 374 个想法进入系统 → 106 个通过方案审核（28.34%）→ 100 个完成上线（94.3%）→ 10 个正向可发布（9.9%）
- 主站推荐：361 想法 → 8 可发布结果，用户 App 消费时长累计 +0.561%
- 生活服务：13 想法 → 2 可发布结果，年化超 1 亿元人民币收入
- 单 worker 并发实验数 12（vs 人工 1.5），提升 8 倍
- 单 worker 每周产出 1.1 个可发布结果，是人工 13.8 倍
- 单位人力业务价值提升 3.7 倍
- 自加速：周并发从 15→60，idea 通过率 15%→45%，周产出 2→5

PCV 增强精排分案例：第一轮 PCV boosting 未达显著性，转化为第二轮输入（质量门控+自适应权重），最终观看时长 +0.071%、真实曝光 +0.118%。

模型侧拓展：自动阅读论文、复现方法、跨论文结构组合，达到发布级别的模型在快手 App 直播时长指标上带来 +0.865% 收益。