效果漂移检测
持续观察成功率、误报、返工和用户纠偏,提前发现质量下滑。
持续观察成功率、误报、返工和用户纠偏,提前发现质量下滑。
区分 prompt 问题、数据问题、模型问题和流程问题,不把锅乱甩。
把 badcase、纠偏和验收证据沉淀成可复用数据。
给出能执行的修复建议,让运营从发现问题走到改进落地。
AEO 盯住质量变化,把坏案例变成改进燃料。
第一次跑起来,就能看到它接管哪一段工作。
需要长期追踪回答质量、任务完成率和用户满意度。
上线后要解释效果波动,知道该改数据、改 prompt 还是换模型。
把审计、失败和返工都纳入运营视角,持续减少重复错误。
安装后执行 init,先看真实效果,再决定接入多深。
npm install @self-evolving-harness/aeo