跳到内容
← 日志

从容的 AI 平台:在不烧光团队的前提下交付智能

三个我用来把现代 AI 引入企业平台的实用模式 —— 不会把团队变成永久的救火队员,反而让周一早上重新变得无聊。

发布于 2026年4月22日 · 1 分钟阅读
  • AI
  • 平台
  • 架构
  • Claude

当 AI 工作在一个严肃团队里走得顺利时,它会呈现出一种特定的形态:不光鲜,大多是管道工程,而又在缓慢地成为软件构建方式中最重要的一次转变。

这就是我一直在推动的那种”平台里的 AI”:从容、可观测,而且让周一早上重新变得无聊。

1. 智能体不是产品

智能体是抵达下一项决策的最快路径。Claude Code 工作流、Codex 任务、本地模型 —— 都不是产品,而是杠杆。

当团队把智能体当作产品时,会发生两件事:

  • 在表面(聊天 UI、Prompt UX、品牌)上过度投入。
  • 底层(评测、重试、幂等、审计、成本)上投入不足。

把它反过来。先建底层。选择最便宜的表面:一个 CLI、一条 Slack 命令、一个嵌进现有后台的按钮。把表面投入留到你已经有”值得做的决策”履历那一刻。

2. 可观测性是与未来的你签订的合同

每一次智能体调用都进入结构化 trace:模型、in/out token、延迟、prompt id、tool calls、推理 hash、成本。这条 trace 像其它生产遥测一样被查询:Grafana 仪表盘、告警阈值、每周复盘。

胜利不在”我们知道智能体做了什么”。胜利在捕捉回归:新版本模型来了,把昨天的 trace 重放一遍,在它触达真实用户之前就看到成本、延迟和行为的差异。

如果你回答不了”上周二下午 3 点,这个智能体决定了什么、为什么”,你拥有的不是 AI 平台,只是一个愿望。

3. 无聊的工具,昂贵的判断

可扩展的模式是:

  • 无聊的编排 —— 你现有的 job runner、队列、CI。不引入新的供应商。
  • 昂贵的判断 —— 一组数量很少、命名清晰的”判断”步骤,只有模型能做的事在这里发生。
  • 廉价的兜底 —— 判断步骤失败或评测崩了,系统降级到人类五分钟内能读懂的确定性路径。

不光鲜,无法变成 Twitter 长帖。但团队睡得好,平台在学习,下一次迁移的体量比上一次小一半。

那才是值得交付的 AI。

这篇有帮助吗?