企业需要的
可能不是
AI Agent

AIGC-DAO · 内部分享

01 / 13
观察 02 / 13
很多 AI Agent
只是一个 while-loop
# 看起来很 Agent def agent(task): while not done(task): action = llm.choose(task) result = run(action) task.update(result) return task.result

循环 + LLM = 叫它 Agent?

核心问题 03 / 13
分清 两件事
A
重复执行

流程固定 · 输入确定 · 输出确定

合同摘要 / 报表生成 / 订单录入

80% 的场景

B
动态决策

上下文多变 · 需要权衡 · 路径不可预知

异常处理 / 谈判 / 复杂排障

20% 的场景

多数"Agent 方案"
在用 A 假装做 B
AI 产品架构演进 04 / 13
6 个形态 · 一条从弱到强的主线
01Chatbot
02AI Workflow
03Agent
04Agentic Workflow
05Autonomous Agent
06Harness

接下来,展开看每一个。

01 · Chatbot 05 / 13
Chatbot · 对话界面
特征

一问一答 · 无状态 · 无工具

靠 prompt 拼装上下文

客服 FAQ · 内部知识问答 · 写作辅助

企业视角

最成熟

最容易跑起来

80% 内部 AI 工具停留在此

02 · AI Workflow 06 / 13
AI Workflow · 流程编排
特征

任务拆节点 · DAG 编排

LLM 只是其中一个节点

路径确定 · 可重放 · 可审计

fetch(news) → summarize() → translate(zh, en) → classify(topic) → store(db) → generate(report) → notify(slack)

👉 "AI 提效"的实际形态

03 · Agent 07 / 13
Agent · 工具调用的最小单元
特征

有目标 · 有工具 · 有 ReAct 循环

单次任务 · 单 agent 即可

路径可能变化 · 范围有界

"查一下上季度华东区销售数据并生成报告"

# 最小 Agent 循环 def agent(goal): ctx = init(goal) while not done(ctx): tool = choose_tool(ctx) obs = call(tool, ctx) ctx.add(obs) return ctx.answer

距离生产,还差 10 个工程问题

04 · Agentic Workflow 08 / 13
Agentic Workflow · 多 Agent 协作
Planner
Researcher
Critic
Refiner
Reporter
特征

任务拆给多个角色 Agent

有规划 · 有批评 · 有迭代

质量高 · 成本和延迟也高

场景

深度调研报告

代码多轮 review + 重构

复杂合同条款博弈

05 · Autonomous Agent 09 / 13
Autonomous Agent · 长时间自主运行
特征

持续运行 · 跨天 / 跨周

自我规划 · 自我纠错

持久记忆 + 持久身份

场景

Devin / AutoGPT · 盯 PR · 修 issue

个人 AI 助理 · 日程 · 邮件 · 出行

运营巡检 · 7×24 监控 + 自动响应

能跑 ≠ 能用 ≠ 能上线
06 · Harness 10 / 13
Harness · 治理与编排层
它不是 Agent,
是 Agent 的 工作台
边界
权限
观测
回放
兜底
回滚

统一管理上面 5 种形态

身份 · 工具 · 上下文 · 审计

LangGraph / Temporal /

CrewAI / 内部 Agent Platform

回到全局 11 / 13
边界控制
最后 一层

它不是技术问题,是 治理问题

能跑
能用
能上

大多数企业,卡在第三层。

现实 12 / 13
Demo 生产

Demo · 虚假丝滑

  • 精心挑选的输入
  • 有人兜底的错误
  • 不计成本的 token
  • 一个工程师盯日志

生产 · 真实复杂

  • 脏数据 · 错别字 · 附件
  • 千人并发 · 模型限流
  • 成本要算到分
  • 普通员工不是 Agent 专家
关上工程师的兜底
它还能 不能 跑?
落地 · 判断 13 / 13
企业落地 AI 的 5 件事
  • 安全 · 数据隔离 · 提示词注入 · 私有化边界
  • 权限 · 谁能让 AI 做什么 · 谁能看 AI 做了什么
  • 成本 · Token · 调用次数 · 失败重试的账单
  • 回滚 · 模型/版本切换的灰度与回退
  • 责任 · 出错谁背锅 · 审计链路是否完整
最先被 AI 影响的:
低判断 · 高重复 · 强标准化

谢谢 · AIGC-DAO