知识模块
🤖 Agent 知识模块
五、Agent 架构模式
Chapter2 Materials

Agent 架构设计模式 - AI 伙伴咨询资料汇总

整理时间:2026-03-18 来源:豆包、DeepSeek、Qwen


一、ReAct 架构模式(Reasoning + Acting)

核心原理

ReAct由论文《ReAct: Synergizing Reasoning and Acting in Language Models》提出,核心思想是交替进行推理与行动,通过"思考→行动→观察"的循环逐步解决问题。

工作流程(TAO循环)

  1. Thought(思考):分析问题,确定下一步策略
  2. Action(行动):选择工具 + 构造参数 + 执行调用
  3. Observation(观察):获取工具返回结果,更新上下文
  4. 判断终止条件:答案明确 → 输出Final Answer;否则继续循环

优缺点

优点

  • 减少幻觉:行动前强制思考,避免盲目调用工具
  • 错误可追溯:每步Observation提供外部验证
  • 知识增强:通过工具调用获取实时信息

缺点

  • Token消耗大:每轮循环追加上下文
  • 响应时间长:多次LLM调用串行
  • 无限循环风险:相同Action反复执行

适用场景

  • 知识问答(需联网检索)
  • 多步计算任务
  • 网页导航/表单填写
  • 需要可解释性的决策场景

面试高频问题

  1. ReAct原理是什么? 答:将推理(Reason)和动作(Act)交替执行,先思考"要做什么、为什么",再调用工具/执行,提升可解释性与正确性。

  2. ReAct如何避免无限循环? 答:设置max_iterations、动作去重检测、进度监控。


二、Plan-and-Execute 模式

核心原理

Plan-and-Execute采用两阶段分离架构:先由规划器生成完整的多步计划,再由执行器按序执行子任务,支持执行中动态调整计划。

设计哲学:规划(Planning) ≠ 执行(Execution),解耦提升可维护性。

工作流程

Phase 1: Planning(规划阶段)

  1. 任务理解 → 提取关键信息
  2. 子任务分解 → DAG/序列
  3. 依赖分析 → 确定执行顺序
  4. 工具匹配 → 预分配资源

Phase 2: Execution(执行阶段)

  • 检查前置依赖是否完成
  • 调用对应工具执行
  • 记录结果 + 更新状态
  • [可选] 动态调整后续计划

关键优势(对比ReAct)

  • ✅ 规划可预验证:执行前检查计划合理性
  • ✅ 并行执行友好:无依赖子任务可并发
  • ✅ 调试定位清晰:问题可追溯到具体步骤
  • ✅ Token效率更高:避免ReAct的重复思考

适用场景

  • 复杂工作流(如数据清洗→分析→报告)
  • 多工具协同任务(搜索+计算+格式化)
  • 需要审计追踪的企业级应用
  • 对执行确定性要求高的场景

面试高频问题

  1. Plan-and-Execute相比ReAct,在什么场景下优势更明显? 答:任务可结构化拆解、需要并行执行、审计合规要求、成本控制敏感的场景。

三、Reflexion 反思模式

核心原理

Reflexion是一种基于语言反馈的强化学习框架,通过"执行→评估→反思→改进"的闭环,让Agent从失败经验中学习,无需微调底层模型。

三组件架构

  1. Actor(参与者):根据当前状态生成动作 + 自我批判陈述
  2. Evaluator(评估者):对执行轨迹打分(规则/LLM-based奖励函数)
  3. Self-Reflector(反思器):结合奖励信号+历史轨迹+长期记忆,生成改进建议

工作流程

  1. Initial Response:Actor生成初始答案 + Critique
  2. Tool Execution & Evaluation:执行工具获取外部验证,Evaluator输出奖励信号
  3. Reflection Generation:Self-Reflector分析失败原因,生成结构化反思
  4. Memory Update & Retry:反思内容存入滑动窗口记忆,Actor参考历史反思重新规划
  5. Convergence Check:达到成功标准/最大重试次数 → 输出

适用场景

  • 需要试错学习的决策任务(如策略优化)
  • 代码生成/调试(从编译错误中学习)
  • 复杂推理任务(多跳问答、数学证明)
  • 传统RL数据稀缺的场景

面试高频问题

  1. Reflexion如何实现"无需微调的强化学习"? 答:用语言反馈替代标量奖励,Evaluator输出自然语言反馈,比0/1奖励提供更多信息。

四、RAG + Agent 架构

核心原理

RAG(Retrieval-Augmented Generation)与Agent结合,通过检索增强生成的知识边界。

工作流程

  1. 用户Query → 向量检索相关文档
  2. 检索结果注入Agent上下文
  3. Agent基于检索内容进行推理和工具调用
  4. 生成最终答案

适用场景

  • 企业知识库问答
  • 文档分析任务
  • 需要领域知识的Agent应用

五、DAG 工作流架构

核心原理

DAG(Directed Acyclic Graph)工作流将任务组织为有向无环图,支持并行执行和依赖管理。

特点

  • 无依赖任务可并行执行
  • 有依赖任务按拓扑序执行
  • 支持条件分支和循环

适用场景

  • 数据管道处理
  • ETL任务编排
  • 复杂工作流自动化

六、状态机架构(State Machine)

核心原理

将Agent行为建模为有限状态机,定义状态集合、转换条件和动作。

特点

  • 状态转换明确可控
  • 易于调试和验证
  • 适合固定流程场景

适用场景

  • 对话系统
  • 游戏AI
  • 业务流程自动化

七、层次化 Agent 架构(Hierarchical Agent)

核心原理

采用树状结构组织Agent,高层负责战略规划,中层负责任务分解,底层负责具体执行。

三层架构

  1. 战略层(Strategic):制定高层计划
  2. 战术层(Tactical):转换战略为执行计划
  3. 执行层(Execution):具体操作执行

优点

  • 清晰的权责划分
  • 可控性强,便于管理
  • 决策效率高,减少通信
  • 易于扩展和维护

缺点

  • 层级过多可能导致延迟
  • 上层可能成为瓶颈
  • 灵活性受限,适应慢

适用场景

  • 大型复杂系统(自动驾驶、智慧工厂)
  • 组织管理系统
  • 军事指挥系统

架构模式对比总结

维度ReActPlan-ExecuteReflexion层次化
决策粒度步级任务级迭代级层级
适应性⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
可解释性⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Token效率⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
开发复杂度中等需设计规划器需评估+反思模块

混合架构实践(工业级推荐)

# 示例:Plan-ReAct-Reflexion 混合架构
def hybrid_agent(task):
    # Phase 1: 高层规划
    plan = planner.generate(task)  # Plan-and-Execute
    
    results = []
    for step in plan:
        # Phase 2: 步级执行(ReAct)
        step_result = react_executor.execute(step)
        
        # Phase 3: 关键步骤反思
        if step.is_critical:
            reflection = reflexion.analyze(step_result)
            if reflection.needs_retry:
                step_result = react_executor.execute(step, context=reflection)
        results.append(step_result)
    
    # Phase 4: 全局反思优化
    final_reflection = reflexion.global_review(results, task)
    return aggregate(results, final_reflection)

资料来源:豆包、DeepSeek、Qwen 三大 AI 伙伴咨询整理