Agent 规划与推理

规划与推理是 Agent 的"大脑"，决定了 Agent 如何理解目标、拆解任务、制定执行步骤。本章深入探讨思维链、思维树、思维图谱等推理范式，以及任务分解、自我反思、PDCA 循环等规划策略。

一、为什么规划与推理如此重要？

1.1 Agent 的核心能力

Agent 与传统软件系统的根本区别在于自主决策能力：

┌─────────────────────────────────────────────────────────────┐
│                    传统软件 vs Agent                         │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   传统软件：                                                │
│   ┌─────────┐     ┌─────────┐     ┌─────────┐             │
│   │  输入   │ ──→ │ 固定规则 │ ──→ │  输出   │             │
│   └─────────┘     └─────────┘     └─────────┘             │
│                   程序员预设所有逻辑                          │
│                                                             │
│   Agent：                                                   │
│   ┌─────────┐     ┌─────────┐     ┌─────────┐             │
│   │  目标   │ ──→ │ 自主规划 │ ──→ │ 执行结果 │             │
│   └─────────┘     │ 动态推理 │     └─────────┘             │
│                   │ 调整执行 │                              │
│                   └─────────┘                              │
│                   Agent 自己决定"怎么做"                     │
│                                                             │
└─────────────────────────────────────────────────────────────┘

1.2 规划与推理的关系

概念	定义	作用
规划	将目标分解为可执行步骤	解决"做什么"的问题
推理	对每个步骤进行逻辑推导	解决"怎么做"的问题
执行	按计划调用工具完成任务	解决"做了什么"的问题

┌─────────────────────────────────────────────────────────────┐
│                    规划与推理协作流程                         │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   ┌──────────────────────────────────────────────────────┐ │
│   │                                                      │ │
│   │   用户目标："帮我策划一次公司团建活动"                │ │
│   │                                                      │ │
│   └──────────────────────────────────────────────────────┘ │
│                          │                                  │
│                          ↓                                  │
│   ┌──────────────────────────────────────────────────────┐ │
│   │                    规划阶段                           │ │
│   │                                                      │ │
│   │   1. 确定活动类型（户外拓展/室内聚会/旅行）           │ │
│   │   2. 确定预算范围                                     │ │
│   │   3. 选择活动地点                                     │ │
│   │   4. 安排活动流程                                     │ │
│   │   5. 准备物资清单                                     │ │
│   │                                                      │ │
│   └──────────────────────────────────────────────────────┘ │
│                          │                                  │
│                          ↓                                  │
│   ┌──────────────────────────────────────────────────────┐ │
│   │                    推理阶段                           │ │
│   │                                                      │ │
│   │   步骤1推理：                                         │ │
│   │   - 公司有50人，适合集体活动                          │ │
│   │   - 季节是春季，户外拓展合适                          │ │
│   │   - 建议选择户外拓展                                  │ │
│   │                                                      │ │
│   │   步骤2推理：                                         │ │
│   │   - 人均预算200-300元合理                             │ │
│   │   - 总预算10000-15000元                               │ │
│   │                                                      │ │
│   └──────────────────────────────────────────────────────┘ │
│                          │                                  │
│                          ↓                                  │
│   ┌──────────────────────────────────────────────────────┐ │
│   │                    执行阶段                           │ │
│   │                                                      │ │
│   │   • 搜索附近户外拓展基地                              │ │
│   │   • 查询价格和可预约时间                              │ │
│   │   • 生成活动方案文档                                  │ │
│   │                                                      │ │
│   └──────────────────────────────────────────────────────┘ │
│                                                             │
└─────────────────────────────────────────────────────────────┘

二、核心推理范式

2.1 推理范式演进

┌─────────────────────────────────────────────────────────────┐
│                    推理范式演进历程                          │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  2022          2023          2023          2024            │
│    │             │             │             │              │
│    ↓             ↓             ↓             ↓              │
│ ┌──────┐    ┌────────┐    ┌────────┐    ┌────────┐         │
│ │ CoT  │ ─→ │  ToT   │ ─→ │  GoT   │ ─→ │ 多模态 │         │
│ │思维链│    │ 思维树 │    │思维图谱│    │ 推理   │         │
│ └──────┘    └────────┘    └────────┘    └────────┘         │
│                                                             │
│ 线性推理     树状探索      图状推理      跨模态推理         │
│ Step by     多路径分支    聚合与分解    图文音视频          │
│ Step        BFS/DFS搜索   循环与回溯    综合推理            │
│                                                             │
│ 简单问题     需要回溯      复杂依赖      多媒体内容          │
│ 快速回答     探索最优解    关系推理      深度理解            │
│                                                             │
└─────────────────────────────────────────────────────────────┘

2.2 推理范式对比

范式	结构	特点	适用场景	复杂度
CoT（思维链）	线性链	简单直接，易于实现	数学推理、逻辑推理	★★
ToT（思维树）	树状	支持回溯，多路径探索	复杂决策、创意写作	★★★
GoT（思维图谱）	图状	支持聚合分解，循环推理	复杂问题求解	★★★★

2.3 范式选择指南

┌─────────────────────────────────────────────────────────────┐
│                    推理范式选择决策树                        │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│                      ┌─────────────┐                        │
│                      │ 问题复杂度  │                        │
│                      └──────┬──────┘                        │
│                             │                               │
│              ┌──────────────┼──────────────┐               │
│              ↓              ↓              ↓               │
│         ┌────────┐    ┌────────┐    ┌────────┐            │
│         │  简单  │    │  中等  │    │  复杂  │            │
│         └───┬────┘    └───┬────┘    └───┬────┘            │
│             │             │             │                  │
│             ↓             ↓             ↓                  │
│        ┌─────────┐  ┌──────────┐  ┌───────────┐           │
│        │   CoT   │  │   ToT    │  │    GoT    │           │
│        │ 线性推理 │  │ 树状探索 │  │ 图状推理  │           │
│        └─────────┘  └──────────┘  └───────────┘           │
│                                                             │
│        ┌──────────────────────────────────────┐           │
│        │          是否需要回溯？               │           │
│        └─────────────────┬────────────────────┘           │
│                          │                                 │
│                 ┌────────┴────────┐                       │
│                 ↓                 ↓                       │
│            ┌─────────┐      ┌──────────┐                 │
│            │   否    │      │    是    │                 │
│            └────┬────┘      └────┬─────┘                 │
│                 ↓                 ↓                       │
│           ┌───────────┐    ┌────────────┐                │
│           │    CoT    │    │ ToT 或 GoT │                │
│           └───────────┘    └────────────┘                │
│                                                             │
└─────────────────────────────────────────────────────────────┘

三、规划策略概览

3.1 核心规划方法

方法	核心思想	适用场景
任务分解	将大任务拆分为小任务	复杂多步骤任务
自我反思	执行后检查并改进	需要高质量输出的任务
PDCA 循环	计划-执行-检查-处理	持续改进型任务

3.2 规划粒度控制

┌─────────────────────────────────────────────────────────────┐
│                    任务分解粒度谱系                          │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│   粒度过粗                            粒度过细              │
│   ◄──────────────────────────────────────────────────►     │
│                                                             │
│   ┌─────────┐   ┌─────────┐   ┌─────────┐   ┌─────────┐   │
│   │ 目标级  │   │ 阶段级  │   │ 步骤级  │   │ 操作级  │   │
│   │         │   │         │   │         │   │         │   │
│   │ 完成项目│   │ 需求分析│   │ 编写函数│   │ 输入代码│   │
│   │         │   │ 设计    │   │ 测试    │   │ 点击按钮│   │
│   │         │   │ 开发    │   │ 部署    │   │ 保存文件│   │
│   └─────────┘   └─────────┘   └─────────┘   └─────────┘   │
│                                                             │
│   难以执行      适中粒度       执行清晰       过度细化      │
│   缺乏指导      规划适中       易于执行       成本过高      │
│                                                             │
│                   ▲                                         │
│                   │                                         │
│              最佳粒度                                        │
│           （根据任务复杂度调整）                             │
│                                                             │
└─────────────────────────────────────────────────────────────┘

四、章节内容导航

规划与推理概述 Chain-of-Thought（思维链）Tree-of-Thought（思维树）Graph-of-Thought（思维图谱）任务分解策略自我反思与纠错 PDCA 循环执行

五、学习路径

5.1 推荐学习顺序

入门 → Chain-of-Thought（理解 Step by Step 推理）
         ↓
进阶 → Tree-of-Thought（学习树状探索）
         ↓
深入 → Graph-of-Thought（掌握图状推理）
         ↓
应用 → 任务分解策略（实践规划能力）
         ↓
提升 → 自我反思 + PDCA（持续改进）

5.2 学习目标

阶段	学习内容	预期收获
入门	CoT 原理与实现	理解推理的基本模式
进阶	ToT 搜索策略	掌握多路径推理方法
深入	GoT 图结构	理解复杂推理关系
应用	任务分解	学会规划复杂任务
提升	反思与PDCA	建立持续改进机制

六、总结

概念	一句话总结	面试关键词
规划	将目标分解为可执行步骤	任务分解、粒度控制、依赖分析
推理	对每个步骤进行逻辑推导	CoT、ToT、GoT、Step by Step
反思	执行后检查并改进	Self-Reflection、错误纠正
PDCA	计划-执行-检查-处理循环	持续改进、质量管理

一句话总结：规划解决"做什么"，推理解决"怎么做"，二者结合使 Agent 具备自主决策能力。

最后更新：2026年3月19日

七、规划模块规划模块概述