Agent 分类学
Russell & Norvig 提出的五大智能体类型
来自《人工智能:一种现代方法》(AIMA)第 2 章的经典分类体系,按能力递增排列:
1. 简单反射智能体(Simple Reflex Agent)
基于当前感知,使用条件-动作规则(Condition-Action Rules)直接响应。无状态设计,不存储历史信息,决策延迟通常在毫秒级。典型示例是自动恒温器:当温度低于设定值时启动加热,达到目标后关闭。
2. 基于模型的反射智能体(Model-Based Reflex Agent)
维护内部状态(世界模型),追踪"我在哪里"、"我做过什么"。理解环境自主演化规律和行为作用反馈机制,能够应对部分可观测环境。核心组件包括传感器、内部模型、推理组件和执行器。
3. 基于目标的智能体(Goal-Based Agent)
具备未来状态预测能力,通过搜索与规划算法寻找达成目标的最优路径。与模型反射的本质区别在于:从"当前情况下做什么"(reactive)转向"为了达成目标应该做什么"(proactive),能够牺牲短期利益换取长期目标。
4. 基于效用的智能体(Utility-Based Agent)
使用效用函数(Utility Function)评估结果优劣,不仅问"能否达成目标",更问"哪种方式最优"。能够在多目标间进行权衡优化,选择综合评分最高的路径(如同时考虑时间、能耗、安全等维度)。
5. 学习型智能体(Learning Agent)
包含四大核心组件:性能元件(基于当前知识选择动作)、评判器(评估表现并提供反馈)、学习元件(根据反馈更新知识库)、问题生成器(建议探索未尝试的动作)。通过观察 → 学习 → 行动 → 反馈 → 适应的循环持续改进性能。
参考:
智能体的三个互补分类维度
除了 Russell & Norvig 按能力递增的纵向分类,智能体还可从三个互补的横向维度进行系统性分类,分别对应决策复杂度、决策时序和知识形态:
维度一:基于内部决策架构的分类(Decision Architecture)
反映智能体从简单到复杂的演进路径:
| 类型 | 核心特征 | 典型示例 |
|---|---|---|
| 简单反射型 | 基于当前感知直接映射到行动,无记忆 | 自动恒温器、简单分拣机器人 |
| 基于模型的反射型 | 维护内部世界模型,处理部分可观测环境 | 自动驾驶中的障碍物推断 |
| 基于目标型 | 具备显式目标表示,能规划行动序列 | GPS 导航、路径规划 |
| 基于效用型 | 通过效用函数量化不同状态,进行多目标权衡 | 智能推荐、资源调度 |
| 学习型 | 能从经验中改进性能,具备自适应能力 | AlphaGo、强化学习智能体 |
维度二:基于时间与反应性的分类(Temporal Reactivity)
揭示智能体设计中速度与最优性的核心权衡:
| 类型 | 特点 | 优势 | 代价 |
|---|---|---|---|
| 反应式 (Reactive) | 即时响应,感知-行动直接映射 | 速度快、计算开销低 | 短视,易陷入局部最优 |
| 规划式 (Deliberative) | 深思熟虑,系统探索未来可能性 | 战略性、有远见 | 时间和计算成本高 |
| 混合式 (Hybrid) | 结合两者优点,分层或循环架构 | 既能快速反应又能长期规划 | 架构复杂度高 |
现代 LLM 智能体通常采用**"思考-行动-观察"循环**,将规划(Reasoning)与反应(Acting & Observing)融为一体。
维度三:基于知识表示的分类(Knowledge Representation)
这是 AI 领域持续半个多世纪的范式辩论,关乎智能体"思想"中知识的存储形式:
| 范式 | 核心信念 | 比喻 | 优势 | 缺陷 |
|---|---|---|---|---|
| 符号主义 (Symbolic AI) | 智能源于对符号的逻辑操作 | "一丝不苟的图书管理员" | 透明、可解释、决策可追溯 | 脆弱性、"知识获取瓶颈" |
| 亚符号主义 (Sub-symbolic AI) | 知识内隐分布在神经网络中 | "牙牙学语的孩童" | 强大的模式识别,对噪声鲁棒 | 黑箱、不透明、可能幻觉 |
| 神经符号主义 (Neuro-Symbolic AI) | 融合两者,既能学习又能推理 | 卡尼曼"系统1+系统2" | 兼具直觉与逻辑 | 实现复杂度高 |
Insight:三个维度相互正交,一个智能体可同时属于多个类别。例如,一个现代 AI 科研助手可能是"基于效用的"(架构维度)+ "混合式"(时间维度)+ "神经符号主义"(知识维度)的组合。LLM 智能体打破了传统分类边界—— 其神经网络内核提供亚符号的模式识别(系统1),而通过 Chain-of-Thought 生成结构化推理又实现了符号主义的逻辑能力(系统2)。
参考: