Agent框架¶

约 1423 个字预计阅读时间 4 分钟

随着大语言模型(LLM)的快速发展，Agent框架成为构建智能应用的核心工具。这些框架提供了从简单的单Agent系统到复杂的多Agent协作的完整解决方案。

1.概述¶

Agent框架是用于构建能够自主感知、推理和执行任务的AI系统的工具集。它们通常提供以下核心能力：

工具调用：连接外部API、数据库和工具
记忆管理：维护对话历史和长期记忆
规划能力：将复杂任务分解为可执行的步骤
多Agent协作：多个Agent协同完成复杂任务
状态管理：跟踪Agent的执行状态

2.分类¶

2.1 多Agent系统¶

多Agent系统又可分为垂直型的（Supervisor的），水平型的（去中心的），混合型的。

2.2 规划型¶

Plan-and-Execute最常见，先拆子任务，做完了拿结果回来给规划器，规划器看情况调整计划。

2.3 反思型¶

Reflexion会让Agent明确地批评自己之前的输出，然后重新生成更好的版本，也就是用时间换质量。ToT把问题展开成一棵树，每个节点都是一种可能的思路，扩展、评分、修剪，反复搜索最优解。

3.LangChain¶

概述：LangChain是最早的LLM应用开发框架之一，提供了构建Agent的完整工具链。

核心特性：

模块化设计，可组合各种组件（chains、agents、memory）
丰富的预构建工具集成
支持多种LLM提供商
LangSmith用于调试和监控

适用场景：

快速原型开发
需要丰富工具集成的场景
学习Agent概念

官方资源：

文档：https://python.langchain.com/
GitHub：https://github.com/langchain-ai/langchain

4.LlamaIndex¶

概述：专注于数据连接的Agent框架，擅长构建RAG（检索增强生成）应用。

核心特性：

强大的数据索引和检索能力
支持多种数据源（文档、API、数据库）
LlamaParse用于解析复杂文档
AgentFS提供安全的文件系统访问
Workflows支持构建上下文感知Agent

适用场景：

需要连接私有数据的企业应用
知识库问答系统
文档分析和处理

官方资源：

文档：https://docs.llamaindex.ai/
GitHub：https://github.com/run-llama/llama_index

5.LangGraph¶

概述：LangChain团队推出的图形化Agent编排框架，通过状态图定义Agent行为。

核心特性：

基于图的控制流
循环和条件分支支持
状态管理和持久化
与LangChain生态系统无缝集成
可视化Agent执行流程

适用场景：

需要复杂控制流的Agent
状态机类型的应用
需要可视化和调试的场景

官方资源：

文档：https://langchain-ai.github.io/langgraph/
GitHub：https://github.com/langchain-ai/langgraph

6.CrewAI¶

概述：专注于角色扮演的多Agent协作框架，模拟真实团队工作方式。

核心特性：

基于角色的Agent定义
任务分配和协作机制
自动化工作流设计
支持人工干预
直观的团队配置

适用场景：

模拟团队协作流程
复杂业务流程自动化
需要明确分工的多Agent系统

官方资源：

文档：https://docs.crewai.com/
GitHub：https://github.com/crewAIInc/crewAI

7.HayStack¶

概述：deepset开发的企业级AI编排框架，专注于生产环境部署。

核心特性：

端到端AI应用开发
高级索引和检索
多Agent模式支持
企业级测试和评估
可扩展的模块化架构

适用场景：

企业级生产环境
需要高可靠性和可扩展性
复杂的检索和问答系统

官方资源：

文档：https://docs.haystack.deepset.ai/
GitHub：https://github.com/deepset-ai/haystack

8.AutoGen¶

概述：微软开发的multi-agent框架，专注于Agent间的对话和协作。

核心特性：

对话式Agent交互
可定制的Agent行为
支持人类参与
代码执行能力
与Azure深度集成

适用场景：

需要Agent间对话协作
微软技术栈环境
代码生成和执行场景

官方资源：

文档：https://microsoft.github.io/autogen/
GitHub：https://github.com/microsoft/autogen

9.AutoGPT¶

概述：开创性的自主Agent框架，能够自主完成复杂任务。

核心特性：

完全自主的任务执行
自动规划和分解
内存管理
文件操作能力
Web浏览和交互

适用场景：

自主任务执行
概念验证项目
学习自主Agent原理

官方资源：

文档：https://docs.agpt.co/
GitHub：https://github.com/Significant-Gravitas/AutoGPT

10.MetaGPT¶

概述：模拟完整软件团队的多Agent框架，能够从需求生成完整代码。

核心特性：

模拟完整软件团队（PM、架构师、工程师等）
标准化操作流程(SOP)
自动生成PRD、架构设计、代码
约5轮对话完成软件开发
高质量代码输出

适用场景：

软件开发自动化
从需求到代码的全流程
模拟真实开发团队

官方资源：

文档：https://github.com/FoundationAgents/MetaGPT
GitHub：https://github.com/FoundationAgents/MetaGPT

11.框架对比¶

框架	语言	多Agent	主要特点	学习曲线
LangChain	Python/JS	✓	生态最丰富，组件齐全	中等
LlamaIndex	Python/TS	✓	数据连接最强	中等
LangGraph	Python/JS	✓	图形化编排	较高
CrewAI	Python	✓✓	角色协作	较低
HayStack	Python	✓✓	企业级	较高
AutoGen	Python	✓✓	对话式协作	中等
AutoGPT	Python	-	完全自主	中等
MetaGPT	Python	✓✓	软件开发团队	较高

12.选择建议¶

入门学习：LangChain、CrewAI

企业生产：HayStack、LangGraph

数据密集：LlamaIndex

多Agent协作：CrewAI、AutoGen、MetaGPT

快速原型：LangChain、AutoGPT

13.参考资料¶

Agent框架¶

1.概述¶

2.分类¶

2.1 多Agent系统¶

2.2 规划型¶

2.3 反思型¶

3.LangChain¶

4.LlamaIndex¶

5.LangGraph¶

6.CrewAI¶

7.HayStack¶

8.AutoGen¶

9.AutoGPT¶

10.MetaGPT¶

11.框架对比¶

12.选择建议¶

13.参考资料¶

13.1 综合对比文章¶

13.2 框架官方资源¶

13.3 深度教程¶