跳到主要内容

agentic-design-patterns

Agentic Design Patterns.

📄️ 第 14 章:知识检索(RAG)

LLM 在生成类人文本方面展现出了强大的能力。然而,它们的知识库通常局限于训练时使用的数据,这限制了它们对实时信息、特定公司数据或高度专业化细节的访问。知识检索(RAG,即检索增强生成)技术正是为了解决这一局限性而设计的。RAG 使 LLM 能够访问和整合外部信息、实时数据和特定上下文内容,从而显著提高其输出的准确性、相关性和事实基础。

📄️ 第 16 章:资源感知优化

资源感知优化使智能体在运行过程中能够动态监控和管理计算、时间和财务资源。这与简单的规划不同,规划主要关注动作序列的安排。资源感知优化要求智能体在动作执行方面做出决策,以便在指定的资源预算内达成目标或优化效率。这涉及在更准确但昂贵的模型与更快速、成本更低的模型之间进行权衡,或者决定是分配额外的计算资源来获得更精细的响应,还是返回更快但细节较少的答案。

📄️ 第 17 章:推理技术

本章深入探讨智能体的高级推理方法,重点关注多步骤逻辑推理和复杂问题解决。这些技术超越了简单的顺序操作,使智能体的内部推理过程变得透明可见。通过这种方式,智能体能够将复杂问题分解为更小的子问题、考虑中间推理步骤,并得出更加可靠和准确的结论。这些高级方法的核心原则是在推理过程中分配更多的计算资源。这意味着给予智能体或底层 LLM 更多的处理时间或推理步骤来处理查询并生成响应。与快速单次处理不同,智能体可以进行迭代改进、探索多种解决方案或利用外部工具。这种延长推理时间的方法通常能显著提升准确性、连贯性和鲁棒性,特别是在处理需要深入分析和仔细审议的复杂问题时。

📄️ 第 18 章:Guardrails/安全模式

Guardrails(防护栏),也称为安全模式,是确保智能体安全、符合道德规范并按预期运行的关键机制,特别是在智能体自主并集成到关键系统中的情况下。它们作为保护层,引导智能体的行为和输出,防止有害、有偏见、无关或其他不良响应。这些防护栏可以在多个阶段实施,包括输入验证/清理以过滤恶意内容、输出过滤/后处理以分析生成响应中的毒性或偏见、通过直接指令设置行为约束(提示词级别)、工具使用限制以约束智能体能力、智能体核心的外部审核 API,以及通过"人机协同"机制实现的人工监督/干预。

📄️ 第 20 章:优先级排序

在复杂、动态的环境中,智能体常常面临大量潜在行动、相互冲突的目标以及有限的资源。如果没有明确的流程来确定后续行动,智能体可能会遇到效率低下、操作延迟或无法实现关键目标的问题。优先级排序模式通过使智能体根据重要性、紧迫性、依赖关系和既定标准来评估和排序任务、目标或行动,从而解决这一挑战。这确保智能体将精力集中在最关键的任务上,从而提高有效性和目标一致性。

📄️ 第 21 章:探索和发现

本章探讨了使智能体能够主动寻求新信息、发现新可能性并识别其操作环境中未知因素的模式。探索和发现不同于被动行为或在预定义解决方案空间内的优化。相反,它们侧重于智能体主动进入陌生领域、尝试新方法并生成新知识或理解。这种模式对于在开放式、复杂或快速演变的领域中运行的智能体至关重要,在这些领域中,静态知识或预编程的解决方案是不够的。它强调智能体扩展其理解和能力的能力。

📄️ 结论

在本书中,我们从 Agentic AI 的基础概念出发,一路探索到复杂自主系统的实际实现。我们从这样一个前提开始:构建智能体就像在技术画布上创作一幅复杂的艺术作品——这个过程不仅需要一个强大的认知引擎(如大型语言模型),还需要一套稳健的架构蓝图。这些蓝图,或者说 Agentic 模式,提供了将简单的被动模型转变为能够进行复杂推理和行动的主动的、目标导向的实体所需的结构和可靠性。