智能体编排
如何让智能体真正发挥价值,精准对接用户需求?接下来,就让我们一同深入探索智能体的编排之道,看看哪些核心功能能帮助我们打造出既强大又实用的智能体。
在开始之前,有一个关键原则需要牢记:智能体的优劣,从不取决于功能的堆砌或流程的繁琐。真正能称之为 "优秀" 的智能体,是懂得用 "巧劲" 的 —— 精准筛选出最适配的资源(插件、工作流、MCP、数据表、知识库等),用最精练的组合,直击用户需求的核心。
智能体类型
Nuwax AgentOS 支持两种类型的智能体,分别适用于不同的使用场景:
问答型智能体
特点:
- ❌ 不支持技能和子智能体
- ✅ 支持自定义页面组件
- ⚡ 快速响应,低资源消耗
适用场景:
- 知识问答
- 智能客服
- 快问快答的对话场景
- 需要自定义界面展示的交互
典型应用:客服机器人、知识库助手、产品咨询助手
通用型智能体
特点:
- ✅ 支持技能(Skills)
- ✅ 支持子智能体(Subagents)
- ❌ 不支持自定义页面组件
- 🖥️ 为智能体分配独立的执行环境
- 💾 比较消耗内存资源
- ⏱️ 输出结果较慢
适用场景:
- 应用开发
- 深度调研
- 数据分析
- 演示文稿制作
- 文档生成
- 代码审查与重构
- 复杂的自动化任务
典型应用:开发助手、数据分析专家、文档编写助手、代码审查专家
功能对比:
| 功能 | 问答型智能体 | 通用型智能体 |
|---|---|---|
| 技能 (Skills) | ❌ | ✅ |
| 子智能体 (Subagents) | ❌ | ✅ |
| 自定义页面组件 | ✅ | ❌ |
| 插件 | ✅ | ✅ |
| 工作流 | ✅ | ✅ |
| MCP | ✅ | ✅ |
| 知识库 | ✅ | ✅ |
| 长期记忆 | ✅ | ✅ |
| 响应速度 | ⚡ 快 | 🐢 慢 |
| 资源消耗 | 💚 低 | 🔴 高 |
创建智能体
找到工作空间→智能体开发→创建智能体

填写智能体名称、智能体功能介绍和添加图标,并选择智能体类型(问答型/通用型)

更新智能体
点击左上角编辑按钮

弹出更新智能体设置框,可以修改智能体名称、功能介绍、图标和类型

编排
模型设置
智能体在不使用其他工具时,也是会自带模型,可以制作成普通的对话大模型来使用,点击编排区域右上角的模型设置按钮

弹出模型设置对话框,点击左侧会话模型下拉列表选择对话使用模型

当设置右侧推理模型时,用户可在会话窗口下方切换当前对话模型为推理模型,如果模型设置本身即为推理模型,此选项可不设置


生成多样性包含四种模式(默认使用平衡模式):
- 精确模式:严格遵循指令生成内容,适用于需准确无误的场合,如正式文档、代码等
- 平衡模式:在创新和精确之间寻求平衡,适用于大多数日常应用场景,生成有趣但不失严谨的内容
- 创意模式:激发创意,提供新颖独特的想法,适合需要灵感和独特观点的场景,如头脑风暴、创意写作等
- 自定义模式:通过高级设置,自定义生成方式,根据需求,进行精细调整,实现个性化优化

再介绍下这两个参数的作用:
- 生成随机性(temperature):这个参数的英文描述为 temperature,调高温度会使得模型的输出更多样性和创新性,反之,降低温度会使输出内容更加遵循指令要求但减少多样性。建议不要与 "Top p" 同时调整。
- Top p为累计概率:模型在生成输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到 Top p 值。这样可以限制模型只选择这些高概率的词汇,从而控制输出内容的多样性。建议不要与 "生成随机性" 同时调整。
输入及输出设置:
- 携带上下文轮数:设置带入模型上下文的对话历史轮数。轮数越多,多轮对话的相关性越高,但消耗的 Token 也越多。
- 最大回复长度:控制模型输出的 Tokens 长度上限。通常 100 Tokens 约等于 150 个中文汉字。
⚠️ 重要提示:请正确设置模型最大支持的token输出数量,过小的输出token可能导致无法生成结果文件。
支持的模型协议:
通用型智能体支持以下模型协议:
Anthropic 协议:支持国内各家的编程套餐
注意:非编程套餐的 Anthropic 协议接口,需要在添加模型时的模型描述中增加
use nuwax_cli指令。
OpenAI 协议:基本都支持(需支持流式函数调用)
系统提示词
在大模型交互中,系统提示词(System Prompt)是在用户与模型正式对话前,预先设置给模型的 "底层指令"。它相当于给模型定下的 "行为准则" 或 "角色定位",用于全局约束模型的回答风格、能力范围、价值观倾向等,是比用户输入的普通提示词(User Prompt)更基础的引导。
平台提供 AI 自动生成系统提示词


点击替换即可填入系统提示词输入框

技能 [仅任务型]
⚠️ 注意:此功能仅通用型智能体可用
技能(Skills)是包含指令、脚本和资源的文件夹,智能体可以动态加载它们来提升在专门任务上的性能。
- ✅ 通用型智能体:可以使用技能
- ❌ 问答型智能体:不支持技能
详细的技能管理请参考:技能管理文档

添加技能后,智能体会根据任务自动选择合适的技能来执行。
子智能体 [仅任务型]
⚠️ 注意:此功能仅通用型智能体可用
子智能体是预配置的 AI 个性,主智能体可以将任务委托给它们。每个子智能体使用自己独立的上下文窗口,可以配置为只允许使用特定工具。
- ✅ 通用型智能体:可以使用子智能体
- ❌ 问答型智能体:不支持子智能体
详细的子智能体管理请参考:子智能体文档

添加子智能体后,主智能体可以根据任务类型自动委托给合适的子智能体处理。
插件
插件能够让智能体调用外部 API,例如搜索信息、浏览网页、生成图片等,扩展智能体的能力和使用场景。
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持

将鼠标移动到插件卡片上,右侧出现设置按钮

点击设置按钮,弹出插件设置界面

参数:调用插件需要给插件提供的变量数据,参数是在插件创建时由作者定义的,所以无法对参数进行增删改,但可以调整参数的默认值和是否开启参数,当参数设置为关闭时,大模型将无法看到该参数。如果该参数设置了默认值并且不可见,则在调用时,智能体会默认只使用这个设定值。如下示例,给联网搜索插件设置两个默认值,并且关闭参数可见

输入要求智能体调用联网搜索,智能体调用联网搜索插件时,query参数设置为默认值提交给联网搜索插件,调用结果如下

调用方式:
- 自动调用:用户每次发送消息后都会触发调用一次
- 按需调用:由模型根据任务情况决定是否需要调用
- 手动选择:由用户决定是否使用该工具,在用户选择的情况下和自动调用效果一样
- 手动选择+按需调用:用户选择后,由模型根据任务情况选择是否需要调用;用户不选择则不会调用

异步运行:任务进入异步运行时默认返回一条回复内容,用户可以继续对话,任务在后台运行完成后会通知用户

异常处理:异常时中断流程,异常时输出给大模型的默认信息

卡片绑定 [仅问答型]:调用插件时,会在右侧显示展示台展示卡片信息,先选择卡片样式,然后为卡片选项绑定数据源,开启点击卡片跳转(绑定后,用户在智能体对话流中点击卡片可跳转至其他页面)


工作流
工作流支持通过可视化的方式,对插件、大语言模型、代码块等功能进行组合,从而实现复杂、稳定的业务流程编排,例如旅行规划、报告分析等。
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持

工作流的配置同插件类似,配置中增加了输出方式,选择是否直接输出,如果选择"是",将会把工作流运行结果直接输出到会话框中,不会再经过大模型总结输出。
MCP
智能体可以通过标准化协议(MCP)连接各类服务 API 并发起调用。
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持

MCP 设置参考插件配置。
文本
将文档、URL、三方数据源上传为文本知识库后,用户发送消息时,智能体能够引用文本知识中的内容回答用户问题。
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持

知识库设置:
搜索策略:从知识库中获取知识的检索方式,不同的检索策略可以更有效地找到正确的信息,提高其生成的答案的准确性和可用性。
- 混合(结合全文检索与语义检索的优势,并对结果进行综合排序)
- 语义(基于向量的文本相关性查询,推荐在需要理解语义关联度和跨语言查询的场景使用)
- 全文(依赖于关键词的全文搜索,推荐在搜索具有特定名称、缩写词、短语或 ID 的场景使用)
最大召回数量:从知识库中返回给大模型的最大段落数,数值越大返回的内容越多
最小匹配度:根据设置的匹配度选取段落返回给大模型,低于设定匹配度的内容不会被召回
无召回回复:当知识库没有召回有效切片时的回复话术

数据表
以表格结构组织数据,可实现类似书签和图书管理等功能。
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持

变量
用于保存用户个人信息,让智能体记住用户的特征,使回复更加个性化。默认系统变量包括:
| 名称 | 描述 | 类型 | 是否必须 |
|---|---|---|---|
| SYS_USER_ID | 平台用户ID | 系统变量 | 是 |
| USER_UID | 用户唯一标识 | 系统变量 | 是 |
| USER_NAME | 用户名称 | 系统变量 | 是 |
| AGENT_ID | 智能体唯一标识 | 系统变量 | 是 |
| CONVERSATION_ID | 会话唯一标识 | 系统变量 | 是 |
| REQUEST_ID | 请求唯一标识 | 系统变量 | 是 |
| AGENT_USER_MSG | 用户消息 | 系统变量 | 是 |
| CHAT_CONTEXT | 会话上下文消息列表 | 系统变量 | 是 |
也可新增变量,点击新增按钮,弹出编辑或添加变量对话框,在对话框中输入变量名称(名称需要符合命名规范),展示名称只有当下方的输入方式选择为控件时,在控件上显示的名称。

输入方式 [仅问答型]:是在对话界面显示一个控件,通过用户在控件上的输入给此变量赋值,提供的控件仅为较为常用的形式,如现在新增一个 name 变量

点击确定后就会在对话界面显示此控件

长期记忆
当开启长期记忆时,大模型会总结过往聊天对话的内容,然后提交给大模型,大模型会根据所有提交的内容,反馈结果,能够更好的响应用户的消息
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持

开场白
当用户打开智能体时会弹出此段文字信息。
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持

我们还可以在开场白的下方为用户提供几个常用的预置问题,用户可以不用输入信息,直接点击预置问题就可以与智能体进行对话。

用户问题建议
开启后,在每次智能体回复时,会提供用户问题建议。
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持

定时任务
开启后,用户可以通过设置定时任务的方式让智能体执行任务。
- ✅ 问答型智能体:支持
- ✅ 通用型智能体:支持
使用定时任务:在智能体发布后,找到智能体的发布空间广场

点击智能体卡片,进入智能体对话界面,在右侧添加定时任务

预览与调试
当我们编排完智能体的功能后,可以在右侧区域进行测试预览

点击右上角的调试按钮,会在右侧弹出调试详情界面,我们可以逐个点击调用组件,然后在下方的输入和输出中查看组件运行情况

还可以点击预览界面中,调用组件时出现的查看详情按钮


