跳到主要内容

工具能力总览

智能体通过「工具」与外部世界交互。你不用记工具名——描述目标即可,智能体会自己选用。下面是 当前能力一览,便于你了解「它能做什么」。

能力工具能做什么
联网检索web_search全网搜索,获取最新信息
网页读取web_fetch / link_reader抓取并提取网页/PDF 正文(可批量读多条链接)
文生图 / 图生图image_generate / image_edit按描述生成图片,或编辑已有图片
文生视频video_generate按描述生成视频
语音合成text_to_speech文字转语音
代码执行bash / sandbox_exec_shell / sandbox_exec_python在安全沙箱里跑命令/脚本/数据处理
技能执行execute_skills运行预制的技能工作流
浏览器操作browser_*在无头浏览器里导航、点击、输入、截图、读 DOM
手机操作mobile_use用自然语言驱动移动设备/App
电脑操作computer_use用自然语言驱动桌面电脑
知识库检索knowledge_search检索你的文档集合(RAG)
长期记忆remember_this / recall_memories记住/召回关于你的稳定事实
文件产物artifact_write / 文件读写生成可下载的产物、读写沙箱文件
外部工具mcp__*通过 MCP 接入第三方工具

权限与确认

每个工具都受两道门约束:

  • 权限策略(ToolPolicy):管理员可按 agent 配置某工具「允许 / 禁止 / 需确认」。
  • 风险闸(RiskGate):按动作内容拦截高危操作(如危险命令、强制推送等)。

高风险动作(外部生成、写文件、执行命令等)默认先请你确认再执行。

想深入了解?