跳到主要内容

工具能力总览

智能体通过「工具」与外部世界交互。你不用记工具名——描述目标即可，智能体会自己选用。下面是当前能力一览，便于你了解「它能做什么」。

能力	工具	能做什么
联网检索	`web_search`	全网搜索，获取最新信息
网页读取	`web_fetch` / `link_reader`	抓取并提取网页/PDF 正文（可批量读多条链接）
文生图 / 图生图	`image_generate` / `image_edit`	按描述生成图片，或编辑已有图片
文生视频	`video_generate`	按描述生成视频
语音合成	`text_to_speech`	文字转语音
代码执行	`bash` / `sandbox_exec_shell` / `sandbox_exec_python`	在安全沙箱里跑命令/脚本/数据处理
技能执行	`execute_skills`	运行预制的技能工作流
浏览器操作	`browser_*`	在无头浏览器里导航、点击、输入、截图、读 DOM
手机操作	`mobile_use`	用自然语言驱动移动设备/App
电脑操作	`computer_use`	用自然语言驱动桌面电脑
知识库检索	`knowledge_search`	检索你的文档集合（RAG）
长期记忆	`remember_this` / `recall_memories`	记住/召回关于你的稳定事实
文件产物	`artifact_write` / 文件读写	生成可下载的产物、读写沙箱文件
外部工具	`mcp__*`	通过 MCP 接入第三方工具

权限与确认

每个工具都受两道门约束：

权限策略（ToolPolicy）：管理员可按 agent 配置某工具「允许 / 禁止 / 需确认」。
风险闸（RiskGate）：按动作内容拦截高危操作（如危险命令、强制推送等）。

高风险动作（外部生成、写文件、执行命令等）默认先请你确认再执行。

想深入了解？

权限与确认
想深入了解？