多模态生成
iClaw 支持图片、视频、语音的生成与编辑。所有产物都是可下载的 artifact(带指纹与归属), 不会是临时路径。
| 工具 | 作用 | 关键参数 |
|---|---|---|
image_generate | 文生图 | prompt、size(如 1024x1024) |
image_edit | 图生图(按描述编辑已有图片) | input_ref、prompt、size |
video_generate | 文生视频 | prompt、可选首/尾帧引用 |
text_to_speech | 文字转语音 | text、voice |
用法示例
生成一张「青色调、扁平风格的企业 AI 助手吉祥物」的图,尺寸 1024x1024。
把这段会议纪要转成语音,用沉稳的男声。
注意
- 多模态生成属外部调用,默认会先请你确认再执行(可由管理员策略调整)。
- 需要相应的模型/凭据已由管理员配置;未配置时系统会在启动期预检中提示该能力不可用, 而不是等到调用才失败。
- 生成结果以 artifact 形式返回,可直接下载或在后续步骤里被引用(如
image_edit引用上一步的图)。