openclaw/gemini-skill

Files

WJZ_P 2f8bddf3f9 rename skill

2026-03-13 00:01:10 +08:00

2.5 KiB

Raw Blame History

name, description

name	description
gemini-skill	通过 Gemini 官网（gemini.google.com）执行问答与生图操作。用户提到“问问Gemini/让Gemini回答/去Gemini问”，或出现“生图/画图/绘图/nano banana/nanobanana/生成图片”等关键词时触发。默认使用可用模型中最强档（优先 Gemini 3.1 Pro），按任务切换文本问答或图片生成流程，并把结果回传给用户。

Gemini Web Ops

核心规则

使用 OpenClaw 内置浏览器，profile="openclaw"。
涉及生图关键词（如：生图、绘图、画一张、nano banana）时，优先用无头浏览器流程执行。
文本问答任务（如“问问Gemini xxx”）走 Gemini 文本提问链路。
默认模型：可用列表中最强模型，优先 Gemini 3.1 Pro。
执行生图后先向用户回报“正在绘图中”，完成后回传图片。

任务分流

文本问答触发词：问问Gemini、让Gemini回答、去Gemini问。
生图任务触发词：生图、画、绘图、海报、nano banana、nanobanana、image generation。
若请求含糊，先确认：是文本回答还是要出图。

标准执行流程

A. 文本问答

打开 https://gemini.google.com。
校验登录态（头像/输入框可见）。
选择最强可用模型（优先 Gemini 3.1 Pro）。
将用户问题原样输入并发送。
等待完整输出，提炼后回传（必要时附原文要点）。

B. 生图流程

打开 Gemini 页面并确认登录。
选择最强可用模型（优先 Gemini 3.1 Pro）。
将用户提示词原样输入。
开启/勾选图片生成能力（若 UI 有“生成图片/图片”开关）。
发送后立即通知用户：正在绘图中。
结果出现后：
- 优先用“下载原图”按钮获取原图。
- 若无下载按钮或失败，可对图片右键另存（通常是标清图）。
把图片返回用户；若有多张，按顺序全部回传。

失败回退

元素定位失败：刷新页面后重试一次。
模型不可用：降级到次优 Gemini 模型并告知。
生成超时：回报“仍在生成中”，继续等待一次；再次超时则请用户换短提示词。

低 token 优先策略

优先使用 scripts/gemini_ui_shortcuts.js 的快捷选择器。
先 evaluate 批量动作，再 snapshot 精准兜底。
避免高频全量快照。

参考

详细执行与回退：references/gemini-flow.md
关键词与路由：references/intent-routing.md