Files
gemini-skill/SKILL.md

65 lines
2.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
name: gemini-skill
description: 通过 Gemini 官网gemini.google.com执行生图操作。用户提到"生图/画图/绘图/nano banana/nanobanana/生成图片"等关键词时触发。所有浏览器操作已封装为 MCP 工具AI 无需手动操控浏览器但必要时可以通过gemini_browser_info获取浏览器连接信息如CDP连接端口方便AI自行连接调试。
---
# Gemini Skill
## 触发关键词
- **生图任务**`生图``画``绘图``海报``nano banana``nanobanana``image generation``生成图片`
- 若请求含糊,先确认用户是否需要生图
## 使用方式
本 Skill 通过 MCP Server 暴露工具AI 直接调用即可,**不需要手动操作浏览器**。
浏览器启动、会话管理、图片提取、文件保存等流程已全部封装在工具内部。Daemon 未运行时会自动后台拉起,无需手动启动。
### 可用工具
| 工具名 | 说明 | 入参 |
|--------|------|------|
| `gemini_generate_image` | 生成图片,返回本地文件路径 + base64 图片 | `prompt`(描述词),`newSession`(是否新建会话,默认 false |
| `gemini_browser_info` | 获取浏览器连接信息CDP 端口、wsEndpoint、Daemon 状态等) | 无 |
### 典型调用流程
1. 用户说"帮我画一张猫咪的图"
2. 调用 `gemini_generate_image`,传入 prompt
3. 工具返回本地图片路径和 base64 数据
4. 将图片展示给用户
### 参数说明
- `newSession: false`(默认)— 复用当前 Gemini 会话页,适合连续生图
- `newSession: true` — 新建干净会话,适合全新主题
## MCP 客户端配置
```json
{
"mcpServers": {
"gemini": {
"command": "node",
"args": ["<项目绝对路径>/src/mcp-server.js"]
}
}
}
```
也可通过 `npm run mcp` 手动启动。
## 失败处理
工具内部已包含重试逻辑。若仍然失败,返回值的 `isError: true` 和错误信息会告知原因:
- **生成超时** — 建议用户简化描述词后重试
- **Daemon 未启动** — 工具会自动拉起,若仍失败可手动 `npm run daemon`
- **页面异常** — 可调用 `gemini_browser_info` 查看浏览器状态排查
## 参考
- 详细执行与回退:`references/gemini-flow.md`
- 关键词与路由:`references/intent-routing.md`