feat(gemini): 新增 extractImageBase64 方法优化图片获取流程

This commit is contained in:
WJZ_P
2026-03-15 00:32:43 +08:00
parent 9b7c484ab9
commit f4beac1db2
3 changed files with 100 additions and 10 deletions

View File

@@ -12,7 +12,7 @@ description: 通过 Gemini 官网gemini.google.com执行问答与生图操
3. 文本问答任务(如"问问Gemini xxx")走 Gemini 文本提问链路。
4. 默认模型:可用列表中最强模型,优先 `Gemini 3.1 Pro`
5. 执行生图后先向用户回报"正在绘图中",完成后回传图片。
6. **禁止使用浏览器截图screenshot获取生成图片**。默认通过右键图片另存为Save Image As保存到本地发送给用户;仅当用户明确要求高清/原图时,才调用 `downloadLatestImage()` 走原图下载流程。
6. **禁止使用浏览器截图screenshot获取生成图片**。默认通过 `extractImageBase64()` 从已渲染的 DOM 直接提取图片 Base64 数据,解码后保存到本地发送给用户;仅当用户明确要求高清/原图时,才调用 `downloadLatestImage()` 走原图下载流程。
## 任务分流
@@ -55,12 +55,12 @@ Gemini 页面的操作按钮(`.send-button-container` 内)通过 `aria-label
- 定位依据:`<img class="image loaded">` — 只有同时具有 `image``loaded` 两个 class 的才是已渲染完成的生成图片DOM 中取最后一个即为最新。
- `src``https://lh3.googleusercontent.com/...` 格式的原图 URL。
-`ok === false`,等几秒再调一次;连续两次失败则做 snapshot 排查页面状态。
- **默认**通过 `src` URL 右键另存为Save Image As保存图片到本地然后发送给用户
- **默认**调用 `GeminiOps.extractImageBase64()` 从 DOM 直接提取图片 Base64Canvas 优先,跨域污染时 fallback 到 fetch解码后保存为本地文件发送给用户。注意该函数返回 PromiseCDP 调用时需设置 `awaitPromise:true`
- **高清**:仅当用户明确要求高清/原图时,才调用 `GeminiOps.downloadLatestImage()` 走原图下载按钮流程。
- 下载按钮定位:从 `img` 向上找到 `.image-container` 容器,容器内的 `mat-icon[fonticon="download"]` 即为下载原图按钮。
- ⚠️ **严禁使用浏览器截图screenshot代替保存图片**
8. 将保存到本地的图片文件发送给用户。
9. **将每步操作返回的 `debug` 日志一并回传给用户**,方便排查定位失败和优化策略。所有函数(`probe``click``fillPrompt``pollStatus``getLatestImage``downloadLatestImage`)的返回值都包含 `debug` 字段。
9. **将每步操作返回的 `debug` 日志一并回传给用户**,方便排查定位失败和优化策略。所有函数(`probe``click``fillPrompt``pollStatus``getLatestImage``extractImageBase64``downloadLatestImage`)的返回值都包含 `debug` 字段。
## CDP 保活轮询策略