OpenAI 图像生成 - WisGate Docs

概述

WisGate 提供完整的 OpenAI 图像 API 支持，通过兼容 OpenAI 的接口访问最新的 gpt-image-2、gpt-image-1 和 dall-e-3 模型。只需替换 Base URL 和 API Key 即可使用：

Base URL：https://api.wisgate.ai
API Key：将 $OPENAI_API_KEY 替换为您的 $WISDOM_GATE_KEY

模型对比

模型	文生图	图生图	最多图片数	透明背景	最大提示词
`gpt-image-2`	✅	✅	16 张	✅	32,000 字符
`gpt-image-1`	✅	✅	16 张	✅	32,000 字符
`dall-e-3`	✅	❌	1 张	❌	4,000 字符
`dall-e-2`	✅	✅	1 张	❌	1,000 字符

gpt-image-2 是 OpenAI 最新一代图像模型，具备更高的图像质量、更强的指令理解能力和多图合成能力。推荐新项目优先使用。

文生图（`/v1/images/generations`）

根据文字描述生成图像。使用 JSON 请求体。

快速开始

curl -X POST https://api.wisgate.ai/v1/images/generations \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "夜幕下的未来城市天际线，霓虹灯倒映在湿润的街道上",
    "n": 1,
    "size": "1024x1024",
    "quality": "high"
  }'

透明背景（仅 gpt-image-2 / gpt-image-1）

gpt-image-2 和 gpt-image-1 支持生成透明背景图片，适合 Logo、贴纸、产品抠图等场景。

curl -X POST https://api.wisgate.ai/v1/images/generations \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "可爱的卡通猫咪吉祥物，独立角色无背景",
    "size": "1024x1024",
    "quality": "high",
    "background": "transparent",
    "output_format": "png"
  }'

图生图（`/v1/images/edits`）

基于文字提示编辑或变换已有图像。使用 multipart/form-data 编码。

基础编辑 — 在图片中添加元素

curl -X POST https://api.wisgate.ai/v1/images/edits \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -F "model=gpt-image-1" \
  -F "image=@photo.png" \
  -F "prompt=在天空中添加一道彩虹" \
  -F "size=1024x1024"

局部重绘（Inpainting）— 用 Mask 替换指定区域

上传图片和遮罩（透明 PNG）以替换特定区域的内容：

curl -X POST https://api.wisgate.ai/v1/images/edits \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -F "model=gpt-image-1" \
  -F "image=@room.png" \
  -F "mask=@mask.png" \
  -F "prompt=阳光充足的舒适扶手椅，温暖木质纹理" \
  -F "size=1024x1024"

**遮罩（mask）**必须是 PNG 文件，且尺寸与原图相同。完全透明的像素（alpha=0）标记要替换的区域，完全不透明的像素（alpha=255）保持不变。

多图合成

最多上传 16 张参考图片合成新图像：

curl -X POST https://api.wisgate.ai/v1/images/edits \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -F "model=gpt-image-1" \
  -F "image[]=@product1.png" \
  -F "image[]=@product2.png" \
  -F "image[]=@product3.png" \
  -F "prompt=将这些产品组合成一张大理石台面上的精品生活方式宣传图，柔和自然光线" \
  -F "size=1536x1024" \
  -F "quality=high"

参数说明

文生图参数

参数	类型	必填	说明
`model`	string	否	`gpt-image-2`（默认）、`gpt-image-1`、`dall-e-3`、`dall-e-2`
`prompt`	string	是	图片描述文本。最大 32,000 字符（`gpt-image-2`/`gpt-image-1`），4,000（`dall-e-3`）
`n`	integer	否	生成数量（1-10）。`dall-e-3` 仅支持 `n=1`。默认：`1`
`size`	string	否	图片尺寸，详见下表
`quality`	string	否	`gpt-image-2`/`gpt-image-1`：`auto`/`low`/`medium`/`high`；`dall-e-3`：`standard`/`hd`
`style`	string	否	仅 `dall-e-3`：`vivid`（生动夸张）或 `natural`（自然写实）
`response_format`	string	否	`url`（默认）或 `b64_json`
`background`	string	否	仅 `gpt-image-2`/`gpt-image-1`：`auto`/`transparent`（透明）/`opaque`（不透明）
`output_format`	string	否	仅 `gpt-image-2`/`gpt-image-1`：`png`/`jpeg`/`webp`

各模型支持的尺寸：

模型	支持尺寸
`gpt-image-2`	`1024x1024`、`1536x1024`、`1024x1536`、`auto`
`gpt-image-1`	`1024x1024`、`1536x1024`、`1024x1536`、`auto`
`dall-e-3`	`1024x1024`、`1792x1024`、`1024x1792`
`dall-e-2`	`256x256`、`512x512`、`1024x1024`

图生图参数

参数	类型	必填	说明
`model`	string	否	`gpt-image-2`（默认）、`gpt-image-1`
`image`	file	是	PNG/JPEG/WebP 图片。多图请用 `image[]` 字段名
`prompt`	string	是	编辑描述。最大 32,000 字符
`mask`	file	否	透明 PNG 遮罩（与原图尺寸相同），透明区域将被替换
`size`	string	否	`1024x1024`（默认）、`1536x1024`、`1024x1536`、`auto`
`quality`	string	否	`auto`（默认）、`low`、`medium`、`high`
`n`	integer	否	生成数量（1-10）。默认：`1`

常见问题

`gpt-image-2`、`gpt-image-1` 和 `dall-e-3` 有什么区别？

gpt-image-2 是 OpenAI 最新、最强大的图像模型，具备更高图像质量、更强提示词理解能力和增强的多图合成能力。gpt-image-1 同样支持图生图编辑、透明背景和多图合成，两者的提示词最大长度均为 32,000 字符。dall-e-3 更擅长写实风格，并提供 revised_prompt 反馈，但仅支持文生图且每次只能生成 1 张。

用 `url` 还是 `b64_json` 返回格式？

url：速度快，返回有效期 60 分钟的 CDN 链接，适合即时展示。
b64_json：返回原始图片数据，适合立即存储或内存处理。

response_format: "url" 返回的图片链接在 60 分钟后失效。如需长期存储，请立即将图片保存到您自己的存储服务。

如何一次生成多张图片？

将 n 设置为 2-10，每张图片单独计费：

{
  "model": "gpt-image-1",
  "prompt": "蓝色陶瓷咖啡杯产品图",
  "n": 4,
  "size": "1024x1024"
}

如何查看图像生成费用？

访问 WisGate 价格页面查看各模型和质量档位的每张图片费用。费用按生成图片数量扣除。

可以使用官方 OpenAI SDK 调用吗？

可以，只需更改 base_url 和 api_key：

from openai import OpenAI
client = OpenAI(api_key="YOUR_WISDOM_GATE_KEY", base_url="https://api.wisgate.ai/v1")

其他 SDK 方法和参数完全兼容。

自动生成的 API 参考下方的交互式请求/响应 Schema 根据 OpenAPI 规范自动生成。向下滚动可查看完整参数说明和实时示例。

​概述

​模型对比

​文生图（/v1/images/generations）

​快速开始

​透明背景（仅 gpt-image-2 / gpt-image-1）

​图生图（/v1/images/edits）

​基础编辑 — 在图片中添加元素

​局部重绘（Inpainting）— 用 Mask 替换指定区域

​多图合成

​参数说明

​文生图参数

​图生图参数

​常见问题

​gpt-image-2、gpt-image-1 和 dall-e-3 有什么区别？

​用 url 还是 b64_json 返回格式？

​如何一次生成多张图片？

​如何查看图像生成费用？

​可以使用官方 OpenAI SDK 调用吗？

概述

模型对比

文生图（`/v1/images/generations`）

快速开始

透明背景（仅 gpt-image-2 / gpt-image-1）

图生图（`/v1/images/edits`）

基础编辑 — 在图片中添加元素

局部重绘（Inpainting）— 用 Mask 替换指定区域

多图合成

参数说明

文生图参数

图生图参数

常见问题

`gpt-image-2`、`gpt-image-1` 和 `dall-e-3` 有什么区别？

用 `url` 还是 `b64_json` 返回格式？

如何一次生成多张图片？

如何查看图像生成费用？

可以使用官方 OpenAI SDK 调用吗？