跳转到主要内容

概述

WisGate 提供完整的 OpenAI 图像 API 支持,通过兼容 OpenAI 的接口访问最新的 gpt-image-2gpt-image-1dall-e-3 模型。只需替换 Base URL 和 API Key 即可使用:
  • Base URLhttps://api.wisgate.ai
  • API Key:将 $OPENAI_API_KEY 替换为您的 $WISDOM_GATE_KEY

模型对比

模型文生图图生图最多图片数透明背景最大提示词
gpt-image-216 张32,000 字符
gpt-image-116 张32,000 字符
dall-e-31 张4,000 字符
dall-e-21 张1,000 字符
gpt-image-2 是 OpenAI 最新一代图像模型,具备更高的图像质量、更强的指令理解能力和多图合成能力。推荐新项目优先使用。

文生图(/v1/images/generations

根据文字描述生成图像。使用 JSON 请求体。

快速开始

curl -X POST https://api.wisgate.ai/v1/images/generations \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "夜幕下的未来城市天际线,霓虹灯倒映在湿润的街道上",
    "n": 1,
    "size": "1024x1024",
    "quality": "high"
  }'

透明背景(仅 gpt-image-2 / gpt-image-1)

gpt-image-2gpt-image-1 支持生成透明背景图片,适合 Logo、贴纸、产品抠图等场景。
curl -X POST https://api.wisgate.ai/v1/images/generations \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "可爱的卡通猫咪吉祥物,独立角色无背景",
    "size": "1024x1024",
    "quality": "high",
    "background": "transparent",
    "output_format": "png"
  }'

图生图(/v1/images/edits

基于文字提示编辑或变换已有图像。使用 multipart/form-data 编码。

基础编辑 — 在图片中添加元素

curl -X POST https://api.wisgate.ai/v1/images/edits \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -F "model=gpt-image-1" \
  -F "image=@photo.png" \
  -F "prompt=在天空中添加一道彩虹" \
  -F "size=1024x1024"

局部重绘(Inpainting)— 用 Mask 替换指定区域

上传图片和遮罩(透明 PNG)以替换特定区域的内容:
curl -X POST https://api.wisgate.ai/v1/images/edits \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -F "model=gpt-image-1" \
  -F "image=@room.png" \
  -F "mask=@mask.png" \
  -F "prompt=阳光充足的舒适扶手椅,温暖木质纹理" \
  -F "size=1024x1024"
**遮罩(mask)**必须是 PNG 文件,且尺寸与原图相同。完全透明的像素(alpha=0)标记要替换的区域,完全不透明的像素(alpha=255)保持不变。

多图合成

最多上传 16 张参考图片合成新图像:
curl -X POST https://api.wisgate.ai/v1/images/edits \
  -H "Authorization: Bearer $WISDOM_GATE_KEY" \
  -F "model=gpt-image-1" \
  -F "image[]=@product1.png" \
  -F "image[]=@product2.png" \
  -F "image[]=@product3.png" \
  -F "prompt=将这些产品组合成一张大理石台面上的精品生活方式宣传图,柔和自然光线" \
  -F "size=1536x1024" \
  -F "quality=high"

参数说明

文生图参数

参数类型必填说明
modelstringgpt-image-2(默认)、gpt-image-1dall-e-3dall-e-2
promptstring图片描述文本。最大 32,000 字符(gpt-image-2/gpt-image-1),4,000(dall-e-3
ninteger生成数量(1-10)。dall-e-3 仅支持 n=1。默认:1
sizestring图片尺寸,详见下表
qualitystringgpt-image-2/gpt-image-1auto/low/medium/highdall-e-3standard/hd
stylestringdall-e-3vivid(生动夸张)或 natural(自然写实)
response_formatstringurl(默认)或 b64_json
backgroundstringgpt-image-2/gpt-image-1auto/transparent(透明)/opaque(不透明)
output_formatstringgpt-image-2/gpt-image-1png/jpeg/webp
各模型支持的尺寸:
模型支持尺寸
gpt-image-21024x10241536x10241024x1536auto
gpt-image-11024x10241536x10241024x1536auto
dall-e-31024x10241792x10241024x1792
dall-e-2256x256512x5121024x1024

图生图参数

参数类型必填说明
modelstringgpt-image-2(默认)、gpt-image-1
imagefilePNG/JPEG/WebP 图片。多图请用 image[] 字段名
promptstring编辑描述。最大 32,000 字符
maskfile透明 PNG 遮罩(与原图尺寸相同),透明区域将被替换
sizestring1024x1024(默认)、1536x10241024x1536auto
qualitystringauto(默认)、lowmediumhigh
ninteger生成数量(1-10)。默认:1

常见问题

gpt-image-2gpt-image-1dall-e-3 有什么区别?

gpt-image-2 是 OpenAI 最新、最强大的图像模型,具备更高图像质量、更强提示词理解能力和增强的多图合成能力。gpt-image-1 同样支持图生图编辑、透明背景和多图合成,两者的提示词最大长度均为 32,000 字符。dall-e-3 更擅长写实风格,并提供 revised_prompt 反馈,但仅支持文生图且每次只能生成 1 张。

url 还是 b64_json 返回格式?

  • url:速度快,返回有效期 60 分钟的 CDN 链接,适合即时展示。
  • b64_json:返回原始图片数据,适合立即存储或内存处理。
response_format: "url" 返回的图片链接在 60 分钟后失效。如需长期存储,请立即将图片保存到您自己的存储服务。

如何一次生成多张图片?

n 设置为 2-10,每张图片单独计费:
{
  "model": "gpt-image-1",
  "prompt": "蓝色陶瓷咖啡杯产品图",
  "n": 4,
  "size": "1024x1024"
}

如何查看图像生成费用?

访问 WisGate 价格页面 查看各模型和质量档位的每张图片费用。费用按生成图片数量扣除。

可以使用官方 OpenAI SDK 调用吗?

可以,只需更改 base_urlapi_key
from openai import OpenAI
client = OpenAI(api_key="YOUR_WISDOM_GATE_KEY", base_url="https://api.wisgate.ai/v1")
其他 SDK 方法和参数完全兼容。
自动生成的 API 参考下方的交互式请求/响应 Schema 根据 OpenAPI 规范自动生成。向下滚动可查看完整参数说明和实时示例。