Skip to content

GPT-Image-2 国内镜像使用教程:API 调用、返回格式与入口推荐

如果你搜索的是 GPT-Image-2 国内怎么用GPT-Image-2 APIGPT-Image-2 镜像站,真正要解决的问题通常不是模型原理,而是下面这几件事:

  • 国内有没有能直接用的入口
  • chat 接口和走 images 接口到底有什么区别
  • 返回的是 base64 还是 url
  • 哪个入口更适合直接上手,哪个更适合做 API 接入

这篇文章直接按实操来讲。先说结论:如果你是普通用户,想先跑通文生图和图片编辑,当前更值得优先试的两个入口是 aimichat.aicnbox.com。如果你是开发者,重点要理解的是 chatimages/generationsimages/edits 三种模式返回结构并不一样。

GPT-Image-2 是什么

GPT-Image-2 可以理解成一类以图像生成为核心能力的 OpenAI 兼容模型。常见场景包括:

  • 文生图:一句提示词直接生成图片
  • 图像编辑:上传原图后按提示词修改
  • 参考图重绘:保留主体,再调整风格、背景、比例或细节

对国内用户来说,难点往往不在提示词,而在于:

  • 官方链路不一定适合直接使用
  • 不同镜像站的接口兼容程度不一样
  • 有的平台默认返回 url,有的平台默认返回 base64

所以比起只看“支持不支持 GPT-Image-2”,更重要的是先看这个入口到底怎么返回结果。

GPT-Image-2 国内怎么用

最短路径可以压缩成 3 步:

  1. 先选一个能直接打开的国内入口
  2. 先用最小提示词跑通第一张图
  3. 如果你要做开发接入,再确认平台支持哪些 API 端点

对大多数用户来说,第一步并不是申请 API,而是先确认平台本身是否真的能稳定返回图片。

国内推荐入口:aimi 和 chat.aicnbox.com

1. aimi:更适合想要完整控制项的用户

aimi 更适合第一次系统使用 GPT-Image-2 的用户。它的优势不是“神秘高阶”,而是把常用参数和模型入口做得比较直观。

这类入口一般更适合:

  • 想看见模型切换入口
  • 想明确控制比例、清晰度、参考图上传
  • 想同时测试生成和编辑流程

如果你不仅是“试一张图”,而是准备把 GPT-Image-2 用到封面图、海报图、博客配图、商品图里,aimi 这类界面通常更省时间。

2. chat.aicnbox.com:更适合对话式快速出图

chat.aicnbox.com 更偏轻量型。它更像是在聊天窗口里直接说一句话,然后让系统把图回出来。

这类入口通常更适合:

  • 想像聊天一样出图
  • 不想一上来研究太多参数
  • 先快速验证提示词方向

如果你平时就习惯“发一句话,等结果”,那 chat.aicnbox.com 的交互会更顺手。

aimi 和 chat.aicnbox.com 怎么选

可以直接按使用目的来判断:

场景更推荐的入口原因
第一次系统使用 GPT-Image-2aimi模型、参数、上传图等能力通常更直观
快速测试一句提示词是否能出图chat.aicnbox.com对话式路径更短
准备继续做 API 调试aimi更容易先把功能跑通,再转接口
需要一个备用入口chat.aicnbox.com适合做快速替补测试

如果你不确定自己该先用哪个,最简单的办法就是:

  1. 先在 aimi 生成一张图
  2. 再到 chat.aicnbox.com 用同一句提示词跑一张
  3. 直接比较哪种交互更适合自己

GPT-Image-2 的三种常见调用方式

开发者最容易混淆的,不是模型名,而是接口路径。

1. /v1/chat/completions

这种方式表面上像聊天接口,实际有些镜像站会把生成后的图片链接塞进文本里返回。

典型返回可能长这样:

json
{
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "![image](https://example.com/xxx.png)"
      }
    }
  ]
}

这意味着:

  • 返回主体仍然是文字
  • 只是这段文字里嵌了图片链接
  • 你的代码如果要取图,需要从 content 里把 URL 提出来

它的优点是接入简单,缺点是返回结构不够“干净”,不如图片接口稳定。

2. /v1/images/generations

这是更标准的文生图接口。

典型返回结构:

json
{
  "data": [
    {
      "url": "https://example.com/xxx.png",
      "b64_json": "",
      "revised_prompt": ""
    }
  ]
}

或者某些平台会返回:

json
{
  "data": [
    {
      "b64_json": "iVBORw0K..."
    }
  ]
}

所以开发时要注意:不同镜像站即使都说自己支持 GPT-Image-2,默认返回的也可能不一样。

3. /v1/images/edits

如果你要做的是改图,而不是从零生成,就该走这个接口。

它适合:

  • 把红色商品改成蓝色
  • 保持构图不变,换背景
  • 保留人物姿势,换服装或场景
  • 在现有海报基础上继续细修

典型返回结构和 generations 很像,常见也是:

json
{
  "data": [
    {
      "url": "https://example.com/edited.png",
      "b64_json": ""
    }
  ]
}

返回的是 base64 还是 url

这是 GPT-Image-2 镜像使用里最常见的问题之一。

实际情况不是统一的,而是分两层看:

第一层:看接口类型

  • chat/completions
    • 常见返回是文本
    • 文本里可能嵌一个图片 URL
  • images/generations
    • 常见返回是结构化图片结果
    • 图片内容可能是 url,也可能是 b64_json
  • images/edits
    • generations 类似
    • 返回 urlb64_json 取决于平台实现

第二层:看镜像站实现

同样是 gpt-image-2

  • 有的平台默认给 base64
  • 有的平台默认给 url
  • 还有的平台 chat 返回 Markdown 图片链接,images 返回结构化 url

所以你不能只记“GPT-Image-2 默认返回什么”,而要看“这个镜像站把什么字段填上了”。

实际代码里更稳的判断方式是:

js
const item = response.data?.[0];

if (item?.b64_json) {
  // 解码保存图片
}

if (item?.url) {
  // 直接下载图片
}

第一次使用 GPT-Image-2 的正确步骤

很多人第一次用就堆一大段提示词,结果反而不知道问题出在哪里。更稳的流程是下面这样。

第一步:先做最小测试

先不要写很复杂的商业需求,先来一句最简单的:

text
请生成一张图片:一只坐在窗边的橘猫,早晨自然光,写实风格

目的不是一步到位,而是先确认:

  • 当前入口真的支持图片生成
  • 当前模型真的能回图
  • 返回结构是不是你预期的那种

第二步:用结构化提示词

建议按这个顺序写:

主体 + 场景 + 风格 + 光线 + 限制条件

例如:

text
一个年轻女生坐在靠窗的书桌前阅读,桌上有咖啡和笔记本,午后自然光,写实摄影风格,画面干净,竖版构图,不要文字,不要水印

这种写法通常比单纯堆“高级感、氛围感、电影感”更稳定。

第三步:不要频繁重开,优先追改

GPT-Image-2 的实用价值,很大一部分在于“基于已有结果继续改”。

例如你可以继续说:

text
保持人物和整体构图不变,把背景改成现代办公室,光线更柔和,画面更适合科技文章封面

或者:

text
保留主体不变,把整体色调改成蓝灰色,背景更简洁,适合商业海报

这样通常比每次重新生成一张更快,也更接近你想要的结果。

适合直接复制的 GPT-Image-2 提示词模板

1. 博客封面图

text
一个整洁的家庭办公桌面,电脑屏幕上显示创作界面,旁边有咖啡和绿植,现代内容创作氛围,柔和自然光,横版构图,不要文字

2. 科技文章配图

text
未来感数据流从屏幕中延展出来,一位用户正在操作智能界面,蓝白科技风,现代 UI 视觉感,海报构图,整体简洁,不要英文文字,不要水印

3. 电商产品图

text
一只无线耳机盒放在白色台面上,柔和阴影,少量反光,极简产品摄影风格,高清细节,背景干净,不要人物,不要文字

4. 小红书封面图

text
一个女生站在白色极简咖啡馆门口,穿浅色系穿搭,阳光柔和,生活方式摄影风格,画面干净,竖版构图,适合社交媒体封面,不要文字

5. 公众号头图

text
一个正在分析数据的内容创作者坐在明亮办公桌前,桌面有笔记本电脑、平板和咖啡杯,现代高效办公风格,横版构图,适合公众号头图,不要文字

开发者快速上手示例

文生图:images/generations

bash
curl --http1.1 https://your-api.example/v1/images/generations \
  -H "Authorization: Bearer YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A minimal flat illustration of a red apple on a white background",
    "size": "1024x1024"
  }'

改图:images/edits

bash
curl --http1.1 https://your-api.example/v1/images/edits \
  -H "Authorization: Bearer YOUR_KEY" \
  -F "model=gpt-image-2" \
  -F "prompt=Change the red circle into a green square on a white background" \
  -F "image=@input.png"

聊天式出图:chat/completions

bash
curl --http1.1 https://your-api.example/v1/chat/completions \
  -H "Authorization: Bearer YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "messages": [
      {
        "role": "user",
        "content": "Generate an image of a red apple on a white background"
      }
    ]
  }'

如果返回的是 Markdown 图片链接,记得从 choices[0].message.content 里提取 URL,而不是去找 b64_json

GPT-Image-2 国内使用时最常见的 5 个问题

1. 为什么有的接口能出图,有的接口不行

因为不是所有镜像站都把 chatgenerationsedits 都完整兼容了。有的平台只把 images/generations 做通了,有的平台 chat 能返回图链,但并不适合正式接入。

2. 为什么同样是 GPT-Image-2,有的平台给 url,有的平台给 base64

因为这是镜像实现差异,不是你提示词写错了。最稳的做法是代码同时兼容 urlb64_json

3. 为什么 chat 模式返回的是一段文字

因为有些平台把图片地址包在聊天文本里返回了,本质上还是“chat 响应”,不是“标准图片对象”。

4. 为什么第一张图效果一般

不是模型不行,而是第一轮通常只是定方向。建议:

  1. 第一轮先定主体和场景
  2. 第二轮再补风格和色调
  3. 第三轮再补构图、留白和商业用途要求

5. 为什么编辑结果不稳定

因为每轮改动太多。更稳的方法是每次只改 1 到 2 个变量,比如只改背景、只改颜色、只改光线。

普通用户和开发者分别怎么选

如果你只想快速把 GPT-Image-2 用起来:

如果你准备做程序接入:

  • 先用页面入口把功能跑通
  • 再确认平台是否支持 images/generations
  • 如果你还要改图,再确认是否支持 images/edits
  • 最后再决定是否兼容 chat/completions

结论

GPT-Image-2 国内使用教程 的核心不是“找到模型名”,而是先把下面三件事分清:

  • 你是普通用户,还是开发者
  • 你要的是聊天式出图,还是标准 API 出图
  • 你当前平台返回的是 urlbase64,还是文本里的图片链接

如果你是新手,最省时间的路线通常是:

  1. 先用 aimi 跑通一次生成和编辑
  2. 再用 chat.aicnbox.com 做对话式快速测试
  3. 确认稳定后,再开始做 API 接入

这样你不会一开始就卡在接口兼容细节里,也能更快判断哪个入口适合长期使用。

Last updated:

面向国内用户的 Gemini 镜像站导航。免责声明