GPT-Image-2 国内镜像使用教程：API 调用、返回格式与入口推荐

如果你搜索的是 GPT-Image-2 国内怎么用、GPT-Image-2 API、GPT-Image-2 镜像站，真正要解决的问题通常不是模型原理，而是下面这几件事：

国内有没有能直接用的入口
走 chat 接口和走 images 接口到底有什么区别
返回的是 base64 还是 url
哪个入口更适合直接上手，哪个更适合做 API 接入

这篇文章直接按实操来讲。先说结论：如果你是普通用户，想先跑通文生图和图片编辑，当前更值得优先试的两个入口是 aimi 和 chat.aicnbox.com。如果你是开发者，重点要理解的是 chat、images/generations、images/edits 三种模式返回结构并不一样。

GPT-Image-2 是什么

GPT-Image-2 可以理解成一类以图像生成为核心能力的 OpenAI 兼容模型。常见场景包括：

文生图：一句提示词直接生成图片
图像编辑：上传原图后按提示词修改
参考图重绘：保留主体，再调整风格、背景、比例或细节

对国内用户来说，难点往往不在提示词，而在于：

官方链路不一定适合直接使用
不同镜像站的接口兼容程度不一样
有的平台默认返回 url，有的平台默认返回 base64

所以比起只看“支持不支持 GPT-Image-2”，更重要的是先看这个入口到底怎么返回结果。

GPT-Image-2 国内怎么用

最短路径可以压缩成 3 步：

先选一个能直接打开的国内入口
先用最小提示词跑通第一张图
如果你要做开发接入，再确认平台支持哪些 API 端点

对大多数用户来说，第一步并不是申请 API，而是先确认平台本身是否真的能稳定返回图片。

国内推荐入口：aimi 和 chat.aicnbox.com

1. aimi：更适合想要完整控制项的用户

aimi 更适合第一次系统使用 GPT-Image-2 的用户。它的优势不是“神秘高阶”，而是把常用参数和模型入口做得比较直观。

这类入口一般更适合：

想看见模型切换入口
想明确控制比例、清晰度、参考图上传
想同时测试生成和编辑流程

如果你不仅是“试一张图”，而是准备把 GPT-Image-2 用到封面图、海报图、博客配图、商品图里，aimi 这类界面通常更省时间。

2. chat.aicnbox.com：更适合对话式快速出图

chat.aicnbox.com 更偏轻量型。它更像是在聊天窗口里直接说一句话，然后让系统把图回出来。

这类入口通常更适合：

想像聊天一样出图
不想一上来研究太多参数
先快速验证提示词方向

如果你平时就习惯“发一句话，等结果”，那 chat.aicnbox.com 的交互会更顺手。

aimi 和 chat.aicnbox.com 怎么选

可以直接按使用目的来判断：

场景	更推荐的入口	原因
第一次系统使用 GPT-Image-2	aimi	模型、参数、上传图等能力通常更直观
快速测试一句提示词是否能出图	chat.aicnbox.com	对话式路径更短
准备继续做 API 调试	aimi	更容易先把功能跑通，再转接口
需要一个备用入口	chat.aicnbox.com	适合做快速替补测试

如果你不确定自己该先用哪个，最简单的办法就是：

先在 aimi 生成一张图
再到 chat.aicnbox.com 用同一句提示词跑一张
直接比较哪种交互更适合自己

GPT-Image-2 的三种常见调用方式

开发者最容易混淆的，不是模型名，而是接口路径。

1. `/v1/chat/completions`

这种方式表面上像聊天接口，实际有些镜像站会把生成后的图片链接塞进文本里返回。

典型返回可能长这样：

json

{
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "![image](https://example.com/xxx.png)"
      }
    }
  ]
}

这意味着：

返回主体仍然是文字
只是这段文字里嵌了图片链接
你的代码如果要取图，需要从 content 里把 URL 提出来

它的优点是接入简单，缺点是返回结构不够“干净”，不如图片接口稳定。

2. `/v1/images/generations`

这是更标准的文生图接口。

典型返回结构：

json

{
  "data": [
    {
      "url": "https://example.com/xxx.png",
      "b64_json": "",
      "revised_prompt": ""
    }
  ]
}

或者某些平台会返回：

json

{
  "data": [
    {
      "b64_json": "iVBORw0K..."
    }
  ]
}

所以开发时要注意：不同镜像站即使都说自己支持 GPT-Image-2，默认返回的也可能不一样。

3. `/v1/images/edits`

如果你要做的是改图，而不是从零生成，就该走这个接口。

它适合：

把红色商品改成蓝色
保持构图不变，换背景
保留人物姿势，换服装或场景
在现有海报基础上继续细修

典型返回结构和 generations 很像，常见也是：

json

{
  "data": [
    {
      "url": "https://example.com/edited.png",
      "b64_json": ""
    }
  ]
}

返回的是 base64 还是 url

这是 GPT-Image-2 镜像使用里最常见的问题之一。

实际情况不是统一的，而是分两层看：

第一层：看接口类型

chat/completions
- 常见返回是文本
- 文本里可能嵌一个图片 URL
images/generations
- 常见返回是结构化图片结果
- 图片内容可能是 url，也可能是 b64_json
images/edits
- 和 generations 类似
- 返回 url 或 b64_json 取决于平台实现

第二层：看镜像站实现

同样是 gpt-image-2：

有的平台默认给 base64
有的平台默认给 url
还有的平台 chat 返回 Markdown 图片链接，images 返回结构化 url

所以你不能只记“GPT-Image-2 默认返回什么”，而要看“这个镜像站把什么字段填上了”。

实际代码里更稳的判断方式是：

const item = response.data?.[0];

if (item?.b64_json) {
  // 解码保存图片
}

if (item?.url) {
  // 直接下载图片
}

第一次使用 GPT-Image-2 的正确步骤

很多人第一次用就堆一大段提示词，结果反而不知道问题出在哪里。更稳的流程是下面这样。

第一步：先做最小测试

先不要写很复杂的商业需求，先来一句最简单的：

text

请生成一张图片：一只坐在窗边的橘猫，早晨自然光，写实风格

目的不是一步到位，而是先确认：

当前入口真的支持图片生成
当前模型真的能回图
返回结构是不是你预期的那种

第二步：用结构化提示词

建议按这个顺序写：

主体 + 场景 + 风格 + 光线 + 限制条件

例如：

text

一个年轻女生坐在靠窗的书桌前阅读，桌上有咖啡和笔记本，午后自然光，写实摄影风格，画面干净，竖版构图，不要文字，不要水印

这种写法通常比单纯堆“高级感、氛围感、电影感”更稳定。

第三步：不要频繁重开，优先追改

GPT-Image-2 的实用价值，很大一部分在于“基于已有结果继续改”。

例如你可以继续说：

text

保持人物和整体构图不变，把背景改成现代办公室，光线更柔和，画面更适合科技文章封面

或者：

text

保留主体不变，把整体色调改成蓝灰色，背景更简洁，适合商业海报

这样通常比每次重新生成一张更快，也更接近你想要的结果。

适合直接复制的 GPT-Image-2 提示词模板

1. 博客封面图

text

一个整洁的家庭办公桌面，电脑屏幕上显示创作界面，旁边有咖啡和绿植，现代内容创作氛围，柔和自然光，横版构图，不要文字

2. 科技文章配图

text

未来感数据流从屏幕中延展出来，一位用户正在操作智能界面，蓝白科技风，现代 UI 视觉感，海报构图，整体简洁，不要英文文字，不要水印

3. 电商产品图

text

一只无线耳机盒放在白色台面上，柔和阴影，少量反光，极简产品摄影风格，高清细节，背景干净，不要人物，不要文字

4. 小红书封面图

text

一个女生站在白色极简咖啡馆门口，穿浅色系穿搭，阳光柔和，生活方式摄影风格，画面干净，竖版构图，适合社交媒体封面，不要文字

5. 公众号头图

text

一个正在分析数据的内容创作者坐在明亮办公桌前，桌面有笔记本电脑、平板和咖啡杯，现代高效办公风格，横版构图，适合公众号头图，不要文字

开发者快速上手示例

文生图：`images/generations`

bash

curl --http1.1 https://your-api.example/v1/images/generations \
  -H "Authorization: Bearer YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A minimal flat illustration of a red apple on a white background",
    "size": "1024x1024"
  }'

改图：`images/edits`

bash

curl --http1.1 https://your-api.example/v1/images/edits \
  -H "Authorization: Bearer YOUR_KEY" \
  -F "model=gpt-image-2" \
  -F "prompt=Change the red circle into a green square on a white background" \
  -F "image=@input.png"

聊天式出图：`chat/completions`

bash

curl --http1.1 https://your-api.example/v1/chat/completions \
  -H "Authorization: Bearer YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "messages": [
      {
        "role": "user",
        "content": "Generate an image of a red apple on a white background"
      }
    ]
  }'

如果返回的是 Markdown 图片链接，记得从 choices[0].message.content 里提取 URL，而不是去找 b64_json。

GPT-Image-2 国内使用时最常见的 5 个问题

1. 为什么有的接口能出图，有的接口不行

因为不是所有镜像站都把 chat、generations、edits 都完整兼容了。有的平台只把 images/generations 做通了，有的平台 chat 能返回图链，但并不适合正式接入。

2. 为什么同样是 GPT-Image-2，有的平台给 url，有的平台给 base64

因为这是镜像实现差异，不是你提示词写错了。最稳的做法是代码同时兼容 url 和 b64_json。

3. 为什么 chat 模式返回的是一段文字

因为有些平台把图片地址包在聊天文本里返回了，本质上还是“chat 响应”，不是“标准图片对象”。

4. 为什么第一张图效果一般

不是模型不行，而是第一轮通常只是定方向。建议：

第一轮先定主体和场景
第二轮再补风格和色调
第三轮再补构图、留白和商业用途要求

5. 为什么编辑结果不稳定

因为每轮改动太多。更稳的方法是每次只改 1 到 2 个变量，比如只改背景、只改颜色、只改光线。

普通用户和开发者分别怎么选

如果你只想快速把 GPT-Image-2 用起来：

优先试 aimi
备用入口放一个 chat.aicnbox.com

如果你准备做程序接入：

先用页面入口把功能跑通
再确认平台是否支持 images/generations
如果你还要改图，再确认是否支持 images/edits
最后再决定是否兼容 chat/completions

结论

GPT-Image-2 国内使用教程 的核心不是“找到模型名”，而是先把下面三件事分清：

你是普通用户，还是开发者
你要的是聊天式出图，还是标准 API 出图
你当前平台返回的是 url、base64，还是文本里的图片链接

如果你是新手，最省时间的路线通常是：

先用 aimi 跑通一次生成和编辑
再用 chat.aicnbox.com 做对话式快速测试
确认稳定后，再开始做 API 接入

这样你不会一开始就卡在接口兼容细节里，也能更快判断哪个入口适合长期使用。

GPT-Image-2 国内镜像使用教程：API 调用、返回格式与入口推荐 ​

GPT-Image-2 是什么 ​

GPT-Image-2 国内怎么用 ​

国内推荐入口：aimi 和 chat.aicnbox.com ​

1. aimi：更适合想要完整控制项的用户 ​

2. chat.aicnbox.com：更适合对话式快速出图 ​

aimi 和 chat.aicnbox.com 怎么选 ​

GPT-Image-2 的三种常见调用方式 ​

1. /v1/chat/completions ​

2. /v1/images/generations ​

3. /v1/images/edits ​

返回的是 base64 还是 url ​

第一层：看接口类型 ​

第二层：看镜像站实现 ​

第一次使用 GPT-Image-2 的正确步骤 ​

第一步：先做最小测试 ​

第二步：用结构化提示词 ​

第三步：不要频繁重开，优先追改 ​

适合直接复制的 GPT-Image-2 提示词模板 ​

1. 博客封面图 ​

2. 科技文章配图 ​

3. 电商产品图 ​

4. 小红书封面图 ​

5. 公众号头图 ​

开发者快速上手示例 ​

文生图：images/generations ​

改图：images/edits ​

聊天式出图：chat/completions ​

GPT-Image-2 国内使用时最常见的 5 个问题 ​

1. 为什么有的接口能出图，有的接口不行 ​

2. 为什么同样是 GPT-Image-2，有的平台给 url，有的平台给 base64 ​

3. 为什么 chat 模式返回的是一段文字 ​

4. 为什么第一张图效果一般 ​

5. 为什么编辑结果不稳定 ​

普通用户和开发者分别怎么选 ​

结论 ​

GPT-Image-2 国内镜像使用教程：API 调用、返回格式与入口推荐

GPT-Image-2 是什么

GPT-Image-2 国内怎么用

国内推荐入口：aimi 和 chat.aicnbox.com

1. aimi：更适合想要完整控制项的用户

2. chat.aicnbox.com：更适合对话式快速出图

aimi 和 chat.aicnbox.com 怎么选

GPT-Image-2 的三种常见调用方式

1. `/v1/chat/completions`

2. `/v1/images/generations`

3. `/v1/images/edits`

返回的是 base64 还是 url

第一层：看接口类型

第二层：看镜像站实现

第一次使用 GPT-Image-2 的正确步骤

第一步：先做最小测试

第二步：用结构化提示词

第三步：不要频繁重开，优先追改

适合直接复制的 GPT-Image-2 提示词模板

1. 博客封面图

2. 科技文章配图

3. 电商产品图

4. 小红书封面图

5. 公众号头图

开发者快速上手示例

文生图：`images/generations`

改图：`images/edits`

聊天式出图：`chat/completions`

GPT-Image-2 国内使用时最常见的 5 个问题

1. 为什么有的接口能出图，有的接口不行

2. 为什么同样是 GPT-Image-2，有的平台给 url，有的平台给 base64

3. 为什么 chat 模式返回的是一段文字

4. 为什么第一张图效果一般

5. 为什么编辑结果不稳定

普通用户和开发者分别怎么选

结论