Appearance
GPT-Image-2 国内镜像使用教程:API 调用、返回格式与入口推荐
如果你搜索的是 GPT-Image-2 国内怎么用、GPT-Image-2 API、GPT-Image-2 镜像站,真正要解决的问题通常不是模型原理,而是下面这几件事:
- 国内有没有能直接用的入口
- 走
chat接口和走images接口到底有什么区别 - 返回的是
base64还是url - 哪个入口更适合直接上手,哪个更适合做 API 接入
这篇文章直接按实操来讲。先说结论:如果你是普通用户,想先跑通文生图和图片编辑,当前更值得优先试的两个入口是 aimi 和 chat.aicnbox.com。如果你是开发者,重点要理解的是 chat、images/generations、images/edits 三种模式返回结构并不一样。
GPT-Image-2 是什么
GPT-Image-2 可以理解成一类以图像生成为核心能力的 OpenAI 兼容模型。常见场景包括:
- 文生图:一句提示词直接生成图片
- 图像编辑:上传原图后按提示词修改
- 参考图重绘:保留主体,再调整风格、背景、比例或细节
对国内用户来说,难点往往不在提示词,而在于:
- 官方链路不一定适合直接使用
- 不同镜像站的接口兼容程度不一样
- 有的平台默认返回
url,有的平台默认返回base64
所以比起只看“支持不支持 GPT-Image-2”,更重要的是先看这个入口到底怎么返回结果。
GPT-Image-2 国内怎么用
最短路径可以压缩成 3 步:
- 先选一个能直接打开的国内入口
- 先用最小提示词跑通第一张图
- 如果你要做开发接入,再确认平台支持哪些 API 端点
对大多数用户来说,第一步并不是申请 API,而是先确认平台本身是否真的能稳定返回图片。
国内推荐入口:aimi 和 chat.aicnbox.com
1. aimi:更适合想要完整控制项的用户
aimi 更适合第一次系统使用 GPT-Image-2 的用户。它的优势不是“神秘高阶”,而是把常用参数和模型入口做得比较直观。
这类入口一般更适合:
- 想看见模型切换入口
- 想明确控制比例、清晰度、参考图上传
- 想同时测试生成和编辑流程
如果你不仅是“试一张图”,而是准备把 GPT-Image-2 用到封面图、海报图、博客配图、商品图里,aimi 这类界面通常更省时间。
2. chat.aicnbox.com:更适合对话式快速出图
chat.aicnbox.com 更偏轻量型。它更像是在聊天窗口里直接说一句话,然后让系统把图回出来。
这类入口通常更适合:
- 想像聊天一样出图
- 不想一上来研究太多参数
- 先快速验证提示词方向
如果你平时就习惯“发一句话,等结果”,那 chat.aicnbox.com 的交互会更顺手。
aimi 和 chat.aicnbox.com 怎么选
可以直接按使用目的来判断:
| 场景 | 更推荐的入口 | 原因 |
|---|---|---|
| 第一次系统使用 GPT-Image-2 | aimi | 模型、参数、上传图等能力通常更直观 |
| 快速测试一句提示词是否能出图 | chat.aicnbox.com | 对话式路径更短 |
| 准备继续做 API 调试 | aimi | 更容易先把功能跑通,再转接口 |
| 需要一个备用入口 | chat.aicnbox.com | 适合做快速替补测试 |
如果你不确定自己该先用哪个,最简单的办法就是:
- 先在 aimi 生成一张图
- 再到 chat.aicnbox.com 用同一句提示词跑一张
- 直接比较哪种交互更适合自己
GPT-Image-2 的三种常见调用方式
开发者最容易混淆的,不是模型名,而是接口路径。
1. /v1/chat/completions
这种方式表面上像聊天接口,实际有些镜像站会把生成后的图片链接塞进文本里返回。
典型返回可能长这样:
json
{
"choices": [
{
"message": {
"role": "assistant",
"content": ""
}
}
]
}这意味着:
- 返回主体仍然是文字
- 只是这段文字里嵌了图片链接
- 你的代码如果要取图,需要从
content里把 URL 提出来
它的优点是接入简单,缺点是返回结构不够“干净”,不如图片接口稳定。
2. /v1/images/generations
这是更标准的文生图接口。
典型返回结构:
json
{
"data": [
{
"url": "https://example.com/xxx.png",
"b64_json": "",
"revised_prompt": ""
}
]
}或者某些平台会返回:
json
{
"data": [
{
"b64_json": "iVBORw0K..."
}
]
}所以开发时要注意:不同镜像站即使都说自己支持 GPT-Image-2,默认返回的也可能不一样。
3. /v1/images/edits
如果你要做的是改图,而不是从零生成,就该走这个接口。
它适合:
- 把红色商品改成蓝色
- 保持构图不变,换背景
- 保留人物姿势,换服装或场景
- 在现有海报基础上继续细修
典型返回结构和 generations 很像,常见也是:
json
{
"data": [
{
"url": "https://example.com/edited.png",
"b64_json": ""
}
]
}返回的是 base64 还是 url
这是 GPT-Image-2 镜像使用里最常见的问题之一。
实际情况不是统一的,而是分两层看:
第一层:看接口类型
chat/completions- 常见返回是文本
- 文本里可能嵌一个图片 URL
images/generations- 常见返回是结构化图片结果
- 图片内容可能是
url,也可能是b64_json
images/edits- 和
generations类似 - 返回
url或b64_json取决于平台实现
- 和
第二层:看镜像站实现
同样是 gpt-image-2:
- 有的平台默认给
base64 - 有的平台默认给
url - 还有的平台
chat返回 Markdown 图片链接,images返回结构化url
所以你不能只记“GPT-Image-2 默认返回什么”,而要看“这个镜像站把什么字段填上了”。
实际代码里更稳的判断方式是:
js
const item = response.data?.[0];
if (item?.b64_json) {
// 解码保存图片
}
if (item?.url) {
// 直接下载图片
}第一次使用 GPT-Image-2 的正确步骤
很多人第一次用就堆一大段提示词,结果反而不知道问题出在哪里。更稳的流程是下面这样。
第一步:先做最小测试
先不要写很复杂的商业需求,先来一句最简单的:
text
请生成一张图片:一只坐在窗边的橘猫,早晨自然光,写实风格目的不是一步到位,而是先确认:
- 当前入口真的支持图片生成
- 当前模型真的能回图
- 返回结构是不是你预期的那种
第二步:用结构化提示词
建议按这个顺序写:
主体 + 场景 + 风格 + 光线 + 限制条件
例如:
text
一个年轻女生坐在靠窗的书桌前阅读,桌上有咖啡和笔记本,午后自然光,写实摄影风格,画面干净,竖版构图,不要文字,不要水印这种写法通常比单纯堆“高级感、氛围感、电影感”更稳定。
第三步:不要频繁重开,优先追改
GPT-Image-2 的实用价值,很大一部分在于“基于已有结果继续改”。
例如你可以继续说:
text
保持人物和整体构图不变,把背景改成现代办公室,光线更柔和,画面更适合科技文章封面或者:
text
保留主体不变,把整体色调改成蓝灰色,背景更简洁,适合商业海报这样通常比每次重新生成一张更快,也更接近你想要的结果。
适合直接复制的 GPT-Image-2 提示词模板
1. 博客封面图
text
一个整洁的家庭办公桌面,电脑屏幕上显示创作界面,旁边有咖啡和绿植,现代内容创作氛围,柔和自然光,横版构图,不要文字2. 科技文章配图
text
未来感数据流从屏幕中延展出来,一位用户正在操作智能界面,蓝白科技风,现代 UI 视觉感,海报构图,整体简洁,不要英文文字,不要水印3. 电商产品图
text
一只无线耳机盒放在白色台面上,柔和阴影,少量反光,极简产品摄影风格,高清细节,背景干净,不要人物,不要文字4. 小红书封面图
text
一个女生站在白色极简咖啡馆门口,穿浅色系穿搭,阳光柔和,生活方式摄影风格,画面干净,竖版构图,适合社交媒体封面,不要文字5. 公众号头图
text
一个正在分析数据的内容创作者坐在明亮办公桌前,桌面有笔记本电脑、平板和咖啡杯,现代高效办公风格,横版构图,适合公众号头图,不要文字开发者快速上手示例
文生图:images/generations
bash
curl --http1.1 https://your-api.example/v1/images/generations \
-H "Authorization: Bearer YOUR_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A minimal flat illustration of a red apple on a white background",
"size": "1024x1024"
}'改图:images/edits
bash
curl --http1.1 https://your-api.example/v1/images/edits \
-H "Authorization: Bearer YOUR_KEY" \
-F "model=gpt-image-2" \
-F "prompt=Change the red circle into a green square on a white background" \
-F "image=@input.png"聊天式出图:chat/completions
bash
curl --http1.1 https://your-api.example/v1/chat/completions \
-H "Authorization: Bearer YOUR_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"messages": [
{
"role": "user",
"content": "Generate an image of a red apple on a white background"
}
]
}'如果返回的是 Markdown 图片链接,记得从 choices[0].message.content 里提取 URL,而不是去找 b64_json。
GPT-Image-2 国内使用时最常见的 5 个问题
1. 为什么有的接口能出图,有的接口不行
因为不是所有镜像站都把 chat、generations、edits 都完整兼容了。有的平台只把 images/generations 做通了,有的平台 chat 能返回图链,但并不适合正式接入。
2. 为什么同样是 GPT-Image-2,有的平台给 url,有的平台给 base64
因为这是镜像实现差异,不是你提示词写错了。最稳的做法是代码同时兼容 url 和 b64_json。
3. 为什么 chat 模式返回的是一段文字
因为有些平台把图片地址包在聊天文本里返回了,本质上还是“chat 响应”,不是“标准图片对象”。
4. 为什么第一张图效果一般
不是模型不行,而是第一轮通常只是定方向。建议:
- 第一轮先定主体和场景
- 第二轮再补风格和色调
- 第三轮再补构图、留白和商业用途要求
5. 为什么编辑结果不稳定
因为每轮改动太多。更稳的方法是每次只改 1 到 2 个变量,比如只改背景、只改颜色、只改光线。
普通用户和开发者分别怎么选
如果你只想快速把 GPT-Image-2 用起来:
- 优先试 aimi
- 备用入口放一个 chat.aicnbox.com
如果你准备做程序接入:
- 先用页面入口把功能跑通
- 再确认平台是否支持
images/generations - 如果你还要改图,再确认是否支持
images/edits - 最后再决定是否兼容
chat/completions
结论
GPT-Image-2 国内使用教程 的核心不是“找到模型名”,而是先把下面三件事分清:
- 你是普通用户,还是开发者
- 你要的是聊天式出图,还是标准 API 出图
- 你当前平台返回的是
url、base64,还是文本里的图片链接
如果你是新手,最省时间的路线通常是:
- 先用 aimi 跑通一次生成和编辑
- 再用 chat.aicnbox.com 做对话式快速测试
- 确认稳定后,再开始做 API 接入
这样你不会一开始就卡在接口兼容细节里,也能更快判断哪个入口适合长期使用。