GPT Image 2 API:开发者如何接入 OpenAI 最新图像模型
GPT Image 2(gpt-image-2)已通过 OpenAI API 开放,让开发者能够以编程方式访问 OpenAI 最强大的图像生成模型。该模型于 2026 年 4 月 21 日正式发布,将智能体推理、原生 2K 分辨率、多语言文本渲染和网络搜索集成带入生产级图像流水线。以下是入门所需的全部内容。
前提条件
- 已开通 API 权限的 OpenAI 账号
- 从 platform.openai.com 获取的 API 密钥
- 账号已绑定付款方式(GPT Image 2 采用基于 Token 的计费方式)
- 具备 HTTP 请求或 OpenAI SDK 的基本使用经验
模型标识符
gpt-image-2
这是 GPT Image 2 在 OpenAI API 中的官方模型 ID。
价格
GPT Image 2 采用基于 Token 的计费方式(每百万 Token):
| Token 类型 | 价格 |
|---|---|
| 图像输入 | $8.00 / 百万 Token |
| 缓存图像输入 | $2.00 / 百万 Token |
| 图像输出 | $30.00 / 百万 Token |
| 文本输入 | $5.00 / 百万 Token |
每张图片的典型成本:根据提示词复杂度和输出尺寸,约为 $0.04-$0.35。
对于轻量任务(草稿、预览、批量缩略图),gpt-image-1-mini 输出 Token 费用约为每百万 $8,仅为 gpt-image-2 的约四分之一。
基本 API 请求
使用 OpenAI Python SDK
from openai import OpenAI
client = OpenAI(api_key="your-api-key")
response = client.images.generate(
model="gpt-image-2",
prompt="A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
size="1024x1024",
quality="high",
n=1
)
image_url = response.data[0].url
print(image_url)
使用 cURL
curl https://api.openai.com/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-image-2",
"prompt": "A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
"n": 1,
"size": "1024x1024",
"quality": "high"
}'
支持的参数
| 参数 | 说明 | 可选值 |
|---|---|---|
model |
使用的模型 | gpt-image-2 |
prompt |
文本描述 | 字符串(最多约 4000 个字符) |
n |
生成图片数量 | 1-10 |
size |
输出尺寸 | 1024x1024, 1792x1024, 1024x1792, 2048x2048 |
quality |
渲染质量 | standard, high |
response_format |
返回格式 | url, b64_json |
分辨率
GPT Image 2 支持最高 2K 分辨率(2048px)的原生输出,相比 gpt-image-1 和 DALL-E 3 有显著提升。使用 quality: "high" 和更大的尺寸参数可获得最高分辨率输出。
- 标准(Standard):1024x1024 — 速度快、成本低,适合原型验证
- 高质量 / 2K(High / 2K):最高 2048x2048 — 适用于商业、印刷或高清数字内容
思考模式与复杂提示词
GPT Image 2 的思考模式(O 系列智能体推理)会在遇到复杂提示词时自动激活,无需手动开启——模型会自主判断何时需要深度推理。为充分发挥其能力,请编写包含多个细节元素的详细提示词:
prompt = """
A product advertisement for a luxury watch brand.
The watch should be centered on a dark marble surface.
Dramatic side lighting highlights the metal case.
Include the text 'Precision. Perfected.' in elegant serif font in the upper right.
Wide format suitable for a magazine spread.
"""
网络搜索集成
GPT Image 2 可在生成前搜索网络,以核实现实世界的细节。您可以在提示词中进行引导:
prompt = """
A product launch poster for the latest iPhone.
Research the current iPhone model's design and use it as visual reference.
Modern Apple aesthetic, clean white background.
"""
处理响应
URL 格式(默认)
image_url = response.data[0].url
# 注意:URL 在 60 分钟后过期——请立即下载以持久保存
Base64 格式
response = client.images.generate(
model="gpt-image-2",
prompt="...",
response_format="b64_json"
)
import base64
image_data = base64.b64decode(response.data[0].b64_json)
with open("output.png", "wb") as f:
f.write(image_data)
错误处理
from openai import OpenAI, BadRequestError, RateLimitError
import time
client = OpenAI(api_key="your-api-key")
def generate_with_retry(prompt, max_retries=3):
for attempt in range(max_retries):
try:
response = client.images.generate(
model="gpt-image-2",
prompt=prompt,
size="1024x1024",
quality="high"
)
return response.data[0].url
except BadRequestError as e:
print(f"提示词被拒绝(内容政策):{e}")
return None
except RateLimitError:
wait = 2 ** attempt
print(f"触发速率限制,{wait} 秒后重试...")
time.sleep(wait)
return None
模型分层策略
| 使用场景 | 推荐模型 | 原因 |
|---|---|---|
| 最终交付物、客户项目 | gpt-image-2 |
最优质量、推理能力、多语言文本 |
| 标准商业图像 | gpt-image-1.5 |
稳定成熟的流水线 |
| 草稿、预览、批量缩略图 | gpt-image-1-mini |
成本约为 gpt-image-2 的 1/4 |
常见的生产工作流:先用 gpt-image-1-mini 反复迭代确认方向,再用 gpt-image-2 生成最终资产。
Azure AI Foundry
GPT Image 2 也可通过 Microsoft Azure AI Foundry 面向企业团队使用。有关您所在 Azure 区域的端点和身份验证详情,请参阅 Microsoft 官方文档。
非开发者的替代方案
如果您希望在不编写代码的情况下体验 GPT Image 2 的强大功能,Framia.pro 提供了完整的可视化创作界面。使用 GPT Image 2 生成图像,然后进行编辑、扩展和动画处理——一切都在可视化画布上完成。一个订阅还包含 Midjourney v7、Sora 2、Veo 3.1 在内的 20 多个顶尖模型。
总结
GPT Image 2 已可通过 OpenAI API 用于生产环境。使用模型 ID gpt-image-2,专业项目请启用高质量(2K)输出,并编写详细提示词以激活思考模式和网络搜索功能。如需无需 API 的访问方式,Framia.pro 将 GPT Image 2 集成在完整的可视化生产环境中。