GPT Image 2 API 开发者指南 | 定价与代码示例

通过 OpenAI API 使用 GPT Image 2：了解基于 Token 的定价（输入 $8/输出 $30，每百万 Token）、2K 分辨率、思考模式及网页搜索集成，开发者完整指南。

GPT Image 2 API：开发者如何接入 OpenAI 最新图像模型

GPT Image 2（gpt-image-2）已通过 OpenAI API 开放，让开发者能够以编程方式访问 OpenAI 最强大的图像生成模型。该模型于 2026 年 4 月 21 日正式发布，将智能体推理、原生 2K 分辨率、多语言文本渲染和网络搜索集成带入生产级图像流水线。以下是入门所需的全部内容。

前提条件

已开通 API 权限的 OpenAI 账号
从 platform.openai.com 获取的 API 密钥
账号已绑定付款方式（GPT Image 2 采用基于 Token 的计费方式）
具备 HTTP 请求或 OpenAI SDK 的基本使用经验

模型标识符

gpt-image-2

这是 GPT Image 2 在 OpenAI API 中的官方模型 ID。

价格

GPT Image 2 采用基于 Token 的计费方式（每百万 Token）：

Token 类型	价格
图像输入	$8.00 / 百万 Token
缓存图像输入	$2.00 / 百万 Token
图像输出	$30.00 / 百万 Token
文本输入	$5.00 / 百万 Token

每张图片的典型成本：根据提示词复杂度和输出尺寸，约为 $0.04-$0.35。

对于轻量任务（草稿、预览、批量缩略图），gpt-image-1-mini 输出 Token 费用约为每百万 $8，仅为 gpt-image-2 的约四分之一。

基本 API 请求

使用 OpenAI Python SDK

from openai import OpenAI

client = OpenAI(api_key="your-api-key")

response = client.images.generate(
    model="gpt-image-2",
    prompt="A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
    size="1024x1024",
    quality="high",
    n=1
)

image_url = response.data[0].url
print(image_url)

使用 cURL

curl https://api.openai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
    "n": 1,
    "size": "1024x1024",
    "quality": "high"
  }'

支持的参数

参数	说明	可选值
`model`	使用的模型	`gpt-image-2`
`prompt`	文本描述	字符串（最多约 4000 个字符）
`n`	生成图片数量	1-10
`size`	输出尺寸	`1024x1024`, `1792x1024`, `1024x1792`, `2048x2048`
`quality`	渲染质量	`standard`, `high`
`response_format`	返回格式	`url`, `b64_json`

分辨率

GPT Image 2 支持最高 2K 分辨率（2048px）的原生输出，相比 gpt-image-1 和 DALL-E 3 有显著提升。使用 quality: "high" 和更大的尺寸参数可获得最高分辨率输出。

标准（Standard）：1024x1024 — 速度快、成本低，适合原型验证
高质量 / 2K（High / 2K）：最高 2048x2048 — 适用于商业、印刷或高清数字内容

思考模式与复杂提示词

GPT Image 2 的思考模式（O 系列智能体推理）会在遇到复杂提示词时自动激活，无需手动开启——模型会自主判断何时需要深度推理。为充分发挥其能力，请编写包含多个细节元素的详细提示词：

prompt = """
A product advertisement for a luxury watch brand.
The watch should be centered on a dark marble surface.
Dramatic side lighting highlights the metal case.
Include the text 'Precision. Perfected.' in elegant serif font in the upper right.
Wide format suitable for a magazine spread.
"""

网络搜索集成

GPT Image 2 可在生成前搜索网络，以核实现实世界的细节。您可以在提示词中进行引导：

prompt = """
A product launch poster for the latest iPhone.
Research the current iPhone model's design and use it as visual reference.
Modern Apple aesthetic, clean white background.
"""

处理响应

URL 格式（默认）

image_url = response.data[0].url
# 注意：URL 在 60 分钟后过期——请立即下载以持久保存

Base64 格式

response = client.images.generate(
    model="gpt-image-2",
    prompt="...",
    response_format="b64_json"
)

import base64
image_data = base64.b64decode(response.data[0].b64_json)
with open("output.png", "wb") as f:
    f.write(image_data)

错误处理

from openai import OpenAI, BadRequestError, RateLimitError
import time

client = OpenAI(api_key="your-api-key")

def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = client.images.generate(
                model="gpt-image-2",
                prompt=prompt,
                size="1024x1024",
                quality="high"
            )
            return response.data[0].url
        except BadRequestError as e:
            print(f"提示词被拒绝（内容政策）：{e}")
            return None
        except RateLimitError:
            wait = 2 ** attempt
            print(f"触发速率限制，{wait} 秒后重试...")
            time.sleep(wait)
    return None

模型分层策略

使用场景	推荐模型	原因
最终交付物、客户项目	`gpt-image-2`	最优质量、推理能力、多语言文本
标准商业图像	`gpt-image-1.5`	稳定成熟的流水线
草稿、预览、批量缩略图	`gpt-image-1-mini`	成本约为 gpt-image-2 的 1/4

常见的生产工作流：先用 gpt-image-1-mini 反复迭代确认方向，再用 gpt-image-2 生成最终资产。

Azure AI Foundry

GPT Image 2 也可通过 Microsoft Azure AI Foundry 面向企业团队使用。有关您所在 Azure 区域的端点和身份验证详情，请参阅 Microsoft 官方文档。

非开发者的替代方案

如果您希望在不编写代码的情况下体验 GPT Image 2 的强大功能，Framia.pro 提供了完整的可视化创作界面。使用 GPT Image 2 生成图像，然后进行编辑、扩展和动画处理——一切都在可视化画布上完成。一个订阅还包含 Midjourney v7、Sora 2、Veo 3.1 在内的 20 多个顶尖模型。

总结

GPT Image 2 已可通过 OpenAI API 用于生产环境。使用模型 ID gpt-image-2，专业项目请启用高质量（2K）输出，并编写详细提示词以激活思考模式和网络搜索功能。如需无需 API 的访问方式，Framia.pro 将 GPT Image 2 集成在完整的可视化生产环境中。