API GPT Image 2: Cómo los desarrolladores acceden al último modelo de OpenAI

Accede a GPT Image 2 a través de la API de OpenAI. Guía para desarrolladores con precios por tokens ($8/$30 por millón), resolución 2K, Thinking Mode e integración de búsqueda web.

by Framia

API GPT Image 2: Cómo los desarrolladores acceden al último modelo de OpenAI

GPT Image 2 (gpt-image-2) está disponible a través de la API de OpenAI, ofreciendo a los desarrolladores acceso programático al modelo de generación de imágenes más potente de OpenAI. Lanzado el 21 de abril de 2026, incorpora razonamiento agéntico, resolución nativa 2K, renderizado de texto multilingüe e integración de búsqueda web en los pipelines de imágenes en producción. Aquí tienes todo lo que necesitas para empezar.

Requisitos previos

  • Una cuenta de OpenAI con acceso a la API
  • Una clave de API desde platform.openai.com
  • Un método de pago en tu cuenta (GPT Image 2 usa precios basados en tokens)
  • Conocimientos básicos de solicitudes HTTP o del SDK de OpenAI

Identificador del modelo

gpt-image-2

Este es el ID oficial del modelo GPT Image 2 en la API de OpenAI.

Precios

GPT Image 2 usa precios basados en tokens (por millón de tokens):

Tipo de token Precio
Entrada de imagen $8,00 / 1 M de tokens
Entrada de imagen en caché $2,00 / 1 M de tokens
Salida de imagen $30,00 / 1 M de tokens
Entrada de texto $5,00 / 1 M de tokens

Coste típico por imagen: $0,04-$0,35 según la complejidad del prompt y el tamaño de salida.

Para tareas más ligeras (borradores, vistas previas, miniaturas en lote), gpt-image-1-mini cuesta aproximadamente $8/M tokens de salida, es decir, cerca de 1/4 del precio de gpt-image-2.

Solicitud básica a la API

Con el SDK de Python de OpenAI

from openai import OpenAI

client = OpenAI(api_key="your-api-key")

response = client.images.generate(
    model="gpt-image-2",
    prompt="A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
    size="1024x1024",
    quality="high",
    n=1
)

image_url = response.data[0].url
print(image_url)

Con cURL

curl https://api.openai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
    "n": 1,
    "size": "1024x1024",
    "quality": "high"
  }'

Parámetros admitidos

Parámetro Descripción Opciones
model Modelo a utilizar gpt-image-2
prompt Descripción en texto Cadena (hasta unos 4000 caracteres)
n Número de imágenes 1-10
size Dimensiones de salida 1024x1024, 1792x1024, 1024x1792, 2048x2048
quality Calidad de renderizado standard, high
response_format Formato de respuesta url, b64_json

Resolución

GPT Image 2 soporta salida nativa de hasta resolución 2K (2048 px). Es una mejora significativa respecto a gpt-image-1 y DALL-E 3. Usa quality: "high" y parámetros de tamaño mayores para la salida en resolución máxima.

  • Estándar: 1024x1024 — rápido, menor coste, ideal para prototipos
  • Alta / 2K: Hasta 2048x2048 — para uso comercial, impresión o digital de alta definición

Modo Thinking y prompts complejos

El Modo Thinking de GPT Image 2 (razonamiento agéntico de la serie O) se activa automáticamente para prompts complejos. No hay que activarlo explícitamente — el modelo decide por sí solo cuándo razonar con más profundidad. Para aprovecharlo al máximo, escribe prompts detallados con múltiples elementos:

prompt = """
A product advertisement for a luxury watch brand.
The watch should be centered on a dark marble surface.
Dramatic side lighting highlights the metal case.
Include the text 'Precision. Perfected.' in elegant serif font in the upper right.
Wide format suitable for a magazine spread.
"""

Integración de búsqueda web

GPT Image 2 puede buscar en la web antes de generar para verificar detalles del mundo real. Puedes indicarlo en tu prompt:

prompt = """
A product launch poster for the latest iPhone.
Research the current iPhone model's design and use it as visual reference.
Modern Apple aesthetic, clean white background.
"""

Gestión de la respuesta

Formato URL (predeterminado)

image_url = response.data[0].url
# Nota: Las URLs expiran a los 60 minutos — descárgalas de inmediato para conservarlas

Formato Base64

response = client.images.generate(
    model="gpt-image-2",
    prompt="...",
    response_format="b64_json"
)

import base64
image_data = base64.b64decode(response.data[0].b64_json)
with open("output.png", "wb") as f:
    f.write(image_data)

Gestión de errores

from openai import OpenAI, BadRequestError, RateLimitError
import time

client = OpenAI(api_key="your-api-key")

def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = client.images.generate(
                model="gpt-image-2",
                prompt=prompt,
                size="1024x1024",
                quality="high"
            )
            return response.data[0].url
        except BadRequestError as e:
            print(f"Prompt rechazado (política de contenido): {e}")
            return None
        except RateLimitError:
            wait = 2 ** attempt
            print(f"Límite de tasa alcanzado. Reintentando en {wait}s...")
            time.sleep(wait)
    return None

Estrategia de niveles de modelos

Caso de uso Modelo recomendado Por qué
Entregables finales, trabajo para clientes gpt-image-2 Mejor calidad, razonamiento, texto multilingüe
Imágenes comerciales estándar gpt-image-1.5 Pipeline estable y maduro
Borradores, vistas previas, miniaturas en lote gpt-image-1-mini Aproximadamente 1/4 del coste de gpt-image-2

Un flujo de trabajo de producción habitual: iterar con gpt-image-1-mini hasta dar con la dirección correcta, y luego generar el asset final con gpt-image-2.

Azure AI Foundry

GPT Image 2 también está disponible a través de Microsoft Azure AI Foundry para equipos empresariales. Consulta la documentación de Microsoft para obtener los detalles de endpoint y autenticación específicos de tu región de Azure.

Alternativas para no desarrolladores

Si quieres aprovechar la potencia de GPT Image 2 sin código, Framia.pro ofrece una interfaz creativa completa. Genera con GPT Image 2, y luego edita, expande y anima los resultados — todo a través de un lienzo visual. Con una sola suscripción, también accedes a más de 20 modelos líderes, incluyendo Midjourney v7, Sora 2 y Veo 3.1.

Resumen

GPT Image 2 está listo para producción a través de la API de OpenAI. Usa el ID de modelo gpt-image-2, aprovecha la salida de alta calidad (2K) para trabajo profesional, y escribe prompts detallados para activar el Modo Thinking y la búsqueda web. Para acceso sin API, Framia.pro integra GPT Image 2 en un entorno completo de producción visual.