API GPT Image 2: Cómo los desarrolladores acceden al último modelo de OpenAI
GPT Image 2 (gpt-image-2) está disponible a través de la API de OpenAI, ofreciendo a los desarrolladores acceso programático al modelo de generación de imágenes más potente de OpenAI. Lanzado el 21 de abril de 2026, incorpora razonamiento agéntico, resolución nativa 2K, renderizado de texto multilingüe e integración de búsqueda web en los pipelines de imágenes en producción. Aquí tienes todo lo que necesitas para empezar.
Requisitos previos
- Una cuenta de OpenAI con acceso a la API
- Una clave de API desde platform.openai.com
- Un método de pago en tu cuenta (GPT Image 2 usa precios basados en tokens)
- Conocimientos básicos de solicitudes HTTP o del SDK de OpenAI
Identificador del modelo
gpt-image-2
Este es el ID oficial del modelo GPT Image 2 en la API de OpenAI.
Precios
GPT Image 2 usa precios basados en tokens (por millón de tokens):
| Tipo de token | Precio |
|---|---|
| Entrada de imagen | $8,00 / 1 M de tokens |
| Entrada de imagen en caché | $2,00 / 1 M de tokens |
| Salida de imagen | $30,00 / 1 M de tokens |
| Entrada de texto | $5,00 / 1 M de tokens |
Coste típico por imagen: $0,04-$0,35 según la complejidad del prompt y el tamaño de salida.
Para tareas más ligeras (borradores, vistas previas, miniaturas en lote), gpt-image-1-mini cuesta aproximadamente $8/M tokens de salida, es decir, cerca de 1/4 del precio de gpt-image-2.
Solicitud básica a la API
Con el SDK de Python de OpenAI
from openai import OpenAI
client = OpenAI(api_key="your-api-key")
response = client.images.generate(
model="gpt-image-2",
prompt="A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
size="1024x1024",
quality="high",
n=1
)
image_url = response.data[0].url
print(image_url)
Con cURL
curl https://api.openai.com/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-image-2",
"prompt": "A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
"n": 1,
"size": "1024x1024",
"quality": "high"
}'
Parámetros admitidos
| Parámetro | Descripción | Opciones |
|---|---|---|
model |
Modelo a utilizar | gpt-image-2 |
prompt |
Descripción en texto | Cadena (hasta unos 4000 caracteres) |
n |
Número de imágenes | 1-10 |
size |
Dimensiones de salida | 1024x1024, 1792x1024, 1024x1792, 2048x2048 |
quality |
Calidad de renderizado | standard, high |
response_format |
Formato de respuesta | url, b64_json |
Resolución
GPT Image 2 soporta salida nativa de hasta resolución 2K (2048 px). Es una mejora significativa respecto a gpt-image-1 y DALL-E 3. Usa quality: "high" y parámetros de tamaño mayores para la salida en resolución máxima.
- Estándar: 1024x1024 — rápido, menor coste, ideal para prototipos
- Alta / 2K: Hasta 2048x2048 — para uso comercial, impresión o digital de alta definición
Modo Thinking y prompts complejos
El Modo Thinking de GPT Image 2 (razonamiento agéntico de la serie O) se activa automáticamente para prompts complejos. No hay que activarlo explícitamente — el modelo decide por sí solo cuándo razonar con más profundidad. Para aprovecharlo al máximo, escribe prompts detallados con múltiples elementos:
prompt = """
A product advertisement for a luxury watch brand.
The watch should be centered on a dark marble surface.
Dramatic side lighting highlights the metal case.
Include the text 'Precision. Perfected.' in elegant serif font in the upper right.
Wide format suitable for a magazine spread.
"""
Integración de búsqueda web
GPT Image 2 puede buscar en la web antes de generar para verificar detalles del mundo real. Puedes indicarlo en tu prompt:
prompt = """
A product launch poster for the latest iPhone.
Research the current iPhone model's design and use it as visual reference.
Modern Apple aesthetic, clean white background.
"""
Gestión de la respuesta
Formato URL (predeterminado)
image_url = response.data[0].url
# Nota: Las URLs expiran a los 60 minutos — descárgalas de inmediato para conservarlas
Formato Base64
response = client.images.generate(
model="gpt-image-2",
prompt="...",
response_format="b64_json"
)
import base64
image_data = base64.b64decode(response.data[0].b64_json)
with open("output.png", "wb") as f:
f.write(image_data)
Gestión de errores
from openai import OpenAI, BadRequestError, RateLimitError
import time
client = OpenAI(api_key="your-api-key")
def generate_with_retry(prompt, max_retries=3):
for attempt in range(max_retries):
try:
response = client.images.generate(
model="gpt-image-2",
prompt=prompt,
size="1024x1024",
quality="high"
)
return response.data[0].url
except BadRequestError as e:
print(f"Prompt rechazado (política de contenido): {e}")
return None
except RateLimitError:
wait = 2 ** attempt
print(f"Límite de tasa alcanzado. Reintentando en {wait}s...")
time.sleep(wait)
return None
Estrategia de niveles de modelos
| Caso de uso | Modelo recomendado | Por qué |
|---|---|---|
| Entregables finales, trabajo para clientes | gpt-image-2 |
Mejor calidad, razonamiento, texto multilingüe |
| Imágenes comerciales estándar | gpt-image-1.5 |
Pipeline estable y maduro |
| Borradores, vistas previas, miniaturas en lote | gpt-image-1-mini |
Aproximadamente 1/4 del coste de gpt-image-2 |
Un flujo de trabajo de producción habitual: iterar con gpt-image-1-mini hasta dar con la dirección correcta, y luego generar el asset final con gpt-image-2.
Azure AI Foundry
GPT Image 2 también está disponible a través de Microsoft Azure AI Foundry para equipos empresariales. Consulta la documentación de Microsoft para obtener los detalles de endpoint y autenticación específicos de tu región de Azure.
Alternativas para no desarrolladores
Si quieres aprovechar la potencia de GPT Image 2 sin código, Framia.pro ofrece una interfaz creativa completa. Genera con GPT Image 2, y luego edita, expande y anima los resultados — todo a través de un lienzo visual. Con una sola suscripción, también accedes a más de 20 modelos líderes, incluyendo Midjourney v7, Sora 2 y Veo 3.1.
Resumen
GPT Image 2 está listo para producción a través de la API de OpenAI. Usa el ID de modelo gpt-image-2, aprovecha la salida de alta calidad (2K) para trabajo profesional, y escribe prompts detallados para activar el Modo Thinking y la búsqueda web. Para acceso sin API, Framia.pro integra GPT Image 2 en un entorno completo de producción visual.