GPT Image 2 API:開発者がOpenAIの最新モデルにアクセスする方法
GPT Image 2(gpt-image-2)はOpenAI APIを通じて利用可能で、開発者はOpenAIが誇る最高性能の画像生成モデルにプログラムからアクセスできます。2026年4月21日にリリースされたこのモデルは、エージェンティックな推論、ネイティブ2K解像度、多言語テキストレンダリング、Webサーチ統合を本番環境の画像パイプラインにもたらします。始め方をすべて解説します。
前提条件
- APIアクセス付きの OpenAIアカウント
- platform.openai.com からの APIキー
- アカウントへの支払い方法(GPT Image 2はトークンベースの料金体系を採用)
- HTTPリクエストまたはOpenAI SDKの基本的な知識
モデルID
gpt-image-2
これがOpenAI APIにおけるGPT Image 2の公式モデルIDです。
料金
GPT Image 2はトークンベースの料金体系(100万トークンあたり)を採用しています:
| トークンの種類 | 価格 |
|---|---|
| 画像入力 | $8.00 / 100万トークン |
| キャッシュ済み画像入力 | $2.00 / 100万トークン |
| 画像出力 | $30.00 / 100万トークン |
| テキスト入力 | $5.00 / 100万トークン |
1画像あたりの典型的なコスト:プロンプトの複雑さと出力サイズにより、$0.04〜$0.35
軽量なタスク(ドラフト、プレビュー、バッチサムネイル)には、gpt-image-1-miniが出力トークン100万あたり約$8、つまりgpt-image-2の約1/4のコストで利用できます。
基本的なAPIリクエスト
OpenAI Python SDKを使用する場合
from openai import OpenAI
client = OpenAI(api_key="your-api-key")
response = client.images.generate(
model="gpt-image-2",
prompt="A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
size="1024x1024",
quality="high",
n=1
)
image_url = response.data[0].url
print(image_url)
cURLを使用する場合
curl https://api.openai.com/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"model": "gpt-image-2",
"prompt": "A professional headshot of a woman in her 30s, soft studio lighting, neutral background, photorealistic",
"n": 1,
"size": "1024x1024",
"quality": "high"
}'
サポートされているパラメータ
| パラメータ | 説明 | オプション |
|---|---|---|
model |
使用するモデル | gpt-image-2 |
prompt |
テキストによる説明 | 文字列(最大約4000文字) |
n |
生成する画像数 | 1〜10 |
size |
出力サイズ | 1024x1024, 1792x1024, 1024x1792, 2048x2048 |
quality |
レンダリング品質 | standard, high |
response_format |
返却形式 | url, b64_json |
解像度
GPT Image 2は**ネイティブで最大2K解像度(2048px)**の出力をサポートしています。gpt-image-1やDALL-E 3からの大幅なアップグレードです。最大解像度で出力するには、quality: "high"と大きいサイズパラメータを使用してください。
- スタンダード:1024×1024 — 高速、低コスト、プロトタイピングに最適
- ハイ / 2K:最大2048×2048 — 商用、印刷、高精細デジタルコンテンツ向け
シンキングモードと複雑なプロンプト
GPT Image 2のシンキングモード(OシリーズのAIエージェント推論)は、複雑なプロンプトに対して自動的に起動します。明示的に有効にする必要はなく、モデルが自分で深く考えるタイミングを判断します。効果を最大限に引き出すには、詳細な複数要素のプロンプトを記述してください:
prompt = """
A product advertisement for a luxury watch brand.
The watch should be centered on a dark marble surface.
Dramatic side lighting highlights the metal case.
Include the text 'Precision. Perfected.' in elegant serif font in the upper right.
Wide format suitable for a magazine spread.
"""
Web検索統合
GPT Image 2は生成前にWebを検索し、現実世界の詳細を確認することができます。プロンプトでこれを活用できます:
prompt = """
A product launch poster for the latest iPhone.
Research the current iPhone model's design and use it as visual reference.
Modern Apple aesthetic, clean white background.
"""
レスポンスの処理
URL形式(デフォルト)
image_url = response.data[0].url
# 注意:URLは60分後に期限切れになります — 永続的に保存するには即座にダウンロードしてください
Base64形式
response = client.images.generate(
model="gpt-image-2",
prompt="...",
response_format="b64_json"
)
import base64
image_data = base64.b64decode(response.data[0].b64_json)
with open("output.png", "wb") as f:
f.write(image_data)
エラーハンドリング
from openai import OpenAI, BadRequestError, RateLimitError
import time
client = OpenAI(api_key="your-api-key")
def generate_with_retry(prompt, max_retries=3):
for attempt in range(max_retries):
try:
response = client.images.generate(
model="gpt-image-2",
prompt=prompt,
size="1024x1024",
quality="high"
)
return response.data[0].url
except BadRequestError as e:
print(f"プロンプトが拒否されました(コンテンツポリシー): {e}")
return None
except RateLimitError:
wait = 2 ** attempt
print(f"レート制限に達しました。{wait}秒後に再試行します...")
time.sleep(wait)
return None
モデル選択戦略
| ユースケース | 推奨モデル | 理由 |
|---|---|---|
| 最終成果物、クライアント向け | gpt-image-2 |
最高品質、推論機能、多言語テキスト |
| 標準的な商用画像 | gpt-image-1.5 |
安定した成熟したパイプライン |
| ドラフト、プレビュー、大量サムネイル | gpt-image-1-mini |
gpt-image-2の約1/4のコスト |
一般的な本番ワークフロー:gpt-image-1-miniで方向性が定まるまで繰り返し試行し、最終的な成果物をgpt-image-2で生成する。
Azure AI Foundry
GPT Image 2は企業チーム向けにMicrosoft Azure AI Foundryでも利用できます。Azureリージョン固有のエンドポイントと認証の詳細については、Microsoftのドキュメントを参照してください。
コードを使わない代替手段
コードなしでGPT Image 2のパワーを活用したい場合、**Framia.pro**が完全なクリエイティブインターフェースを提供しています。GPT Image 2で生成し、編集、拡張、アニメーション化まで — すべてビジュアルキャンバス上で完結します。1つのサブスクリプションで、Midjourney v7、Sora 2、Veo 3.1を含む20以上の主要モデルも利用できます。
まとめ
GPT Image 2はOpenAI APIを通じて本番環境での利用が可能です。モデルID gpt-image-2を使用し、プロフェッショナルな作業には高品質(2K)出力を活用し、詳細なプロンプトでシンキングモードとWeb検索を最大限に引き出しましょう。APIなしでのアクセスには、Framia.proがGPT Image 2を完全なビジュアル制作環境でラップして提供しています。