Fitur GPT-5.5: Analisis Lengkap Model Spud dari OpenAI

GPT-5.5 (Spud) dirilis 23 April 2026. Pelajari semua fitur utamanya: coding agentik, jendela konteks 1 juta token, GPT-5.5 Pro, penggunaan komputer, riset ilmiah, dan harga.

by Framia

Fitur GPT-5.5: Analisis Lengkap Model Spud dari OpenAI

OpenAI merilis GPT-5.5 pada 23 April 2026 — dengan nama kode internal Spud. Digambarkan sebagai "kelas kecerdasan baru untuk pekerjaan nyata," GPT-5.5 adalah model paling canggih dan siap-produksi yang pernah dibuat perusahaan ini. Panduan ini mencakup setiap fitur dan kemampuan yang signifikan.

1. Coding Agentik — Kemampuan Unggulan

Peningkatan paling menonjol GPT-5.5 dibandingkan GPT-5.4 adalah dalam coding agentik — kemampuan untuk menangani tugas rekayasa perangkat lunak yang kompleks dan berjangka panjang secara mandiri.

Hasil benchmark:

  • Terminal-Bench 2.0: 82,7% (vs 75,1% untuk GPT-5.4) — terdepan, mengalahkan Claude Opus 4.7 di 69,4%
  • Expert-SWE (Internal): 73,1% — tugas dengan estimasi waktu penyelesaian manusia median 20 jam
  • SWE-Bench Pro: 58,6%

Dalam praktiknya, GPT-5.5 lebih baik dalam:

  • Memahami mengapa suatu sistem gagal dan di mana perbaikan perlu dilakukan
  • Mempertahankan konteks di seluruh sistem multi-file yang besar
  • Membuat perubahan yang merambat dengan benar ke seluruh basis kode
  • Melakukan debug pada kegagalan kompleks dan ambigu tanpa permintaan berulang dari pengguna

Dan Shipper, CEO Every, menyebutnya sebagai "model coding pertama yang saya gunakan yang memiliki kejernihan konseptual yang serius."

2. Jendela Konteks 1 Juta Token

Jendela konteks API: 1.000.000 token Jendela konteks Codex: 400.000 token

Ini adalah salah satu peningkatan praktis paling signifikan dari GPT-5.5. Benchmark konteks panjang menunjukkannya secara dramatis:

Rentang Konteks GPT-5.5 GPT-5.4
256K-512K 81,5% 57,5%
512K-1M 74,0% 36,6%

Pada rentang 512K-1M, GPT-5.5 memperoleh akurasi lebih dari dua kali lipat GPT-5.4. Ini membuat analisis seluruh codebase, tinjauan dokumen hukum yang panjang, dan sintesis penelitian multi-bab menjadi benar-benar praktis tanpa chunking.

3. Berbagai Varian GPT-5.5

GPT-5.5 (Dasar)

Model standar untuk ChatGPT (Plus/Pro/Business/Enterprise) dan Codex.

GPT-5.5 Pro

Varian akurasi lebih tinggi dengan performa lebih kuat pada tugas-tugas menuntut:

  • BrowseComp: 90,1% vs 84,4% (dasar)
  • FrontierMath Tier 4: 39,6% vs 35,4% (dasar)
  • GeneBench: 33,2% vs 25,0% (dasar)

Tersedia untuk pengguna Pro, Business, dan Enterprise di ChatGPT; melalui API seharga $30 input / $180 output per 1 juta token.

GPT-5.5 Thinking

Tersedia di ChatGPT, mode ini menghasilkan "jawaban yang lebih cerdas dan ringkas" untuk masalah yang lebih sulit menggunakan penalaran rantai pemikiran yang diperluas.

GPT-5.5 Fast Mode (Codex)

Pembuatan token 1,5x lebih cepat dengan 2,5x biaya standar — untuk alur kerja agentik yang sensitif terhadap latensi.

4. Penggunaan Komputer

GPT-5.5 dapat mengoperasikan perangkat lunak secara mandiri — menavigasi antarmuka, mengklik, mengetik, dan berpindah antar alat untuk menyelesaikan tugas. Ia mencapai 78,7% pada OSWorld-Verified, yang mengukur apakah model dapat mengoperasikan lingkungan komputer nyata secara independen.

Hal ini membawa GPT-5.5 lebih dekat berfungsi sebagai agen AI sejati yang dapat bekerja berdampingan dengan manusia di komputer — bukan hanya merespons perintah.

5. Pekerjaan Pengetahuan

GPT-5.5 memberikan performa terdepan pada tugas pengetahuan profesional:

  • GDPval: 84,9% — menguji agen di 44 pekerjaan untuk kualitas pekerjaan pengetahuan
  • Tau2-bench Telecom: 98,0% — alur kerja layanan pelanggan kompleks, tanpa penyesuaian prompt
  • OfficeQA Pro: 54,1% (vs 43,6% Claude, 18,1% Gemini)
  • Pemodelan Perbankan Investasi: 88,5% (benchmark internal)

Penggunaan nyata yang dilaporkan oleh tim OpenAI: pembuatan laporan bisnis otomatis (menghemat 5-10 jam/minggu), memproses 24.771 formulir pajak dalam waktu yang dipercepat, dan membangun sistem perutean otomatis untuk komunikasi.

6. Riset Ilmiah

GPT-5.5 mewakili lompatan nyata dalam kemampuan ilmiah:

  • GeneBench: 25,0% (GPT-5.4: 19,0%) — analisis genetika multi-tahap dan biologi kuantitatif
  • BixBench: 80,5% (GPT-5.4: 74,0%) — analisis data bioinformatika dunia nyata
  • FrontierMath Tier 4: 35,4% (GPT-5.4: 27,1%)

Yang menonjol, sebuah varian internal GPT-5.5 membantu menemukan bukti baru tentang bilangan Ramsey — diverifikasi dalam asisten bukti Lean — sebuah pencapaian penting dalam kombinatorika.

7. Efisiensi Inferensi

GPT-5.5 menyamai latensi per-token GPT-5.4 meskipun jauh lebih canggih. Detail rekayasa utama:

  • Dirancang bersama untuk sistem NVIDIA GB200/GB300 NVL72
  • Heuristik penyeimbangan beban yang ditingkatkan (dikembangkan bersama Codex) meningkatkan pembuatan token sebesar lebih dari 20%
  • Menggunakan lebih sedikit token untuk menyelesaikan tugas Codex yang sama dibandingkan GPT-5.4

Bagi tim yang sadar biaya: meskipun GPT-5.5 memiliki harga per token yang lebih tinggi, efisiensi tokennya sering kali menghasilkan total biaya yang sebanding atau lebih rendah.

8. Kemampuan Keamanan Siber

GPT-5.5 adalah model keamanan siber paling canggih OpenAI:

  • CyberGym: 81,8% (vs 73,1% Claude Opus 4.7)
  • Capture-the-Flags (Internal): 88,1%

OpenAI mengklasifikasikan kemampuan ini sebagai "Tinggi" dalam Preparedness Framework-nya dan menerapkan kontrol yang lebih ketat pada alur kerja siber berisiko tinggi. Program Trusted Access for Cyber memberikan akses yang diperluas kepada para pembela yang terverifikasi dengan lebih sedikit pembatasan.

9. Harga dan Ketersediaan

Akses ChatGPT: Plus, Pro, Business, Enterprise (tingkat gratis tidak termasuk saat peluncuran) Akses Codex: Paket Plus, Pro, Business, Enterprise, Edu, Go

Harga API:

Model Input Output
gpt-5.5 $5 / 1 juta token $30 / 1 juta token
gpt-5.5-pro $30 / 1 juta token $180 / 1 juta token

Batch/Flex: 50% dari standar. Prioritas: 2,5x standar.

10. Mengakses GPT-5.5 Melalui Platform

Selain antarmuka asli OpenAI, Framia.pro menyediakan alur kerja AI siap pakai yang didukung GPT-5.5 — mencakup pembuatan konten, otomatisasi bisnis, dan tugas penelitian. Ini adalah cara tercepat untuk memanfaatkan kemampuan GPT-5.5 tanpa konfigurasi API.

Ringkasan Fitur Utama

Fitur Detail
Tanggal rilis 23 April 2026
Nama kode Spud
Jendela konteks 1 juta token (API), 400 ribu (Codex)
Benchmark coding terbaik Terminal-Bench 2.0: 82,7%
Benchmark pengetahuan terbaik Tau2-bench Telecom: 98,0%
Penalaran abstrak ARC-AGI-2: 85,0%
Harga API $5/$30 per 1 juta token
Harga API Pro $30/$180 per 1 juta token
Varian Dasar, Pro, Thinking, Fast Mode