OpenAI secara resmi merilis GPT-5.5 pada 23 April 2026, sebuah model AI baru yang dirancang untuk memahami maksud pengguna dalam aplikasi dunia nyata melalui kapabilitas penggunaan komputer secara native. Model ini menampilkan kapabilitas native serbaguna yang memungkinkannya menavigasi aplikasi desktop, mengklik tombol, dan mengetik teks untuk alur kerja multi-langkah, menurut pengumuman OpenAI.

GPT-5.5 menggabungkan penggunaan komputer secara native dengan penalaran tingkat lanjut, menavigasi alat perangkat lunak secara otonom yang diperlukan untuk tugas profesional tingkat tinggi. Jendela konteks ~1,1 juta token model ini memungkinkannya memproses kumpulan data keuangan dalam skala besar yang sebelumnya memerlukan pemotongan manual. Tim keuangan OpenAI menggunakan GPT-5.5 untuk meninjau 24.771 formulir pajak K-1 (71.637 halaman) dan menyelesaikan tugas dua minggu lebih cepat dibanding tahun sebelumnya.

Tolok Ukur Kinerja

GPT-5.5 mencetak 88,5% pada tugas pemodelan internal investment banking dan 60% pada benchmark FinancialAgent v1.1, mengungguli GPT-5.4 dengan selisih empat poin. Model ini mencapai 84,9% pada GDPval, yang menguji kemampuan agen untuk menghasilkan pekerjaan pengetahuan spesifik di 44 pekerjaan. Pada OSWorld-Verified, yang mengukur operasi komputer nyata otonom model, model mencapai 78,7%. GPT-5.5 mencetak 98% pada Tau2-bench Telecom, yang menguji alur kerja layanan pelanggan yang sangat sulit.

Seorang karyawan dari tim Go-to-Market mengonfirmasi bahwa mengotomatisasi laporan bisnis mingguan akan menghemat kira-kira 5-10 jam pekerjaan manual per minggu.

Pembuatan Kode dan Optimalisasi Sistem

OpenAI melaporkan bahwa GPT-5.5 digunakan untuk membantu menulis kode bagi infrastruktur layanannya sendiri. Model mencapai “System-Level Optimization” dengan menganalisis pola lalu lintas produksi untuk menulis heuristik penyeimbangan beban khusus, meningkatkan kecepatan generasi tokennya sendiri sebesar 20%.

Dalam pengujian pengembang, model diminta untuk “merekayasa ulang editor markdown” dan mengembalikan tumpukan 12-diff yang hampir lengkap dengan koreksi manusia yang minimal. OpenAI mencatat bahwa model baru ini mencapai jawaban yang benar dalam lebih sedikit giliran dan menggunakan 40% lebih sedikit token untuk tugas Codex yang sama dibanding GPT-5.4.

Dan Shipper, pendiri dan CEO Every, menggambarkan GPT-5.5 sebagai model pengkodean pertama yang memiliki “kejelasan konseptual yang serius.” Shipper menguji GPT-5.5 setelah ia dan insinyur terbaiknya menghabiskan hari-hari untuk memperbaiki masalah pasca-peluncuran di sebuah aplikasi. Menurut Shipper, GPT-5.5 mencapai hal yang tidak bisa dilakukan GPT-5.4: model ini memeriksa kode yang rusak dan menghasilkan penulisan ulang yang akhirnya diputuskan oleh sang insinyur. Model dapat “mengingat” dan saling merujuk seluruh perpustakaan informasi tanpa kehilangan posisinya, sehingga mengurangi “halusinasi” yang melanda versi-versi sebelumnya.

Kapabilitas Otonom dan Koreksi Diri

OpenAI mengklaim bahwa GPT-5.5 dioptimalkan untuk “self-correction” dan otonomi. Model ini lebih baik dalam menafsirkan instruksi yang ambigu dan menggunakan antarmuka komputer (clicking, typing, browsing) untuk menyelesaikan tujuan tanpa campur tangan manusia. Model menjadi sangat berguna ketika diperlukan agen untuk mengoperasikan perangkat lunak, mengelola alur kerja yang berat pada terminal, atau bernalar lintas seluruh basis kode (500K+ tokens) dengan akurasi penelusuran yang tinggi.

Fitur Thinking GPT-5.5

Di ChatGPT, OpenAI memperkenalkan “GPT-5.5 Thinking,” yang menurut perusahaan membuka bantuan lebih cepat untuk masalah yang lebih sulit. Fitur ini menyediakan jawaban yang lebih cerdas, lebih ringkas, untuk membantu pengguna menyelesaikan tugas-tugas rumit dengan lebih efisien. Fitur ini unggul dalam pekerjaan profesional seperti sintesis dan analisis informasi, pengkodean, serta tugas yang padat dokumen seperti riset, terutama saat menggunakan plugin.

Penguji awal GPT-5.5 Pro melaporkan peningkatan besar baik pada kualitas maupun tingkat kesulitan pekerjaan yang dapat ditangani ChatGPT. Latensinya yang lebih rendah membuatnya lebih praktis untuk tugas-tugas yang menuntut dibanding GPT-5.4 Pro. Respons GPT-5.5 Pro terstruktur dengan baik, relevan, berguna, dan akurat, dengan performa yang terutama kuat di bidang hukum, ilmu data, bisnis, dan pendidikan.

Harga dan Aksesibilitas

Meskipun versi dasar tersedia, versi dengan kapabilitas paling tinggi (GPT-5.5 Pro) berharga $100/bulan untuk pelanggan individu. Untuk bisnis, biaya per output token kira-kira dua kali lipat dari GPT-5.4, bahkan dengan efisiensi token 40% lebih tinggi. Pengeluaran total untuk penerapan skala besar yang bersifat agentik dapat menjadi sangat besar. Ada kekhawatiran yang meningkat bahwa penalaran tingkat tertinggi akan menjadi sebuah “kemewahan” yang hanya dapat diakses oleh perusahaan-perusahaan yang didanai dengan baik, berpotensi memperlebar kesenjangan produktivitas antara perusahaan besar dan startup yang lebih kecil.

Lihat Sumber

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Komentar

0/400

AprDaydream

· 2jam yang lalu

Harap pihak resmi menyediakan mekanisme log aktivitas / pemutaran ulang yang dapat diaudit, jika tidak, akan sulit untuk menuntut tanggung jawab jika terjadi masalah, terutama untuk akun aset yang dioperasikan secara otomatis.

Lihat AsliBalas0

PaperHandsPro

· 2jam yang lalu

Memahami niat dalam aplikasi nyata adalah tantangan utama, semoga tidak lagi muncul situasi memalukan di mana kamu ingin memesan tiket pesawat, tetapi dia mengubah CV-mu.

Lihat AsliBalas0

Half-SectionedSucculent

· 2jam yang lalu

Sedikit berharap, juga sedikit takut: bisa mengklik mouse sama dengan bisa melakukan banyak hal yang hanya bisa dilakukan oleh "klik manusia", pengendalian risiko dan anti penipuan harus ditingkatkan.

Lihat AsliBalas0

ACalmnessWithAHintOfPomelo

· 2jam yang lalu

Gelombang ini juga akan berdampak pada Web3, otomatisasi operasi di blockchain, proses penandatanganan, interaksi dompet, jika bisa dilakukan secara mulus, bentuk produk akan berubah.

Lihat AsliBalas0

StarsInTheGlassDome

· 2jam yang lalu

API dan harga jangan buru-buru, lihat dulu apakah bisa tahan terhadap pop-up, multi-jendela, dan jitter jaringan di lingkungan desktop yang kompleks.

Lihat AsliBalas0

GateUser-b665e41c

· 2jam yang lalu

Merasa bahwa dari "bisa berbicara dan menulis" berevolusi menjadi "bisa melakukan dan menyerahkan", langkah selanjutnya adalah memberinya memori dan manajemen tugas yang lebih baik.

Lihat AsliBalas0

LintCollector

· 2jam yang lalu

Jika benar-benar dapat menghubungkan lintas aplikasi: menjelajah browser untuk mencari data → mengolah di Excel → membuat presentasi di PPT → mengirim melalui email, maka itu adalah rangkaian lengkap proses kerja kantor yang tertutup.

Lihat AsliBalas0

DegenWithNotebook

· 2jam yang lalu

Akhirnya sudah bisa dioperasikan secara native di desktop? Sekarang benar-benar harus menjadi "magang digital".

Lihat AsliBalas0