Pindai untuk Mengunduh Aplikasi Gate

Opsi Unduhan Lainnya

Jangan ingatkan saya lagi hari ini

Gemini 3 Datang di Tengah Malam: Mengalahkan GPT 5.1, Era Model Besar Google Telah Tiba

DeepFlowTech

2025-11-19 01:35:34

Gemini 3 belum muncul, Twitter sudah down sebagai penghormatan.

Tidak ada rilis model yang lebih menarik perhatian daripada Gemini 3. Berdasarkan frekuensi pembaruan Gemini yang dilakukan setiap 3 bulan sebelumnya, komunitas AI telah menantikan Gemini 3 sejak bulan September.

Hari ini, kepala hubungan pengembang Google dan kepala Google AI Studio mengeluarkan sebuah tweet yang hanya berisi kata “Gemini”, dan setelah berbulan-bulan menunggu, akhirnya momen yang dinanti-nantikan tiba, topik terkait di Twitter seketika menjadi ramai.

Menariknya, menjelang rilis node, Twitter justru “secara kebetulan” mengalami beberapa kali down. Meskipun “dalang” di baliknya adalah Cloudflare, namun waktu kerusakan ini sangat tepat sehingga membuat orang curiga ada yang berbuat curang (bisik-bisik: bagaimanapun juga Twitter adalah panggung promosi utama untuk berbagai model).

Tidak tahu apa yang dipikirkan Musk saat ini setelah merilis Grok 4.1 pagi ini, bagaimanapun juga meme dari netizen sudah bertebaran di mana-mana.

Baru saja, Gemini 3 akhirnya resmi diluncurkan, mari kita lihat seberapa kuat ia muncul di bawah sorotan banyak orang.

Model Paling Cerdas

Ternyata, Google tidak mengecewakan orang-orang yang menunggu, Gemini 3 telah resmi diluncurkan, sekali lagi mendefinisikan SOTA, Ultraman dan Musk juga mengirimkan ucapan selamat.

Google mendefinisikannya sebagai “langkah penting menuju AGI” dan menekankan bahwa ini adalah agen dengan kemampuan pemahaman multimodal yang paling kuat dan interaksi yang paling mendalam di dunia saat ini.

Gemini 3 tidak hanya memperbarui standar SOTA dalam kemampuan penalaran dasar, tetapi juga melalui peluncuran platform Google Antigravity yang baru dan mode Deep Think, berusaha untuk membentuk kembali ekosistem pengembang dan pengalaman bantuan AI.

Monster inferensi yang mendominasi peringkat

Gemini 3 Pro secara resmi disebut sebagai “model inferensi paling canggih”, yang secara signifikan melampaui pendahulunya Gemini 2.5 Pro di hampir semua pengujian standar AI utama, dan sepenuhnya mengungguli pesaing utama seperti Claude Sonnet 4.5 dan GPT-5.1.

Gemini 3 Pro meraih skor tinggi yang mencolok 1501 Elo di puncak Papan Peringkat LMArena, mendapatkan skor tertinggi di Ujian Terakhir Kemanusiaan (mencapai 37,5% tanpa menggunakan alat apapun) dan GPQA Diamond (91,9%), menunjukkan kemampuan penalaran setara doktor. Ini juga menetapkan standar baru untuk model-model terdepan dalam bidang matematika, mencapai level SOTA terbaru 23,4% di MathArena Apex.

Selain teks dan logika, Gemini 3 Pro juga mendefinisikan ulang batasan penalaran multimodal. Ini meraih skor tinggi 81% dan 87,6% di MMMU-Pro dan Video-MMMU masing-masing, yang berarti baik dalam menganalisis grafik ilmiah yang kompleks maupun memahami aliran video dinamis.

Lebih penting lagi, ia mendapatkan skor 72,1% di SimpleQA Verified, menunjukkan kemajuan besar dalam akurasi fakta — ia tidak hanya kuat, tetapi juga dapat diandalkan.

Menolak rekan berpikir yang memuji

Evolusi Gemini 3 Pro tidak hanya terletak pada skor yang dihasilkan, tetapi juga pada kualitas interaksinya. Ia menghindari klise umum dan pujian berlebihan yang sering ditemui pada AI sebelumnya, menjadi lebih cerdas, ringkas, dan langsung: memberi tahu Anda apa yang perlu didengar, bukan hanya apa yang Anda suka dengar.

Ini berfungsi sebagai mitra berpikir yang nyata, memberikan Anda cara baru untuk memahami informasi dan mengekspresikan diri, mulai dari menerjemahkan konsep ilmiah yang sulit melalui pembuatan kode visual berkualitas tinggi, hingga brainstorming kreatif.

Gemini 3 Deep Think

Mode Deep Think Gemini 3 lebih lanjut memperluas batasan kecerdasan, membawa kemajuan signifikan dalam kemampuan penalaran dan pemahaman multimodal Gemini 3, membantu Anda menyelesaikan masalah yang lebih kompleks.

Dalam pengujian, Gemini 3 Deep Think menunjukkan kinerja yang lebih baik daripada Gemini 3 Pro yang sudah cukup baik di Humanity's Last Exam (skor 41,0% tanpa menggunakan alat) dan GPQA Diamond (skor 93,8%). Selain itu, ia juga mencapai skor yang belum pernah terjadi sebelumnya sebesar 45,1% di ARC-AGI-2 (eksekusi kode, yang telah diverifikasi oleh ARC Prize), menunjukkan kemampuannya untuk menghadapi tantangan baru.

Mode Gemini 3 Deep Think menunjukkan kinerja luar biasa dalam beberapa pengujian AI yang paling menantang.

Belajar, membangun, dan merencanakan

Belajar apapun

Gemini dari awal dirancang untuk mengintegrasikan berbagai jenis informasi dari berbagai mode, termasuk teks, gambar, video, audio, dan kode. Gemini 3 menggabungkan kemampuan penalaran, pemahaman visual dan spasial yang canggih, kinerja multibahasa yang unggul, serta jendela konteks token jutaan, lebih jauh memperluas batas-batas penalaran multimodal, membantu Anda belajar dengan cara yang paling sesuai untuk Anda.

Misalnya, jika Anda ingin belajar cara memasak hidangan tradisional keluarga, Gemini 3 dapat menginterpretasikan dan menerjemahkan resep tulisan tangan dalam berbagai bahasa, menghasilkan resep yang dapat dibagikan dengan keluarga.

Atau, jika Anda ingin mempelajari topik baru, Anda dapat menyediakan makalah akademis, kuliah video panjang, atau tutorial, yang dapat menghasilkan kartu memori interaktif, visualisasi, atau kode dalam format lain, untuk membantu Anda menguasai pengetahuan terkait.

Ini bahkan dapat menganalisis video pertandingan pickleball Anda, menemukan area yang bisa diperbaiki, dan merancang rencana latihan untuk membantu Anda meningkatkan keterampilan bermain secara menyeluruh.

Untuk membantu Anda lebih memahami informasi di internet, mode AI dalam pencarian sekarang menggunakan Gemini 3 untuk mewujudkan pengalaman UI generatif baru, seperti tata letak visual yang imersif, alat interaktif, dan simulasi, semua ini dihasilkan secara instan berdasarkan kueri Anda.

Mengembangkan apa pun

Berdasarkan keberhasilan 2.5 Pro, Gemini 3 memenuhi janji untuk mewujudkan ide-ide pengembang. Ini menunjukkan kinerja yang luar biasa dalam generasi tanpa contoh, mampu menangani perintah dan petunjuk yang kompleks, sehingga menghasilkan antarmuka pengguna Web yang lebih kaya dan interaktif.

Gemini 3 adalah model pengkodean Vibe dan pengkodean Agen terbaik yang telah dibangun oleh Google hingga saat ini, membuat produk Google lebih mandiri dan secara signifikan meningkatkan efisiensi pengembang. Ini menduduki peringkat teratas di papan peringkat WebDev Arena dengan skor Elo yang mencolok sebesar 1487. Selain itu, ia juga mencapai 54,2% dalam pengujian Terminal-Bench 2.0, yang dirancang untuk mengevaluasi kemampuan model dalam menggunakan alat untuk mengoperasikan komputer melalui terminal. Sementara itu, ia juga jauh melampaui versi 2.5 Pro (dengan skor 76,2%) dalam pengujian SWE-bench Verified, yang digunakan untuk mengukur kinerja agen pengkodean.

Sekarang, pengguna dapat menggunakan Google AI Studio, Vertex AI, Gemini CLI, dan platform pengembangan agen cerdas baru Google Antigravity dengan Gemini 3 untuk membangun. Ini juga berlaku untuk platform pihak ketiga seperti Cursor, GitHub, JetBrains, Manus, Replit, dan lainnya.

Misalnya, membuat game pesawat luar angkasa 3D retro yang memiliki efek visual yang lebih kaya dan interaktivitas yang lebih kuat.

Misalnya, menulis UI Web dan aplikasi yang lebih kaya dan interaktif:

Merencanakan segala sesuatu

Sejak Gemini 2, Gemini secara signifikan meningkatkan kemampuan perencanaan dalam tugas jangka panjang.

Kemampuan perencanaan Gemini 3 semakin terbukti dalam pengujian Vending-Bench 2: Gemini 3 memuncaki daftar tersebut dalam uji simulasi pengelolaan mesin penjual otomatis, dengan seluruh proses dikelola melalui perencanaan jangka panjang untuk operasi bisnis virtual.

Dalam simulasi operasional tahunan yang lengkap, Gemini 3 Pro selalu menjaga konsistensi dalam pemanggilan alat dan keputusan, sambil terus fokus pada tujuan tugas untuk mencapai pengembalian investasi yang lebih tinggi.

Gemini 3 Pro menunjukkan kemampuan perencanaan jangka panjang yang lebih unggul, mampu menciptakan pengembalian yang lebih tinggi dibandingkan model-model terdepan lainnya.

Gemini Agent juga dapat membantu mengatur kotak masuk Gmail.

Gemini 3 sekarang sudah sepenuhnya terbuka. Mulai hari ini, pengguna biasa dan pengguna berlangganan dapat menggunakan model baru melalui Aplikasi Gemini dan mode pencarian AI; pengembang dan pelanggan perusahaan juga dapat mengakses melalui AI Studio, Vertex AI, dan saluran lainnya. Mengenai “mode pemikiran mendalam” yang sangat dinantikan, diperkirakan akan diluncurkan secara eksklusif untuk pengguna berlangganan Google AI Ultra dalam beberapa minggu ke depan.

Selain itu, menurut kartu model yang bocor sebelumnya, ada banyak informasi kunci yang patut diperhatikan: Google menggunakan TPU untuk melatih model ini dari awal, sebagai MoE, memiliki 1M input dan 64k token output, MoE berarti mereka dapat mampu membuatnya menjadi lebih murah.

Dalam hal penetapan harga, Gemini 3.0 Pro memperkenalkan mekanisme penetapan harga bertingkat berdasarkan panjang konteks: untuk tugas di bawah 200k token, harga input/output adalah $2.00/$12.00 (per juta token); untuk lebih dari 200k token, masing-masing adalah $4.00 dan $18.00.

Pengalaman pengembangan “Prioritas Kecerdasan Buatan” yang sepenuhnya baru

Google Antigravity adalah platform pengembangan agen cerdas baru dari Google yang memungkinkan pengembang untuk beroperasi pada tingkat yang lebih tinggi dan berbasis tugas. Dengan memanfaatkan kemampuan penalaran, penggunaan alat, dan pemrograman agen yang canggih dari Gemini 3, Google Antigravity mengubah AI dari sekadar alat dalam kotak alat pengembang menjadi mitra kolaboratif yang aktif.

Meskipun inti dari Google Antigravity adalah pengalaman AI IDE (integrated development environment) yang sudah dikenal, agennya telah ditingkatkan ke antarmuka khusus dan diberikan akses langsung ke editor, terminal, dan browser. Sekarang, agen dapat merencanakan secara mandiri dan sekaligus melaksanakan tugas perangkat lunak end-to-end yang kompleks atas namamu, sambil memverifikasi kode mereka sendiri.

Selain Gemini 3 Pro, Google Antigravity juga terintegrasi erat dengan model Penggunaan Komputer Gemini 2.5 terbaru dari Google untuk kontrol browser, serta model pengeditan gambar teratasnya Nano Banana (Gemini 2.5 Image).

pengalaman langsung

Karena versi pratinjau Gemini 3 Pro telah diluncurkan di platform AI Studio, kami juga mencoba untuk merasakannya.

Prompt : SVG dari NEW YORK SKYLINE Gunakan pustaka apapun untuk menyelesaikan ini tetapi pastikan saya dapat menempel semuanya ke dalam satu file HTML dan membukanya di Chrome. buatlah menarik dan sangat detail, tunjukkan detail yang tidak ada yang mengharapkan, jadilah kreatif dan penuh keindahan dalam satu blok kode.

Prompt: Buatlah permainan Space Invaders yang memukau secara visual.

Seekor pelikan yang mengendarai sepeda dalam SVG animasi.

Dibandingkan dengan versi sebelumnya, Gemini 3 telah mengalami kemajuan yang signifikan, namun masih terdapat bug, seperti pedal sepeda yang berputar di udara.

Kami telah mengganti dengan kata kunci yang lebih jelas: Buat kode SVG animasi tunggal, lengkap, dan mandiri (tanpa file atau gambar eksternal) dari seekor pelikan lucu yang mengendarai sepeda dari sudut samping. Kali ini, sepeda yang dihasilkan Gemini 3 tampaknya tidak memiliki pedal.

Ditulis di akhir

Dalam jajak pendapat “Perusahaan mana yang memiliki LLM terbaik pada akhir 2026?” yang diprakarsai oleh blogger X Chubby, Google Gemini unggul jauh.

Kenaikan kepercayaan pasar ini juga tercermin dalam data, CEO Alphabet Sundar Pichai meninjau kemajuan Gemini selama dua tahun terakhir di blog resminya: pengguna aktif bulanan AI Overviews telah mencapai 2 miliar, aplikasi Gemini mencapai lebih dari 650 juta pengguna bulanan, dan lebih dari 70% pelanggan cloud serta 13 juta pengembang sedang menggunakan model generatifnya.

Melihat kembali dua tahun terakhir, dari peluncuran Bard (pendahulu Gemini) yang terburu-buru dan penurunan harga saham yang drastis, hingga penggabungan kembali Google DeepMind, memanggil kembali pendiri, dan meraih Hadiah Nobel, Google telah menyelesaikan “perputaran gajah” yang seperti dalam buku teks.

Raksasa yang pernah mendefinisikan Transformer, kini “All in Gemini”, sudah siap untuk melakukan serangan balik secara menyeluruh.

Apakah itu dapat mengakhiri persaingan “LLM terbaik”? Jangan terburu-buru, biarkan peluru (dan server) terbang sedikit lebih lama.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.