Cursor Mengungkap Metode Pelatihan Autoinstal, Meningkatkan Kinerja Composer 2 Sebesar 14 Poin Persentase

Berdasarkan pengungkapan terbaru Cursor, perusahaan ini meluncurkan teknik pelatihan bernama autoinstall untuk rangkaian model Composer: menggunakan model generasi sebelumnya untuk secara otomatis menyiapkan lingkungan eksekusi bagi reinforcement learning generasi berikutnya. Saat melatih Composer 2, Cursor menggunakan Composer 1,5 untuk menyelesaikan tugas ini. Metode ini bekerja dalam dua langkah: pertama, sebuah agen membaca dokumentasi repositori kode dan konfigurasi untuk menghasilkan 10 perintah verifikasi beserta output yang diharapkan; kedua, agen lain menggunakan 3 dari perintah tersebut untuk menyiapkan lingkungan dari nol hingga perintah berhasil dijalankan, dengan maksimal 5 percobaan ulang. Composer 2 meraih skor 61,7% di Terminal-Bench, tolok ukur yang mengukur kemampuan penyiapan lingkungan, dibandingkan dengan Composer 1,5 yang 47,9%, menandai peningkatan 14 poin persentase.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

NVIDIA meluncurkan Nemotron 3 Nano Omni, multimodal sumber terbuka

NVIDIA mengumumkan model multimoda open-source Nemotron 3 Nano Omni, yang mengintegrasikan visual, suara, dan bahasa dalam satu model sebagai lapisan persepsi untuk AI agent. Intinya adalah 30B-A3B MoE, context 256K, dan throughput 9x; mendukung input teks, gambar, audio, video, dan lainnya, dengan output berupa teks. Dipadukan dengan Nemotron 3 Super/Ultra, ditujukan untuk skenario seperti operasi komputer, kecerdasan dokumen, serta pemahaman audio-visual. Bobot dan data pelatihan dipublikasikan, dengan opsi penyebaran mencakup lokal, NIM, dan platform pihak ketiga.

ChainNewsAbmedia20menit yang lalu

OpenAI DevDay 2026 akan diadakan pada 29/9 di San Francisco

OpenAI mengumumkan DevDay 2026 akan diselenggarakan pada 29/9 di San Francisco secara langsung, dengan lomba posting yang dibuat menggunakan GPT-5.5 dan Image Gen. Codex akan menyaring otomatis 2–3 karya setiap minggu, dan pemenang akan mendapatkan tiket gratis serta tiket pesawat dan hotel lintas kota. Konferensi berfokus pada ekosistem GPT-5.5 dan penilaian kolaborasi manusia-mesin. Untuk berpartisipasi, peserta harus berusia minimal 18 tahun dan bukan merupakan anggota keluarga langsung karyawan OpenAI. Poin pengamatan meliputi model baru, integrasi agen, dan strategi multi-cloud.

ChainNewsAbmedia25menit yang lalu

Nvidia berinvestasi pada startup legaltech AI asal Swedia, Legora, dengan Jude Law sebagai duta merek global

NVIDIA melakukan perluasan investasi putaran Series D senilai 50 juta dolar AS untuk Legora, sehingga total penggalangan dana Legora mencapai 600 juta dolar AS dan valuasinya 5,6 miliar dolar AS. Atlassian, Adams Street Partners, dan Insight Partners turut berpartisipasi. Legora fokus pada legal tech berbasis AI, menyediakan alat untuk pemeriksaan otomatis, analisis kontrak, dan riset hukum. ARR lebih dari 100 juta dolar AS, sementara jumlah karyawan naik dari 40 menjadi 400. Jude Law menjadi duta merek global, dengan slogan iklan Law just got more attractive.

ChainNewsAbmedia31menit yang lalu

Prediksi AI 2027 Sudah 65% Rampung, Percepatan Pengembangan Perangkat Lunak Tertahan di 17%, Kata Co-Founder Google Docs

Menurut Steve Newman, pendiri dan ketua Google Docs Golden Gate Institute, AI telah menyelesaikan sekitar 65% prediksi terukur yang diuraikan dalam prakiraan skenario 2027 yang dirilis tahun lalu. Namun, metrik yang paling kritis—akselerasi AI terhadap perangkat lunaknya sendiri

GateNews1jam yang lalu

Claude/GPT terlalu suka menyenangkan? Sebuah prompt Claude.md membuat AI memberikan jawaban yang tegas dan akurat

Artikel ini memperkenalkan sebuah prompt yang bisa dimasukkan ke Claude.md / Agents.md, untuk mengubah AI dari asisten yang halus menjadi konsultan yang blak-blakan, melalui empat lapisan penyesuaian: penetapan identitas, verifikasi fakta, pelepasan nada bicara, serta pengecualian untuk politis-korekt. Prompt ini meminta output yang lengkap, verifikasi bertahap, dan tidak pernah berhalusinasi; bila perlu, bahkan mendorong provokasi. Artikel ini juga menjelaskan waktu pemuatan, risiko, serta skenario penggunaan yang sesuai (penelitian, penulisan, penilaian teknis, dan diskusi akademis), serta menyatakan bahwa prompt ini tidak cocok untuk layanan pelanggan, edukasi, maupun konsultasi medis. Sumber naskah aslinya berasal dari ABMedia.

ChainNewsAbmedia1jam yang lalu

OpenAI luncurkan ChatGPT Futures: 26 mahasiswa angkatan pertama menerima beasiswa 10.000 dolar AS, mencakup lebih dari 20 universitas

OpenAI mengumumkan angkatan pertama ChatGPT Futures Class of 2026, yang beranggotakan 26 siswa yang masih menempuh pendidikan dari lebih dari 20 universitas top, dengan pendanaan hibah masing-masing 10.000 dolar AS dan akses ke model-model mutakhir. Para siswa ini mulai kuliah pada musim gugur 2022, tumbuh bersama ChatGPT; bidang riset mereka mencakup pemetaan objek ruang angkasa, pendeteksian penyintas bencana, pelestarian bahasa yang terancam punah, layanan kesehatan, dan lain-lain. Program ini bertujuan menggunakan AI untuk menjawab kebutuhan manusia yang nyata, serta menghubungkan fondasi infrastruktur bagi para kreator generasi baru.

ChainNewsAbmedia1jam yang lalu
Komentar
0/400
Tidak ada komentar