10.000 USD = 4 Agent sepanjang tahun tanpa henti MiniMax M2.5 model biaya rekonstruksi Apakah titik kritis penerapan skala AI telah tercapai?

Question

Perang AI Musim Liburan Imlek, MiniMax (HK00100, harga saham 680.0 HKD, kapitalisasi pasar 213,272 milyar HKD) tidak absen.

Pada 12 Februari, MiniMax resmi meluncurkan model pemrograman flagship terbaru MiniMax M2.5. Diketahui, sebagai model produksi tingkat tinggi yang dirancang secara asli untuk skenario Agent (agen cerdas), performa pemrograman dan agen (Coding&Agentic)-nya sejajar dengan model top internasional, langsung bersaing dengan Claude Opus 4.6, mendukung pengembangan pemrograman full-stack untuk PC, aplikasi, dan aplikasi lintas platform.

Mungkin dipengaruhi berita ini, hingga penutupan pasar saham Hong Kong pada 13 Februari, harga saham MiniMax naik 15,65%, dengan kapitalisasi pasar total 213,272 milyar HKD.

Hal yang juga patut diperhatikan adalah bahwa versi M2.5-lightning mendukung kecepatan output lebih dari 100 TPS (transaksi per detik), sekitar dua kali lipat dari model arus utama; harga input sekitar 0,3 USD per juta Token, harga output sekitar 2,4 USD per juta Token.

Jika dihitung dengan output 100 Token per detik, biaya operasional selama satu jam sekitar 1 USD; jika 50 Token, biaya sekitar 0,3 USD. Ini berarti, secara teori, 10.000 USD dapat mendukung 4 agen bekerja terus menerus selama satu tahun.

Menjelang Tahun Baru Imlek, arah taruhan berbagai perusahaan AI sudah mulai berbeda. Beberapa pemain fokus pada multimodalitas, ada yang berebut akses ke konsumen (C-end), sementara MiniMax menaruh semua chip-nya pada “terobosan performa dan biaya di skenario Agent”. Apakah ini awal dari perang harga, atau jalan baru mempercepat komersialisasi AI?

Di balik peluncuran model teks: Apakah MiniMax ingin merevolusi ekonomi Agent?

Mengenai performa model MiniMax M2.5, Presiden Think Fast Slow Think Institute Tian Feng mengatakan kepada wartawan Daily Economic News bahwa dari posisi M2.5, model ini adalah “model produksi Agent asli”, dengan nilai inti menyediakan pemahaman tugas teks yang andal dan kemampuan inferensi jangka panjang untuk masalah kompleks di skenario Agent.

“Dalam kemampuan inti Agent seperti pemrograman, pemanggilan alat, dan pemecahan tugas kompleks, M2.5 sudah mencapai tingkat SOTA (State of the Art, paling maju) global, kemampuan ini adalah fondasi untuk membangun Agent yang efisien,” kata Tian Feng.

Segala tanda menunjukkan bahwa MiniMax sudah memiliki rencana yang jelas untuk skenario Agent.

Dalam 108 hari terakhir, MiniMax dari iterasi M2, M2.1 hingga M2.5, meningkat dari skor 69,4 menjadi 80,2 dalam pengujian SWE-Bench Verified (benchmark pengujian rekayasa perangkat lunak). Diketahui, tim mengaitkan lonjakan ini dengan peningkatan besar dalam pembelajaran penguatan Agent secara skala besar (RL Scaling).

Framework Forge yang dikembangkan sendiri oleh mereka melalui pemisahan antara mesin pelatihan dan Agent, memungkinkan generalisasi optimalisasi terhadap berbagai kerangka kerja dan alat Agent, serta mempercepat pelatihan sekitar 40 kali lipat melalui penjadwalan asinkron dan strategi penggabungan pohon.

Selain itu, di tingkat algoritma, mereka menggunakan optimisasi CISPO dan mekanisme penghargaan proses untuk mengurangi masalah distribusi kredit dalam skenario konteks panjang, serta memasukkan “waktu nyata tugas” ke dalam fungsi penghargaan, mencapai keseimbangan antara efektivitas dan kecepatan respons.

Pada 12 Februari, M2.5 sudah diintegrasikan ke dalam MiniMax Agent, dan pada 13 Februari, mendukung open source global untuk deployment lokal. Kurang dari satu hari, pengguna dari seluruh dunia telah membangun lebih dari 10.000 ahli di atas MiniMax Agent, dan jumlahnya terus bertambah pesat.

MiniMax menyatakan harapannya agar, selain terus meningkatkan kemampuan model, dapat membangun ekosistem Agent yang berkelanjutan—Agent Universe.

Perlu dicatat bahwa saat ini, fokus taruhan perusahaan AI lebih banyak pada model besar multimodal, lalu apa maksud peluncuran model teks besar ini oleh MiniMax?

Tian Feng menyatakan bahwa MiniMax mengkonsentrasikan hampir semua sumber daya pada peningkatan berkelanjutan kemampuan model dasar, “Peluncuran M2.5 adalah kelanjutan dari strategi ini—pertama tingkatkan kemampuan model dasar, lalu ekspansi ke skenario aplikasi spesifik.”

Namun, dia juga menambahkan bahwa MiniMax adalah salah satu perusahaan pertama di dalam negeri yang mengadopsi teknologi model multimodal secara penuh, dan peluncuran model teks murni bukan berarti meninggalkan multimodalitas, melainkan melakukan optimisasi khusus untuk skenario Agent berdasarkan kemampuan multimodal yang sudah ada.

CEO iMedia Zhang Yi mengatakan kepada wartawan bahwa MiniMax secara agresif mendorong model besar biaya rendah, dengan jalur diferensiasi yang jelas: menghindari kompetisi di jalur merah multimodal, dan langsung menargetkan masalah utama biaya tinggi dan efisiensi rendah dalam penerapan Agent.

Selain kemajuan performa, perhatian besar terhadap M2.5 adalah pengendalian biaya. MiniMax berpendapat bahwa ketika performa dan biaya tidak lagi menjadi kendala, model ekonomi deployment skala besar Agent akan mengalami perubahan fundamental.

Menurut Wang Peng, peneliti muda di Akademi Ilmu Sosial Beijing, MiniMax dan perusahaan lain yang menekan biaya penggunaan Agent ke tingkat sangat rendah menandai bahwa komersialisasi AI telah memasuki tahap “penggantian skala” dari “verifikasi teknologi”.

Wang Peng berpendapat bahwa sebelumnya, biaya inferensi yang tinggi membatasi skenario penggunaan Agent (hanya untuk tugas bernilai tinggi), namun kini biaya rendah memungkinkan perusahaan melakukan deployment massal AI untuk pekerjaan rutin harian (seperti layanan pelanggan, entri data), bahkan menciptakan model bisnis baru (seperti layanan AI berbasis hasil).

Akankah industri beralih ke perang harga? Ahli: Lebih mungkin memicu “perang nilai”

Perlu dicatat bahwa menjelang Tahun Baru Imlek, banyak perusahaan AI telah melakukan penataan terkait Agent.

Dalam produk, berbagai pemain berlomba merebut peluang. Pada 11 Februari, Meituan LongCat merilis Agent “penelitian mendalam” asli. Uji coba pengguna menunjukkan tingkat “kegunaan keseluruhan” mencapai 61,1%, lebih baik dari ChatGPT yang 42,8%. Saat ini fitur ini sudah tersedia gratis di situs LongCat.

Pada 20 Januari, MiniMax merilis versi Agent 2.0, yang ditujukan sebagai “meja kerja AI asli”, tidak hanya tersedia di desktop, mendukung Mac dan Windows, tetapi juga meluncurkan “Agent Ahli” untuk skenario vertikal profesional. Pada 19 Januari, JieYue XingChen resmi mengumumkan produk Agent desktop “JieYue AI Desktop Partner”, dan merilis versi Windows yang dapat digunakan gratis.

Dalam hal model, pada malam 3 Februari, Alibaba merilis model pemrograman agen generasi baru Qwen3-Coder-Next, yang hanya mengaktifkan 3B, performa pemrograman agen-nya sudah mampu bersaing dengan DeepSeek-V3.2, GLM-4.7 dan model open source top lainnya.

Diketahui, berkat terobosan teknologi baru, Qwen3-Coder-Next yang “ringan dan cepat” memiliki biaya inferensi yang jauh lebih rendah, hanya 5-10% dari biaya model dengan performa setara, sangat cocok untuk deployment agen di komputer rumah dan server ringan, serta merupakan model pemrograman open source kecil dengan kemampuan pemrograman agen terkuat saat ini.

Alibaba menyatakan bahwa, menghadapi masalah nyata seperti inferensi konteks panjang, penggunaan alat, dan pemulihan dari kegagalan eksekusi yang sering dihadapi agen, model baru ini mampu mengatasinya dengan tenang.

Dapat dilihat bahwa, terkait model besar yang berfokus pada Agent, pengurangan biaya adalah arah utama industri saat ini. Apakah ini berarti, dengan masuknya M2.5, industri akan beralih ke perang harga?

“Ini belum tentu soal menghamburkan uang demi pasar,” kata Zhang Yi. “Harga rendah ini lebih banyak dicapai melalui optimisasi teknologi, bukan subsidi dan pemborosan uang seperti jalur lama. Mengenai kemungkinan perang harga, kita harus menunggu perkembangan pasar selanjutnya. Tapi yang pasti, ini akan mempercepat eliminasi produk yang tidak efisien, dan industri pun beralih ke kompetisi dua dimensi: performa dan biaya.”

Tian Feng berpendapat bahwa biaya rendah M2.5 adalah hasil dari optimalisasi arsitektur teknologi dan peningkatan kemampuan engineering, yang akan mendorong Agent dari “bukti konsep” menuju “komersialisasi skala besar”, dan lebih berpotensi memicu “perang nilai” daripada perang harga tradisional.

“Kami prediksi bahwa penurunan biaya inferensi model besar sebesar 10 kali setiap tahun adalah tren yang sangat mungkin berlanjut. Kemunculan M2.5 akan mempercepat tren ini, mendorong seluruh industri menuju arah yang lebih efisien dan berbiaya rendah,” kata Tian Feng.

Dia juga menyebutkan bahwa sebelumnya, harga produk Agent umumnya tinggi dan ditujukan untuk pelanggan korporat, namun keunggulan biaya dari M2.5 diharapkan dapat memperluas pasar Agent ke usaha kecil dan menengah, pengembang, bahkan pengguna individu. “Ini bisa memperbesar skala pasar Agent secara keseluruhan, bukan sekadar kompetisi harga.”

Menurut Wang Peng, ledakan Agent dan penurunan biaya menandai bahwa AI dari “titik puncak teknologi” beralih ke “titik puncak produk”, “Seperti ponsel pintar menggantikan ponsel fitur, kompetisi AI di masa depan tidak lagi soal parameter besar atau kecil, tetapi seberapa mampu AI benar-benar menyatu dalam alur kerja dan menciptakan nilai nyata.”

Perang AI Musim Liburan Imlek yang sengit, apakah titik kritis penerapan skala besar AI sudah tiba?

Mengenai alasan kolektif industri dalam menaruh taruhan besar pada Agent, Wang Peng berpendapat bahwa inti dari semua ini adalah transformasi paradigma teknologi dari “respons pasif” menjadi “eksekusi aktif”.

“Model besar tradisional seperti ‘basis pengetahuan’, sementara Agent lebih mirip ‘karyawan digital’, mampu memecah tugas, memanggil alat, menangani pengecualian, bahkan melakukan pengoptimalan sendiri. Perubahan ini berasal dari peningkatan kebutuhan perusahaan: pengguna tidak lagi puas hanya mendapatkan informasi, tetapi menginginkan AI menyelesaikan seluruh siklus kerja secara langsung (misalnya otomatisasi pemrosesan pesanan, pembuatan laporan keuangan).” katanya.

Seiring peluncuran model dan produk baru secara kolektif, apakah saat ini perusahaan sudah mulai membedakan diri di jalur Agent?

Tian Feng berpendapat bahwa, memang, jalur model besar Agent sedang memperlihatkan perbedaan, tetapi perbedaan ini lebih banyak terlihat dari kemampuan engineering, kemampuan implementasi skenario, dan efisiensi biaya, bukan sekadar parameter atau kemampuan dasar.

Perlu dicatat bahwa di balik semua ini, semua perusahaan menaruh harapan besar pada realisasi komersialisasi AI.

Tian Feng menegaskan bahwa M2.5 secara tegas ditetapkan sebagai “model produksi Agent asli”, dengan semua peningkatan kemampuan inti berfokus pada pemrograman, pemanggilan alat, dan produktivitas kerja bernilai tinggi. Pilihan jalur ini mencerminkan pemahaman mendalam MiniMax terhadap realisasi komersial.

Selain itu, selama Tahun Baru Imlek ini, AI telah menjadi jalur utama yang didorong oleh berbagai perusahaan teknologi besar. Meskipun jalur pengembangan berbeda-beda, industri menunjukkan tren yang semakin menyatu dan jelas.

Tian Feng menyebut bahwa industri sedang beralih dari “bertaruh parameter” ke “bertaruh pendapatan” dan “bertaruh keuntungan”, di mana keunggulan teknologi saja tidak cukup untuk memenangkan pasar; yang penting adalah seberapa cepat teknologi tersebut dapat diubah menjadi pendapatan bisnis yang terukur.

Dia juga menambahkan bahwa, baik model “traffic + skenario” ByteDance, “platform e-commerce + ekosistem” Alibaba, maupun “spesialisasi + implementasi” MiniMax, semuanya secara esensial membangun benteng ekosistem yang berbeda.

Zhang Yi juga menyatakan bahwa dari perang AI selama Tahun Baru Imlek, terlihat bahwa industri telah beralih dari “kompetisi homogen” menuju “diferensiasi”. “Arah pengembangan perusahaan semakin beragam, termasuk multimodalitas, efisiensi Agent, dan ekosistem yang dapat diimplementasikan. Perbedaan ini muncul dari perbedaan kemampuan teknologi, tahap komersialisasi, dan kebutuhan skenario masing-masing perusahaan.”

Menurutnya, ini juga menandai bahwa industri secara keseluruhan beralih dari “perlombaan parameter” ke tahap kompetisi baru yang lebih berfokus pada skenario, implementasi, dan segmentasi pasar.

Dari “pamer kemampuan” menuju “komersialisasi”, dari “coba-coba” menuju “penyebaran umum”, selama Tahun Baru Imlek ini, jalur AI penuh warna dan penuh semangat. Ketika biaya AI semakin terjangkau dan pengguna semakin sering berinteraksi dengan produk AI, kompetisi yang intens selama liburan ini mungkin akan dikenang sebagai titik balik sejarah AI dari “kembang api festival” menuju “lampu harian”.

10.000 USD = 4 Agent sepanjang tahun tanpa henti MiniMax M2.5 model biaya rekonstruksi Apakah titik kritis penerapan skala AI telah tercapai?

Topik Trending

IsraelStrikesIranBTCPlunges

TrumpordersfederalbanonAnthropicAI

DeepCreationCamp

95%ofAltsBelow200-daySMA

GateSquare$50KRedPacketGiveaway

Hot Gate Fun

DEA

DEA

马年行好运

马年行好运

我帅的要命

我帅的要命

马年嬲塞

马年嬲塞

DDR

内存条

Sematkan