Lanskap kecerdasan buatan sedang bergeser dari model yang sekadar “mengobrol” menjadi model yang “berfungsi”. Sebagai langkah besar bagi komunitas sumber terbuka, startup AI Tiongkok Z.ai (juga dikenal sebagai Zhupai AI) telah merilis GLM-5.1, model Mixture-of-Experts (MoE) dengan parameter besar dengan 754 miliar parameter yang dirancang untuk tugas otonom berdurasi panjang.
Berbeda dengan AI generasi sebelumnya yang sering “melayang” atau kehilangan fokus setelah beberapa langkah, GLM-5.1 dirancang untuk beroperasi secara independen hingga delapan jam pada satu tujuan kompleks. Hal ini menandai transisi dari “pengkodean getaran”—di mana pengguna menggunakan AI dan berharap yang terbaik—ke rekayasa agen, di mana AI bertindak sebagai pekerja jangka panjang yang dapat mengoreksi diri sendiri.
Mendobrak Tingkat Kinerja: Pola “Tangga”.
Salah satu hambatan utama dalam pengembangan AI adalah “efek dataran tinggi”. Secara tradisional, ketika agen AI diberi lebih banyak alat atau lebih banyak waktu untuk memecahkan suatu masalah, kinerjanya pada akhirnya terhenti atau mulai membuat kesalahan melalui “penyimpangan strategi”.
Penelitian Z.ai menunjukkan bahwa GLM-5.1 mengatasi hal ini melalui pengoptimalan “pola tangga”. Model ini tidak mengalami perkembangan linier, namun mengalami periode penyesuaian bertahap yang diikuti dengan terobosan struktural secara tiba-tiba.
Bukti nyata dari kemampuan ini meliputi:
– Pengoptimalan Basis Data: Dalam tugas yang melibatkan pengoptimalan basis data vektor performa tinggi, GLM-5.1 melakukan lebih dari 6.000 panggilan alat. Meskipun model sebelumnya mencapai batas maksimum sekitar 3.500 kueri per detik (QPS), GLM-5.1 secara mandiri mendesain ulang arsitektur sistem, dan pada akhirnya mencapai 21.500 QPS —peningkatan enam kali lipat.
– Kernel Pembelajaran Mesin: Dalam pengujian KernelBench, model menunjukkan kemampuannya untuk mengoptimalkan kernel GPU yang kompleks. Meskipun tertinggal sedikit di belakang Claude Opus 4.6 dari Anthropic dalam hal kecepatan awal, GLM-5.1 membuktikan bahwa ia dapat mempertahankan pekerjaan produktif jauh lebih lama dibandingkan pendahulunya, dan mempertahankan kemajuan melampaui 1.000 putaran penggunaan alat.
“Agen dapat melakukan sekitar 20 langkah pada akhir tahun lalu; GLM-5.1 dapat melakukan 1.700 langkah saat ini,” ujar pemimpin Z.ai, Lou on X.
Membandingkan Kesuksesan: Mengungguli Raksasa
Peluncuran GLM-5.1 menempatkan Z.ai bersaing langsung dengan laboratorium AI terkemuka di dunia. Pada SWE-Bench Pro —sebuah tolok ukur ketat untuk menyelesaikan masalah GitHub di dunia nyata—GLM-5.1 mencapai skor 58,4, melampaui:
– GPT-5.4 (57.7)
– Claude Opus 4.6 (57.3)
– Gemini 3.1 Pro (54.2)
Model ini juga menunjukkan kekuatan luar biasa dalam domain khusus, seperti matematika (95,3 pada AIME 2026) dan penalaran sains (86,2 pada GPQA-Diamond). Mungkin yang paling mengesankan, dalam pengujian untuk membangun lingkungan desktop bergaya Linux dari awal, model ini tidak hanya berhenti pada antarmuka dasar; ia secara mandiri membangun peramban file, terminal, dan bahkan permainan fungsional selama periode delapan jam.
Strategi Bisnis Hibrida: Sumber Terbuka vs. Kepemilikan
Z.ai menerapkan strategi jalur ganda yang canggih untuk menyeimbangkan pertumbuhan komunitas dengan kelangsungan komersial:
- Unggulan Open Source (GLM-5.1): Dirilis di bawah Lisensi MIT yang permisif, bobot model tersedia di Hugging Face. Hal ini membangun kepercayaan pengembang dan menetapkan standar global.
- Sprinter Berpemilik (GLM-5 Turbo): Versi sumber tertutup yang lebih cepat dan dioptimalkan untuk tugas berkecepatan tinggi yang diawasi. Hal ini berfungsi sebagai pendorong pendapatan margin tinggi bagi perusahaan yang memerlukan inferensi cepat.
Harga dan Tingkatan
Z.ai telah memposisikan GLM-5.1 sebagai alat teknik dan bukan chatbot konsumen, dengan menawarkan paket berlangganan berjenjang:
– Lite: $27/kuartal (untuk beban kerja ringan).
– Pro: $81/kuartal (untuk beban kerja kompleks dengan eksekusi lebih cepat).
– Maks: $216/kuartal (untuk pengembang tingkat lanjut dan bervolume tinggi).
Untuk pengguna API, model ini diberi harga $1,40 per juta token masukan dan $4,40 per juta token keluaran, sehingga membuatnya bersaing dengan model kelas atas lainnya seperti GPT-5.4 dan Claude Opus 4.6.
Kesimpulan
Peluncuran GLM-5.1 menandakan era baru di mana nilai model AI diukur tidak hanya dari kecerdasannya, namun juga dari daya tahan nya. Dengan membuktikan bahwa model sumber terbuka dapat menangani alur kerja teknik yang berkelanjutan dan memakan waktu berjam-jam, Z.ai menantang dominasi model milik Barat dan mendefinisikan ulang batasan tenaga kerja digital yang otonom.




























