Від “вайб-кодингу” до автономного інжинірингу: Z.ai представляє GLM-5.1

14

Ландшафт штучного інтелекту зміщується від моделей, які просто «чатяться», до моделей, які «працюють». Зробивши важливий крок для open-source спільноти, китайський ІІ-стартап Z.ai (також відомий як Zhupai AI) випустив GLM-5.1 – масивну модель на архітектурі Mixture-of-Experts (MoE) з 754 мільярдами параметрів, призначену для тривалих автономних завдань.

На відміну від попередніх поколінь ІІ, які часто «збиваються з курсу» або втрачають фокус після кількох десятків кроків, GLM-5.1 спроектована для незалежної роботи над однією складною метою протягом ** восьми годин. Це знаменує перехід від «вайб-кодингу» (vibe coding) — коли користувачі пишуть промпти і сподіваються на кращий результат — до агентного інжинірингу**, де ІІ виступає в ролі довгострокового співробітника, що самокоректується.

Подолання плато продуктивності: патерн «сходи»

Однією з головних перешкод у розвитку ІІ є «ефект плато». Традиційно, коли ІІ-агенту надають більше інструментів або більше часу для вирішення завдання, його продуктивність згодом завмирає або він починає робити помилки через «стратегічний дрейф».

Дослідження Z.ai показує, що GLM-5.1 долає це за допомогою «сходового патерну» оптимізації. Замість лінійного прогресу модель проходить через періоди поступового налаштування, за якими йдуть раптові структурні прориви.

Реальні докази цієї здатності включають:
Оптимізація баз даних: У задачі оптимізації високопродуктивної векторної бази даних GLM-5.1 виконала понад 6 000 викликів інструментів. Коли попередні моделі упиралися в стелю приблизно в 3 500 запитів в секунду (QPS), GLM-5.1 автономно перепроектувала архітектуру системи, в результаті досягнувши 21 500 QPS – шестиразовий приріст.
Ядра машинного навчання: У тестах KernelBench модель продемонструвала здатність оптимізувати складні ядра GPU. Хоча вона трохи поступається Claude Opus 4.6 від Anthropic у чистій швидкості прискорення, GLM-5.1 довела, що може підтримувати продуктивну роботу набагато довше за своїх попередників, зберігаючи прогрес навіть після 1 000 циклів використання інструментів.

«До кінця минулого року агенти могли виконувати близько 20 кроків; GLM-5.1 прямо зараз здатна зробити 1700», – зазначив керівник Z.ai Lou в мережі X.

Бенчмарки та успіх: обхід гігантів

Випуск GLM-5.1 ставить Z.ai у пряму конкуренцію із провідними світовими ІІ-лабораторіями. У SWE-Bench Pro — строгому бенчмарку для вирішення реальних завдань на GitHub — GLM-5.1 набрала 58,4 бала, обійшовши:
GPT-5.4 (57,7)
Claude Opus 4.6 (57,3)
Gemini 3.1 Pro (54,2)

Модель також показала видатні результати у спеціалізованих областях, таких як математика (95,3 в AIME 2026) та наукові міркування (86,2 у GPQA-Diamond). Можливо, найбільш вражаючим став тест створення графічного середовища в стилі Linux з нуля: модель не просто зупинилася на базовому інтерфейсі, а автономно створила файловий менеджер, термінал і навіть функціональні ігри протягом восьми годин.

Гібридна бізнес-стратегія: Open Source проти пропрієтарних рішень

Z.ai використовує складну двоколійну стратегію, щоб збалансувати зростання спільноти та комерційну життєздатність:

  1. Open Source флагман (GLM-5.1): Випущена під гнучкою ліцензією MIT, ваги моделі доступні на Hugging Face. Це сприяє довірі розробників та встановлює глобальний стандарт.
  2. Пропрієтарний спринтер (GLM-5 Turbo): Швидша закрита версія, оптимізована для високошвидкісних завдань під контролем користувача. Вона служить високомаржинальним джерелом доходу підприємствам, яким необхідний швидкий висновок (inference).

Ціноутворення та тарифи

Z.ai позиціонує GLM-5.1 як інструмент для інженерів, а не як споживчий чат-бот, пропонуючи рівні передплати:
Lite: $27 на квартал (для легких навантажень).
Pro: $81 на квартал (для складних навантажень із прискореним виконанням).
Max: $216 на квартал (для розвинених розробників з великими обсягами роботи).

Для користувачів API вартість складає $1,40 за мільйон вхідних токенів та $4,40 за мільйон вихідних токенів, що робить її конкурентоспроможною порівняно з іншими топовими моделями, такими як GPT-5.4 та Claude Opus 4.6.

Висновок

Випуск GLM-5.1 знаменує собою нову еру, де цінність моделі ІІ вимірюється не тільки її інтелектом, але і її витривалістю. Доводячи, що моделі з відкритим вихідним кодом можуть долати тривалі, багатогодинні інженерні робочі процеси, Z.ai кидає виклик домінуванню західних пропрієтарних моделей і перевизначає межі автономної цифрової праці.