Ландшафт штучного інтелекту зміщується від моделей, які просто «чатяться», до моделей, які «працюють». Зробивши важливий крок для open-source спільноти, китайський ІІ-стартап Z.ai (також відомий як Zhupai AI) випустив GLM-5.1 – масивну модель на архітектурі Mixture-of-Experts (MoE) з 754 мільярдами параметрів, призначену для тривалих автономних завдань.
На відміну від попередніх поколінь ІІ, які часто «збиваються з курсу» або втрачають фокус після кількох десятків кроків, GLM-5.1 спроектована для незалежної роботи над однією складною метою протягом ** восьми годин. Це знаменує перехід від «вайб-кодингу» (vibe coding) — коли користувачі пишуть промпти і сподіваються на кращий результат — до агентного інжинірингу**, де ІІ виступає в ролі довгострокового співробітника, що самокоректується.
Подолання плато продуктивності: патерн «сходи»
Однією з головних перешкод у розвитку ІІ є «ефект плато». Традиційно, коли ІІ-агенту надають більше інструментів або більше часу для вирішення завдання, його продуктивність згодом завмирає або він починає робити помилки через «стратегічний дрейф».
Дослідження Z.ai показує, що GLM-5.1 долає це за допомогою «сходового патерну» оптимізації. Замість лінійного прогресу модель проходить через періоди поступового налаштування, за якими йдуть раптові структурні прориви.
Реальні докази цієї здатності включають:
– Оптимізація баз даних: У задачі оптимізації високопродуктивної векторної бази даних GLM-5.1 виконала понад 6 000 викликів інструментів. Коли попередні моделі упиралися в стелю приблизно в 3 500 запитів в секунду (QPS), GLM-5.1 автономно перепроектувала архітектуру системи, в результаті досягнувши 21 500 QPS – шестиразовий приріст.
– Ядра машинного навчання: У тестах KernelBench модель продемонструвала здатність оптимізувати складні ядра GPU. Хоча вона трохи поступається Claude Opus 4.6 від Anthropic у чистій швидкості прискорення, GLM-5.1 довела, що може підтримувати продуктивну роботу набагато довше за своїх попередників, зберігаючи прогрес навіть після 1 000 циклів використання інструментів.
«До кінця минулого року агенти могли виконувати близько 20 кроків; GLM-5.1 прямо зараз здатна зробити 1700», – зазначив керівник Z.ai Lou в мережі X.
Бенчмарки та успіх: обхід гігантів
Випуск GLM-5.1 ставить Z.ai у пряму конкуренцію із провідними світовими ІІ-лабораторіями. У SWE-Bench Pro — строгому бенчмарку для вирішення реальних завдань на GitHub — GLM-5.1 набрала 58,4 бала, обійшовши:
– GPT-5.4 (57,7)
– Claude Opus 4.6 (57,3)
– Gemini 3.1 Pro (54,2)
Модель також показала видатні результати у спеціалізованих областях, таких як математика (95,3 в AIME 2026) та наукові міркування (86,2 у GPQA-Diamond). Можливо, найбільш вражаючим став тест створення графічного середовища в стилі Linux з нуля: модель не просто зупинилася на базовому інтерфейсі, а автономно створила файловий менеджер, термінал і навіть функціональні ігри протягом восьми годин.
Гібридна бізнес-стратегія: Open Source проти пропрієтарних рішень
Z.ai використовує складну двоколійну стратегію, щоб збалансувати зростання спільноти та комерційну життєздатність:
- Open Source флагман (GLM-5.1): Випущена під гнучкою ліцензією MIT, ваги моделі доступні на Hugging Face. Це сприяє довірі розробників та встановлює глобальний стандарт.
- Пропрієтарний спринтер (GLM-5 Turbo): Швидша закрита версія, оптимізована для високошвидкісних завдань під контролем користувача. Вона служить високомаржинальним джерелом доходу підприємствам, яким необхідний швидкий висновок (inference).
Ціноутворення та тарифи
Z.ai позиціонує GLM-5.1 як інструмент для інженерів, а не як споживчий чат-бот, пропонуючи рівні передплати:
– Lite: $27 на квартал (для легких навантажень).
– Pro: $81 на квартал (для складних навантажень із прискореним виконанням).
– Max: $216 на квартал (для розвинених розробників з великими обсягами роботи).
Для користувачів API вартість складає $1,40 за мільйон вхідних токенів та $4,40 за мільйон вихідних токенів, що робить її конкурентоспроможною порівняно з іншими топовими моделями, такими як GPT-5.4 та Claude Opus 4.6.
Висновок
Випуск GLM-5.1 знаменує собою нову еру, де цінність моделі ІІ вимірюється не тільки її інтелектом, але і її витривалістю. Доводячи, що моделі з відкритим вихідним кодом можуть долати тривалі, багатогодинні інженерні робочі процеси, Z.ai кидає виклик домінуванню західних пропрієтарних моделей і перевизначає межі автономної цифрової праці.






































