Ландшафт искусственного интеллекта смещается от моделей, которые просто «чатятся», к моделям, которые «работают». Сделав важный шаг для open-source сообщества, китайский ИИ-стартап Z.ai (также известный как Zhupai AI) выпустил GLM-5.1 — массивную модель на архитектуре Mixture-of-Experts (MoE) с 754 миллиардами параметров, предназначенную для длительных автономных задач.
В отличие от предыдущих поколений ИИ, которые часто «сбиваются с курса» или теряют фокус после нескольких десятков шагов, GLM-5.1 спроектирована для независимой работы над одной сложной целью в течение восьми часов. Это знаменует переход от «вайб-кодинга» (vibe coding) — когда пользователи пишут промпты и надеются на лучший результат — к агентному инжинирингу, где ИИ выступает в роли самокорректирующегося долгосрочного сотрудника.
Преодоление плато производительности: паттерн «лестницы»
Одним из главных препятствий в развитии ИИ является «эффект плато». Традиционно, когда ИИ-агенту предоставляют больше инструментов или больше времени для решения задачи, его производительность со временем замирает или он начинает совершать ошибки из-за «стратегического дрейфа».
Исследование Z.ai показывает, что GLM-5.1 преодолевает это с помощью «лестничного паттерна» оптимизации. Вместо линейного прогресса модель проходит через периоды постепенной настройки, за которыми следуют внезапные структурные прорывы.
Реальные доказательства этой способности включают:
— Оптимизация баз данных: В задаче по оптимизации высокопроизводительной векторной базы данных GLM-5.1 выполнила более 6 000 вызовов инструментов. В то время как предыдущие модели упирались в потолок примерно в 3 500 запросов в секунду (QPS), GLM-5.1 автономно перепроектировала архитектуру системы, в итоге достигнув 21 500 QPS — шестикратный прирост.
— Ядра машинного обучения: В тестах KernelBench модель продемонстрировала способность оптимизировать сложные ядра GPU. Хотя она немного уступает Claude Opus 4.6 от Anthropic в чистой скорости ускорения, GLM-5.1 доказала, что может поддерживать продуктивную работу гораздо дольше своих предшественников, сохраняя прогресс даже после 1 000 циклов использования инструментов.
«К концу прошлого года агенты могли выполнять около 20 шагов; GLM-5.1 прямо сейчас способна сделать 1 700», — отметил руководитель Z.ai Lou в сети X.
Бенчмарки и успех: обход гигантов
Выпуск GLM-5.1 ставит Z.ai в прямую конкуренцию с ведущими мировыми ИИ-лабораториями. В SWE-Bench Pro — строгом бенчмарке для решения реальных задач на GitHub — GLM-5.1 набрала 58,4 балла, обойдя:
— GPT-5.4 (57,7)
— Claude Opus 4.6 (57,3)
— Gemini 3.1 Pro (54,2)
Модель также показала выдающиеся результаты в специализированных областях, таких как математика (95,3 в AIME 2026) и научные рассуждения (86,2 в GPQA-Diamond). Возможно, самым впечатляющим стал тест на создание графической среды в стиле Linux с нуля: модель не просто остановилась на базовом интерфейсе, а автономно создала файловый менеджер, терминал и даже функциональные игры в течение восьми часов.
Гибридная бизнес-стратегия: Open Source против проприетарных решений
Z.ai использует сложную двухпутную стратегию, чтобы сбалансировать рост сообщества и коммерческую жизнеспособность:
- Open Source флагман (GLM-5.1): Выпущенная под гибкой лицензией MIT, веса модели доступны на Hugging Face. Это способствует доверию разработчиков и устанавливает глобальный стандарт.
- Проприетарный спринтер (GLM-5 Turbo): Более быстрая закрытая версия, оптимизированная для высокоскоростных задач под контролем пользователя. Она служит высокомаржинальным источником дохода для предприятий, которым необходим быстрый вывод (inference).
Ценообразование и тарифы
Z.ai позиционирует GLM-5.1 как инструмент для инженеров, а не как потребительский чат-бот, предлагая уровни подписки:
— Lite: $27 в квартал (для легких нагрузок).
— Pro: $81 в квартал (для сложных нагрузок с ускоренным исполнением).
— Max: $216 в квартал (для продвинутых разработчиков с большими объемами работы).
Для пользователей API стоимость составляет $1,40 за миллион входных токенов и $4,40 за миллион выходных токенов, что делает её конкурентоспособной по сравнению с другими топовыми моделями, такими как GPT-5.4 и Claude Opus 4.6.
Заключение
Выпуск GLM-5.1 знаменует собой новую эру, где ценность модели ИИ измеряется не только её интеллектом, но и её выносливостью. Доказывая, что модели с открытым исходным кодом могут справляться с длительными, многочасовыми инженерными рабочими процессами, Z.ai бросает вызов доминированию западных проприетарных моделей и переопределяет границы автономного цифрового труда.




























