Google активно расширяет свою инфраструктуру искусственного интеллекта, представляя мощные новые чипы и заключая многомиллиардную сделку с Anthropic, одновременно бросая вызов доминированию Nvidia на рынке AI-ускорителей. Объявления сосредоточены вокруг нового чипа седьмого поколения Tensor Processing Unit (TPU) и расширенных опций для процессоров Arm-based Axion, отражая сдвиг в отрасли в сторону эффективного развертывания уже обученных моделей ИИ для миллиардов пользователей, а не только их обучения.
Новый чип Google: Ironwood
В основе этого расширения лежит чип Ironwood, новейший специализированный AI-ускоритель от Google. Он обеспечивает более чем в четыре раза большую производительность по сравнению с предшественником как для обучения, так и для инференса. Один «под» чипов Ironwood может объединять до 9216 чипов через запатентованную Google Inter-Chip Interconnect, создавая суперкомпьютер, способный обмениваться 1,77 петабайта высокоскоростной памяти (High Bandwidth Memory) — примерно эквивалентно 40 000 фильмов на Blu-ray. Ключевыми особенностями являются Optical Circuit Switching (OCS), который автоматически перенаправляет трафик данных вокруг сбоев с минимальными перебоями, и системно-ориентированный подход к совместному проектированию, оптимизирующий аппаратное и программное обеспечение вместе.
Обязательства Anthropic на миллиард долларов
Наиболее значимым подтверждением возможностей Ironwood стали обязательства компании Anthropic, специализирующейся на безопасности ИИ и разработчика семейства моделей Claude. Они обязуются получить доступ к одному миллиону чипов TPU, что по оценкам составляет сделку стоимостью десятки миллиардов долларов — одну из крупнейших известных сделок в области облачной инфраструктуры в истории. Это инвестирование позволит Anthropic масштабировать свои вычислительные мощности и поддерживать скорость и надежность, которые ожидают их клиенты.
Процессоры Axion: дополнение к специализированному ИИ
Вместе с Ironwood Google представил расширенные опции для своей линейки процессоров Axion, пользовательских CPU на базе Arm, предназначенных для общих задач и поддержки приложений ИИ. Тип инстанса N4A предназначен для микросервисов и других задач, критически важных для приложений ИИ, обеспечивая производительность на 2X лучше, чем сопоставимые виртуальные машины x86. Новый металлический инстанс C4A предоставляет выделенные физические серверы для специализированных задач.
AI-гиперкомпьютер: программное обеспечение и интеграция
Google подчеркивает, что одного лишь аппаратного обеспечения недостаточно; необходимы оптимизированные программные решения. Они предлагают «AI-гиперкомпьютер», интегрированную систему, объединяющую вычислительные ресурсы, сети, хранилище и программное обеспечение. По сообщениям, эта система обеспечила возврат инвестиций в размере 353% за три года для клиентов. Ключевые улучшения программного обеспечения включают расширенное обслуживание кластеров TPU, поддержку открытого исходного кода MaxText framework для продвинутых техник обучения и Inference Gateway, который интеллектуально балансирует запросы для уменьшения задержки и стоимости обслуживания.
Решение проблемы инфраструктуры: мощность и охлаждение
Google признает масштабные физические проблемы инфраструктуры, связанные с этим расширением. Они внедряют подачу питания постоянным током +/-400 вольт, способную поддерживать до 1 мегаватта на стойку, и вносят свой вклад в проект Open Compute Project пятого поколения дизайна распределительных узлов охлаждения. Это включает использование жидкостного охлаждения, которое может транспортировать в 4000 раз больше тепла, чем воздух, что имеет решающее значение для все более энергоемких AI-чипов.
Бросая вызов доминированию Nvidia
Объявления Google представляют собой смелый вызов доминированию Nvidia (оцениваемому в 80-95% доли рынка) на рынке AI-ускорителей. Хотя разработка специализированных чипов требует значительных инвестиций и сталкивается с проблемами экосистемы программного обеспечения, Google утверждает, что тесная интеграция от исследований моделей до проектирования чипов позволяет осуществлять уникальные оптимизации.
Ключевые выводы
Последние шаги Google подчеркивают важный сдвиг в ландшафте ИИ, при котором поставщики облачных сервисов все чаще сосредоточены на эффективном развертывании обученных моделей ИИ в больших масштабах. Новые чипы компании, масштабная сделка с Anthropic и фокус на интегрированном аппаратном и программном обеспечении призваны изменить конкурентную динамику рынка инфраструктуры ИИ и предоставить жизнеспособную альтернативу GPU Nvidia. Способность отрасли поддерживать этот уровень инвестиций и темпы архитектурных инноваций будет иметь решающее значение в ближайшие месяцы.
