Швидкий розвиток інфраструктури штучного інтелекту Google: нові чіпи, великі контракти та виклик від Nvidia

26

Google агресивно розширює свою інфраструктуру штучного інтелекту, відкриваючи нові потужні чіпи та укладаючи багатомільярдну угоду з Anthropic, кидаючи виклик домінуванню Nvidia на ринку прискорювачів ШІ. Оголошення зосереджені навколо нового чіпа Tensor Processing Unit (TPU) сьомого покоління та розширених опцій для процесорів Axion на базі Arm, що відображає перехід галузі в бік ефективного розгортання вже навчених моделей ШІ для мільярдів користувачів, а не просто їх навчання.

Нова фішка Google: Ironwood

В основі цього розширення лежить чіп Ironwood, останній спеціальний прискорювач ШІ від Google. Він забезпечує більш ніж у чотири рази більшу продуктивність, ніж його попередник, як для навчання, так і для висновків. Один «стручок» чіпів Ironwood може з’єднати до 9216 чіпів через запатентовану Google Inter-Chip Interconnect, створюючи суперкомп’ютер, здатний спільно використовувати 1,77 петабайт пам’яті високої пропускної здатності, що приблизно еквівалентно 40 000 фільмів Blu-ray. Основні функції включають оптичну комутацію ланцюгів (OCS), яка автоматично перенаправляє трафік даних навколо несправностей з мінімальними збоями, і системно-орієнтований підхід спільного проектування, який разом оптимізує апаратне та програмне забезпечення.

Зобов’язання Anthropic на мільярд доларів

Найвагомішим підтвердженням можливостей Ironwood стала прихильність Anthropic, компанії, що спеціалізується на безпеці ШІ та розробника сімейства моделей Claude. Вони зобов’язуються отримати доступ до мільйона чіпів TPU в рамках угоди на десятки мільярдів доларів — однієї з найбільших відомих угод хмарної інфраструктури в історії. Ці інвестиції дозволять Anthropic масштабувати свої обчислювальні можливості та підтримувати швидкість і надійність, яких очікують їхні клієнти.

Процесори Axion: доповнення до спеціалізованого ШІ

З Ironwood компанія Google представила розширені параметри для лінійки процесорів Axion, призначених для користувача процесорів на базі Arm, призначених для виконання загальних завдань і підтримки додатків ШІ. Тип екземпляра N4A розроблений для мікросервісів та інших завдань, критичних для додатків штучного інтелекту, забезпечуючи вдвічі кращу продуктивність, ніж аналогічні віртуальні машини x86. Новий металевий екземпляр C4A надає виділені фізичні сервери для спеціалізованих робочих навантажень.

Гіперкомп’ютер AI: програмне забезпечення та інтеграція

Google наголошує, що одного апаратного забезпечення недостатньо; потрібні оптимізовані програмні рішення. Вони пропонують «гіперкомп’ютер зі штучним інтелектом», інтегровану систему, яка поєднує обчислення, мережу, сховище та програмне забезпечення. Повідомляється, що система забезпечила 353% повернення інвестицій протягом трьох років для клієнтів. Ключові вдосконалення програмного забезпечення включають розширене обслуговування кластерів TPU, підтримку фреймворку MaxText з відкритим кодом для передових методів навчання та шлюз Inference Gateway, який розумно балансує запити, щоб зменшити затримку та витрати на обслуговування.

Вирішення інфраструктурної проблеми: живлення та охолодження

Google визнає величезні проблеми фізичної інфраструктури, пов’язані з цим розширенням. Вони впроваджують джерело живлення +/-400 вольт постійного струму, здатне підтримувати до 1 мегават на стійку, і вносять свій внесок у проект п’ятого покоління вузла розподілу охолодження Open Compute Project. Це включає в себе використання рідинного охолодження, яке може транспортувати в 4000 разів більше тепла, ніж повітря, що є критичним для все більш енергоємних мікросхем ШІ.

Виклик домінуванню Nvidia

Оголошення Google кидає сміливий виклик домінуванню Nvidia (за оцінками, частка ринку становить 80-95%) на ринку прискорювачів ШІ. Хоча розробка чіпів на замовлення потребує значних інвестицій і стикається з проблемами екосистеми програмного забезпечення, Google каже, що тісна інтеграція від дослідження моделі до дизайну чіпа дозволяє унікальну оптимізацію.

Ключові висновки

Останні кроки Google підкреслюють важливу зміну в ландшафті штучного інтелекту, коли хмарні постачальники все більше зосереджуються на ефективному розгортанні навчених моделей штучного інтелекту в масштабах. Нові чіпи компанії, масштабна угода з Anthropic і зосередженість на інтегрованому обладнанні та програмному забезпеченні готові змінити конкурентну динаміку ринку інфраструктури ШІ та забезпечити життєздатну альтернативу графічним процесорам Nvidia. Здатність галузі підтримувати цей рівень інвестицій і темпи архітектурних інновацій буде мати вирішальне значення в найближчі місяці.