додому Різне Spinta sull’infrastruttura AI di Google: nuovi chip, affari enormi e una sfida...

Spinta sull’infrastruttura AI di Google: nuovi chip, affari enormi e una sfida a Nvidia

Google sta espandendo in modo aggressivo la sua infrastruttura di intelligenza artificiale, svelando nuovi potenti chip e assicurandosi un accordo multimiliardario con Anthropic, il tutto sfidando il dominio di Nvidia nel mercato degli acceleratori di intelligenza artificiale. Gli annunci sono incentrati sulla nuova Tensor Processing Unit (TPU) di settima generazione e su opzioni ampliate per i processori Axion basati su Arm, riflettendo uno spostamento nel settore verso la fornitura di modelli di intelligenza artificiale già addestrati a miliardi di utenti, piuttosto che limitarsi a formarli.

Il chip più recente di Google: Ironwood

Al centro di questa espansione c’è il chip Ironwood, l’ultimo acceleratore AI personalizzato di Google. Vanta prestazioni quattro volte superiori rispetto al suo predecessore sia per i carichi di lavoro di addestramento che per quelli di inferenza. Un singolo “pod” di chip Ironwood può connettere fino a 9.216 chip tramite l’Inter-Chip Interconnect proprietario di Google, creando un supercomputer in grado di condividere 1,77 petabyte di memoria ad alta larghezza di banda, equivalenti all’incirca a 40.000 film Blu-ray. Le caratteristiche principali includono la commutazione di circuiti ottici (OCS), che reindirizza automaticamente il traffico dati in caso di guasti con interruzioni minime, e un approccio di co-progettazione a livello di sistema che ottimizza insieme hardware e software.

L’impegno miliardario di Anthropic

La conferma più significativa delle capacità di Ironwood proviene da Anthropic, la società di sicurezza AI dietro la famiglia di modelli Claude. Si sono impegnati ad accedere fino a un milione di chip TPU, un accordo stimato in decine di miliardi di dollari, uno dei più grandi impegni infrastrutturali cloud conosciuti nella storia. Questo investimento consentirà ad Anthropic di ampliare la propria capacità di elaborazione e mantenere la velocità e l’affidabilità che i clienti si aspettano.

Processori Axion: complemento dell’IA specializzata

Oltre a Ironwood, Google ha introdotto opzioni ampliate per la sua famiglia di processori Axion, CPU personalizzate basate su Arm progettate per carichi di lavoro generici che supportano applicazioni AI. Il tipo di istanza N4A si rivolge ai microservizi e ad altri carichi di lavoro critici per le applicazioni AI, offrendo un rapporto prezzo-prestazioni fino a 2 volte migliore rispetto alle macchine virtuali x86 comparabili. Una nuova istanza metal C4A fornisce server fisici dedicati per carichi di lavoro specializzati.

L’ipercomputer AI: software e integrazione

Google sottolinea che le sole prestazioni hardware sono insufficienti; richiede un software ottimizzato. Stanno offrendo l’“AI Hypercomputer”, un sistema integrato che unisce elaborazione, rete, archiviazione e software. Secondo quanto riferito, questo sistema ha fornito ai clienti un ritorno sull’investimento triennale del 353%. I principali miglioramenti del software includono la manutenzione avanzata per i cluster TPU, il supporto del framework MaxText open source per tecniche di formazione avanzate e un gateway di inferenza che bilancia in modo intelligente il carico delle richieste per ridurre la latenza e i costi di servizio.

Affrontare la sfida infrastrutturale: energia e raffreddamento

Google riconosce le enormi sfide poste dall’infrastruttura fisica da questa espansione. Stanno implementando l’erogazione di potenza in corrente continua da +/-400 volt in grado di supportare fino a un megawatt per rack e stanno contribuendo al progetto Open Compute Project con la progettazione dell’unità di distribuzione del raffreddamento di quinta generazione. Ciò include lo sfruttamento del raffreddamento a liquido, che può trasportare 4.000 volte più calore dell’aria, fondamentale per i chip AI sempre più ad alta intensità energetica.

Sfidare il dominio di Nvidia

Gli annunci di Google rappresentano una sfida coraggiosa allo schiacciante dominio di Nvidia (quota di mercato stimata dell’80-95%) nel mercato degli acceleratori AI. Sebbene lo sviluppo del silicio personalizzato richieda investimenti significativi e debba affrontare sfide legate all’ecosistema software, Google sostiene che la stretta integrazione dalla ricerca del modello alla progettazione del chip consente ottimizzazioni uniche.

Punti chiave

Le ultime mosse di Google evidenziano un cambiamento cruciale nel panorama dell’intelligenza artificiale, con i fornitori di servizi cloud sempre più concentrati sull’implementazione efficiente di modelli di intelligenza artificiale addestrati su larga scala. I nuovi chip dell’azienda, il massiccio accordo con Anthropic e il focus su hardware e software integrati mirano a rimodellare le dinamiche competitive del mercato delle infrastrutture AI e fornire una valida alternativa alle GPU di Nvidia. La capacità del settore di sostenere questo livello di investimenti e il ritmo dell’innovazione architettonica saranno fondamentali da monitorare nei prossimi mesi.

Exit mobile version