Google agresivně rozšiřuje svou infrastrukturu umělé inteligence, odhaluje nové výkonné čipy a uzavírá multimiliardovou dohodu se společností Anthropic, přičemž zpochybňuje dominanci Nvidie na trhu s akcelerátory AI. Oznámení se soustředí kolem nové sedmé generace čipu Tensor Processing Unit (TPU) a rozšířených možností pro procesory Axion na bázi Arm, které odrážejí průmyslový posun směrem k efektivnímu nasazování již vyškolených modelů umělé inteligence pro miliardy uživatelů, spíše než jen jejich školení.
Nový čip Google: Ironwood
Srdcem tohoto rozšíření je čip Ironwood, nejnovější vyhrazený akcelerátor AI od Googlu. Poskytuje více než čtyřikrát vyšší výkon než jeho předchůdce pro trénink i vyvozování. Jeden Ironwood „pod“ čipů může propojit až 9 216 čipů prostřednictvím patentovaného Inter-Chip Interconnect společnosti Google, čímž vznikne superpočítač schopný sdílet 1,77 petabajtů High Bandwidth Memory – což je zhruba ekvivalent 40 000 filmů na Blu-ray. Mezi klíčové funkce patří přepínání optických okruhů (OCS), které automaticky přesměrovává datový provoz kolem poruch s minimálním narušením, a systémově orientovaný přístup ke společnému návrhu, který společně optimalizuje hardware a software.
Miliardový závazek společnosti Anthropic
Nejvýznamnějším potvrzením schopností Ironwood byl závazek společnosti Anthropic, která se specializuje na zabezpečení AI a vývojář rodiny modelů Claude. Zavazují se získat přístup k jednomu milionu čipů TPU v odhadovaném obchodu v hodnotě desítek miliard dolarů – jedné z největších známých obchodů s cloudovou infrastrukturou v historii. Tato investice umožní Anthropicu škálovat své výpočetní schopnosti a zachovat rychlost a spolehlivost, kterou jejich zákazníci očekávají.
Procesory Axion: Doplnění specializované umělé inteligence
S Ironwoodem představil Google rozšířené možnosti pro svou řadu procesorů Axion, vlastní CPU na bázi Arm určené pro obecné úkoly a podporující aplikace AI. Typ instance N4A je navržen pro mikroslužby a další úlohy kritické pro aplikace AI a poskytuje výkon až 2x lepší než srovnatelné x86 virtuální stroje. Nová kovová instance C4A poskytuje vyhrazené fyzické servery pro specializované pracovní zátěže.
Hyperpočítač AI: software a integrace
Google zdůrazňuje, že samotný hardware nestačí; jsou zapotřebí optimalizovaná softwarová řešení. Nabízejí „hyperpočítač AI“, integrovaný systém, který kombinuje výpočetní techniku, sítě, úložiště a software. Systém údajně poskytoval klientům 353% návratnost investice za tři roky. Mezi klíčová softwarová vylepšení patří vylepšená údržba clusterů TPU, podpora open source frameworku MaxText pro pokročilé školicí techniky a Inference Gateway, která inteligentně vyvažuje požadavky na snížení latence a nákladů na údržbu.
Řešení problému infrastruktury: napájení a chlazení
Google uznává obrovské výzvy fyzické infrastruktury spojené s tímto rozšířením. Zavádějí napájení +/-400 V DC schopné podporovat až 1 megawatt na rack a přispívají k páté generaci návrhu chladicího distribučního uzlu projektu Open Compute Project. To zahrnuje použití kapalinového chlazení, které dokáže přenést 4 000krát více tepla než vzduch, což je pro čipy AI stále náročnější na spotřebu energie.
Zpochybnění dominance Nvidie
Oznámení společnosti Google představuje odvážnou výzvu pro dominanci Nvidie (odhadem 80-95% podíl na trhu) na trhu akcelerátorů AI. Zatímco vývoj vlastních čipů vyžaduje značné investice a čelí výzvám softwarového ekosystému, Google říká, že těsná integrace od výzkumu modelu po návrh čipu umožňuje jedinečné optimalizace.
Klíčové věci
Nejnovější kroky společnosti Google zdůrazňují důležitý posun v oblasti umělé inteligence, kdy se poskytovatelé cloudu stále více zaměřují na efektivní nasazení trénovaných modelů umělé inteligence ve velkém měřítku. Nové čipy společnosti, masivní obchod s Anthropic a zaměření na integrovaný hardware a software jsou připraveny změnit konkurenční dynamiku trhu s infrastrukturou AI a poskytnout životaschopnou alternativu k GPU Nvidia. Schopnost průmyslu udržet tuto úroveň investic a tempo architektonických inovací bude v nadcházejících měsících kritická.







































