


Google Cloud dnes oficiálne spustil Ironwood, svoj siedmy generáciu Tensor Processing Unit (TPU), špeciálne navrhnutý ako najpokročilejší akcelerátor umelej inteligencie (AI) pre veľké inferenčné úlohy. Tento masívny systém s 9 216 čipovými podmi (chiplets) a pokročilým kvapalinovým chladením sľubuje až dvojnásobnú efektivitu oproti predchodcovi Trillium, čím sa stavia do pozície, aby predbehol dominanciu Nvidie v AI hardvéri. Dostupnosť sa rozširuje v nasledujúcich týždňoch pre vybraných zákazníkov Google Cloud, vrátane partnerstva s Anthropic na tréningu modelov Claude. S výkonom 42,5 ExaFLOPs a spotrebou takmer 10 MW je Ironwood súčasťou AI Hypercomputer architektúry, ktorá optimalizuje hardvér a softvér pre náročné AI úlohy.
Ironwood: Špeciálne pre „myšliace modely“ a inferenciu
Ironwood je prvý TPU od Google, ktorý je primárne zameraný na inferenciu – fázu, kde AI modely ako veľké jazykové modely (LLM) alebo mixture of experts (MoE) „myslia“ a generujú odpovede v reálnom čase. Na rozdiel od predchádzajúcich generácií, ktoré sa sústredili na tréning, Ironwood minimalizuje pohyb dát a latenciu, čím zvláda komplexné úlohy ako pokročilé uvažovanie alebo kolaboratívne AI agenty. Každý čip dosahuje 4 614 TFLOPs v FP8 presnosti, s 192 GB HBM3e pamäťou pri priepustnosti 7,4 TB/s – 16-násobný nárast oproti TPU v4.
Systém využíva dvojitú die architektúru s dvoma compute chiplets v strede balenia, obklopenými I/O chiplets pre inter-chip interconnect (ICI). Tieto umožňujú synchrónnu komunikáciu až 9 216 čipov v SuperPod konfigurácii, ktorá zahŕňa 144 rackov, optické switche a chladiaci systém schopný odvádzať vyše 100 kW tepla na rack. Celková zdieľaná pamäť dosahuje rekordných 1,77 PB, čo je svetový rekord pre multi-čipové setupy. Google zdôrazňuje, že Ironwood bol navrhnutý s pomocou AI na optimalizáciu ALU obvodov a floorplanu, vrátane štvrtej generácie SparseCore pre akceleráciu embeddingov a kolektívnych operácií v odporúčacích systémoch.
Kvapalinové chladenie: Kľúč k efektivite a spoľahlivosti
Jedným z najväčších inovácií je pokročilé kvapalinové chladenie tretej generácie, ktoré umožňuje udržať až dvojnásobný výkon oproti vzduchovému chladeniu pri kontinuálnych AI workloadoch. Systém s cold plate riešením a distribučným rackom (CBU) zabezpečuje 99,999 % uptime na gigawattovej škále, čo je kritické pre hyperskálové datacentrá. Podľa Google, Ironwood dosahuje 2x vyšší perf/watt oproti Trillium, čo je kľúčové v ére, kde elektrická kapacita je hlavným obmedzením AI rozvoja. „Naša pokročilá kvapalinová infraštruktúra a optimalizovaný dizajn čipu umožňujú spoľahlivý výkon aj pri intenzívnych úlohách,“ uviedol Amin Vahdat, viceprezident Google Cloud pre systémy a infraštruktúru.
Tento prístup rieši aj spoľahlivosť: Ironwood zahŕňa integrovaný root of trust, secure boot a AI-asistované checkpointing pre rekonfiguráciu mŕtvych uzlov bez straty dát. 3D torus layout a optické circuit switche (OCS) umožňujú škálovanie na desiatky SuperPodov, s pružnou konfiguráciou do rôznych veľkostí.
Partnerstvá a dostupnosť: Rozšírenie v týždňoch
Google uzavrel viacročnú dohodu s Anthropic v hodnote stoviek miliárd dolárov, ktorá poskytne až 100 miliónov TPU na tréning a prevádzku modelov Claude. Ironwood sa integruje s Pathways softvérovým stackom, ktorý umožňuje vývojárom využívať desiatky tisíc čipov bez zložitostí. Dostupnosť sa rozširuje v nasledujúcich týždňoch pre Google Cloud zákazníkov, s plnou hyperskálovou nasadenosťou v datacentrách. „Ironwood je jadrom nášho AI Hypercomputera – spája modelový výskum, softvér a hardvér pod jednou strechou,“ dodal Vahdat.
Konkurencia s Nvidio: Google na ústupe?
Tento launch prichádza v čase, keď Nvidia dominuje AI hardvérom s Blackwell GPU, no Google sa snaží dobehnúť vďaka custom dizajnu a nižším nákladom. Ironwood sľubuje vyššiu efektivitu pre inferenciu, kde Nvidia čelí výzvam s energiou. Analytici z Hot Chips 2025 oceňujú, že Ironwood „posúva hranice AI akcelerátorov na podlahu“, s potenciálom na 24-násobný výkon oproti superpočítačom ako El Capitan.
Krátkodobý a dlhodobý výhľad
Býčí scenár: Ak Ironwood splní sľuby, Google by mohol získať 20 % podiel v AI inference trhu do 2026, s partnerstvami ako Anthropic tlačiacimi adopciu a cenami pod Nvidiu o 30 %.
Medvedí scenár: Oneskorené nasadenie alebo problémy s kvapalinovým chladením by mohli udržať Nvidiu v vedení, s rizikom oneskorenia v ére, kde energia je limitujúca.
Ironwood nie je len hardvérom – je to krok k ére, kde AI „myslí“ na škále. S 9 216 čipmi a kvapalinovým chladením Google signalizuje, že je pripravený na súboj o AI budúcnosť. Sledujte nasledujúce týždne: prvé nasadenia ukážu, či Ironwood naozaj predbehne konkurenciu.
Príspevok Google uvádza na trh Ironwood TPU je zobrazený ako prvý na Kryptoblog24.








