Skip to content
Capital.com – Ticker Tape Widget

Zobraziť viac...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Menu

Google uvádza na trh Ironwood TPU

Google Cloud dnes oficiálne spustil Ironwood, svoj siedmy generáciu Tensor Processing Unit (TPU), špeciálne navrhnutý ako najpokročilejší akcelerátor umelej inteligencie (AI) pre veľké inferenčné úlohy. Tento masívny systém s 9 216 čipovými podmi (chiplets) a pokročilým kvapalinovým chladením sľubuje až dvojnásobnú efektivitu oproti predchodcovi Trillium, čím sa stavia do pozície, aby predbehol dominanciu Nvidie v […]
Menej ako 1 min. min.

Google Cloud dnes oficiálne spustil Ironwood, svoj siedmy generáciu Tensor Processing Unit (TPU), špeciálne navrhnutý ako najpokročilejší akcelerátor umelej inteligencie (AI) pre veľké inferenčné úlohy. Tento masívny systém s 9 216 čipovými podmi (chiplets) a pokročilým kvapalinovým chladením sľubuje až dvojnásobnú efektivitu oproti predchodcovi Trillium, čím sa stavia do pozície, aby predbehol dominanciu Nvidie v AI hardvéri. Dostupnosť sa rozširuje v nasledujúcich týždňoch pre vybraných zákazníkov Google Cloud, vrátane partnerstva s Anthropic na tréningu modelov Claude. S výkonom 42,5 ExaFLOPs a spotrebou takmer 10 MW je Ironwood súčasťou AI Hypercomputer architektúry, ktorá optimalizuje hardvér a softvér pre náročné AI úlohy.

Ironwood: Špeciálne pre „myšliace modely“ a inferenciu

Ironwood je prvý TPU od Google, ktorý je primárne zameraný na inferenciu – fázu, kde AI modely ako veľké jazykové modely (LLM) alebo mixture of experts (MoE) „myslia“ a generujú odpovede v reálnom čase. Na rozdiel od predchádzajúcich generácií, ktoré sa sústredili na tréning, Ironwood minimalizuje pohyb dát a latenciu, čím zvláda komplexné úlohy ako pokročilé uvažovanie alebo kolaboratívne AI agenty. Každý čip dosahuje 4 614 TFLOPs v FP8 presnosti, s 192 GB HBM3e pamäťou pri priepustnosti 7,4 TB/s – 16-násobný nárast oproti TPU v4.

Systém využíva dvojitú die architektúru s dvoma compute chiplets v strede balenia, obklopenými I/O chiplets pre inter-chip interconnect (ICI). Tieto umožňujú synchrónnu komunikáciu až 9 216 čipov v SuperPod konfigurácii, ktorá zahŕňa 144 rackov, optické switche a chladiaci systém schopný odvádzať vyše 100 kW tepla na rack. Celková zdieľaná pamäť dosahuje rekordných 1,77 PB, čo je svetový rekord pre multi-čipové setupy. Google zdôrazňuje, že Ironwood bol navrhnutý s pomocou AI na optimalizáciu ALU obvodov a floorplanu, vrátane štvrtej generácie SparseCore pre akceleráciu embeddingov a kolektívnych operácií v odporúčacích systémoch.

Kvapalinové chladenie: Kľúč k efektivite a spoľahlivosti

Jedným z najväčších inovácií je pokročilé kvapalinové chladenie tretej generácie, ktoré umožňuje udržať až dvojnásobný výkon oproti vzduchovému chladeniu pri kontinuálnych AI workloadoch. Systém s cold plate riešením a distribučným rackom (CBU) zabezpečuje 99,999 % uptime na gigawattovej škále, čo je kritické pre hyperskálové datacentrá. Podľa Google, Ironwood dosahuje 2x vyšší perf/watt oproti Trillium, čo je kľúčové v ére, kde elektrická kapacita je hlavným obmedzením AI rozvoja. „Naša pokročilá kvapalinová infraštruktúra a optimalizovaný dizajn čipu umožňujú spoľahlivý výkon aj pri intenzívnych úlohách,“ uviedol Amin Vahdat, viceprezident Google Cloud pre systémy a infraštruktúru.

Tento prístup rieši aj spoľahlivosť: Ironwood zahŕňa integrovaný root of trust, secure boot a AI-asistované checkpointing pre rekonfiguráciu mŕtvych uzlov bez straty dát. 3D torus layout a optické circuit switche (OCS) umožňujú škálovanie na desiatky SuperPodov, s pružnou konfiguráciou do rôznych veľkostí.

Partnerstvá a dostupnosť: Rozšírenie v týždňoch

Google uzavrel viacročnú dohodu s Anthropic v hodnote stoviek miliárd dolárov, ktorá poskytne až 100 miliónov TPU na tréning a prevádzku modelov Claude. Ironwood sa integruje s Pathways softvérovým stackom, ktorý umožňuje vývojárom využívať desiatky tisíc čipov bez zložitostí. Dostupnosť sa rozširuje v nasledujúcich týždňoch pre Google Cloud zákazníkov, s plnou hyperskálovou nasadenosťou v datacentrách. „Ironwood je jadrom nášho AI Hypercomputera – spája modelový výskum, softvér a hardvér pod jednou strechou,“ dodal Vahdat.

Konkurencia s Nvidio: Google na ústupe?

Tento launch prichádza v čase, keď Nvidia dominuje AI hardvérom s Blackwell GPU, no Google sa snaží dobehnúť vďaka custom dizajnu a nižším nákladom. Ironwood sľubuje vyššiu efektivitu pre inferenciu, kde Nvidia čelí výzvam s energiou. Analytici z Hot Chips 2025 oceňujú, že Ironwood „posúva hranice AI akcelerátorov na podlahu“, s potenciálom na 24-násobný výkon oproti superpočítačom ako El Capitan.

Krátkodobý a dlhodobý výhľad

Býčí scenár: Ak Ironwood splní sľuby, Google by mohol získať 20 % podiel v AI inference trhu do 2026, s partnerstvami ako Anthropic tlačiacimi adopciu a cenami pod Nvidiu o 30 %.

Medvedí scenár: Oneskorené nasadenie alebo problémy s kvapalinovým chladením by mohli udržať Nvidiu v vedení, s rizikom oneskorenia v ére, kde energia je limitujúca.

Ironwood nie je len hardvérom – je to krok k ére, kde AI „myslí“ na škále. S 9 216 čipmi a kvapalinovým chladením Google signalizuje, že je pripravený na súboj o AI budúcnosť. Sledujte nasledujúce týždne: prvé nasadenia ukážu, či Ironwood naozaj predbehne konkurenciu.

Príspevok Google uvádza na trh Ironwood TPU je zobrazený ako prvý na Kryptoblog24.

Podporte SIA NEWS!

Ďakujeme za každú vašu podporu.

Zadajte platnú sumu.
Ďakujeme za vašu podporu.
Vašu platbu nebolo možné spracovať.
revolut banner

Kategórie