Next-gen GPU Nvidia s architekturou Blackwell ještě nebudou 3nm

Blackwell bude bez přechodu na novější výrobní proces?

Je to zhruba půl roku od vydání nové generace grafik Nvidia, ale začaly se objevovat informace, či možná spíš spekulace o tom, co přinese generace příští, tedy grafiky zřejmě označené GeForce RTX 5000, které by logicky měly vyjít za rok a půl, pokud Nvidia zachová obvyklý dvouletý cyklus. Většina informací je teď asi vysoce nejistá, ale už máme první detaily, které by mohly být reálné a stojí za to se na ně podívat.

Takto v předstihu mívají nejvíc „informací“ youtubeři, u kterých se ale těžko ubránit dojmu, že potřebují udržovat zájem publika, a tak berou zavděk i spekulacemi, které nejsou založené na nějakém úniku z Nvidie, ale jen na něčím tipování. Rok a půl předem tedy to, co uvádějí o budoucích architekturách, může být dost mimo.

O architektuře Blackwell se nyní rozhovořil youtuber RedGamingTech. Podle jeho zdrojů prý Blackwell budou opět monolitické čipy včetně highendových herních modelů (GB102), s možností, že by mohly existovat čipletové verze pro servery a HPC (GB100). Otázka je, zda se jejich architektura nebude jmenovat jinak, tak jako máme nyní paralelně výpočetní Hopper a herní Ada Lovelace. Nicméně podle staršího úniku, který nastal kvůli hacku serverů firmy, by podobně jako Ampere tato architektura mohla mít jak herní, tak výpočetní verze.

RedGamingTech na svém videu uváděl, že dle jeho názoru by čipy Blackwell mohly používat 3nm proces TSMC. Je to asi ale jenom odhad, ne reálné zjištění. Z tohoto se ovšem nakonec vyklubala nová informace, protože zareagoval nejkvalitnější leaker plánů Nvidie Kopite7kimi, podle kterého Blackwell ještě 3nm čipy nebudou.

GPU generací Hopper a Blackwell v ukradeném kódu ovladačů Nvidie (zdroj: VideoCardz)

Bohužel to asi znamená, že bude použitá nějaká parametry horší technologie pořád v 4nm generaci. Protože již Ada Lovelace se vyrábí na silně upraveném 5nm procesu TSMC, který bude asi víceméně parametry na úrovni 4nm procesu N4 (pokud ne lepší), znamená to, že by GPU Blackwell mohla být v situaci, kdy získají jen minimální zisky v hustotě tranzistorů a energetické efektivitě z lepší výrobní technologie oproti čipům Ada Lovelace. Nvidia by možná mohla využít nějakou verzi N4, která zlepší výkon tím, že dosáhne vyšších taktů – TSMC například chystá speciální „HPC“ procesy jako N4X. Ale takový proces zřejmě nenabídne nějaké velké zlepšení poměru výkonu a spotřeby, který je u GPU hodně důležitá věc. Nebo aspoň byla v době, kdy trh neakceptoval zvyšování TDP tak snadno jako dnes.

Více: Přímo proti Intelu: TSMC uvádí speciální křemíkové procesy pro maximální výkon. První je N4X

512bitové paměti?

Víc toho o Blackwellu Kopite7kimi zatím nechce říkat – podle jeho Twitteru je zatím příliš brzo na podobné debaty. Nicméně zmínil, že by ho nepřekvapilo, pokud by tato GPU měla širší paměťové sběrnice a highendový čip by se dostal na 512bitovou šířku pamětí. To by bylo poprvé od GPU Fermi, ve své době nechvalně proslulého spotřebou. Od té doby se Nvidia držela jako maxima 384bitových pamětí. Zatím to ale asi také není nějaká jistá informace, takže je to třeba brát jen jako možnost, zatímco to o nepoužití 3nm procesu je patrně z lepších zdrojů.

Velké architektonické změny

Už zase jen podle RedGamingTechu prý Nvidia pravděpodobně v Blackwellu bude mít výrazně přepracovanou architekturu. Má se to týkat i změněné struktury jednotlivých bloků SM (výpočetních jednotek). SM prý budou propojené „hyperrychlou“ propojovací logikou, která by snad mohla pak být použitá i pro propojení čipletů u oné serverové verze GB100.

GPU by prý také mohla mít specializovaný akcelerátor denoisingu, nebo možná nějaké instrukční rozšíření či vylepšení tensor jader pro tento účel. Odšumění obrazu se používá při ray tracingu a už nyní ho akcelerují tensor jádra, takže rozšíření jejich funkcionality se zdá pravděpodobnější než přidání samostatné jednotky pro tyto účely.

Tyto informace jsou ale, jak už bylo řečeno, asi hodně předběžné a ještě ne moc spolehlivé. Hodně se toho ale asi dá úspěšně uhádnout, každého asi napadne podpora PCI Express 5.0 a možné použití pamětí GDDR7. RedGamingTech také uvádí, že by highendový čip GB102 mohl mít stále jen 144 SM (stejný počet jako u AD102) a navýšení výkonu by pocházelo z architektonických zlepšení a frekvencí.

Ale je opravdu otázka, zda to zatím není jen spekulace. Možná je toto číslo užitečné hlavně k tomu, abychom ho za rok a půl mohli porovnat se skutečností k zhodnocení toho, jak moc mělo smysl těmto druhům youtuberských úniků naslouchat. GeForce RTX 5000 by pravděpodobně mohly vyjít na podzim roku 2024, pokud Nvidia udrží dosavadní dvouleté rozestupy.

Zdroje: Kopite7kimi (1, 2), RedGamingTech

Jan Olšan, redaktor Cnews.cz


  •  
  •  
  •  
Flattr this!

Intel uvádí Xeon 6700E, svůj první 3nm procesor se 144 E-Core

AMD se na Computexu pochlubilo budoucími serverovými procesory Epyc Turin. Jeho hlavní konkurent Intel také nenechal serverovou oblast na tomto veletrhu na pokoji a rovnou oznámil vydání nových serverových procesorů Intel Xeon 6 „Sierra Forest“. Jde o poměrně zajímavá CPU – čipletové Xeony, které poprvé používají architekturu malých jader, kterých ovšem obsahují velký počet a konkurují tak různým „cloudovým“ procesorům ARM. Celý článok „Intel uvádí Xeon 6700E, svůj první 3nm procesor se 144 E-Core“ »

  •  
  •  
  •  

Intel Lunar Lake: Detaily nejefektivnějšího x86 procesoru

Intel na Computexu 2024 nyní představil extrémně zajímavé nové procesory Lunar Lake. Mají mít velmi vysokou mobilitu a efektivitu (údajně nejlepší mezi x86 procesory) a být jak konkurencí k čipům Applu, tak proti jiným ARM procesorům v Copilot+ PC, vedle konkurování AMD. Lunar Lake má velmi zajímavé architektury jak velkých jader P-Core, tak malých E-Core, ale novinek je v něm mnohem víc – v podstatě ve všem to bude to „nej“, co Intel má. Celý článok „Intel Lunar Lake: Detaily nejefektivnějšího x86 procesoru“ »

  •  
  •  
  •  

AMD ukázalo nejrychlejší CPU na světě. Turin má 192 jader Zen 5

V pondělí odhalilo AMD procesory Ryzen 9000 pro desktop, první s jádry Zen 5 a po nich také nové mobilní procesory „Strix Point“ s touto architekturou. Ovšem firma rovnou oznámila i verzi Zenu 5 pro servery, která bude možná nejimpozantnější. Tyto procesory budou poskytovat až 192 jader. Epycy 9005 „Turin“, jak se jmenují, také přijdou na trh v druhé polovině roku a mohly by dál posílit pozici AMD proti Intelu a také proti různým procesorům ARM. Celý článok „AMD ukázalo nejrychlejší CPU na světě. Turin má 192 jader Zen 5“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *