Next-gen GPU Nvidia s architekturou Blackwell ještě nebudou 3nm

Blackwell bude bez přechodu na novější výrobní proces?

Je to zhruba půl roku od vydání nové generace grafik Nvidia, ale začaly se objevovat informace, či možná spíš spekulace o tom, co přinese generace příští, tedy grafiky zřejmě označené GeForce RTX 5000, které by logicky měly vyjít za rok a půl, pokud Nvidia zachová obvyklý dvouletý cyklus. Většina informací je teď asi vysoce nejistá, ale už máme první detaily, které by mohly být reálné a stojí za to se na ně podívat.

Takto v předstihu mívají nejvíc „informací“ youtubeři, u kterých se ale těžko ubránit dojmu, že potřebují udržovat zájem publika, a tak berou zavděk i spekulacemi, které nejsou založené na nějakém úniku z Nvidie, ale jen na něčím tipování. Rok a půl předem tedy to, co uvádějí o budoucích architekturách, může být dost mimo.

O architektuře Blackwell se nyní rozhovořil youtuber RedGamingTech. Podle jeho zdrojů prý Blackwell budou opět monolitické čipy včetně highendových herních modelů (GB102), s možností, že by mohly existovat čipletové verze pro servery a HPC (GB100). Otázka je, zda se jejich architektura nebude jmenovat jinak, tak jako máme nyní paralelně výpočetní Hopper a herní Ada Lovelace. Nicméně podle staršího úniku, který nastal kvůli hacku serverů firmy, by podobně jako Ampere tato architektura mohla mít jak herní, tak výpočetní verze.

RedGamingTech na svém videu uváděl, že dle jeho názoru by čipy Blackwell mohly používat 3nm proces TSMC. Je to asi ale jenom odhad, ne reálné zjištění. Z tohoto se ovšem nakonec vyklubala nová informace, protože zareagoval nejkvalitnější leaker plánů Nvidie Kopite7kimi, podle kterého Blackwell ještě 3nm čipy nebudou.

GPU generací Hopper a Blackwell v ukradeném kódu ovladačů Nvidie (zdroj: VideoCardz)

Bohužel to asi znamená, že bude použitá nějaká parametry horší technologie pořád v 4nm generaci. Protože již Ada Lovelace se vyrábí na silně upraveném 5nm procesu TSMC, který bude asi víceméně parametry na úrovni 4nm procesu N4 (pokud ne lepší), znamená to, že by GPU Blackwell mohla být v situaci, kdy získají jen minimální zisky v hustotě tranzistorů a energetické efektivitě z lepší výrobní technologie oproti čipům Ada Lovelace. Nvidia by možná mohla využít nějakou verzi N4, která zlepší výkon tím, že dosáhne vyšších taktů – TSMC například chystá speciální „HPC“ procesy jako N4X. Ale takový proces zřejmě nenabídne nějaké velké zlepšení poměru výkonu a spotřeby, který je u GPU hodně důležitá věc. Nebo aspoň byla v době, kdy trh neakceptoval zvyšování TDP tak snadno jako dnes.

Více: Přímo proti Intelu: TSMC uvádí speciální křemíkové procesy pro maximální výkon. První je N4X

512bitové paměti?

Víc toho o Blackwellu Kopite7kimi zatím nechce říkat – podle jeho Twitteru je zatím příliš brzo na podobné debaty. Nicméně zmínil, že by ho nepřekvapilo, pokud by tato GPU měla širší paměťové sběrnice a highendový čip by se dostal na 512bitovou šířku pamětí. To by bylo poprvé od GPU Fermi, ve své době nechvalně proslulého spotřebou. Od té doby se Nvidia držela jako maxima 384bitových pamětí. Zatím to ale asi také není nějaká jistá informace, takže je to třeba brát jen jako možnost, zatímco to o nepoužití 3nm procesu je patrně z lepších zdrojů.

Velké architektonické změny

Už zase jen podle RedGamingTechu prý Nvidia pravděpodobně v Blackwellu bude mít výrazně přepracovanou architekturu. Má se to týkat i změněné struktury jednotlivých bloků SM (výpočetních jednotek). SM prý budou propojené „hyperrychlou“ propojovací logikou, která by snad mohla pak být použitá i pro propojení čipletů u oné serverové verze GB100.

GPU by prý také mohla mít specializovaný akcelerátor denoisingu, nebo možná nějaké instrukční rozšíření či vylepšení tensor jader pro tento účel. Odšumění obrazu se používá při ray tracingu a už nyní ho akcelerují tensor jádra, takže rozšíření jejich funkcionality se zdá pravděpodobnější než přidání samostatné jednotky pro tyto účely.

Tyto informace jsou ale, jak už bylo řečeno, asi hodně předběžné a ještě ne moc spolehlivé. Hodně se toho ale asi dá úspěšně uhádnout, každého asi napadne podpora PCI Express 5.0 a možné použití pamětí GDDR7. RedGamingTech také uvádí, že by highendový čip GB102 mohl mít stále jen 144 SM (stejný počet jako u AD102) a navýšení výkonu by pocházelo z architektonických zlepšení a frekvencí.

Ale je opravdu otázka, zda to zatím není jen spekulace. Možná je toto číslo užitečné hlavně k tomu, abychom ho za rok a půl mohli porovnat se skutečností k zhodnocení toho, jak moc mělo smysl těmto druhům youtuberských úniků naslouchat. GeForce RTX 5000 by pravděpodobně mohly vyjít na podzim roku 2024, pokud Nvidia udrží dosavadní dvouleté rozestupy.

Zdroje: Kopite7kimi (1, 2), RedGamingTech

Jan Olšan, redaktor Cnews.cz


  •  
  •  
  •  
Flattr this!

Intel Lunar Lake má 100 TOPS AI výkonu. A taky hodně silné GPU?

Microsoft spolu s výrobci notebooků a procesorů plánuje příchod tzv. AI PC (a svou vlastní verzi prý chystá také Apple, až vydá procesory M4). Tato zařízení budou potřebovat výrazně vyšší výkony, aby mohla provozovat pokročilé neuronové sítě lokálně na vlastním hardwaru. Intel se teď pochlubil výkonem chystaných procesorů Lunar Lake, které přijdou koncem roku do mobilních zařízení jako Core Ultra druhé generace. Celý článok „Intel Lunar Lake má 100 TOPS AI výkonu. A taky hodně silné GPU?“ »

  •  
  •  
  •  

GeForce RTX 5090 nakonec s 512bitovou pamětí, GB203 má 96 SM

Minulý týden se dostaly ven informace o 28GHz pamětech na grafikách GeForce generace RTX 5000. Byla to ale jen předehra, leaker Kopite7kimi poté přidal podrobnější pohled na specifikace chystaných herních GPU generace Blackwell. Zdá se, že to bude větší výkonnostní skok. Tak trochu v duchu citátu „odvolávám, co jsem odvolal“ je totiž zpět ve hře 512bitová sběrnice, s níž by Blackwell byl nejtěžší kalibr Nvidie za dlouhou dobu. Celý článok „GeForce RTX 5090 nakonec s 512bitovou pamětí, GB203 má 96 SM“ »

  •  
  •  
  •  

Čínské SMIC chystá 3nm výrobní proces. Bez EUV bude mít problém

Loni se objevily informace o čínském 5nm výrobním procesu od společnosti SMIC (byť možná bude mít blíž k vylepšené generaci 7nm technologie, kterou mělo SMIC dříve plánovanou). Tyto snahy o čínskou soběstačnost ve špičkových výrobních procesech budou pokračovat. SMIC nyní plánuje dokonce i 3nm výrobní proces. Západní sankce ale mají vliv – pokud se firmě podaří takovou technologii vyvinout, výroba dost možná bude ekonomicky nevýhodná. Celý článok „Čínské SMIC chystá 3nm výrobní proces. Bez EUV bude mít problém“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *