AMD Zen 4 už bude mít AVX-512. Také BFloat16 a další instrukce

Zen 4: podpora AVX-512 a plochy čipletů

Máme další novinky k příští procesorové architektuře od AMD: Zen 4 chystaný do 5nm Ryzenů a Epyců má konečně mít instrukce AVX-512 a také podporu pro výpočty ve formátu BFloat16, užitečné pro aplikace umělé inteligence. Také už známe, jak velké budou 5nm čiplety: jejich plocha je ještě o trošku menší než u 7nm Ryzenů 3000 „Matisse“. Ale rozdíl je jen pár mm², což snad už chlazení o moc neztíží.

Včera jsme tu měli zprávu o prosáknutí některých informací o serverových procesorech AMD s architekturou Zen 4, které také budou už vyráběné na 5nm procesu. Dostanou nový socket, 12kanálové paměti DDR5 a 96 jader, které budou v 12 čipletech. Krátce poté přicházejí další dokreslující informace k Zenu 4. Například příjemná věc, že AMD údajně konečně přidá podporu 512bitových SIMD instrukcí AVX-512.

Tato informace se objevila na fóru Chiphell a je doložena výřezem z dokumentu, který má být slajdem od AMD – samozřejmě nemůžeme vědět jistě, že je to není „fake“. Informace o tom, že Zen 4 podporuje AVX-512, ale je prý pravdivá podle předchozího leakera ExecutableFix, což by mohlo podporovat i pravost ostatních informací na tomto útržku.

Co tam tedy je dále? Potvrzeno je „víc než 64“ jader, ale ne přímo číslo 96. Současně je zde jasně uvedeno, že jádro Zen 4 má pořád jenom dvě vlákna na jedno jádra (tedy SMT je jenom dvoucestné jako dosud). Také je řečeno, že procesory Epyc této čtvrté generace budou pořád podporovat maximálně jen dvousocketové (2S) servery a desky.

AMD na údajném slajdu uvádí, že jsou podporovány instrukce „AVX3-512“ (AVX3 bylo dříve se objevující předběžné označení pro AVX-512). Není řečeno, jaké subsety AVX-512 bude Zen 4 podporovat, což je dost důležité, ale aspoň se základy by tedy asi měl být kompatibilní. Zen 4 by tedy mohl dorovnat tuto dílčí výhodu, kterou má Intel od vydání architektury Skylake-X/Skylake-SP. Ovšem také nemusel. Bude záviset na tom, s jakým výkonem bude výpočet probíhat. Pokud by například byly pořád použité 256bitové jednotky SIMD a 512bitové operace probíhaly ve dvou průchodech, nemusí se výkon proti AVX/AVX2 téměř vůbec zlepšit a podpora by pak měla hlavně cenu kompatibility.

Leak k architektuře Zen 4 v procesorech Epyc 7004 (Zdroj: Chiphell)

Kromě AVX-512 bude jádro také podporovat výpočty s hodnotami BFloat16, což je 16bitový formát čísel uzpůsobený pro trénování neuronových sítí. Obsažené ale mají být i další instrukční rozšíření. Není řečeno jaká, takže nemáme žádnou představu, zda se pod tímto skrývají jen drobnosti nebo něco významnějšího.

Zen 4 má podle těchto informací mít vylepšený výkon a energetickou efektivitu – a to jak samotným architektonickým návrhem, tak 5nm výrobním procesem. Ale nic jiného se asi ani nečekalo. Také je uvedeno, že CPU bude podporovat 52bitové fyzické adresování RAM zatímco virtuální adresy budou podporované 57bitové.

Velikosti čipletů: lepší proces pro IO křemík?

Kromě informací o nových instrukcí je tu také ještě něco k fyzické podobě procesoru. Včera jsme ukazovali „koncept“ toho, jak by měl procesor podle leakera vypadat. ExecutableFix pak potvrdil že ač jde o nepravou podobu (ručně „naphotoshopovanou“ z obrázku procesoru Epyc druhé generace), polohy a velikosti čipů na ní sedí s tím, jak vypadá reálné schéma.

Současně s tím také zveřejnil reálné velikosti čipletů, z kterých vyplývá, že IO čiplet zřejmě dostane novější výrobní technologii, což by mohlo zlepšit efektivitu. U 7nm procesorů Epyc (Rome i Milan) má IO čiplet nějakých 416 mm²; u Epycu Genoa bude menší s 396,64 mm². Není to o moc – podle obrázku to vypadalo na větší rozdíl – ale procesor bude mít místo PCIe 4.0 už konektivitu PCIe 5.0, bude podporovat komunikaci s o 50 % vyšším počtem CPU čipletů a také o 50 % víc kanálů paměťového řadiče, navíc s podporou DDR5. Pravděpodobně je proto použitý lepší výrobní proces s vyšší hustotou a snad také lepší energetickou efektivitou.

Takto nějak by měl procesor Genoa vypadat. Jde jen o montáž ne reálnou podobu (Zdroj: ExecutableFix)

Chlazení asi zůstane výzva

U 5nm CPU čipletů lepší proces je už jasný, ale jak jsme zmínili minule, kvůli udržení počtu jader na osmi jsme měli trošku strach o jejich velikost. Při malé ploše by se totiž procesory s jedním nebo dvěma čiplety (tedy Ryzeny pro desktop) špatně chladily. Velikost těchto 5nm křemíků je nakonec skutečně menší, mají jen 72,225 mm². Není to ale už o moc méně, než měly 7nm čiplety s jádry Zen 2, pro ty se uvádí 74 mm². Snad se tedy teploty těchto procesorů nezhorší o moc.

Jinak je pravděpodobné, že stejný výrobní proces, jako bude použitý u IO čipletu Epycu Genoa, bude také využitý v IO čipletu procesorů Raphael pro desktopový socket AM5. A to kvůli ušetření nákladů na vývoj dvou těchto čipů.

Jan Olšan, redaktor Cnews.cz


  •  
  •  
  •  
Flattr this!

Zen 5 s V-Cache už brzo. Ryzen 7 9800X3D prý vyjde za měsíc

Když AMD vydalo procesory s architekturou Zen 5 pro desktop, byly to zatím jenom běžné modely bez 3D V-Cache, kterou mají „X3D“ modely a výrazně zlepšuje výkon ve hrách. Zájemci o herní PC nebo upgrade tak zatím nemají náhradu za Ryzen 7 7800X3D předchozí generace, který víceméně zůstává nejlepším herním CPU. Toto by se ale mohlo brzo změnit, zdá se, že AMD už začíná být o X3D verzi Zenu 5 sdílná a vydání nastane brzo. Celý článok „Zen 5 s V-Cache už brzo. Ryzen 7 9800X3D prý vyjde za měsíc“ »

  •  
  •  
  •  

Jak moc Zenu 5 pomůže AVX-512 v x265? A jak podporu zapnout?

Možná to nevíte, ale enkodér videa x265 dokáže použít instrukce AVX-512, avšak z historických důvodů v něm nejsou zapnuté. Před pár lety jsme probírali, jak optimalizace používající tyto instrukce zapnout, a zkoušeli, jaký to má vliv nejdřív na procesorech Intel Rocket Lake a potom na Zenu 4. Vzhledem k velké oblibě těchto článků jsme stejné testy teď zopakovali i na nové architektuře Zen 5, pro porovnání s předchozími jádry. Celý článok „Jak moc Zenu 5 pomůže AVX-512 v x265? A jak podporu zapnout?“ »

  •  
  •  
  •  

Lepší výkon Zenu 5 s AGESA 1.2.0.2? AMD opraví latence mezi CCX

Vydání procesorů s architekturou Zen 5 bylo letos spojeno se značnou porcí postupného „zrání“ oproti tomu, jaký výkon měly procesory v prvních recenzích. Došlo na zvyšování TDP (ovšem jen volitelné), také se ukázalo, že se výkon těchto procesorů zvedl s aktualizacemi Windows. A vypadá to, že přijde minimálně ještě jeden posun ve výkonu kvůli úpravě nebo opravě, která se teď chystá v tzv. kódu AGESA a firmwaru pro základní desky. Celý článok „Lepší výkon Zenu 5 s AGESA 1.2.0.2? AMD opraví latence mezi CCX“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *