Jaká je architektura Gracemont, malé jádro Alder Lake? (analýza)

Paměťový subsystém: Dvakrát víc AGU a Load/Store

Intel teď odhalil architekturu svých nejnovějších procesorů Alder Lake. Tentokrát jsou to ale architektury dvě. Alder Lake je hybridní a vedle „velkých“ jader pro jednovláknový výkon má další „malá“ jádra Gracemont. Ta ale nejsou jen do počtu či pro úsporu energie v nečinnosti jako u ARMů v mobilech, naopak se významně podílí na celkovém výkonu. Jejich architektura je vlastně sama celkem velká a teď se na ní detailně podíváme.

Load-Store část má čtyři jednotky AGU (porty 10, 11, 12, 13), které mohou provést dvě čtení a současně i dva zápisy dat do paměti (respektive do cache). Toto je na úrovni procesorů Ice Lake/Tiger Lake a dá se to považovat za velmi výkonný load/store subsystém. Tremont ještě měl jen dvě AGU, které uměly maximálně dvě operace za cyklus (maximálně dvě čtení nebo zápisy). Šířka těchto paměťových operací je 16 bajtů (128 bitů), což umožňuje za cyklus přečíst i zapsat data dvou SIMD vektorů instrukcí SSE, nebo jednoho 256bitového SIMD vektoru instrukcí AVX/AVX2 (32 B/cyklus).

V této datové propustnosti je jádro Gracemont horší než Golden Cove, jenž sice nezvládá o moc víc operací (3 čtení a 2 zápisy za cyklus), ale je to s dvojnásobnou datovou šířkou 256 bitů, takže propustnost je výrazně lepší (čtení až 96 bajtů/cyklus, zápis zřejmě 64 bajtů/cyklus), což se při náročných SIMD výpočtech s hodně daty může projevit. Na druhou stranu ani třeba Zen 3 také nemá zas tak silnou propustnost, takže toto nemusí typicky být tak velký handicap.

V Tremontu AGU byly univerzální, zatímco čtyři v Gracemontu jsou dedikované pro zápis nebo čtení. To znamená, že pokud program neustále současně zapisuje i čte, má Gracemont až 2× výkon těchto operací, ale pokud by se jen četlo nebo jen zapisovalo, není proti staršímu jádru rozdíl. Na dalších dvou portech (8, 9) jsou pak separátně operace pro ukládání dat.

Cache: sdílená L2 (a také L3)

L1 datová cache Gracemontu má kapacitu 32 KB, menší než je 48 KB v Golden Cove nebo Sunny/Willow/Cypress Cove (procesory Ice/Tiger/Rocket Lake), ale stejnou, jako má Zen 3. Jenže Gracemont také zřejmě má nižší (lepší) latenci. Pro operace „pointer-chasing“ Intel udává jen tři cykly. Je ale asi možné, že pro jiné operace už to budou čtyři cykly.

L2 Cache má u architektury Gracemont konfigurovatelnou kapacitu, může to být 2 MB, nebo 4 MB, což ale není pro jedno jádro, ale sdílené pro čtyři, která tvoří jeden sdružený klastr. Podle před časem uniklých informací by v procesorech Alder Lake měla být použitá kapacita nižší, 2 MB společně pro čtyři jádra.

Propustnost této cache je 64 bajtů za cyklus (1024 bitů/cyklus), což je relativně dost i pro zátěž všech jader, a její latence je 17 cyklů. L2 Cache také podporuje až 64 paralelních missů, tedy požadavků na data do L3 Cache nebo RAM (protože se v L2 nenašly). Toto zvyšuje výkon při prací s pamětí. Větší buffer těchto operací omezuje výskyt situací, kdy se musí čekat, až dorazí dříve požadovaná data, než se budou moci poptávat další.

Všechny úrovně cache v Gracemontu mají mít vylepšený prefetching, který detekuje různé druhy pravidelného streamování dat a dokáže pak podle onoho vzorce načítat předem z potřebných adres. Podporovaná je technologie Intel Resource Director, která umožňuje softwaru nastavit rozdělení pásma cache pro jednotlivá jádra nebo vlákna.

Schéma CPU jádra Intel Gracemont (Zdroj: Intel)

Zatímco L1 a L2 cache jsou přímo vlastnost architektury Gracemont, o L3 cache Intel zatím nehovoří. V procesorech Alder Lake budou asi jak velká jádra, tak malá jádra mít sdílenou L3 cache o stejných parametrech, neboť ta je vázaná na prstencovou sběrnici, která jádra propojuje. Zdá se ale, že zatímco každé velké jádro má vlastní 3MB blok L3 cache, u jader Gracemont bude jeden takový blok sdílený současně pro celý klastr čtyř jader Gracemont (ostatně podobně jako bude sdílená L2 cache).

Článek pokračuje další kapitolou.

  •  
  •  
  •  
Flattr this!

Intel spěšně ukončí prodej 125W procesorů Core 13. generace

Od února se šíří zprávy o nestabilitě výkonnějších procesorů Intel Core 13. a 14. generace ve hrách. Intel teď udělal netypickou věc, která vyvolává otázku, zda třeba s problémem nesouvisí. Jen pár měsíců po vydání refreshových modelů Raptor Lake, tedy Core 14. generace, ukončuje výrobu předchozích modelů generace 13. Přitom obvykle firma nechávala starší generace dojíždět mnohem déle, takže by to teoreticky mohlo s aktuální chybou souviset. Celý článok „Intel spěšně ukončí prodej 125W procesorů Core 13. generace“ »

  •  
  •  
  •  

Nestabilních procesorů Raptor Lake přibývá, Intel věc analyzuje

Před nedávnem jsme psali o tom, jak mají procesory Intel Raptor Lake problémy se stabilitou ve hrách. Zprávy o pádech často provázených zavádějící hláškou o nedostatku grafické paměti, zdá se, neutichají a naopak se spíš množí, stejně jako počty her, ve kterých jsou tyto problémy hlášené. Intel zatím k věci nezaujal nějaké oficiální stanovisko, ale problém analyzuje. Jde možná o největší takové problémy s procesory Intel v poslední době. Celý článok „Nestabilních procesorů Raptor Lake přibývá, Intel věc analyzuje“ »

  •  
  •  
  •  

Poslední Core i9: Speciální i9-14900KS má i extrémní spotřebu

Intel letos chystá vydání nové generace desktopových procesorů – čipletové 3nm Arrow Lake, které už bude pojmenované Core Ultra a bude mít novou platformu LGA 1851. Ještě předtím se ale firma rozloučí se socketem LGA 1700 už asi navždy nejvýkonnějším procesorem, jaký bude na jejím 7nm procesoru existovat: Core i9-14900KS. Tato speciální edice teď bude nejrychlejším, ale také zdaleka nejžravějším procesorem pro hráče od Intelu. Celý článok „Poslední Core i9: Speciální i9-14900KS má i extrémní spotřebu“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *