Intel udělal změny cache v malých i velkých jádrech Alder Lake

L1, L2 a L3 cache v jádrech Intel Golden COve a Gracemont a procesorech Alder Lake

Architektura Alder Lake by mohla být nejzajímavější počin Intelu v procesorech za poslední roky. Mimo hybridní přístup big.LITTLE by zejména velké jádro (samo označované Golden Cove) mělo přinést velké zvýšení výkonu na 1 MHz frekvence, tedy tzv. IPC. Ještě neznáme podrobnosti, ale objevily se informace o konfiguraci mezipamětí cache, a to pro Golden Cove, tak i pro malá jádra Gracemont, která také ukazují, jak budou propojená velká a malá jádra.

Tyto informace pocházejí z kódu, který zveřejnil přímo Intel a obsahuje výpis různých vlastností ES vzorku procesoru Alder Lake. Vzhledem k oficiálnímu původu by tedy mělo jít o téměř zaručená data.

Vzorek, na kterém jsou tato data pořízena, je desetijádro, a to zřejmě mobilní Alder Lake řady U, protože obsahuje dvě velká jádra Golden Cove a k tomu osm malých jader Gracemont. Že mainstreamové mobilní verze budou mít přesně tento mix jader, už ukázaly tyto uniklé informace, podle kterých takovéto procesory budou mít TDP 9 W nebo 15 W (s určitou mírou konfigurovatelnosti).

Verze procesorů Intel Alder Lake pro mobilní zařízení a notebooky (Zdroj: HXL)

Golden Cove: stejná L1 cache, snížená asociativita u L2?

Výpis na Githubu postupně vypisuje všechny cache. Pro Golden Cove se zdá, že L1 cache je víceméně beze změny proti jádrům Sunny Cove a Willow Cove (procesory Ice Lake a Tiger Lake). L1 pro data má 48 KB s 12cestnou asociativitou, L1 pro instrukce má 32 KB s 8cestnou. Toto neznamená nutně, že výkon je stejný, mohly by se například nějak změnit latence, propustnost, algoritmy prefetchingu a podobně.

Kde je ale rozdíl proti Tiger Lake/Willow Cove, je v L2 cache. Intel převzal 1,25MB kapacitu, toto tedy zůstalo zachováno. Ovšem zatímco asociativita je u nynějších procesorů 20cestná, Alder Lake a Golden Cove ji má zredukovanou na 10cestnou. Méněcestná asociativita by teoreticky mohla zhoršit hit-rate této cache a tím její účinnost. Nicméně by také mohla umožnit snížit latenci, což zase výkonu pomáhá. Zde tedy není úplně jasné, zda se výkon L2 cache zlepší, nebo zhorší. Je možné, že různé úlohy mohou reagovat různě (někde to přinese zpomalení, někde zrychlení).

<cache level="2" id="0x0" type="3">
<cache_size>1310720</cache_size>
<line_size>64</line_size>
<ways>10</ways>
<sets>2048</sets>

Budou budoucí jádra mít ještě větší L2 cache?

Intel asociativitu snížil u 256KB L2 cache jádra Skylake, kde byla jen 4cestná, zatímco rovněž 256KB cache předchozích architektur až po Broadwell byla 8cestná. Pravděpodobně šlo o přípravu na zvýšení kapacit L2, které nastalo v jádrech Ice Lake (na 512KB/8cestná asociativita), ale zejména v serverovém Skylake-SP (1 MB/16cestná).

Snížení asociativity u Golden Cove by proto mohlo znamenat, že v následující evoluci jader hodlá Intel zvětšit kapacity L2 cache, což je mimochodem také jedna z věcí, která asi procesorům Apple pomáhá k vysokému výkonu. Apple nicméně má také velmi velké L1 cache, což Intel ani AMD zatím moc nepřevzaly. Podle uniklých materiálů má každopádně následující generace Raptor Lake dělat nějaké změny právě v systému pamětí cache, údajně takové, které zlepší herní výkon (což doufejme neznamená, že ten u Golden Cove nebude dobrý…)

Kromě budoucích architektur by také L2 cache mohla být zvětšená u paralelně vyvíjené serverové verze Golden Cove – procesorů Sapphire Rapids, které tuto architekturu také mají (ale asi s posíleným výkonem v AVX-512).

Vzorek procesoru Intel Alder Lake-S pro socket LGA 1700 (Zdroj: VideoCardz)

Gracemont: větší L1 cache pro instrukce, než má velké jádro

Zajímavé jsou údaje pro malé jádro Gracemont, kde jsou cache také změněné proti předchozí architektuře Tremont. To má proti velkému jádru menší datovou L1 cache, jen 32 KB s 8cestnou asociativitou, což je nezměněné proti minulosti. Ale zatímco u Tremontu měla L1 pro instrukce stejné parametry a kapacitu, Gracemont ji má dvakrát větší – 64 KB. Ovšem asociativita se nezvýšila a zůstala 8cestná.

<cache level="1" id="0x9" type="2">
<cache_size>65536</cache_size>
<line_size>64</line_size>
<ways>8</ways>
<sets>128</sets>

Zvětšení instrukční cache je možná provedeno v návaznosti na architekturu s dvěma klastry instrukčních dekodérů schopnými paralelně zpracovávat dva proudy instrukcí, což Intel poprvé zkusil v Tremontu a v Gracemontu by zřejmě idea mohla být dále rozvinutá.

L2 cache je u Tremontu s kapacitou 2 MB a s 16cestnou asociativitou. Ovšem není vyhrazená pro jedno jádro jako u velkého jádra. Z předchozích malých jader je převzatá architektura, kdy je L2 cache sdílená společně blokem čtyř jader Gracemont. V procesoru s osmi malými jádry jsou proto dvě tyto 2MB L2 cache. Čtveřice jader s jednou L2 bude patrně tvořit jednotný klastr, který nejspíš také bude mít společné jediné zapojení do prstencové sběrnice, která všechna jádra propojuje dohromady.

L3 cache je společná, 4 malá jádra jsou jako 1 velké

Tomu nasvědčuje konfigurace L3 cache. V procesoru je jen jedna, takže by měla být sdílena velkými i malými jádry, a má kapacitu 12 MB a je 12-cestná. To je konfigurace, která přesně odpovídá čtyřjádrovému procesoru Tiger Lake/Willow Cove, s 3MB bloky cache pro každé jádro. U Alder Lake v mobilní konfiguraci 2+8 tedy zřejmě dochází k tomu, že jeden čtyřjádrový klastr malých jader hraje v celkové soustavě stejnou roli, jako jedno velké jádro. Na prstencové sběrnici tak budou procesorová jádra představovat čtyři zastávky, ale za jednou zastávkou pro malá jádra budou vždy čtyři Gracemonty spolu místo jen jednoho.

Výkonná desktopová verze s 8+8 jádry tedy bude mít prstencovou sběrnici se osmi velkými jádry a potom dalšími dvěma zastávkami pro dva čtyřjádrové klastry malých jader. Měla by se tedy chovat podobně jako prstencová sběrnice u desetijádrového Comet Lake-S. Pokud opět bude mít L3 cache kapacitu 3 MB na každé velké jádro nebo klastr malých jader, pak by 8+8jádrové CPU mělo mít 30 MB L3.

Slajd Intelu k 10nm procesorům Alder Lake (Zdroj: VideoCardz)

To, že malá jádra nebudou mít každé vlastní zastávku, sníží výrazně průměrné latence při komunikaci mezi jádry (minimálně mezi těmi velkými), protože u ringbusu se latence s každým přidaným zastavením zhoršují. Na šestnáct samostatných jader už by asi ringbus nemusel zas tak dobře škálovat, takže by se architektura sběrnice musela změnit. Intel u serverových CPU s více jádry proto už dávněji přešel nejdřív na dva propojené prstence, což ale asi bylo příliš komplikované, a potom od Skylake-SP na mesh propojení.

Z tohoto pohledu se asi mobilní 2+8jádro Alder Lake do značné míry bude dát srovnávat s nehybridním čtyřjádrem a výkonné 8+8 Alder Lake-S pro desktop zase s hypotetickým desetijádrem (se všemi jádry velkými). Uvidíme tedy, zda vícevláknový výkon bude škálovat lépe, než jaký by asi podávaly takové nehybridní alternativy. Na tom by tedy v budoucnu možná mohlo být vidět, zda se big.LITTLE koncepce Intelu vyplatí, nebo ne.

Zdroj: Project ACRN/Github, via: Hardware Times

Jan Olšan, redaktor Cnews.cz


  •  
  •  
  •  
Flattr this!

Konečně jsou tu ITX desky s Intel Jasper Lake, dokonce pasivní

Čipová krize měla různé oběti, ale jednou byly i úsporné procesory Celeron a Pentium z „atomové“ linie malých jader. Intel už před rokem a půl uvedl na trh jejich 10nm generaci Jasper Lake s architekturou Tremont. Jenže čipů Jasper Lake asi nebylo dost. Prakticky vůbec nejsou k mání desktopové desky pro úsporné sestavy. Po dlouhé době se to snad lepší, teď konečně přicházejí Mini-ITX desky s Jasper Lake, dokonce i pasivně chlazené. Celý článok „Konečně jsou tu ITX desky s Intel Jasper Lake, dokonce pasivní“ »

  •  
  •  
  •  

Vyšla mATX deska s osmijádrovým 10nm CPU Intel Tiger Lake-H

Po vydání 10nm procesorů Tiger Lake-H a pořád 14nm Rocket Lake pro desktop, které trpěly už poměrně špatnou energetickou efektivitou, leckoho mrzelo, že 10nm čipy nemohly přijít i do desktopu. Intel vydal BGA verze, které používaly například jeho NUCy, ale nebyly k mání samostatné desky. Teď se zpožděním takový hardware vychází: čínský výrobce Maxsun teď má mATX desku s osmijádrovým Tiger Lake Core i7-11800H. Celý článok „Vyšla mATX deska s osmijádrovým 10nm CPU Intel Tiger Lake-H“ »

  •  
  •  
  •  

Intel vydal procesory Tiger Lake pro desktop. (Update: správné takty)

Mnohokrát asi bylo litováno, že se Intel nevydal na platformě LGA 1200 10nm procesory. Jako Core 11. generace pro desktop vyšlo 14nm Rocket Lake, paradoxně až v momentě, kdy se Intelu podařilo 10nm proces opravit a 10nm čipy by konečně měly dost výkonu. Vypadá to ale, že pokud jste 10nm procesor v desktopu chtěli vidět, určitou možnost budete mít – Intel totiž teď překvapivě vydal opravdové modely procesorů Tiger Lake pro desktop. Celý článok „Intel vydal procesory Tiger Lake pro desktop. (Update: správné takty)“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *