Velká a „malá“ jádra: proč vůbec?
Intel teď odhalil architekturu svých nejnovějších procesorů Alder Lake. Tentokrát jsou to ale architektury dvě. Alder Lake je hybridní a vedle „velkých“ jader pro jednovláknový výkon má další „malá“ jádra Gracemont. Ta ale nejsou jen do počtu či pro úsporu energie v nečinnosti jako u ARMů v mobilech, naopak se významně podílí na celkovém výkonu. Jejich architektura je vlastně sama celkem velká a teď se na ní detailně podíváme.
Tzv. „big.LITTLE“ koncepce byla u Alder Lake kritizována od chvíle, kdy o ní přišly první zprávy, panovaly obavy, že bude výkon procesoru minimálně v desktopové oblasti brzdit. Jak je tomu skutečně se opravu ukáže až v recenzích, ale už z odhalených rysů architektury Gracemont je jasné, že tato debata možná byla od začátku svedená na scestí používáním ono pojmu „malé jádro“.
Po pohledu na schéma Gracemontu se toto označení nezdá být správné a vskutku: Intel tuto architekturu označuje jako „Efficient Core“ (E-Core), tedy efektivní jádro. Možná bychom na chvíli měli zapomenout na to, co o big.LITTLE víme, a také na to, že Gracemont evolučně vychází z linie malých jader Intelu (linie Atom). Podle toho co Intel představil, použití dvou druhů jader řeší v desktopových procesorech Alder Lake problém, který vlastně ani moc nevychází z mobilní oblasti, a to problém optimálního dimenzování procesorové architektury pro ideální výkon ve všech úlohách. Je možné, že snižování spotřeby a prodlužování výdrže na baterii v mobilní verzi Alder Lake je nakonec i jen vedlejší produkt.
Řešení dilematu mezi ST a MT výkonem?
V čem onen problém spočítá? Od procesorového jádra požadujeme jednak co nejvyšší jednovláknový výkon, který je důležitý pro rychlost jednovláknových aplikací, výkon ve hrách, ale i responzivnost OS a webového prohlížeče. Současně je zde ale také celkový mnhovláknový výkon – tedy výkon, který z procesoru lze vydupat, když se použijí všechna jeho jádra a vlákna. Potíž je v tom, že jedna stejná architektura nemusí být optimální pro obě tyto role.
Jde vlastně o stejnou věc, kvůli které ARM rozdělil svou linii velkých jader na Cortex-A78 a X1 (a podobně v následujících generacích). Pokud se procesor zaměřuje na dosažení co nejvyššího jednovláknového („ST“ jako single-thread) výkonu, dává smysl udělat kompromisy, které za relativně menší navýšení výkonu platí poměrně velkým navýšením spotřeby, ale také komplexity, počtu potřebných tranzistorů a tím velikostí čipu. Navýšení jednovláknového výkonu třeba o 10 % může klidně opodstatňovat, aby jádro bylo o 30 % větší a žravější, protože vysoký ST výkon je z pohledu designérů CPU dost cenná věc. A jednovláknová úloha většinou není omezená celkovým TDP čipu, protože maximální příkon jednoho jádra bývá menší než TDP celého procesoru.
Ovšem pokud chceme získat vyšší mnohovláknový („MT“, multi-thread) výkon, tak můžeme zjistit, že je strategie potřebná pro maximalizaci ST výkonu naopak na obtíž. Pro mnohovláknový výkon je obvykle podstatným omezením to, jakou má procesor dovolenou spotřebu (TDP). Úkolem inženýrů je v rámci konečného počtu wattů dosáhnout co nejlepší možný MT výkon, tedy souhrnný výkon všech jader dohromady. To nutně znamená, že nesmíte kvůli 10 % výkonu akceptovat 30 % spotřeby navíc, potřebujete naopak řešení, kde bude nárůst výkonu s nárůstem spotřeby mnohem více v rovnováze. Dobrou strategií je použít více jader, která ale běží na nižší, více efektivní frekvenci, než na jaké by běžela pro dosažení ST výkonu. Kvůli tomu, abyste mohli mít jader co nejvíce, je zase nutné být šetrnější v zabraném místu na čipu, protože jinak se vám na něj nevejde tolik, kolik byste chtěli, nebo bude čip dražší, než vám je dovoleno.
Pro nejlepší MT výkon je tudíž optimální jádro, které nejde za ST výkonem tak agresivně – spokojí se s třeba o 10 % nižším maximálním ST výkonem jádra, ovšem získá za to o 30 % nižší spotřebu a o 30 % nižší plochu. Díky tomu pak tato jádra v určitém počtu dokáží dostat z daného TDP (ať už je to třeba 35 W, nebo 125 W) vyšší MT výkon.
U procesorů ARM tuto strategii sledují velká jádra Cortex-A78 nebo nyní A710, která jsou navržená na optimální poměr výkonu, plochy a spotřeby, zatímco strategie k dosažení vyššího ST výkonu za cenu horší efektivity a neoptimální velikosti jádra vedla k jádrům Cortex-X1 a X2.
U Alder Lake se zdá, že jádro Golden Cove je hodně jako ARM Cortexy-X a „malá jádra“ Gracemont zase nejsou ani tak malá, jako spíše střední nebo menší velká jádra, podobně jako Cortex-A78 nebo A710. To, že Intel používá označení Performance Core a Efficiency Core by tomuto odpovídalo. Cíl použití hybridní architektury je, aby se už nemuselo rozhodovat, zda procesor použije jádra aspirující na maximální jednovláknový výkon (ST strategie), čímž ale utrpí maximální MT výkon, nebo zda by nebylo lepší je udělat více efektivní a menší pro vyšší MT výkon.
Hybridní přístup Alder Lake znamená, že v procesoru je nějaký počet velkých jader plně se soustředících na maximální ST výkon, ale další jádra už jsou více zaměřená na vyšší efektivitu a mnohovláknový výkon (Intel tomu také říká „škálovatelnost“ a optimalizace na výpočetní propustnost/throughput). Ta tím vylepší MT výkon, který procesor zvládne dosáhnout v rámci určitého limitu TDP a plochy čipu. Jednovláknový výkon není logicky třeba mít vysoký na všech jádrech, pokud operační systém umí jednovláknové aplikace na ta správná jádra umístit. Proto může být výhodné mít dokonce i většinu jader těch malých, nebo lépe řečeno efektivních. A to je podle drbů, které se šíří o budoucích procesorech následujících po Alder Lake, prý přesně směr, kterým Intel půjde. Můžeme se prý setkat s procesory s osmi velkými a šestnácti, nebo i 32 efektivními jádry.
Teorie je jedna věc, uvidíme, jak dopadne praxe
Tento dlouhý a ukecaný úvod měl za cíl vysvětlit, proč „big.LITTLE“ strategie přes obecnou skepsi může mít smysl i v desktopových a poměrně výkonných procesorech. Soudě podle komentářů si to teď totiž mnoho z vás nemyslí a očekávání jsou spíš negativní.
Zatím nevíme, zda v praxi procesory Alder Lake v onom řešení popisovaného problému uspějí. Rozumná nebo opodstatněná koncepce se nemusí vždy přetavit ve fungující implementaci. Může se samozřejmě stát, že efektivita, kterou tato konkrétní verze malých/efektivních jader dosáhne, nebude dost dobrá, aby převážila potíže, které může hybridní (asymetrický procesor) zase způsobit. Ovšem koncepce sama o sobě vypadá smysluplně a životaschopně.
Teď už tedy opravdu k rozboru architektury Gracemont. Doporučujeme přečíst nejdřív článek o velkém jádru („Performance Core“) Golden Cove. Malé jádro („Efficiency Core“) Gracemont stojí za to vnímat v kontextu větší sesterské architektury.
Tip: Detaily CPU jádra Intel Alder Lake/Golden Cove odhalené (analýza)
Článek pokračuje další kapitolou.
- Contents
- Velká a „malá“ jádra: proč vůbec?
- Gracemont: „malá“(?) architektura silná už jako Skylake
- Výpočetní jednotky: 17 portů, potenciál pro vysoké IPC
- Paměťový subsystém: Dvakrát víc AGU a Load/Store
- Rychlost: „Malé“ jádro má až dvě třetiny výkonu velkého