Ampere má 192jádrový ARM procesor, už i s vlastní architekturou

AmpereOne: Nejvýkonnější procesor s architekturou ARM?

V posledních letech se mnoho firem pokoušelo o ARM procesory pro servery, aby to řada zase vzdala. Vedle specifického případu Amazonu se nakonec stala nejúspěšnější firma Ampere (vzniklá z někdejšího AppliedMicro s jednou z nejdelších tradic). A tato společnost teď uvádí svůj zbrusu nový procesor s rekordním počtem 192 jader. Tato jádra jsou přitom jeho vlastní architekturou, nikoliv již licenčními jádry ARM Neoverse, takže jde o zajímavé CPU.

Jak jsme zmínili, firma Ampere má delší historii. Původně šlo o divizi firmy Applied Micro, která již v roce 2013 oznámila první 64bitový procesor ARM právě pro servery (na trh to ale nakonec jako první zvládl Apple se svým mobilním čipem A6). Její procesory X-Gene měly vlastní architekturu, která se ale nakonec ukázala být slabinou – výkon nebyl příliš dobrý a ani energetická efektivita nezaujala, takže tato CPU nakonec konkurovala jen serverovým Atomům, a ani proti nim nebyla úspěšná.

AppliedMicro se této divize zbavilo a nakonec z ní vznikla samostatná firma Ampere Computing, do níž nastoupila jako CEO bývalá viceprezidentka Intelu. První procesor eMag byl přeznačený X-Gene třetí generace z linie AppliedMicro, ale poté firma přešla na licenční architekturu ARM Neoverse N1, na níž vznikly procesory Altra a Altra Max, které teprve zaznamenaly úspěch, a pokud nyní chcete ARM server, jsou vaší hlavní nebo v praxi i jedinou možností. Nicméně firma oznámila, že se chce k vlastní architektuře CPU vrátit (protože je to jedna z mála možností, jak se odlišit od procesorů na bázi ARM Neoverse, které si může licenčně vyrobit kdekdo). A to se teď vyplnilo.

AmpereOne

Nový procesor Ampere se jmenuje poněkud ztřeštěně „AmpereOne“, ačkoliv jde o ne první, ale třetí až šestou generaci podle toho, co všechno počítáte (tento styl značek je ale evidentně stále v módě). Mělo by jít o design, který byl předtím v roadmapách pod označením „Siryn“.

Podobně jako předchozí Ampere Altra a Altra Max je tento procesor zaměřen na vysoký počet jader, která ale sama o sobě nemají úplně špičkový výkon – alespoň ve srovnání s dnešními Xeony a Epycy. Nepoužívají také SMT a ani nemají pokročilé SIMD instrukce typu AVX-512. Floating-point výkon pro potřeby HPC aplikací bude poměrně slabou stránkou. Výměnou za to ale procesor poskytuje až 192 samostatných jader, což se dobře hodí pro hostování cloudových instancí.

Parametry procesorů AmpereOne (zdroj: ServeTheHome)

Procesory AmpereOne budou prodávány v konfiguracích se 136, 144, 160, 176 a 192 jádry. Jejich TDP má být 200 až 350 W, také tedy možná dojde k určitému navýšení spotřeby proti předchozí generaci. Mělo by jít o kompletní SoC, takže k této spotřebě už není třeba přidat žádný čipset s vlastním TDP. Procesory budou poskytovat 128 linek PCI Express 5.0 a obsahují osmikanálový řadič pamětí DDR5, tedy na úrovni procesorů Intel Xeon „Sapphire Rapids“ (zatímco Epyc 9004 „Genoa“ od AMD už má paměti 12kanálové).

AmpereOne je vyráběný na 5nm procesu TSMC a jeho fyzická implementace bude mít některé inovace. Například umí detekovat poklesy napětí a vyhnout se díky tomu potenciální nestabilitě (toto používá AMD od jádra Excavator z roku 2015). Tato technologie má současně za cíl odhalit případnou degradaci parametrů čipu časem během provozu a opět zabránit nestabilitě procesoru.

Parametry procesorů AmpereOne (zdroj: Ampere Computing)

Firma současně přešla k čipletové koncepci podobně jako AMD. Procesor AmpereOne by měl být tvořen kombinací CPU čipletu (5nm) a IO čipletů obsahujících řadiče pamětí a PCIe 5.0. Čiplety jsou propojené logikou AMBA CHI, stejně jako u čipletových Gravitonů 3. Na rozdíl od návrhu AMD jsou čiplety, zdá se, posazené jeden vedle druhého, na fotkách ani není patrné, že nejde o monolit. Podle fotek zřejmě procesor nebude mít rozvaděč tepla nebo jiný kovový kryt, místo toho se bude chladit přímo čip (čiplety) podobně jako u GPU. Půjde nicméně o procesor instalovaný do socketu (FCLGA 5964), ne pájený na desku.

Malá (prostřední?) úsporná jádra

Samotná architektura jádra, která má být nyní vlastní, je podle firmy navržená tak, aby měla vyvážený poměr výkonu ke spotřebě a také k velikosti jádra na čipu, což jsou cíle deklarované i pro předchozí licenční jádro ARM Neoverse N1. Proti tomu by prý jádro od Ampere mělo dosahovat vyššího IPC. Například má být lepší výkon při zotavení z nesprávně odhadnutého větvení. Také optimalizace práce s pamětí (memory disambiguation) má být lepší a Ampere také uvádí zlepšení prefetchingu dat do L1 cache.

Procesory budou mít odlišnou cache (64kB L1 pro data s čtyřcestnou asociativitou a 16kB L1 pro instrukce s čtyřcestnou asociativitou). Také L2 cache byla změněná, místo 1MB jádra Neoverse N1 bude použitá 2MB L2 cache (osmicestná asociativita). Tato L2 cache je stále privátní pro každé ze 192 jader, což cílí na ono cloudové použití, kdy jedno jádro často bude provozováno v samostatné instanci. Kromě toho procesory budou mít také L3 cache, která má být dvakrát větší než v předchozí generaci, s kapacitou až 64 MB.

Jádro procesoru AmpereOne (zdroj: ServeTheHome)

Firma zatím příliš dalších podrobností o architektuře jader neuvádí, měla by ale mít instrukční sadu Armv8.6+ (ještě tedy ne ARMv9) a podporovat datový typ BFloat16 užitečný pro trénování umělé inteligence (SIMD jednotky pro tyto operace jsou dvě s šířkou 128 bitů). Frekvence by prý měly být někde okolo 2,8–3,0 GHz a procesory zřejmě nebudou mít nějaké výrazné boostování dynamicky měnící frekvenci, které je normou u x86 CPU. Firma to uvádí jako výhodu, protože je výkon jádra víceméně konstantní (ale nevysoký).

Servery s procesory AmpereOne by měly být dostupné od Gigabyte, respektive jeho serverové odnože Giga Computing, SuperMicro, HP a dalších. Také by tyto procesory zřejmě měly být nabízené v cloudech velkých společností, zmíněné jsou Microsoft, Google, Alibaba, Oracle, Tencent.

Tyto procesory budou, jak už bylo zmíněno, zaměřené na cloudové uživatele a služby, s čímž výrobci serverových CPU spojují koncepci procesoru s vysokým počtem jader, která ale mají nižší jednotlivý výkon. Také Intel a AMD chystají takové „cloud native“ procesory. U Intelu to budou Xeony Sierra Forest založené na architektuře E-Core (tedy menších efektivních jader z big.LITTLE procesorů), zatímco AMD chystá Epyc „Bergamo“, který používá výkonná jádra Zen 4 i s podporou HT a AVX-512, ale optimalizovaná na větší hustotu a efektivitu výměnou za nižší frekvence (tzv. Zen4c). Zatím teprve uvidíme, jak si AmpereOne proti této konkurenci povede. Úplně slibné není, že v prezentaci firma Ampere uvádí výkonnostní srovnání se systémem na bázi Epycu 9004, jenž měl dle dokumentace značně suboptimální nastavení a zřejmě neukázal skutečný potenciál.

Podle výrobce začíná nyní sériová výroba těchto procesorů, takže by se měly dostat do prodeje a serverů během několika měsíců. Ceny zatím řečeny nebyly.

Zdroje: Ampere Computing, ServeTheHome

Jan Olšan, redaktor Cnews.cz


Flattr this!

Unikl procesor AMD „Sound Wave“, zřejmě 3nm APU s jádry Zen 6

Pomalu se blíží vydání procesorů AMD s jádry Zen 5. Měli bychom se začít dozvídat o plánech AMD po Zenu 5 a nyní se ven dostala zajímavá věc. Na LinkedIn se objevily informace o asi mobilním procesoru Ryzen s architekturou Zen 6. Protože zde sdílí informace jako součást svého CV přímo inženýři, je to dost zajímavý zdroj informací. Vypadá to z něj, že AMD nasadí čiplety i do notebooků a může to nastat už u APU „Strix Point“ se Zenem 5. Celý článok „Unikl procesor AMD „Sound Wave“, zřejmě 3nm APU s jádry Zen 6“ »

Radeon RX 7900 GRE vychází globálně. S nižší cenou a víc modely

Do nabídky grafik Radeon se zařadí další model stojící mezi Radeonem RX 7800 XT a Radeonem RX 7900 XT. Do této mezery AMD loni ještě před vydáním samotného Radeonu RX 7800 XT pustilo Radeon RX 7900 GRE, který zpočátku vypadaly jako speciální model pro Čínu. Poté se ale stejně jako Ryzen 5 7500F začaly objevovat na běžném trhu. Teď to AMD celé zoficializovalo – Radeon RX 7900 GRE vychází globálně a s větším výběrem modelů. Celý článok „Radeon RX 7900 GRE vychází globálně. S nižší cenou a víc modely“ »

Zlevnění Radeonů RX 7900 XT a RX 7900 GRE proti refreshi Nvidie

Tento týden Nvidia vydala GeForce RTX 4070 Super a v následujících dvou týdnech ji budou následovat další dva modely „Super“ refreshe generace Ada Lovelace. Zatím nevíme o tom, že by podobný refresh chystalo také AMD (které teď ovšem vydává Radeon RX 7600 XT 16GB), ale firma na modely Super od Nvidie zareagovala slevami existujících grafik Radeon RX 7000, takže i konkurenční grafické karty teď budou výhodnější. Celý článok „Zlevnění Radeonů RX 7900 XT a RX 7900 GRE proti refreshi Nvidie“ »

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *