Odklady a oklešťování plánovaných výpočetních GPU Intelu
V posledních týdnech se objevovaly informace o údajných problémech Intelu s vývojem budoucích 4nm procesorů Meteor Lake a 3nm Arrow Lake. Firma má ale, zdá se, potíže i jinde – ve svém projektu špičkových GPU pro superpočítače. První generace Ponte Vecchio byla velmi opožděná, ale teď Intel ke všemu ještě zrušil jejich druhou generaci a také se stahují mraky nad „XPU“ Falcon Shores, kterými měly ambice Intelu v GPU vyvrcholit.
Zlověstné zprávy o osudu budoucích produktů se obvykle nejdřív objevují z různých neoficiálních zdrojů (zde je třeba zmínit, že zrovna ty o zpoždění 3nm a 4nm CPU Intel popírá). Ale v tomto případě to tak není. Viceprezident Intelu Jeff MecVeigh nyní publikoval na webu Intelu oficiální blogpost, v němž oznamuje úplná a částečná zrušení následujících dvou generací výpočetních GPU, což je prý zefektivnění roadmapy (česky by se asi dalo říct „fárplánu“) a její sladění s očekáváními zákazníků.
Intel tímto oznámil, že výpočetní GPU, která v listopadu oficiálně začala první generací akcelerátoru Intel Max (s kódovým jménem „Ponte Vecchio“), přejdou na dvouletý interval příchodu nových generací. Podle Intelu to odpovídá očekáváním zákazníků a tomu, co víc preferují, ale to asi je spíš snaha podat to co nejméně negativně. Ve skutečnosti to znamená, že je zrušená následující generace GPU. Ta již byla oficiálně oznámená pod kódovým označením Rialto Bridge loni v létě a měla zvýšit počet výpočetních jednotek (ale i spotřebu) proti Ponte Vecchio.
Rialto Bridge mělo původně vyjít letos (asi také až koncem roku, vzorky prý měly být v létě). Otázka je samozřejmě, zda Intel stíhal a nedošlo by třeba zase ke zpoždění jako u Ponte Vecchio. Rialto Bridge bylo inkrementální evolucí Ponte Vecchio a plánované zvýšení výkonu asi nebylo na novou generaci moc velké oproti tomu, o kolik se zvyšuje výkon v nových generacích Nvidie a AMD. Nicméně zrušení znamená, že proti těmto konkurentům Intel bude mít jen předchozí (opožděnou) generaci Ponte Vecchio, takže jeho pozice bude ještě horší.
Situace XPU je teď nejistá
Nicméně zrušení Rialto Bridge není jediná znepokojivá věc na tomto oznámení. Intel totiž ťal i do důležitější následující generace Falcon Shores. Ta měla být extrémně významná, protože místo aby šlo o samostatné GPU, už mělo dojít k integraci do spojeného akcelerátoru „vše v jednom“ s procesorovými jádry, podobně jako to plánuje AMD s Instinctem MI300 (a podobný případ je asi i Nvidia Grace Hopper Superchip, byť tam je zřejmě integrace menší). Intel proto Falcon Shores označoval jako „XPU“.
Falcon Shores mělo dle předchozí roadmapy vyjít v roce 2024, jenže teď Intel uvádí, že je cíleno na uvedení v roce 2025. Došlo tedy k jeho posunutí, nebo alespoň k nastavení realističtějšího termínu (pokud už Intel věděl, že bude mít zpoždění).
Nejde ale zřejmě jen o zpoždění. Patrick J. Kennedy z webu ServeTheHome dokonce uvádí, že Intel udělal kompromisy v plánované architektuře. V onom roce 2025 prý má vyjít verze Falcon Shores, která nakonec nebude XPU, ale pořád jen samostatné výpočetní GPU připojené k procesoru zvlášť přes PCI Express a případně další koherentní propojovací logiku, tedy jako u Ponte Vecchio a zrušeného Rialto Bridge. Opět nevýhoda pro Intel v konkurenci s Nvidií a AMD, které zmíněná integrovaná řešení mají uvést letos.
Just as a quick note on this one. I got a call from Intel clarifying the roadmap. The Falcon Shores XPU in 2025 is actually GPU only now. The vision of XPU unified HPC compute like NVIDIA and AMD are doing in 2023 seems to now be a post-2025 focus for Intel
— Patrick J Kennedy (@Patrick1Kennedy) March 3, 2023
Unifikované řešení XPU není úplně mrtvé a architektura Falcon Shores s ním počítá, ale pokud XPU verze vyjde, pak až v následujících letech (2026?). Intel se asi rozhodl nekumulovat najednou moc rizik. Falcon Shores má být nová architektura, takže asi chce nejprve vyrobit jednodušší implementaci v podobě jen GPU a až v dalším kroku podstoupit náročný úkol integrace s CPU.
Vývoj Intel Flex také okleštěn
Intel má vedle výpočetních GPU Max, která používají vlastní design čipů (přesněji, skládají se z velkého množství čipletů), pro servery ještě jednu linii grafik, pojmenovanou Intel Flex. Ta používá stejné čipy, jako herní grafiky Arc, a její role v serverech jsou hlavně multimediální operace nebo se dají použít pro virtualizaci SR-IOV. I zde ale roadmapa prošla řezem.
Intel má teď na trhu loni uvedenou generaci kódově označenou Arctic Sound-M, která je založená na čipech s architekturou Alchemist (Flex 140 má 2048 shaderů ve dvou čipech ACM-G11 a 75W TDP, Flex 170 má ACM-G10 s 4096 shadery a 150W TDP).
Po tomto měla přijít generace Lancaster Sound, snad letos. Ta je ale také zrušená a opět má být používaná dvouletá kadence, kdy příští generace asi vyjde až v roce 2024 – má jít o generaci Melville Sound. Zrušení mezikroku má Intelu umožnit soustředit víc prostředků na Melville Sound. Tato GPU prý mají přinést výrazný architektonický skok a pokrok ve funkcích a výkonu.
Úklid po Rajovi Kodurim – nebo jenom šetření?
Podle blogpostu jde o zjednodušení a zeštíhlení/zefektivnění (streamlining) roadmapy, které také umožní klientům „maximalizovat jejich investice do nynější generace GPU“. Takovéto formulace jsou vždy volené vágně a je otázka, zda má smysl snažit se je nějak vykládat. Ale přece jenom trošku budí pochybnosti. Zrušení jedné plánované generace a posunutí té následující na pozdější termín, nebo alespoň její osekání o důležitou část plánovaných funkcí, to nelze interpretovat jinak, než že Intel dodá klientům méně, než původně plánoval. Na druhou stranu toto může být i v koordinaci s budoucími zákazníky, kteří mohli Intelu signalizovat nezájem o zrušené produkty. Intel také uvádí, že toto umožní investovat více do následujících GPU, a to by měla být pravda.
Building on this momentum, with close customer engagement on their requirements, we are simplifying and streamlining our data center GPU roadmap. This enables our customers and the ecosystem to maximize their investments on currently available Max Series and Flex Series GPUs, while ensuring next-generation products deliver significant leaps in performance and developer productivity. […]
With a goal of maximizing return on investment for customers, we will move to a two-year cadence for data center GPUs. This matches customer expectations on new product introductions and allows time to develop their ecosystems.
Jeff McVeigh je vedle role jednoho z viceprezidentů také dočasným generálním ředitelem pro segment Accelerated Computing and Graphics (AXG). Tu Intel v prosinci přeorganizoval tak, že týmy pracující na herních grafikách Arc přičlenil ke klientské divizi (tedy nejhlavnější části vyvíjející procesory Core) a týmy pracující na výpočetních GPU, kterých se týká nynější zpráva, zase k serverové divizi. Tehdy ztratil pozici šéfa AXG známý Raja Koduri a Jeff McVeigh nyní zastává jeho místo.
Co si z toho vzít? Dost možná Intel zhodnotil původní plány a roadmapu a shledal, že Raja Koduri měl nereálné cíle a Rialto Bridge a původní verzi Falcon Shores by firma nezvládla vyvinout a dodat v termínu, takže by zase došlo k ostudu nesoucímu zpoždění jako u Ponte Vecchio – u druhé a třetí generace produktu by to ale bylo pro reputaci asi ještě horší. Na druhou stranu, nemusí to nutně být tak, že Raja Koduri v šéfování selhal a nedokázal dosáhnout toho, čeho měl. Intel totiž také v posledních kvartálech přistoupil ke škrtům a omezování některých aktivit kvůli slabým finančním výsledkům. Je proto možné, že důvodem okleštění roadmapy a zrušení Rialto Bridge je to, že na vývoj teď bude méně prostředků nebo od těchto produktů nebyl očekáván finanční úspěch.
Více: Intel rozpustil divizi samostatných GPU, týmy se rozdělí. Raja Koduri spadl na nižší pozici?
Zdroje: Intel, Tom’s Hardware, ServeTheHome (Twitter)
Jan Olšan, redaktor Cnews.cz
⠀