Site icon HWCooling.net

Opět čínské GPU ambice, výrobce procesorů Loongson chystá grafiku

Vlastní GPU k procesorům architektury LoongArch

Zřejmě je to hlavně unikátní kombinací poptávky shora po vlastním řešení a vládních subvencí, ale v Číně se v posledních letech vynořilo množství firem snažících se o vývoj vlastního GPU a grafických karet pro tamní trh. Přitom globálně se skoro dvacet let do samostatných GPU nikdo mimo Intelu (a kdysi VIA/S3) prorazit nepokusil. V Číně to ale teď zkouší i Loongson vyrábějící procesory, takže by mohl mít zajímavé kompletní řešení.

Loongson je na rozdíl od ostatních soutěžících stará firma, a nikoliv startup, už dlouhou dobu vyvíjí lokální čínská CPU, původně s variantou instrukční sady MIPS, později s vlastní novou (nebo možná lépe řečeno upravenou) nazvanou LoongArch. Zatímco vlastní CPU má tato firma dlouho, chyběla jí kompletní platforma. Jednu dobu dokonce používala se svými procesory čipset od AMD (připojený přes Hyper Transport) a celou dobu procesory Loongson vyžadují samostatné GPU.

Firma proto před časem oznámila vývoj grafického jádra a nakonec s ním má vzniknout i samostatné GPU. To má označení Loongson 9A1000. Jeho primární rolí sice bude zajistit prostě možnost připojení monitoru k počítači platformy LoongArch a provozu grafického operačního systému, pracovní plochy a obvyklých programů, ale bude mít i výpočetní výbavu a schopnost grafické akcelerace jako plnohodnotné GPU, byť ne nijak rychlé.

Loongson 9A1000

Firma nyní o grafice 9A1000 mluvila při oznámení hospodářských výsledků. Toto GPU má údajně poskytnout kartu srovnatelnou zhruba s Radeonem RX 550, což je na dnešní poměry dost stará (2017) a nevýkonná grafika, pokud jde o herní výkon. Je ale reálně stále prodávaná, podobně jako třeba GeForce GT 1030 (a asi s podobným určením, o které jde Loongsonu). Radeon RX 550 obsahuje čip Polaris 12, který poskytuje 8 CU architektury Polaris (512 shaderů) a 128bitové paměťové rozhraní. Hrubý výkon byl s takty lehce nad 1 GHz tehdy uváděné 1,2 TFLOPS ve výpočtech s přesností FP32.

Grafika Loongson 9A1000 má údajně mít podobný výkon, ale těžko říct, zda to bude platit v praxi, nebo jsou tím míněné třeba jen teoretické TFLOPS dané počtem jednotek a frekvencí. Pro GPU je obtížné přetavit takový teoretický výkon do reálného výkonu v aplikacích, což vyžaduje neobyčejně komplexní ovladače, které jsou v podstatě ten pravý důvod, proč se do rybníku Nvidie, AMD (a Intelu, který se opírá o své dlouhodobě existující integrované GPU) nedařilo nikomu dalšímu nasadit vlastní ryby. Dá se proto očekávat, že i u grafiky Loongson 9A1000 budou ovladače limitujícím faktorem a například ve hrách moc dobře fungovat nebude, vedle použití pro základní desktopové zobrazení. S tím má velké problémy i zatím nejpovedenější GPU z Číny od Moore Threads Technology. Teoreticky mělo konkurovat RTX 3060 Ti, prakticky často má problémy s GeForce GTX 1050, ne-li GT 1030.

Grafická karta Moore Threads MTT S80 (zdroj: Moore Threads)

Podle šéfa a zakladatele Loongsonu Hu Weiwu bude GPU podporovat vědecké výpočty (tedy „GPGPU“ využití programovatelných ve výpočetních jednotkách), což je dnes ovšem zcela standardní. Také má umět akceleraci AI, ale i tady pravděpodobně může být řeč o použití standardních výpočetních jednotek, byť je také možné, že firma bude s ohledem na budoucí použití od začátku do architektury přidávat i nějaké specializované AI jednotky podobné tensor core u Nvidie. Naopak není zmíněno, zda bude GPU mít podporu akcelerace enkódování a dekódování videa. Bloky pro tuto funkci lze licencovat, a nemělo by být tak těžké je začlenit, takže je asi lze očekávat.

Na trhu v roce 2025

Loongson je na sankčním seznamu USA, což mu asi znemožní toto GPU vyrábět v TSMC. Pravděpodobně tedy čipy počítají s výrobou v čínské továrně SMIC a první generace nejspíš bude na starším procesu. Podle Loongsonu bude tapeout příští rok v třetím kvartálu, tedy až za rok. Po tapeoutu typicky bývá třeba ještě nějaký rok, než se podaří produkt vydat, takže grafiky Loongson 9A1000 asi budou vydané až v roce 2025.

Dlouhé vývojové cykly byly problémem Loongsonu i u procesorů, je tedy otázka, zda tedy skutečné nasazení nebude trvat ještě déle. Nakonec ovšem nejdůležitější přínos tohoto vývoje může být, až toto GPU bude integrováno k procesorům, které tak budou konečně schopné fungovat jako kompletní SoC a již nebude vyžadováno osazování jakéhokoli samostatného GPU.

Zdroj: Tom’s Hardware

Jan Olšan, redaktor Cnews.cz