Site icon HWCooling.net

Microsoft chystá vlastní čipy pro AI konkurující GPU Nvidie

H100 architektury Hopper, 4nm výpočetní GPU Nvidie v provedení SXM5 (Zdroj: Nvidia)

Project Athena: AI hardware pro OpenAI

Vývoj umělé inteligence vstoupil v posledních měsících zprávami o ChatGPT a OpenAI a podobných projektech do obecného povědomí. Tyto pokročilé neuronové sítě a AI modely mají velké hardwarové nároky, z čehož těží Nvidia, jejíž GPU jsou pro trénování a provoz těchto neuronových sítí používány. Ale tento zájem jí také může přinést nové konkurenty. Mezi nimi je prý i Microsoft, který pro AI chystá vlastní čipy.

Tuto zprávu přinesl web The Information, který se odvolává na svědectví dvou osob, které jsou s projektem Microsoftu údajně obeznámené. Softwarový gigant podle nich chystá vlastní hardware uzpůsobený pro běh umělých inteligencí typu Large Language Model, tedy těch, které jsou schopné generovat nebo „interpretovat“ texty simulující lidského mluvčího.

Motivace Microsoftu je získat hardware, který by extrémně náročné a velké modely zvládal lépe než to, co se dá na trhu koupit volně (tedy GPU Nvidie, ale také konkurenční specializované akcelerátory, se kterými přišlo již docela velké množství různých firem). Současně Microsoft také asi chce dosáhnout úspor tím, že nebude Nvidii platit její marži. I různí konkurenti Microsoftu jako Facebook nebo Google (jehož TPU jsou známé) mají podobné programy, takže se u Microsoftu nejedná o zrovna překvapivou věc.

Nejde ale o reakci na aktuální dění, i když to možná vedlo k posílení a zrychlení vývoje. Microsoft údajně čipy pro AI tajně připravuje už od roku 2019 a nyní už je projekt, který má interní označení „Athena“, v relativně pokročilém stadiu. Podle The Information má již společnost zřejmě funkční vzorky, protože někteří zaměstnanci Microsoftu a OpenAI k nim dostali přístup za účelem jejich testování. Možná již příští rok by pak čipy Athena prý mohly být zpřístupněny většímu okruhu uživatelů v rámi Microsoftu a OpenAI, což by mohlo znamenat, že se do té doby rozběhne nějaká zkušební výroba.

Tato první generace má být údajně vyráběná na 5nm procesu TSMC, jsou tu tedy předpoklady pro špičkovou úroveň výkonu (pokud bude i samotná architektura kvalitní). I tak ale asi první generace čipů Athena může sloužit hlavně jako test a získávání zkušeností pro další generace, které jsou v plánu (firma nepracuje jen na jedné, ale na celé roadmapě postupně vylepšovaných akcelerátorů). Ty by se teoreticky pak mohly dostat třeba i do cloudu Azure, a být tak k dispozici externím zákazníkům. Ale to, jak Microsoft svůj AI hardware bude komerčně využívat, zatím jenom můžeme hádat.

Cloud TPU, AI akcelerátor Google nabízený jako služba (zdroj: Google)

Zpráva nezmiňuje přímo, zda tyto čipy budou určené pro trénování neuronových sítí, nebo pro inferenci, tedy naopak pro jejich používání třeba ve vyhledávači Bing a dalších službách. Je možné, že v první fázi se Microsoft bude soustředit jen na inferenci. Information zmiňuje, že čipy Athena asi v Microsoftu nenahradí GPU od Nvidie kompletně a firma je bude používat dál. Ale Microsoft může v případě úspěchu asi pokračovat i akcelerátory pro samotné trénování.

Vlastní čipy nejsou pro Microsoft úplně nová oblast zájmu. Firma se údajně zajímala i o vývoj procesorů ARM pro mobilní zařízení (Surface) a také pro servery. Nějaké hmatatelné výsledky srovnatelné s dobře známými procesory Graviton od Amazonu z toho ale zatím veřejně nevzešly.

Zdroje: The Information, The Verge, Tom’s Hardware