Domov Dopredu myslenie Veľké zmeny sú konečne na obzore pre superpočítače

Veľké zmeny sú konečne na obzore pre superpočítače

2024

Pri spätnom pohľade na superpočítačovú konferenciu ISC 17, ktorá sa konala tento týždeň, sa zdá, že v superpočítačovom svete sa v najbližších rokoch objavia nejaké veľké vylepšenia, ale aktualizácia dvojročného zoznamu 500 najrýchlejších superpočítačov na svete sa príliš nelíšila od predchádzajúcu verziu.

Najrýchlejšími počítačmi na svete sú stále dva masívne čínske stroje, ktoré sa umiestnili na špičke zoznamu už niekoľko rokov: počítač Sunway TaihuLight z čínskeho Národného superpočítačového centra vo Wuxi s trvalým výkonom Linpack viac ako 93 petaflop (93 tisíc biliónov plávajúcich bodov) operácie za sekundu); a počítač Tianhe-2 z čínskeho Národného superpočítačového centra v Guangzhou, s trvalým výkonom viac ako 33, 8 petaflop. Zostávajú najrýchlejšími strojmi s obrovským odstupom.

Nové číslo tri je systém Piz Daint od Swiss National Supercomputing Center, Cray systém, ktorý používa Intel Xeony a Nvidia Tesla P100s, ktorá bola nedávno inovovaná tak, aby jej Linpack dosiahol trvalý výkon 19, 6 petaflop, čo je dvojnásobok jej predchádzajúceho súčtu. To ho posunulo hore z čísla 8 na zozname.

Tým sa zníži špičkový americký systém - Titanský systém v Národnom laboratóriu Oak Ridge - na štvrté miesto, čo je prvýkrát za dvadsať rokov, že v prvých troch nie je žiadny americký systém. Zvyšok zoznamu zostal nezmenený, zatiaľ čo USA stále tvoria päť z desiatich najvýznamnejších celkov celkovo a Japonsko dva.

Aj keď najrýchlejší zoznam počítačov sa príliš nezmenil, inde sú veľké zmeny. V zozname energeticky najúčinnejších systémov Green 500 sa zmenilo deväť z prvých desiatich. Na vrchole je systém Tsubame 3.0, upravený systém HPE ICE XA v Tokijskom technologickom inštitúte založený na jadre Xeon E5-2680v4 14, prepojení Omni-Path a Tesla P100 od spoločnosti Nvidia, čo umožňuje 14, 1 gigaflopov na watt. Toto je obrovský skok od spoločnosti DGX Saturn V od spoločnosti Nvidia, založenej na platforme DGX-1 firmy a čipoch P100, ktoré boli v novembrovom zozname číslo jedna, ale tentoraz číslo 10, na 9, 5 gigaflops / Watt. P100 je v deviatich z desiatich najlepších systémov Green500.

Prelomiť 10 gigaflopov / watt je veľký problém, pretože to znamená, že hypotetický exaflop systém postavený na dnešnej technológii by spotreboval menej ako 100 megawattov (MW). To je stále príliš veľa - cieľ je 20 - 30 MW pre exaflop systém, ktorý vedci dúfajú, že ho uvidia v najbližších piatich rokoch - je to však obrovský krok vpred.

Podobne ako zoznam 500 najlepších, aj v podobných zoznamoch s rôznymi referenčnými hodnotami došlo len k malým zmenám, napríklad k porovnávaniu s vysokovýkonnými konjugovanými gradientmi (HPCG), kde stroje majú tendenciu vidieť iba 1 až 10 percent svojho teoretického maximálneho výkonu a kde sú najvyššie systém - v tomto prípade stroj Riken K - stále dodáva menej ako 1 petaflop. Na tomto zozname sa posunuli systémy TaihuLight aj Piz Daint. Keď vedci hovoria o exaflopovom stroji, majú tendenciu znamenať benchmark Linpack, ale HPCG môže byť realistickejší, pokiaľ ide o výkon v reálnom svete.

Vývoj GPU ako urýchľovača - takmer vždy pomocou procesorov Nvidia GPU, ako je P100 - bol v posledných rokoch najviditeľnejšou zmenou na týchto zoznamoch, po ktorej nasledovalo zavedenie vlastného urýchľovača Intel, viacjadrového Xeon Phi (vrátane najnovšia verzia rytierskych vykládok). Aktuálny zoznam Top 500 obsahuje 91 systémov, ktoré používajú urýchľovače alebo koprocesory, vrátane 74 s GPU Nvidia a 17 s Xeon Phi (ďalšie tri používajú obidva); jeden s GPD AMD Radeon ako urýchľovač a druhý, ktorý používa mnohojadrový procesor od japonského dodávateľa PEZY Computing. Ďalších 13 systémov teraz používa Xeon Phi (Knights Landing) ako hlavnú spracovateľskú jednotku.

Ale mnohé z väčších zmien superpočítačov sú stále na obzore, keď začíname vidieť väčšie systémy navrhnuté s ohľadom na tieto koncepty. Jedným z príkladov je nové zariadenie MareNostrum 4 v superpočítačovom centre v Barcelone, ktoré sa zaradilo do zoznamu 500 najlepších na čísle 13. Toto je systém Lenovo založený na pripravovanej verzii Xeon Skylake-SP (oficiálne Xeon Platinum 8160 24). -core procesor). Zaujímavé sú tri nové zoskupenia „vznikajúcich technológií“ plánované na najbližšie roky, vrátane jedného klastra s procesormi IBM Power 9 a GPU Nvidia, ktoré sú navrhnuté tak, aby mali špičkové spracovateľské schopnosti nad 1, 5 Petaflopov; druhá vychádza z verzie rytierskeho kopca Xeon Phi; a tretí založený na 64-bitových procesoroch ARMv8 navrhnutých spoločnosťou Fujitsu.

Tieto koncepcie sa používajú v mnohých ďalších veľkých superpočítačových projektoch, najmä vo viacerých sponzorovaných Ministerstvom energetiky USA ako súčasť spolupráce CORAL v Oak Ridge, Argonne a Lawrence Livermore National Labs. Na prvom mieste by mal byť Summit v Oak Ridge, ktorý bude využívať procesory IBM Power 9 a GPU Nvidia Volta, a mal by byť dodávaný cez 150 až 300 špičkových petaflop; nasledovaná Sierrou v Lawrence Livermore, ktorá má dodať vyše 100 špičkových petaflop.

Potom by sme mali vidieť superpočítač Aurora v národnom laboratóriu v Argonne, ktorý vychádza z verzie Xeon Phi z oblasti Knights Hill a postavil ho Cray, ktorý má dodávať 180 špičkových petaflop. Systémy CORAL by mali byť funkčné a beh ďalší rok.

Medzitým čínske a japonské skupiny plánovali aj upgrady, väčšinou využívajúce jedinečné architektúry. Malo by byť zaujímavé sledovať.

Ešte väčší posun sa zdá byť o niečo ďalej: posun smerom k strojovému učeniu, zvyčajne na masívne paralelných procesorových jednotkách v samotnom procesore. Zatiaľ čo číslo Linpack sa týka 64-bitového alebo dvojitého presného výkonu, existujú triedy aplikácií - vrátane mnohých aplikácií založených na hlbokej neurónovej sieti -, ktoré lepšie pracujú pri výpočtoch s presnosťou na jeden alebo dokonca na polovicu. Využívajú to noví spracovatelia, napríklad nedávne oznámenie spoločnosti Volta V100 od spoločnosti Nvidia a pripravovaná verzia Xeon Phi pre Knights Mill. Na výstave spoločnosť Intel uviedla, že verzia, ktorá má byť vo výrobe v štvrtom štvrťroku, by mala mať nové súbory inštrukcií pre „výpočty s nízkou presnosťou“ nazvané Quad Fused Multiply Add (QFMA) a Quad Virtual Neural Network Instruction (QVNNI)., Predpokladám, že tieto koncepcie by sa mohli uplatniť aj na iné architektúry, ako sú napríklad TPU spoločnosti Google alebo FPGA spoločnosti Intel a čipy Nervana.

Aj keď tento rok neuvidíme veľké zmeny, budúci rok by sme mali očakávať viac. Koncepcia stroja na exascale (1 000 teraflopov) je stále v dohľade, aj keď bude pravdepodobne zahŕňať ešte väčšie zmeny.