V posledných rokoch sme videli niekoľko zaujímavých nových prístupov k vysokovýkonnému počítaču, najmä posun od tradičných veľkých procesorov a smerom k zoskupeniam x86 CPU s urýchľovačmi alebo koprocesormi na urýchlenie konkrétnych druhov výpočtov. Vychádzajúc z minulotýždňovej superpočítačovej show sme videli, ako sa spoločnosť Intel snaží integrovať svoj koprocesor Xeon Phi s tradičným serverovým procesorom Xeon, aby sa uľahčilo programovanie; Nvidia predstavuje novú verziu svojho urýchľovača Tesla GPU; a Micron podporujúce veľmi odlišný druh procesora pre ešte špecializovanejšiu prácu s počítačom. A to všetko sa dialo v čase, keď urýchľovače a koprocesory začali dominovať na zozname 500 najrýchlejších počítačov na svete, čo viedlo niektorých odborníkov, aby navrhli, že existujúce referenčné hodnoty týmto procesorom prikladajú príliš veľkú váhu.
Nvidia vychvaľovala svoje úspechy pomocou dosiek urýchľovača Tesla, veľkých klastrov GPU pripojených k hlavným procesorom buď od spoločnosti Intel alebo AMD. Takéto čipy sa používajú v mnohých systémoch vrátane systému Titan v Národnom laboratóriu Oak Ridge a nového systému Piz Daint vo Švajčiarskom národnom superpočítačovom výpočtovom centre. Ešte zaujímavejšie je, že spoločnosť hovorí, že dosky spoločnosti Tesla sú vo všetkých 10 najlepších systémoch na najnovšom zozname zelených 500 energeticky najúčinnejších superpočítačov na svete. Všetky tieto systémy využívajú aj Intel Xeons s výnimkou Titanu založeného na AMD Opteron, ktorý je druhým najrýchlejším systémom na svete v Top 500, ale na zozname Green 500 je oveľa nižší.
Spoločnosť Nvidia okrem toho oznámila partnerstvo s IBM s cieľom ponúknuť svoje urýchľovače Tesla v systémoch založených na architektúre IBM Power. Spoločnosť IBM už dlho ponúka svoje sériové výkony a systém BlueGene / Q založený na procesoroch Power prevádzkuje okrem iného systém Sequoia v Národnom laboratóriu Lawrence Livermore a systém Mira v Národnom laboratóriu Argonne. Spoločná spolupráca spoločností IBM a Nvidia by mala v budúcnosti viesť k niektorým zaujímavým systémom.
Na výstave spoločnosť oznámila svoju Tesla K40, ďalšiu generáciu svojej rady GPU akcelerátora. Spoločnosť uviedla, že ponúkne 1, 4 teraflopy s dvojnásobnou presnosťou, 12 GB pamäte (šírka pásma 288 GBps) a funkciu GPU Boost, ktorá jej umožňuje v niektorých situáciách pracovať rýchlejšie. Toto je inovácia z existujúcej série Tesla K20 pomocou rovnakého základného návrhu GPU vyrobeného na 28nm technológii.
Medzi ďalšie iniciatívy patria spôsoby uľahčenia programovania GPU, vrátane CUDA 6, ktorá teraz podporuje zjednotenú pamäť, umožňujúc vývojárom pristupovať k pamäti ako jeden fond, aj keď CPU a GPU pamäť zostávajú oddelené. Spoločnosť tiež podporuje OpenACC, štandardnú kolekciu smerníc pre kompilátory, ktorá hovorí systému, ktoré časti programu (napísané v C / C ++ a Fortran) môžu byť vyťažené z procesora na urýchľovač, aby sa zvýšil výkon.
Prístup spoločnosti Intel, ktorý nazýva architektúrou mnohých integrovaných jadier (MIC), je veľmi odlišný. Kombinuje niekoľko malých jadier x86 do jedného čipu nazývaného Xeon Phi. Spoločnosť Intel už niekoľko rokov upozorňuje na to, že programovanie všetkých počítačov typu x86 je jednoduchšie, aj keď je zrejmé, že vývojári sa stále musia zameriavať priamo na architektúru. Súčasná verzia Xeon Phi, nazývaná Knights Corner, je navrhnutá na použitie ako urýchľovač spolu s tradičnejšími serverovými čipmi Xeon E a používa ju celý rad špičkových systémov vrátane čínskeho Tianhe-2 (v súčasnosti najrýchlejší systém) na svete) a systém Stampede v Centre pokročilých výpočtov na Texaskej univerzite.
Na výstave spoločnosť Intel oznámila novú verziu s názvom Knights Landing, ktorá bude fungovať aj ako samostatný procesor, ktorý sa zmestí do štandardnej architektúry stojana a bude priamo spúšťať operačný systém bez potreby hostiteľského procesora (napríklad Xeon E). To by mohlo byť veľmi dôležité pri rozširovaní príťažlivosti Xeon Phi, najmä na trhu pracovných staníc. Znova je to určené na to, aby vývojárom softvéru uľahčilo ich prezeranie ako jedného CPU. Knights Landing bude k dispozícii ako samostatný procesor aj ako doska PCI Express, ktorá sa zmestí do existujúcich systémov ako upgrade z Knights Corner.
Existujú aj ďalšie významné zmeny týkajúce sa rytierskych pristátí vrátane pridania „takmer pamäte“, efektívne DRAM, ktorý sa ponúka na balíku s procesorom, a teda môže poskytovať oveľa väčšiu šírku pásma ako tradičná pamäť DDR, ktorá je obmedzená rýchlosťou autobus. (Aj to sa zrýchľuje, ale nie toľko.) Toto nie je prvý krok v tomto smere; Spoločnosť IBM ponúka už roky integrovanú technológiu DRAM vo svojej architektúre napájania a spoločnosť Intel sama vkladá integrovanú pamäť DRAM pre grafiku do verzií Iris Pro svojej rodiny Haswell Core. Myslím si však, že v nasledujúcich rokoch uvidíme oveľa viac úsilia týmto smerom.
Medzitým jeden z najzaujímavejších nových prístupov pochádza od spoločnosti Micron, ktorá oznámila nový urýchľovač s názvom Automata Processor, ktorý bol navrhnutý hlavne na riešenie zložitých neštruktúrovaných problémov s údajmi.
Spoločnosť Micron to opísala ako ponuku látky pozostávajúcej z desiatok tisíc až miliónov spracovateľských prvkov spojených s riešením konkrétnych úloh. Spoločnosť, jeden z najväčších výrobcov pamätí DRAM a NAND, tvrdí, že toto využije spracovanie založené na pamäti na vyriešenie zložitých úloh v oblasti výpočtovej techniky v oblastiach ako je zabezpečenie siete, bioinformatika, spracovanie obrazu a analytika. Spoločnosť Micron bude spočiatku distribuovať procesor Automata na doske PCI-Express, aby s ním vývojári mohli pracovať, ale spoločnosť plánuje predať procesory na štandardných pamäťových moduloch známych ako DIMM alebo ako jednotlivé čipy pre vstavané systémy. V niektorých ohľadoch to znie podobne ako programovateľné hradlové polia (FPGA), ktoré sú vyladené tak, aby riešili konkrétne aplikácie zahŕňajúce párovanie vzorov.
Spoločnosť uviedla, že spolupracuje s firmou Georgia Tech, University of Missouri a University of Virginia na vývoji nových aplikácií pre Automatu. Hoci spoločnosť neoznámila termín konečných produktov, predpokladá sa, že budúci rok vyjde súprava na vývoj softvéru spolu so simulačnými nástrojmi.
Automaty znie ako nedokončená práca a je pravdepodobne príliš skoro na to, aby sme vedeli, aké široké sú aplikácie, ale je to zaujímavý prístup.
Celkovo vidíme vývoj vysokovýkonných výpočtov. Nie je to tak veľa rokov, najrýchlejšími počítačmi boli väčšinou iba obrovské množstvá štandardných serverových procesorov. Systémy IBM Blue Gene a systémy založené na Sparc (ako napríklad počítač K v RIKEN Advanced Institute for Computational Science v Japonsku, ktorý používa procesory Fujitsu Sparc) stále predstavujú veľkú časť trhu, vrátane piatich z 10 najrýchlejších systémy na svete. V posledných rokoch sa však hybnosť posunula smerom k koprocesoru, pričom systémy využívajúce Tesla a novšie urýchľovače Xeon Phi tvoria viac z novších systémov. Vďaka vylepšeniam týchto systémov, novým partnerstvám, lepšiemu softvéru a niektorým novým prístupom sa trh so superpočítačmi môže v budúcnosti veľmi líšiť.