Domov recenzia Ako môžu podniky vnímať trh veľkých dát

Ako môžu podniky vnímať trh veľkých dát

Video: Až 70 % ľudí si nevie nájsť vysnenú prácu, lebo im chýba prax. Slovák prišiel na to, ako to vyriešiť (November 2024)

Video: Až 70 % ľudí si nevie nájsť vysnenú prácu, lebo im chýba prax. Slovák prišiel na to, ako to vyriešiť (November 2024)
Anonim

Podniky nezískavajú žiadne body za to, ako efektívne funguje ich infraštruktúra alebo ako vysoko dokážu zhromaždiť všetky veľké údaje, ktoré zhromažďujú. Čo sa počíta, je kvalita analytických a spravodajských informácií, ktoré údaje produkujú.

V posledných niekoľkých rokoch je Hadoop slovo, ktoré sa stalo najviac synonymom prijímania, spracovania a transformácie údajov. Tento otvorený zdrojový rámec pre distribuované ukladanie a spracovanie údajov vytvoril svoj vlastný podnikový priestor a integroval svoju cestu do všetkých hlavných cloudových platforiem. Hadoop nie je ani zďaleka jedinou technológiou Big Data, o ktorej by ste mali hovoriť, ale stala sa taká, na ktorej je postavených mnoho ďalších.

Problém pre podniky je, že priestor Hadoop je plný možností distribúcie a nástrojov, a ako vysvetlil riaditeľ výskumu spoločnosti Gartner Nick Heudecker, mnoho z nich vyzerá rovnako. Heudecker, ktorého výskum pokrýva správu informácií vrátane priestorov Big Data a NoSQL, uviedol, že ak sa pozriete na všeobecné možnosti spracovania údajov, veľa predajcov ponúka veľmi podobné funkcie.

Rozklad trhu

Existujú tri hlavné začínajúce podniky Hadoop, ktoré sa zaoberajú čistou hrou - Cloudera, Hortonworks a MapR - a všetky sa v roku 2015 neustále rozrastali. Podľa spoločnosti Gartner má každý približne 700 zákazníkov, dáva alebo berie 10 percent, čím sa svetový trh dostáva medzi 2 100 - 2 400 zákazníkov spoločnosti Hadoop na celom svete. Všetky tri ponúkajú bezplatnú aj podnikovú úroveň svojej distribúcie Hadoop a každá z nich významne prispieva z otvorených zdrojov na projekty pod hlavičkou Apache Software Foundation (ASF).

„Naše údaje naznačujú, že 44% používateľov Hadoopu je v súčasnosti neplatených, “ uviedol Heudecker. „Existuje jasný vodca? Nemyslím si to. Všetci berú trhový podiel, pretože je to veľmi nový priestor.“

V posledných mesiacoch sa veľká časť konkurencie medzi týmito tromi stala konkurenciou v oblasti analytických schopností a kreatívnych spôsobov integrácie Apache Spark, open-source nástroja na spracovanie veľkých dát s prípadmi použitia od dátových tokov v reálnom čase až po strojové učenie., Spoločnosť MapR nedávno oznámila MapR Streams ako súčasť „konvergovanej dátovej platformy“, ktorá integruje Hadoop, spracovanie streamov založených na technológii Spark a analytiku. Spoločnosť Hortonworks zaviedla aktualizáciu Hortonworks Data Platform (HDP) s analýzou Spark v pamäti a spoločnosť Cloudera ponúka prostredníctvom integrovanej iniciatívy pre jednu platformu množstvo integrácií s otvoreným zdrojovým kódom Spark spolu s ponukou školiacich kurzov Spark.

„V priestoroch správy informácií a informačnej infraštruktúry sa toho veľa deje a nie je to všetko Hadoop, “ vysvetlil Heudecker. „Za modelom Sparkovho rýchleho a pamäťovo orientovaného spracovania údajov je obrovská dynamika, hoci vývoj Spark je stále v ranom štádiu. Spark bude ďalšou lingua franca v spracovaní údajov, podobne ako dnes SQL, a určite vykazuje známky toho, že má nejaké nohy ako do nej investuje čoraz viac spoločností. ““

Heudecker tiež zdôraznil dôležitosť cloudových hráčov v Big Data; technickí giganti, ktorí integrovali technológiu Hadoop a ďalšie technológie veľkých dát do svojich existujúcich ponúk Infraštruktúra ako služba (IaaS).

Spoločnosť Amazon Web Services (AWS) využíva svoju službu Amazon Elastic MapReduce (EMR) pre orchestráciu Hadoop na báze cloudu. Spoločnosť Microsoft ponúka celý rad veľkých dátových služieb v rámci svojej cloudovej platformy Azure a spolupracuje so spoločnosťou Hortonworks na svojej službe HDInsight na správu aplikácií Apache Hadoop, Spark, HBase a Storm, spolu s analytickým softvérom Azure Data Lake a SQL založeným na SQL. Spoločnosť IBM ponúka v rámci svojej ponuky IBM Open Platform pre Hadoop aj IBM BigInsights, analytický balík, ktorý sa má spustiť, spolu so spravovaným serverom Hadoop a Apache Spark-as-a-service v cloudu Bluemix. Zoznam pokračuje a podniky nájdu použiteľnejšie prípady použitia v cloude.

„Odhadujeme, že samotná spoločnosť AWS má okolo 5 000 zákazníkov, takže je to viac ako dvojnásobok zákazníckej základne čistých hier, “ uviedol Heudecker. „Jednou z výhod prechodu do cloudu je to, že dostanete ekosystém. Čistú distribúciu Hadoop môžete získať v ktorejkoľvek z ponúk IaaS. MapR je k dispozícii vo všetkých oblakoch, na ktoré môžete myslieť, okrem IBM; rovnaké pre Cloudera a Hortonworks. Nevideli sme, že sa dostupnosť cloudu stáva príliš veľkým faktorom pri výbere medzi jedným dodávateľom a druhým. ““

Výber stratégie podnikových údajov

Spoločnosť Heudecker pri investovaní do riešení na spracovanie a analýzu údajov pre malé a stredne veľké podniky (MSP) aj pre rastúce podnikové podniky uviedla, že rozhodujúcim faktorom je, ktorá platforma môže poskytovať najvyššiu úroveň služieb. Podľa spoločnosti Gartner je najväčšou výzvou pre podniky priepasť v oblasti zručností - zisťovanie, kto bude platformu spravovať, keď bude nainštalovaná a nasadená.

„Ak spoločnosti hľadajú partnera pre dátovú platformu, kto im pomôže s prijímaním údajov? Kto im pomôže vybudovať analytickú aplikáciu? Pokiaľ ide o tri čisto hrajúce Hadoopers, hodnotiace kritériá bývajú okolo zrelosť nástrojov riadenia a konzol, nástrojov správy údajov a výkonnosti. ““

Ďalším zaujímavým aspektom výberu platformy Hadoop je nedostatok lojality. Spoločnosti prehodnocujú svoju platformu Hadoop tak často, ako každých 6 až 12 mesiacov, aby zistili, či sú komponenty na spracovanie údajov stále vhodné, a to kvôli tomu, ako rýchlo sa priestor mení a ako málo sa veľkí hráči diferencovali. Heudecker povedal, že 20 percent spoločností, o ktorých hovoril, má v svojich dátových centrách alebo cloudoch spustené viaceré distribúcie spoločnosti Hadoop. Buď nechal rôzne tímy zvoliť si platformu výberu alebo zámerne diverzifikovať, aby nedošlo k uviaznutiu iba s jednou distribúciou Hadoop.

Tento druh diverzifikovaného portfólia platforiem prispieva k tomu, čo Frank Buytendijk, viceprezident spoločnosti Gartner Research and Distinguished Analyst so zameraním na digitálnu stratégiu, nazýva „informáciami ako aktívum“. Rovnako ako vy nemôžete podnikať bez kapitálu, práce, materiálu a fyzických alebo virtuálnych zariadení, Buytendijk povedal, že nemôžete podnikať bez informácií.

„Boli sme zvyknutí pozerať sa na podnikanie z hľadiska troch tokov: primárnym tokom bol tovar, sekundárnym tokom boli peniaze a terciárny tok boli informáciami na zabezpečenie súladu tovaru a peňazí. Teraz vo väčšine podnikov je to naopak Hlavným tokom sú informácie, od identifikácie a konfigurácie až po marketing obsahu, atď. Či už hovoríte tomu, že veľké dáta alebo nie, na tom skutočne nezáleží. “

„Veľké údaje“ sú zastarané

Buytendjik povedal, že veľké dáta nevidí ako samostatnú technológiu pre podniky, ale ako jednu tému alebo spôsob myslenia v rámci vašej celkovej digitálnej stratégie.

„Neverím, že mám stratégiu veľkých dát, “ povedal Buytendjik. „Podnikateľská stratégia už bez digitálnych komponentov sotva existuje, takže verím v digitálnu stratégiu, v ktorej všetky druhy technológií poskytujú kritické schopnosti. Patria sem mobilné, sociálne, cloudové, IoT, inteligentné počítače a veľké dáta.“

Heudecker verí, že začneme hovoriť o „veľkých údajoch“ čoraz menej, pretože teraz sú to len údaje. Je to spôsob podnikania. Obrovské objemy a vysoká rýchlosť údajov už nie sú také skľučujúce.

„Big Data sa opäť stáva súčasťou informácií a analýz, “ uviedol Heudecker. „Kategória Big Data sa úprimne nerozlišuje. Vždy sa nás pýtame na veľkosť trhu s veľkými dátami, ale čo to dokonca znamená? Big Data nie je v skutočnosti trh, je to koncept. Pre podnikanie, premýšľanie o Big Data ako niečo jedinečné a zvláštne, ktoré sa radikálne líši od toho, čo ste predtým urobili, je chyba. V tomto okamihu sú údaje jednoducho normálne. ““

Ako môžu podniky vnímať trh veľkých dát