Domov názory Veľké dáta sú iba veľkým podvodom john c. dvorak

Veľké dáta sú iba veľkým podvodom john c. dvorak

Anonim

Novo vznikajúci systém „veľkých údajov“ nebol nikdy definovaný žiadnym zmysluplným a definitívnym spôsobom. Je to najviac amorfný nový bzučiak, ktorý som videl desať rokov. Je to jeden z tých termínov „oko diváka“, ktorý sa používa na oživenie seminára a nakoniec na nasiaknutie investorov.

Začnime otázkou, čo znamenajú veľké údaje? Veľa údajov? Viac údajov, ako dokážete zvládnuť? Amorfné údaje? Mimo kontroly? Užitočné údaje pre analýzu? Zbytočné údaje? Prebytok informácií?

Ak čítate dosť o veľkých údajoch, je to všetko vyššie uvedené. Kľúčom nie sú údaje, ale výzva, ako zaobchádzať s údajmi a čo robiť so samotnými údajmi.

Inými slovami, ako môžeme urobiť túto obrovskú hromadu údajov, ktorú sa nám podarilo nazhromaždiť, užitočnými novými a ziskovými spôsobmi? Dátové fondy môžu pochádzať odkiaľkoľvek prostredníctvom rôznych výpočtových mechanizmov, ako sú príspevky na Facebooku, denníky NSA, zoznamy adresátov, zákazníci atď.

Tvrdil by som, že väčšina čitateľov tohto stĺpca je sama o sebe archívom veľkých údajov. Práve som si kúpil disk 3 Terabyte na zálohovanie. Mám veľa údajov na zálohovanie! Veľké dáta!

Užitočným nástrojom, ktorý si dokážem predstaviť, by bol nástroj na analýzu veľkých dát, ktorý by polícia mohla použiť na zistenie viny za náhodný zločin pri prehliadaní vašich súborov. Alebo aspoň nájdite niečo, čo by vás trápilo. Veľké dáta!

To všetko sa vracia k komentáru bývalého generálneho riaditeľa spoločnosti American Express, ktorý povedal publiku, že ak by spoločnosť chcela (a to platí pre všetky spoločnosti vydávajúce kreditné karty), mohla by použiť vaše osobné nákupné zvyklosti a tendencie na zostavenie kompletného a určite povedať, či máte pomer alebo nie. Veľké dáta!

Z toho, čo môžem povedať, to je presne to, čo veľké údaje dokážu najlepšie, špehovanie jednotlivcov.

Populárny komentár odvetvia je taký, že sa vo váš prospech použijú obrovské databázy, ktoré obsahujú informácie o vás. Áno, viete, takže získate informácie o veciach, ktoré vás skutočne zaujímajú. Cielená reklama. To prospieva všetkým!

Takto to funguje. Mám záujem o kúpu novej kamery a počujem o novej Bogus One. Čítal som článok o PCMag.com o fotoaparáte, potom idem do Amazonu a pozrite sa na ceny a recenzie používateľov. Vyzerá to, že sa mu nepáči nikto. Je to očividný kus svinstva. Všetci recenzenti sa vyhýbali fotoaparátu. Kupujúci nenávidia fotoaparát. Toto nie je kamera, ktorú chcem. Softvér na analýzu veľkých údajov sa však rozhodol na každej webovej stránke, ktorú navštívim, ponúknuť stovky reklám, pričom všetky zobrazujú kameru Bogus One. Veľké dáta!

Je to horšie ako to. Keby to išlo iným smerom a ja som sa rozhodol, že sa mi páči a chcela som kameru a skutočne som si ju kúpil, stále by som dostávala reklamy, ktoré ma povzbudzujú, aby som si kameru kúpil. Veľké dáta!

Cielená „veľká dátová“ reklama je vôbec najväčšou záťažou.

OK, nezabudnime na fiasko a prejdeme k používaniu veľkých údajov na trendy. Veľké dáta môžu nájsť rôzne ihly v rôznych kupách sena. Získate niečo také: Štyridsať percent všetkých kupujúcich Subaru je vegetariánskych / vegánskych a 80 percent z nich sú demokrati. Tento počet sa však zvýšil na 60 percent a 90 percent, ak hovoríme o Subaru Outback. Okrem toho sa zvyšuje na 99% vegetariánskeho / vegánskeho a 99% demokratického, ak je auto maľované zelenou farbou.

Teoretici veľkých údajov by mali na seminári s týmito informáciami deň v teréne. Ignoruje však všetky premenné, ktoré môžu zmeniť výpočty a trendy, ktoré sú nekonečné. Ako dlho vydrží niektoré z týchto veľkých údajov, ak sa generálny riaditeľ Subaru usadí na zhromaždenie v zelenom Outbacke a vyhlási, že „všetky veľryby musia byť zničené!“?

Neznamená to ani tak veľa na zmenu dynamiky záverov veľkých údajov. Napriek tomu, čo hovorí American Express, údaje sú v skutočnosti slepé. Preto získavate reklamy na produkty, ktoré ste už zakúpili.

Veľké údaje by vás viedli k záverom.

Ak si niekto kúpi desať kníh o tom, ako vyrobiť bombu, znamená to, že chce vyhodiť do vzduchu federálnu budovu? Čo keby bol odborníkom na likvidáciu bomby a to nebolo zahrnuté do jeho pracovného miesta ako policajný poradca? Veľké dáta zatiaľ nemôžu vedieť všetko. Nemôže vedieť, čo si myslíte. Napríklad si myslím, že fotoaparát Bogus One je na hovno. Veľké údaje to nemôžu vedieť, pokiaľ nie som vypočúvaný. A možno by som o tom klamal.

Nič z toho pre spoločnosť neznie dobre alebo zdravo. Skočiť na závery, robiť predpoklady, konať na základe nepravdivých predpokladov. Honenie verejnosti zbytočnými s.

Veľké dáta ako vysoký koncept sa nikdy úplne nedefinujú a nezomrú smrteľnú smrť. Dúfam.

Veľké dáta sú iba veľkým podvodom john c. dvorak