Domov recenzia Použitie matematiky na nájdenie najhlúpejších (a najchytrejších) komentárov webu

Použitie matematiky na nájdenie najhlúpejších (a najchytrejších) komentárov webu

Obsah:

Video: 16. Tvorba webu (HTML a CSS) - Další možnosti psaní CSS a proč je nepoužívat (Septembra 2024)

Video: 16. Tvorba webu (HTML a CSS) - Další možnosti psaní CSS a proč je nepoužívat (Septembra 2024)
Anonim

obsah

  • Použitie matematiky na nájdenie najhlúpejších (a najchytrejších) komentátorov webu
  • Do zoznamu…
  • Spodok hlavne

Ľudia kedysi dúfali, že World Wide Webbernet spojí ľudí zo všetkých oblastí života v novom duchu digitálnej kumbayaness. Aj keď nás technológia skutočne spojila bezprecedentnými spôsobmi, oprávňuje aj tých, ktorí majú malý záujem o zdvorilosť, ale s veľkým množstvom voľného času anonymne šíria nahnevané, fakticky nedostatočné slovné zásobníky ALL-CAPS po celom internete.

Sekcie komentárov z celého webu rezonujú hovormi „GAY !!!“, „LIBTARD !!!!“, „NAZI !!!“ a „RON PAUL 2016 !!!!“. To je spôsob, akým internet diskutuje o naliehavých problémoch dňa. (A nezabúdajme na sprosté konšpiračné teórie, ktoré sa preplietajú do úplne neprepojených miest.)

Ale pýtali ste sa niekedy, ktorá internetová komunita v komunikačných schopnostiach najviac chýbala ? Určite máte v tejto veci názor. Keď pomyslíme na týchto ľudí, môžeme vymenovať aspoň jednu webovú stránku.

Bohužiaľ, akýkoľvek pokus o vytvorenie hierarchie komentárov musí byť poskvrnený škvrnou (alebo aspoň vzhľadu) zaujatosti. V skutočnosti však môže existovať spôsob, ako odstrániť všetku predsudky a ideológiu z tejto záležitosti a využiť chladnú, početne orientovanú analýzu relatívnej hlúposti rôznych komunít s komentármi.

„Kalkulačka čitateľnosti“ na stránke Online-utility.org prideľuje skóre podľa množstva rôznych testov čitateľnosti, ako je napríklad index Gunning Fog Index.

Tieto skóre sú výsledkom rovníc, ktoré zohľadňujú kvantifikovateľné atribúty, ako je počet slov, viet a slabík. Rovnica pre index zbrane vyzerá takto:

Skóre sa zhoduje s počtom rokov formálneho vzdelania v USA, ktoré by človek musel ľahko porozumieť textu. Skóre 12 by teda znamenalo, že spĺňa úroveň čítania niekoho v dvanástej triede, zatiaľ čo skóre 4 znamená, že text bol na úrovni čítania štvrtej triedy a tak ďalej.

Aby sme videli, ako by to mohlo platiť pre web, vzali sme vzorku sekcií komentárov ôsmich populárnych webových stránok z rôznych kútov anglicky hovoriaceho digitálneho internetu: (uvedené v abecednom poradí) CNN, Fox Nation, Gawker, New York Times, PCMag (áno, vrátane nás), Reddit, The Atlantic a YouTube. Roztočili sme ich pomocou kalkulačky čitateľnosti, aby sme sledovali chladné tvrdé fakty o tom, kto mal najchytrejších a najhlúpejších komentárov.

Zistenia vás môžu prekvapiť.

Po prvé, rýchly prehľad našej metodológie:

Pre každú webovú stránku zahrnutú do nášho prieskumu sme vybrali tri veľmi komentované príbehy, ktoré sa použili ako súbor údajov. Ak je k dispozícii, vybrali sme si z najobľúbenejšej sekcie webu (alebo z podobného zoznamu „najpopulárnejších“ príbehov - niečo, čo naznačovalo, že tieto kusy boli vysoko aktívne).

Ďalej sme skopírovali prvých 50 komentárov z každého príbehu do dokumentu programu Word. Potom sme pomocou komplexnej série operácií „nájsť a nahradiť“ oddelili text komentára od všetkých cudzích zvyškov lokality, ako sú avatary, mená komentárov, časové podpisy atď.

Potom nám zostal dokument plný čistého, neregulovaného textu generovaného používateľmi, ako je tento:

Ďalej sme kombinovali destilovaný text do hlavného textu, ktorý sme zaradili do „Kalkulačky čitateľnosti“.

Ako rýchly príklad sme analyzovali prvú kapitolu klasického Mobyho Dicka Hermana Melvillu (dostupnú ako dokument vo verejnej doméne) a zistili sme, že dosiahol nasledujúce skóre čitateľnosti.

Index Gunning Fog: 12.02

Coleman-Liau Index: 8, 62

Úroveň stupňa Flesch-Kincaid: 10.16

ARI (Automated Index Readability Index): 9.97

Index SMOG: 11, 33

V tomto prípade Fog skóre naznačuje, že text je na úrovni čítania vyššieho stredoškoláka. Pri väčšine spisov zameraných na širokú verejnosť lingvisti považujú ideálne skóre za niekde okolo 7 alebo 8.

Zvyšok indexov (ktoré každý používa na výpočet svojho skóre rôzne rovnice) zistil, že človek by mohol potrebovať kdekoľvek medzi ôsmym a jedenástym stupňom vzdelania, aby si ľahko prezrel Mobyho Dicka .

Mám to? OK, čítajte ďalej a zistite, ako sa umiestnili najlepšie stránky na webe.

Pokračujte v čítaní: do zoznamu>

Použitie matematiky na nájdenie najhlúpejších (a najchytrejších) komentárov webu