Domov názory Google, opravte svoje chyby! | john c. dvorak

Google, opravte svoje chyby! | john c. dvorak

Video: Пацанки. 5 сезон 4 выпуск (Septembra 2024)

Video: Пацанки. 5 сезон 4 выпуск (Septembra 2024)
Anonim

ZOBRAZIŤ VŠETKY FOTKY V GALÉRII

Aby som získal svoje správy, často skenujem Google News, ktoré agreguje články z celého sveta na základe toho, čo určil „robot“. Je to všetko o tom, čo je trendy. Zvyčajne mi chýbajú najnovšie správy a úplne ignoruje dôležitý komentár, napríklad môj stĺpec. Namiesto toho sa zdá, že uprednostňuje prechod na mŕtve odkazy - čím mám na mysli Wall Street Journal , ktorý si vyžaduje prečítanie predplatného.

Dnes tomu tak je. Z CES sa objavila prelomová správa o tom, že sieť Dish Network sa pokúšala kúpiť Clearwire. Spoločnosť Google sa namiesto toho, aby odkazovala na ľubovoľné súvisiace príbehy bezplatnými a čitateľnými webovými stránkami, rozhodla, že hlavný príbeh má pochádzať z denníka Wall Street Journal .

V minulosti mala spoločnosť Google nejakú dohodu, ktorá používateľom umožnila aspoň si prečítať úvodný odsek alebo dokonca celý článok predtým, ako boli blokované platobnou bránou. Pokiaľ nepoznáte trik obchádzky (popísané nižšie), toto už neplatí. Teraz narazíte na výplatnú bránu a ste hotoví. Domnievam sa, že skutoční predplatitelia to prekonajú, ale zaujímalo by ma, ako sa tým dostanú roboti Google, aby na prvom mieste našli príbeh. Platí spoločnosť Google? Pochybujem. Takže pre robotov Google musí existovať nejaký backdoor, správne?

Toto je falošné a slúži pre používateľov služieb Google. Google prechádza všetkými týmito problémami, aby porazil ľudí, ktorí sa pokúšajú zahrať systém, ale umožňuje Wall Street Journalu tento kúsok ťahať? V podstate ide o predplatné na Wall Street Journal . Je to to, čo Google chce? Dostáva spoločnosť Google zníženie?

Pre spoločnosť Google nemôže byť ťažké vyriešiť túto nepríjemnosť. Trvalo by to minútu - päť vrcholov. Je to príliš veľa práce?

Ak má spoločnosť zabudovanú do svojej služby paywall, spoločnosť Google by ju nemala vôbec prehľadávať. Roboti by mali vedieť, že existuje výplata a jednoducho sa vyhýbať vyhľadávaniu. A áno, rád by som vysvetlil, ako presne roboti môžu prehľadávať web, ktorý je blokovaný platobnou bránou. Je to záhada.

Výplata by mala byť presne rovnaká ako súbor „robots.txt“, ktorý hovorí robotovi prehľadávača, aby odišiel. Čo sa týka vzťahu WSJ- Google, je však niečo zaujímavé. Najjednoduchší spôsob, ako zabiť všetkých robotov, je metaznačka v súbore robots.txt: ,

ZOBRAZIŤ VŠETKY FOTKY V GALÉRII

WSJ namiesto toho konkrétne blokuje určité podadresáre, ale zjavne nie všetky. A ešte čudnejšie, ak vyhľadávate presne ten istý článok v službe Google News, namiesto jednoduchého kliknutia na odkaz v preplnenom článku, získate tento článok pomocou nejakého iného mechanizmu.

Vyzývam technických čitateľov, aby zistili, čo sa s nimi deje, preskúmaním súboru robots.txt, ktorý používa WSJ . Verejný dokument je k dispozícii tu.

V každom prípade majú stránky finančné výplaty. Ak chcú hrať hry so svojím obsahom, je to jedna vec, ale malo by sa zakázať vo výsledkoch vyhľadávania rovnakým spôsobom, ako sa Google pokúša zmariť ľudí, ktorí sa pokúšajú hrať systém. Spoločnosť Google zakáže nešťastnému blogerovi pri poklopení klobúk nejaké povrchné správanie. A čo tak s rovnakým webom zaobchádzať?


Môžete sledovať John C. Dvorak na Twitteri @therealdvorak.

Viac John C. Dvorak:

Choďte mimo témy s Johnom C. Dvorakom.

ZOBRAZIŤ VŠETKY FOTKY V GALÉRII

Google, opravte svoje chyby! | john c. dvorak