Domov obchodné Google zjednodušuje strojové učenie pomocou sql

Google zjednodušuje strojové učenie pomocou sql

Obsah:

Video: Querying Cloud SQL from BigQuery (November 2024)

Video: Querying Cloud SQL from BigQuery (November 2024)
Anonim

Spoločnosť Google teraz pridala možnosti strojového učenia (ML) do svojej ponuky cloudovej databázy spoločnosti Google BigQuery, spoločnosti Petabyte (PB). Nová verzia, ktorá sa teraz nazýva BigQuery ML, vám umožňuje používať jednoduché príkazy jazyka Structured Query Language (SQL) na vytváranie a nasadzovanie modelov ML pre prediktívnu analýzu.

To nie je dobrá správa pre vedcov údajov, ktorí používajú Google. Je to dobré aj pre podnikateľov, ktorí majú záujem o zdokonalenie svojich analytických schopností, pretože pridáva jedného účinnejšieho konkurenta do pomerne malého zoznamu dodávateľov, ktorí sú schopní poskytovať túto úroveň sofistikovanosti prostredníctvom cloudu. Ďalšie dve najznámejšie názvy sú Amazon's Relational Database Service a Microsoft Azure SQL a ďalšie informácie nájdete v našom nedávnom kole cloudových služieb.

Zlomom všetkých predajcov a kupujúcich dátových produktov bola vždy medzera v zručnostiach. To platí najmä pre tých, ktorí sa zaujímajú o ML a prediktívnu analýzu, pretože tieto disciplíny často vyžadujú znalosť nových technológií a dopytovanie sa jazykov.

„Pre každého vedca údajov pracujú s údajmi stovky analytikov, ktorí najviac využívajú SQL, “ uviedol pre PCMag sudhir Hasbe, riaditeľ produktového manažmentu v službe Google Cloud. Niečo muselo dať, keby sa sila armády dátových analytikov mohla odtrhnúť od úzkeho miesta, ktoré vytvorilo príliš málo a príliš prepracovaných vedcov údajov.

Odpoveď spoločnosti Google na túto dilemu nie je ničím pozoruhodným. Zatiaľ čo ML je horúci trend a objavuje sa vo výrobkoch všetkého druhu všade, stále je to pevne územie vedcov údajov. Mnoho výrobcov sa pokročilo v zjednodušovaní technológie, ale škaredá pravda je, že ju môžete veľa zjednodušiť a je stále príliš ťažké ju použiť pre viac ako 99 percent ľudskej populácie. Napriek tomu musíme byť schopní ho používať, pretože ML môže urobiť viac a urobiť to rýchlejšie, ako dokáže skupina super inteligentných ľudí.

Google zakladá ML vo vnútri Google BigQuery, aby sa nachádzal bližšie k údajom. Aplikácia prinesie funkcie ML rýchlejšie ako tradičné modely ML čiastočne, pretože analýza údajov sa môže vykonávať pri zdroji. Teraz vo verzii beta umožňuje nástroj BigQuery ML analytikom (a dátovým vedcom) spúšťať prediktívne analýzy, ako napríklad predpovedanie predaja a vytváranie zákazníckych segmentov, priamo nad údajmi, kde sú uložené. To samo osebe je úctyhodný a pozoruhodný upgrade.

Spoločnosť Google však išla ďalej ako pridaním funkcie, ktorá umožňuje analytikom údajov používať jednoduché príkazy SQL na vytváranie a zavádzanie modelov ML. V súčasnosti sú možnosťami prediktívnej analýzy modely lineárnej regresie a logistické regresie, pretože tieto dva najbežnejšie používané modely sú.

Tu je ilustrácia, ktorú poskytla spoločnosť Google s cieľom demonštrovať, ako analytici údajov využijú túto schopnosť:

Podľa Hasbe Google plánuje v priebehu času pridať do tejto schopnosti viac možností ML. „Potrebujeme počuť od našich zákazníkov, ktoré modely chcú pridať, aby sme najskôr poskytovali tie najužitočnejšie modely, “ uviedol.

Ďalšie vylepšenia Google BigQuery

Medzi hlavné zoznamy inovácií po ML patrí aj schopnosť zoskupovania, BigQuery Geographic Information Systems (BigQuery GIS), nový dátový konektor Google Sheets a nový dátový konektor Google Sheets.

Klastrovanie je tiež v beta verzii a umožňuje vytváranie klastrových tabuliek v pohybe optimalizácie údajov, ktorý spája riadky s podobnými klastrovými kľúčmi dohromady. Tým sa znižujú náklady, pretože to zvyšuje výkon a umožňuje službe Google BigQuery účtovať užívateľovi iba údaje, ktoré sú naskenované, a nie celú tabuľku alebo oddiel.

BigQuery GIS je momentálne v alfa verzii a používa sa na analýzu geopriestorových údajov. Aj keď tím služby Google Cloud spolupracoval s programom Google Earth Engine pri zostavovaní systému BigQuery GIS, musíte do tabuľky priniesť svoje vlastné geoprostorové údaje. To nie je problém vo viacerých odvetviach vrátane prepojených automobilových systémov, internetu vecí (IoT), výroby, maloobchodu, inteligentných miest a telematiky. Nehovoriac o vládnych agentúrach od Agentúry na ochranu životného prostredia (EPA) a Národnej geopriestorovej spravodajskej služby po Národnú správu pre oceánske a atmosférické prostredie (NOAA) a samozrejme všetky vojenské zložky.

BigQuery GIS používa knižnicu S2, ktorá má teraz cez miliardu používateľov prostredníctvom rôznych produktov, ako sú Google Earth Engine a Google Maps. Ak potrebujete viac geopriestorových údajov, federálna vláda ich zdieľa obrovské množstvo na GeoPlatforme.

Nový dátový konektor Tabuliek Google pravdepodobne poteší mnoho analytikov údajov jednoducho preto, že je to tak praktické na každodenné použitie. K službe Google BigQuery môžete pristupovať z Tabuliek Google (tabuľkový procesor) a používať nástroje Tabuľky Google, ako je napríklad Explore, čo je kombinovaná spolupráca, vizualizácia údajov a dotazovanie v prirodzenom jazyku.

Google BigQuery má teraz nové používateľské rozhranie (UI) aj vo verzii beta. Jedným z najzaujímavejších prvkov je funkcia vizualizácie jedným kliknutím, ktorú Google Data Studio podporuje. Všetci povedali, je to skvelé kolo vylepšení už tak elegantnej služby. Tieto aktualizácie sa budú testovať v ďalšom kole prehľadov riešenia DBaaS (Database-as-a-Service) databázy PCMag, potom čo sa chyby vyriešia a produkty sa posunuli za hranice svojich stavov alfa a beta.

PCMag EIC Dan Costa diskutuje o budúcnosti údajov:
Google zjednodušuje strojové učenie pomocou sql