Video: Google Assistant vs Apple Siri: Smart Assistant Battle 2020 Edition! (November 2024)
Inteligentní asistenti - Siri, Google Now, Cortana a podobne - sa pred pár rokmi prešli zo zvedavosti a spoločenských trikov na základné nástroje, ktoré mnohí ľudia používajú v každodennom živote. Minulý týždeň som upustil od konferencie Inteligentných asistentov v New Yorku, ktorú predstavil Opus Research, a bol som ohromený pokrokom, ktorý softvér dosahuje v rôznych odvetviach vrátane pokroku finančných, poisťovacích a zdravotníckych spoločností pri budovaní konkrétnych agentov.,
Zakladateľ Opus Research Dan Miller vysvetlil, že mnohé zo základných technológií, ako napríklad rozpoznávanie reči, existujú už viac ako 20 rokov. Aj keď v poslednej dobe videl niekoľko veľkých vylepšení, nie revolúciu, povedal: „Sme na evolučnej ceste“, s množstvom produktov na kontinuu s rôznymi schopnosťami. Poznamenal, že existujú stovky podnikových inteligentných asistentov, ktoré možno použiť na jednoduchú textovú konverzáciu v jednoduchej angličtine pomocou pevného súboru údajov a na veci, ako je napríklad navigácia na webových stránkach alebo často kladené otázky. Na opačnom konci spektra je pravdepodobne len niekoľko desiatok „dynamických aplikácií, ktoré ovplyvňujú človeka“, ktoré sú viac konverzačné a kontextovo orientované.
Miller poukázal na aplikácie, ktoré na konferencii získali ceny. Amtrak Julie začala pred rokmi pôsobiť ako interaktívny agent telefonických služieb s hlasovou odozvou, ale teraz sa vyvinula v agenta, ktorý pracuje na webových stránkach, aby usmerňoval cestujúcich cez Amtrak.com na základe agenta spoločnosti Next IT. Telefónica Mexico má agenta menom Nico, ktorý má avatar a tiež poskytuje podporu prostredníctvom Twitteru a Facebooku založeného na platforme AgentBot. ING Netherlands má aplikáciu Inge, ktorá vám umožní overiť si zostatok na vašom bankovom účte alebo preniesť peniaze prostredníctvom hlasu pomocou hlasovej biometrickej technológie od spoločnosti Nuance.
Čestné uznania zahŕňajú aplikácie zdravotnej starostlivosti, ako je napríklad aplikácia, ktorá vám pomôže vybrať si plán zdravotnej starostlivosti. Medzi ďalšie aplikácie, ktoré som na výstave počul, patrí Domino's Pizza, ktorá má aplikáciu s názvom Dom, ktorá vám umožňuje používať hlas na objednanie pizze; a BMW, ktoré má virtuálneho agenta ako súčasť svojho finančného financovania Up2drive.
Brett Beraneck spoločnosti Nuance hovoril o tom, ako pokroky v oblasti neurónových sietí s hlbokým učením zlepšili veci, ako je porozumenie prirodzenému jazyku, ako aj rozpoznávanie hlasu, a ako sa to teraz spája, aby sa umožnil oveľa väčší záujem o túto oblasť. Asistentka spoločnosti Nina od spoločnosti Nance bola prvým príkladom a od tej doby sa rozrástla na množstvo konkrétnych aplikácií, od interaktívnych systémov hlasovej odozvy v poisťovniach po nákupné aplikácie. Každá z týchto aplikácií má inú osobnosť v závislosti od toho, čo sa vám snaží pomôcť.
Jednou z veľkých nových funkcií, o ktorých hovoril, bola hlasová biometria, pri ktorej váš hlas nahrádza heslo. Hovoril o tom, ako spoločnosti ako ING v Európe vyvíjajú agentov, ktorí používajú nielen rozpoznávanie hlasu a spracovanie prirodzeného jazyka, ale začínajú používať hlas aj na rozpoznávanie volajúceho. Povedal, že to bolo bezpečnejšie a prirodzenejšie ako tradičné heslo.
Aj keď sa nedávne štúdie obávali, že by takéto systémy mohli oklamať hlasové nahrávky, spoločnosť Nuance poznamenala, že súčasná technológia zahŕňa funkcie zamerané na zisťovanie anomálií zo zaznamenaného hlasu a poukázala na iné štúdie, ktoré mali iný pohľad. Okrem toho, dizajnéri môžu používať rôzne úrovne biometrie hlasu pre rôzne funkcie, ako napríklad jednoduché rozpoznávanie na kontrolu stavu účtu alebo požiadavku, aby ste opakovali náhodnú sekvenciu slov pre významné prevody peňazí.
Zdá sa, že hlasová biometria trochu priťahuje. Na sympóziu Gartner, ktoré sa konalo minulý týždeň, zasadnutie týkajúce sa „skvelých prípadov zákazníkov“ vo finančných službách zahŕňalo aplikáciu Citibank, ktorá túto funkciu využívala.
MyWave má asistenta s názvom Frank, ktorý má byť aktivovaný viacerými podnikmi, aby ste s nimi mohli komunikovať konverzačnejšie, než aby si každý podnik nechal rozvíjať svoj vlastný. Medzi prvé použitia patrí banka Nového Zélandu a aplikácia s názvom Saveawatt, ktorá vám pomôže vybrať si vášho dodávateľa elektriny.
Generálna riaditeľka Geraldine McBride vysvetlila, že spoločnosť sa snaží vytvoriť asistentov, ktorí preklenú priepasť medzi zákazníkmi a aplikáciami služieb, s tým, čo nazýva „vzťahy riadené zákazníkom“ alebo CMR, rotácia tradičných aplikácií CRM. Jeden veľký rozdiel, povedala, spočíva v tom, že zákazník má na starosti všetky svoje údaje, a nie obchod.
Ďalšia relatívne nová spoločnosť, Expect Labs, má produkt s názvom MindMeld, ktorý funguje ako backend k viacerým spoločnostiam, ktoré chcú ponúknuť hlasové rozhranie, ktoré nahradí tradičné rozhrania a spracuje otázky a odpovede. To by sa mohlo použiť na rôzne aplikácie, napríklad na sledovanie televíznych relácií, keď sa len opýtate na meno a máte viacnásobné systémové požiadavky na systémový dopyt. (Požiarna televízia Amazonu má niektoré z týchto funkcií, ale nie je integrovaná do vášho káblového set-top boxu, zatiaľ čo jedným z investorov v spoločnosti Expect Labs je káblová spoločnosť Liberty Global.)
Generálny riaditeľ Tim Tuttle vysvetlil, že MindMeld má tendenciu používať rozpoznávanie reči, ktoré je už k dispozícii vo väčšine zariadení, a namiesto toho sa zameriava na porozumenie prirodzenému jazyku a vytváranie grafu znalostí dostupných informácií. Uviedol, že firma sa snaží škálovať systém tak, aby obsahoval viac informácií z viacerých zdrojov, a rozobrať hierarchie rôznych kategórií informácií, ktoré sú súčasťou väčšiny takýchto systémov. Skutočne pochopiteľné otázky znamenajú schopnosť porozumieť zámeru v rôznych kategóriách.
Jedna vec, ktorú som počul od mnohých účastníkov, boli štatistiky naznačujúce, že približne 10 percent všetkých webových vyhľadávaní sa teraz vykonáva prostredníctvom spravodajských agentov. (Priekopník AI Andrew Ng povedal, že to platí minulý rok pre hlasové vyhľadávanie v Baidu a niekoľko ľudí uviedlo, že to platí aj pre spoločnosť Google, ale nepočula som žiadne potvrdenie z prvej ruky.)
Čo sa týka budúcnosti, Miller spoločnosti Opus Research povedal, že ešte treba vykonať veľa práce. Základná presnosť systémov má veľa priestoru na zlepšenie, najmä pri prechode z toho, čo hovoríte, na to, čo máte na mysli, čo robiť. Na konferencii sa zmienil o predhovore generálneho riaditeľa spoločnosti Xerox PARC Stephena Hoovera, ktorý povedal, že systémy sú dnes až do 90 percent presné v pochopení toho, čo máme na mysli, ale že 10 percent je stále problém, pretože to je to, čo si väčšina ľudí pamätá, keď sa zaoberajú systém. A Miller povedal, že existuje priestor na lepšiu personalizáciu, pretože ak systém vie, s kým hovorí, môže to priniesť lepšie výsledky. Napríklad poznamenal, že Facebook vie, kto systém používa, pretože ste prihlásený; a povedal, že hladké vykonávanie tohto postupu s väčším počtom agentov bude stále dôležitejšie.
Je to určite fascinujúca kategória a očakávam, že všetci strávime oveľa viac času rozhovormi s našimi telefónmi a počítačmi a interakciou s agentmi, ktorí nie sú celkom ľudskí. Považujem to za jeden z najzaujímavejších trendov v oblasti výpočtovej techniky v týchto dňoch.