Domov názory Svätý grál prekladu hlasu, teraz na skype john c. dvorak

Svätý grál prekladu hlasu, teraz na skype john c. dvorak

Video: EKG/ECG Interpretation (Basic) : Easy and Simple! (November 2024)

Video: EKG/ECG Interpretation (Basic) : Easy and Simple! (November 2024)
Anonim

Keby ste od počiatku mikroprocesora sledovali počítačovú revolúciu, vedeli by ste, že existuje veľa prvých sľubov, ktoré sa ešte musia splniť.

Jednou z nich je nepretržitá preložená reč, kde hovoríte niečo anglicky a opakuje sa v inom jazyku, napríklad v španielčine, v reálnom čase. Aj keď stále prebieha, Microsoft je teraz o krok bližšie k Skype Translator, ktorého prvá fáza sa začala tento týždeň.

Ak sa to priblíži k práci a nejde o vtip, je to produkt desaťročia. Skype Translator v súčasnosti podporuje preklady zo španielčiny do angličtiny a z angličtiny do španielčiny, ale bude nasledovať viac jazykov.

Typickým problémom týchto druhov vecí je neuveriteľná úroveň obtiažnosti. Ešte som nevidel slušný prekladový balík, ktorý dokáže dobre fungovať preklady z jedného textu na druhý. Preklad reči má úplne odlišnú úroveň problémov, najmä v reálnom čase.

Spoločnosť Microsoft má film zobrazujúci dve deti hovoriace po španielsky a anglicky, vďaka čomu vyzerá dobre. Ale videl som podobný systém demonštrovaný spoločnosťou IBM takmer pred 20 rokmi, ktorý nikdy nevidel denné svetlo. Verzia spoločnosti IBM bola vyvinutá v 90. rokoch minulého storočia, keď existovala mánia na rozpoznávanie reči, ktorú viedla spoločnosť Lernout & Hauspie, spoločnosť, ktorá sa stala zlomenou - predtým, ako v roku 2001 prekonala škandál s podvodom. Predtým však kúpila každú technológiu reči spoločnosti, vrátane Dragon Dragon, Berkeley Speech Technologies, Fonix, Dictaphone a ďalších. Spoločnosť Microsoft mala 8% podiel v spoločnosti L&H a skončila s niektorými technológiami ako dar na rozdelenie bankrotu.

Teraz sa náhle objaví Skype Translator. Náhoda? V každom prípade však celá táto technológia trvala príliš dlho, kým sa dostala k tomuto bodu.

Pozrite sa na nešťastné preklady počítačov typu text-text, ktoré vykonáva spoločnosť Google a ďalšie. Text neodstraňuje a nemôže sa vyhnúť najzreteľnejším chybám. Nič z toho sa nepribližuje k zložitosti prekladu reči, čo znamená náročné spracovanie signálu.

Som zberateľ vína a často navštevujem webové stránky francúzskeho vinárstva. Moja francúzština je v poriadku, takže často si preklad zapnem, aby som si stránky rýchlo prečítal. Sme tu v roku 2014 a žiaden z prekladateľov nemôže zistiť, že prekladom zámku Château Margaux je Château Margaux, nie Castle Margaux. Aké zložité je vyhnúť sa prekladu bežne používaného slova používaného vo vlastnom mene, ako je napríklad zámok, zvyčajne odkazujúci na konkrétne vinárstvo, do slova zámok? Zrejme to nie je možné. Všetci to robia.

Aké ťažké je napísať do kódu, ktorý prekladateľovi hovorí, že je na webovej stránke o víne Bordeaux, nejakú výnimku? Na tomto mieste slovo zámok neznamená zámok. Prekladateľ sa často pokúsi dekódovať aj zvyšok názvu zámku so smiešnymi výsledkami. Najlepšie, čo môžete so prekladom textu spravidla urobiť, je obťažovať sa, čo web hovorí.

Opýtajte sa sami seba: ak je text tak zložitý, ako bude spoločnosť Microsoft riadiť reč?

Je to takmer nemožné aj v rovnakom jazyku. Využite telefónnu službu Google Voice. Má funkciu prevodu textu na text. Nikdy som nedostal hlasovú správu, ktorá by sa blížila tomu, čo osoba skutočne povedala. Ani raz.

Priznám sa, že v tichej miestnosti, keď hovoríte zreteľne a zreteľne, sa hlasové rozpoznávanie darí dobre. Používam ju na prijímanie textových správ v telefóne s Androidom. V skutočnom rozhovore však nikto takto nehovorí. Obdivujem spoločnosť Microsoft za to, že sa to podarilo dosiahnuť. Ale nebude fungovať tak, ako je inzerované.

To znamená, že je to aspoň niečo, s čím si môžete zahrať. Mohlo by to dokonca spustiť novú generáciu výskumu. Takže sa nebudem príliš sťažovať.

Každý to chce. Vráťme sa k tomu.

Svätý grál prekladu hlasu, teraz na skype john c. dvorak