Umelá inteligencia (Artificial Intelligence - AI) čoraz viac preniká do nášho života. Pre časť spoločnosti predstavuje hrôzostrašnú budúcnosť v podobe humanoidných robotov, ktoré raz prevezmú vládu nad svetom, pre triezvejších sa stáva nielen zdrojom zábavy, skvelým pomocníkom pri každodenných činnostiach, ale aj nádejou na návrat do spoločnosti. Na najvyššej úrovni vytvára akúsi koexistenciu s ľudským mozgom, vďaka čomu nevidomí znovu vidia, hluchí počujú, paralyzovaní sa začnú hýbať...

Nekonečné možnosti

AI využívajú vedecké tímy, kozmonauti, lekári, dopravcovia, preniká do osobných počítačov i múdrych telefónov. Nie je novinkou, že smartfóny už dávno neslúžia len na telefonovanie. Práve vďaka moderným technológiám a AI dokážu prekladať cudzojazyčné texty, identifikovať interpretov neznámych skladieb, zistiť názvy rastlín či jedál, skenovať obaly kníh a poskytnúť používateľom všetky dostupné informácie o nich. Počúvajú nás, čítajú a píšu za nás, dokonca sa s nimi dá „porozprávať“. Niektoré svojich majiteľov rozoznajú po­dľa tváre, takže zadávanie hesla nie je potrebné, alebo ich možno ovládať hlasom aj gestami.

EUPHONIA V PRAXI Je síce stále vo vývoji, ale už dnes dokáže rozoznávať a zapisovať neštandardný jazyk nepočujúcich i ľudí s vážnymi poruchami reči.
EUPHONIA V PRAXI Je síce stále vo vývoji, ale už dnes dokáže rozoznávať a zapisovať neštandardný jazyk nepočujúcich i ľudí s vážnymi poruchami reči.
Zdroj: GOOGLE

Denne v nich pribúda množstvo aplikácií, z ktorých niektoré zostávajú mimo zorného uhla väčšinovej spoločnosti. Ich vý­znam si uvedomíme, až keď nás či našich blízkych dostane zdravotné postihnutie do izolácie, vylúči zo spoločnosti.
Taká je napríklad aplikácia Google Look­out, určená pre nevidiacich a slabozrakých. Je síce zatiaľ v plienkach, v angličtine a temer výhradne v telefónoch amerického technologického giganta, je však len otázka času, kedy prenikne aj do našich končín v lokalizovaných verziách.

Čo dokáže?

Pomocou kamery v smartfóne pomáha nevidiacim zorientovať sa v priestore, hlasovo pomenúva okolité objekty, určuje ich polohu, nasmeruje používateľov na ulici, upozorní na prekážky v miestnostiach, asistuje pri nákupoch, číta nápisy na informačných tabuliach, etiketách výrobkov, skenuje čiarové kódy, dokonca rozoznáva peniaze a ich hodnotu.

Stačí si telefón zavesiť na krk, stlačiť príslušnú ikonku a asistent informuje majiteľa o všetkom, čo „vidí“ okolo. Výrobcovia upozorňujú, že ich aplikácia stále nie je dokonalá a práve preto má i funkciu strojového učenia. Čím viac ľudí ju využíva, tým viac sa zdokonaľuje a rozširuje svoje možnosti.

MÚDRE TELEFÓNY Dokážu za nás čítať, písať, určia názov rastliny, tovaru, spoznajú interpretov hudby...
MÚDRE TELEFÓNY Dokážu za nás čítať, písať, určia názov rastliny, tovaru, spoznajú interpretov hudby...
Zdroj: GOOGLE

Hluchý matematik

To nie je všetko, čo chce americký technologický gigant na tomto poli ponúknuť. Podľa Svetovej zdravotníckej organizácie (World Health Organization) je na svete približne 466 miliónov nepočujúcich alebo ľudí s ťažkým poškodením sluchu. A stále ich pribúda.

Jedným z nich je rusko-americký matematik Dimitri Kanevsky. Napriek tomu, že ako ročný prišiel o sluch, na základnej škole patril k najlepším matematikom a neskôr vyštudoval na Moskovskej štátnej univerzite, kde získal doktorát z matematiky.
Počas svojej kariéry pracoval vo významných výskumných centrách, v newyorskom IBM Watson Research Center a posledných päť rokov je v spoločnosti Google. Na svojom konte má vyše 290 patentov, ku ktorým patrí aj takzvaný umelý spolucestujúci v automobiloch. Sleduje pohyby očných viečok vodičov a upozorní ich, keď vykazujú znaky ospalosti.

LOOKOUT Jedna z mála aplikácií, ktoré pomáhajú nevidomým zorientovať sa aj v neznámom prostredí.
LOOKOUT Jedna z mála aplikácií, ktoré pomáhajú nevidomým zorientovať sa aj v neznámom prostredí.
Zdroj: GOOGLE

Hlavným cieľom Kanevského však vždy bolo zdokonaľovať technológiu na rozpoznávanie reči. Tri desiatky rokov sa snaží, aby týmto spôsobom mohli nepočujúci komunikovať so svetom.

Projekt Euphonia

Systémy, ktoré umožňujú diktovať text počítačom či mobilom, existujú už niekoľko rokov. Nie sú však dostatočne rýchle na vzájomný rozhovor. A je tu ďalší problém. Nepočujúci, zvlášť tí, ktorí sa s postihnutím narodili, ale aj ďalší ľudia s vážnou poruchou reči, vyslovujú slová nezrozumiteľne a bežné počítače im nerozumejú.

Dimitri prišiel na spôsob, ako ich to naučiť. So svojím tímom zaznamenali tisíce hlasových vzoriek, ktoré zmenili na spektrogramy. Tak, aby ich umelá inteligencia dokázala spracovať. Táto cesta je náročná a každý používateľ jej musí venovať veľa času. Ako nám hovorí Dimitri, zhruba 15-tisíc fráz nahrával 25 hodín.

Jeho Live Transcribe Euphonia (personalizované rozpoznávanie neštandardnej reči) je, žiaľ, stále len prototyp. Ako funguje? Telefón majiteľa jemným vibrovaním informuje o tom, že niekto v okolí hovorí, a rozhovor v dosahu okamžite zapisuje na obrazovku. Čo je však podstatné, dokáže spracovať aj nezrozumiteľné výrazy v reálnom čase. Aj keď zápis nie je vždy presný, umelá inteligencia vyhodnotí kontext a zobrazí najpravdepodobnejšiu alternatívu.

DIMITRI KANEVSKY Trvalo dlhých tridsať rokov, kým vyvinul systém na personalizované rozpoznávanie neštandardnej reči. Dnes sa dohovorí s kolegami aj so svojimi vnúčatami.
DIMITRI KANEVSKY Trvalo dlhých tridsať rokov, kým vyvinul systém na personalizované rozpoznávanie neštandardnej reči. Dnes sa dohovorí s kolegami aj so svojimi vnúčatami.
Zdroj: GOOGLE

Splnený sen

Pre matematika to znamená splnenie obrovského sna. Spomína na časy, keď mal problém dorozumieť sa nielen s kolegami, ale aj s rodinou. Roky pracoval na algoritmoch, ktoré by situáciu zmenili. Dnes bez väčších problémov komunikuje, prednáša, a čo je pre neho najdôležitejšie, vie sa konečne „porozprávať“ so svojimi vnúčatami. „Teraz sa cítim slobodný, môžem sa baviť s kýmkoľvek,“hovorí s úsmevom.

Zároveň priznáva, že aplikácia zatiaľ nie je univerzálna. Preto stále hľadajú nové možnosti, ako ju zdokonaliť, aby porozumela úplne každému bez dlhých hodín nahrávania fráz. „Spolupracujeme pri tom s Gallaudet University, čo je jediná univerzita pre nepočujúcich v USA. Tam náš program testujú a už teraz dostávame množstvo reakcií, ako im Live Transcribe mení život,“ dodáva výskumník.

Popri projekte Euphonia pracujú v Googli na ďalších interaktívnych systémoch pre postihnutých, v ktorých je alebo bude využívaná umelá inteligencia. Napríklad prototyp Live Ready umožní nepočujúcim telefonovať. Dokáže reč z druhého konca linky prevádzať do písaného textu a, naopak, písaný text do strojového hlasu. Projektom vzdialenejšej budúcnosti je vývoj zariadení, ktoré budú spracovávať nielen gestá, ale dokonca mimiku tváre.