"Snackable AI teeb põhimõtteliselt helil põhineva sisu otsitavaks. Nii nagu me oleme harjunud kasutama Google'is sõnal ja pildil baseeruvat informatsiooni, siis Snackable missiooniks on teha audiosisu inimkonnale paremini otsitavaks," rääkis Joller Vikerraadio saates "Huvitaja".

Inimkond asub aina enam helilist sisu tarbima, olgu see siis podcastide, audioraamatute, raadiosaadete, Youtube'i videoblogide või personaalsete helisalvestuste kaudu. Nutiassistendid, nagu Alexa, Siri või Google Assistant vähendavad vajadust vaadata ekraanile ja suurendavad kuulamise osatähtsust. See muudabki oluliseks ka vajaduse luua süsteem, mis oleks võimeline miljarditest tundidest audiomaterjalist välja otsima kasutaja soovitud sisu.

Helilõigu kuulamisel saab inimene osaks nii kõnelejate tunnetest kui ka salvestusel valitsenud õhkkonnast. "Martin Luther King'il oli kuulus kõne, kus ta rääkis oma unelmast. Kogu tema hääl, intonatsioon ja inimeste mass, kogu see tagapõhi annab edasi emotsiooni. Kui seda lihtsalt tuimemalt raamatust loed, ei anna ta edasi emotsionaalset siduvust selle inimese, sündmuse või selle kõne olulisusega," rääkis Joller.

Snackable AI-l on ka teine pool. Otsitud materjalist koostatakse uus helilõik, kuhu koondatakse kasutajale välja otsitud helisisu kompaktse kokkuvõttena. Olukorras, kus inimene ekraani vaadata ei taha või ei saa, tuleb otsingule saadav vastus esitada loogilisena nii, et kuulaja saab aru, millise helilõigu ja milliste rääkijatega on tegu. Selleks peab tehisintellekt eelnevalt aru saama nii sellest, millise saatega on tegu ning kes selles kõnelevad. Näiteks, kui kõnelejaid on kaks, on tegemist tõenäoliselt intervjuuga.

Praegu keskendub Snackable enam professionaalselt loodud helile, ehk hea kvaliteediga müravabas helistuudios salvestatud sisule, millest on arvutil lihtsam tehisintellektile arusaadavat materjali luua.

Snackable AI ei ole Jolleri jaoks esimene helimaailmas tegutsev iduettevõte. "Snackable asutamine oli seotud minu eelmise firmaga, mis oli proaktiivne assistent nimega Scarlet. See oli nutisekretär, kes pööras kogu inimese ja masina vahelise suhtluse peapeale. Kui masin on tark, miks sunnib ta mind siis küsimusi esitama. Ta peaks ise aru saama minust, minu graafikust, huvidest ja vajadustest ning minule õigel ajal vastuseid andma," rääkis Joller. Mobiiliäpp Scarlet näitas, et inimesi köitis just info lühidus, konkreetsus ning personaalsus. "Kui me läksime meediafirmade juurde, et uurida, kus sellist sisu veel on, mida rakenduse ümber luua, siis me nägime, et helimaailm on viimane must kast. Kus andmeid helide ümber on väga vähe, võib-olla on sul pealkiri, võib-olla mingit muud infot veel, aga tegelikult sa selle heli sisse ei näe," kirjeldas Joller.

"Tulemas on audioaastad. Kõnel baseeruvad rakendused on väga kiiresti kasvamas ja meil on väga võimas potentsiaal viia inimesteni õige sisu õiges kontekstis läbi nende rakenduste," rääkis Joller, kes tänu hiljutisele suurinvesteeringule, mille firma pälvis, plaanib Eestis peagi laieneda ning asuda kõnest aru saavat tehisintellekti arendama just Eestis.

Ta lisas, et ettevõte tahab just Eestis võtta tööle veel heal tasemel masinõppe- ning keeletöötluse spetsialiste ja ka tarkvara arendajaid.