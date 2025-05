Google on viimase aasta jooksul hakanud tootvat tehisintellekti (generative artificial intelligence) oma otsingumootorisse integreerima. Praegu avaldub see kasutaja jaoks peamiselt TI resümeeritud vastustes otsingutele. Enamasti on neile lisatud lingid allikatele, mille põhjal Google'i suur keelemudel Gemini on kokkuvõte tootnud.

Nüüdseks pakuvad teised otsingumootorid kasutajatele sarnaseid TI loodud sünteetilisi vastuseid. Ühelt poolt suurendab see kasutajate mugavust, teisalt soosib "null-kliki otsinguid", mis piirduvad allikate asemel TI kokkuvõtetega. Sellel võivad olla soovimatud tagajärjed kasutajate teadmuskäitumisele ehk teadmuse omandamise, hindamise ja levitamise praktikatele üha enam sünteetilist meediat sisaldavad informatsiooni ökosüsteemis.

Google on järk-järgult muutunud allikaid vahendavast otsingumootorist kasutajaid oma teenuste juures hoidvaks platvormiks. See algas 2007. aastal Google Mapsist, Youtube'ist ning teistest Google'i teenustest pärinevate vastete lisamisega otsingutulemustele. Tsitaadid allikatest lisandusid 2012. aastal. Nüüdseks oleme jõudnud TI kokkuvõteteni ja hetkel on testimisel juturoboti laadne teenus, mis otsingutulemusi kuvamata kasutaja küsimustele vastab.

"Kahju kannatavad informatsiooni pakkuvad veebilehed, mille sissetulek sõltub külastajatest."

See on kasulik Google'ile ning teistele sama teed minevatele ettevõtetele, sest nende platvormidel püsivad kasutajad jagavad nendega rohkem oma andmeid ja näevad seetõttu ka rohkem personaliseeritud reklaami. Kahju kannatavad informatsiooni pakkuvad veebilehed, mille sissetulek sõltub külastajatest. Google on oma keelemudeli treeninud nende sisu peal, sageli ilma kompensatsioonita või luba küsimata, ning ei suuna nende poole enam ka veebiliiklust.

Chirag Shah ja Emily Bender iseloomustavad internetti informatsiooni ökosüsteemina. Selle erinevad, üksteisest sõltuvad osad on teineteisega usaldussuhetes. Infootsijad soovivad leida usaldusväärseid allikaid ning allikad püüavad end usaldusväärsena näidata. Shah ja Bender usuvad, et sünteetiline sisu lõhub neid usaldussuhteid, mõjutades kasutajate teadmuskäitumist nii, et nad on umbusklikud ka usaldusväärsete allikate suhtes.

Selleks on nende arvates mitu põhjust. Esimene on tõik, et tootev TI hõlbustab desinformatsiooni loomist, mille levikut võib lisaks sotsiaalmeediale soodustada selle sattumine suurte keelemudelite treeningandmetesse ning sealt TI kokkuvõtetesse otsingumootorites.

Teine on niinimetatud hallutsineerimine ehk suurte keelemudelite kalduvus valeinformatsiooni luua. Näiteks 2021. aasta oktoobris levis sotsiaalmeedias kuvatõmmis Google'i TI resümeeritud soovitustest, mida teha krambihoo korral. Kokkuvõte põhines Utah ülikooli kodulehel, kuid selles soovitati teha kõike, mida koduleht soovitas mitte teha. Kui suurte keelemudelite hallutsinatsioone ei saa täielikult kõrvaldada, siis soodustab see usaldamatust TI kokkuvõtete vastu, mis võib edasi kanduda ka allikatele.

Kolmas on suurte keelemudelite kallutatus, sest seda on nende treeningandmed. Shah ja Bender toovad 2021. aastast pärineva näite, kus otsingule "koledaim keel Indias" vastas Google'i TI, et selleks on kannada keel. Kuna me kipume masinaid objektiivseteks pidama, siis võivad sellised vastused kinnistada levinud eelarvamusi.

Mida raskemaks osutub inimeste loodud sisu sünteetilisest eristamine, seda olulisemaks muutub informatsiooni päritolu ning allikate usaldusväärsus. Pakkudes kasutajatele esimesena TI kokkuvõtet või asendades tulevikus otsingumootori juturobotiga ütleb Google, et kasutajad peaksid nende tarkvara informatsiooniallikana usaldama. Kuni see ei ole usaldusväärne, tuleks kasutajatel TI kokkuvõtete kõrval – või nende asemel – naasta ka allikate juurde.

