Ben Nimmo: kaksteist viisi, kuidas tunda ära bot’i
Bot’id olemas selleks, et mõjutada inimesi. Selle artikli eesmärk on aidata inimestel tunda ära bot’e, et need ei saaks inimesi mõjutada, kirjutab Atlantic Councili vanemteadur Ben Nimmo.
Bot’id – automatiseeritud sotsiaalmeedia kontod, mis esitavad end inimestena – on Twitteris sagedased. Neid on miljoneid; ja nende võrgustikud võivad hõlmata poolt miljonit omavahel seotud kontot.
Bot’id võivad oluliselt kallutada debatti, eriti siis, kui nad koos tegutsevad. Neid saab kasutada selleks, et muuta mõni väljend või märksõna populaarseks, nagu DFRLab on varem näidanud; neid saab kasutada sõnumi või artikli võimendamiseks; neid saab kasutada sõnumi või teiste kasutajate ründamiseks.
Paljud bot’id ja botnet’id on suhteliselt lihtsalt avastatavad ka ilma spetsiaalse tarkvarata. See artikkel annab tosina näpunäidet, mille DFRLab on leidnud valekontode paljastamisel kasuliku olevat.
Esmased põhimõtted
Twitteri bot on lihtsalt konto, mida jooksutab jupp tarkvara, analoogselt lennuki autopiloodile. Just nagu autopilooti saab lülitada sisse ja välja, võivad ka kontod käituda mõnikord nagu bot’id ja mõnikord nagu inimestest kasutajad. Seega on allpool olevad näpunäited selleks, et tunda ära bot’i siis, kui see tegutseb bot’ina, ja neid ei saa võtta kinnitusena, et konto on bot igal ajahetkel.
His ancient bridge is thinking without the last saturated computer.
— PoetryBot (@AutoShakespeare) 29. marraskuuta 2015
Mõistatuslik postitus luulebotilt.
Mitte kõik bot'id ei ole pahatahtlikud või poliitilised. Automatiseeritud kontod võivad olla loodud ka selleks, et postitada näiteks luuletusi, fotosid või uudiseid, ja seda ilma, et infot moonutataks.
Selle kirjutise fookus on neil bot’idel, mis maskeerivad end inimesteks ja võimendavad poliitilist sõnumit.
Kõigil juhtudel on oluline tähele panna, et ükski loos nimetatud tunnustest eraldi võttes ei ole bot’i kindlaks tegemiseks piisav. Oluline on tunnuste kombinatsioon. Meie kogemuse kohaselt on peamised tunnused aktiivsus, anonüümsus ja võimendus.
1. Aktiivsus
Kõige selgem ilming selle kohta, et konto on automatiseeritud, on selle aktiivsus. Seda saab kindlaks teha, jagades profiilileheküljel olevate posituste arvu päevade arvuga, mille jooksul konto on olnud aktiivne. Täpse konto loomise päeva saab kindlaks teha, kui liikuda hiirega üle „Liitus…“ (inglise keeles Joined) märke kasutajaprofiili.
Kuvatõmmis @Sunneversets100 kontolt.
Piir, millest alates postituste arv kahtlust äratavaks muutub, võib olla erinev. Oxfordi internetiinstituudi meeskond näeb selle piirina 50 ja enam postitust päevas. See on ka laialt tunnustatud piirmäär, kuid see võib osutuda liiga väikseks. DFRLab loeb kahtlaseks 72 säutsu päevas (see tähendab keskmiselt üks säuts iga kümne minuti sees 12 tunni jooksul), ja väga kahtlaseks postitussageduseks üle 144 säutsu päevas.
Näiteks konto @sunneversets100, Kremli-meelsete sõnumite võimendaja, loodi 2016. aasta 14. novembril. 2017. aasta 28. augustiks oli see 288 päeva vana. Selle aja jooksul postitas see 203197 säutsu (täpse arvu saab leida, kui libistada hiir üle alajaotuse „säutsud“ (tweets).
See tähendab 705 postitust päevas ehk peaaegu üks säuts minutis 12 tunni jooksul, iga päev üheksa kuud järjest. See ei ole muster, mis oleks inimkäitumisele omane.
2. Anonüümsus
Teine peamine tunnus on konto anonüümsuse tase. Üldine reegel on, et mida vähem teavet konto inimese kohta annab, seda suurema tõenäosusega on tegu bot’iga. Näiteks @Sunneversets100 profiilipilt on Florences asuv katedraal, taustapilt osa demograafiagraafikust, lisaks anonüümne kasutajanimi ja anonüümne kasutajaviide. Ainus personaalne element on link Ühendriikides asuvale poliitilisele rühmitusele, kuid see ei ole isikutuvastuseks kaugeltki piisav.
Teine näide on @BlackManTrump, veel üks hüperaktiivne konto, mis postitas 2016. aasta augustist 2016. aasta detsembrini 89944 säutsu (arhiivisalvestust saab näha siin), keskmiselt 789 postitust päevas.
Kuvatõmmis @BlackManTrump arhiivist.
Konto ei anna mingisugust teavet selle kasutaja kohta. Avatar ja tasutapilt on mittespetsiifilised, asukohaks on antud „USA“ ja elulookirjeldus sisaldab vaid üldist poliitilist seisukohta. Seega ei ole migit viidet sellele, kes konto haldaja võiks olla.
3. Võimendus
Kolmas võtmetunnus on võimendus. Üks peamistest bot'ide eesmärkidest on võimendada teiste kasutajate sõnumeid neid retviitides, laikides või tsiteerides. Tüüpilise bot'i ajajoon sisaldab jada retviite ja sõnasõnalisi tsitaate pealkirjadest, ja vaid mõne või mitte ühtegi originaalset postitust.
Kõige tulemuslikum viis selle mustri kindlaks tegemiseks on kasutada vastavaid programme, aga seda saab näha ka ilma, piisab, kui klikkida säutsude ja vastuste ribale ja kerida 200 postitust tagasi. Number 200 üsna suvaline, mõeldud andmaks mõistliku ja hallatava, samas piisavalt laiapõhjalise väljavõtte. Need teemaga tegelejad, kel enam aega ja treenitumad silmad, võivad vaadelda rohkemaid postitusi.
Näiteks 28. augustiks oli @Sunneversets100 viimased 200 postitust retviidid, paljud neist Kremli väljannete RT ja Sputnik uudiste retviidid.
Seega, kui panna kokku kõrge aktiivsus, anonüümsus ja võimendus, võib nii @BlackManTrump kui @Sunneversets käitumises leida mitu tunnust, mis viitavad sellele, et tegu võib olla bot’idega.
Mööndusena tuleb märkida, et @BlackManTrump vaikis 2016. aasta 14. novembrist 13. detsembrini, ja postituste jätkudes oli nende intensiivsus väiksem ning isiklikustatud postituste määr oli suurem. Seega oleks korrektne öelda, et kuni novembri keskpaigani käitus konto nagu bot, ja mitte seda, et see on bot praegu.
Teine võimendamistehnika on bot'i programmeerimine jagama lugusid kindlatelt saitidelt ilma kommentaarideta. Otsesed jagamised on Twitteris tavaline praktika, samas aga kui konto postitab püsivalt jagamisi samalt saidilt, on see ilmselt automatiseeritud. Just nagu selle konto puhul, mis vastandus Ühendriikide president Donald Trumpile ja mis tuvastati selle aasta juulis:
4. Vähe postitusi - suur mõju
Eelmainitud bot’id saavutavad oma sihi, võimendades massiivselt üheainsa konto postitusi. Teine viis sama efekti saamiseks on botnet’i ehk bot’ivõrgu loomine. Bot’ivõrk tähendab suurt hulka kontosid, mis retviidivad ühte ja sama postitust.
Bot’ivõrgu saab kergesti tuvastada, kuna nad võimendavad ühte ja sama postitust, samas kui postituse loonud konto ei ole tavaliselt aktiivne.
Näiteks 24. augustil postitas konto @KirstenKellog_ säutsu (konto on praeguseks eemaldatud, kuid arhiivi salvestatud säutsu saab näha siit), mis ründas Ühendriikide meediaväljaannet ProPublica.com.
Tegu oli väga väikse aktiivsusega kontoga. Sel oli vaid 12 postitust, 11 neist oli juba kustutatud. Sel oli 76 jälgijat, ja see ei jälginud ise ühtegi kontot. Sellest hoolimata retviidiiti ja laigiti seda postitust enam kui 23 000 korda.
Järgmisel päeval postitas teine, samuti ilmselt Venemaalt pärit konto pea sarnase rünnaku, mis kogus üle 12000 retviidi ja laigi.
See konto on sama väikse aktiivsusega kui eelmine. Alates 25. augustist on see teinud kuus postitust ja jälgib viite teist kontot:
Ei ole usutav, et kaks sellist mitteaktiivset kontot oleks võimelised genereerima nii suurel hulgal retviite, isegi siis, kui nad kasutavad selliseid märksõnu nagu #FakeNews ja #HateGroup. Nende aktiivsuse ja mõju mittevastavus viitab sellele, et neid võimendanud kontod on osa bot’ivõrgustikust.
5. Sarnane sisu
Tõenäosust, et kontod kuuluvad samasse võrgustikku, saab kontrollida nende postitusi vaadates. Kui kõik postitavad sama või sarnase sisuga materjali ja teevad seda samal ajal, on nad tõenäoliselt programmeeritud nii tegema.
Näiteks võimaliku bot’ivorgustiku puhul, mis võimendas @KirstenKellog_ postitusi, oli paljude kontode jagatav sisu identne.
Mõnikord jagavad bot’id tervet seeriat postitusi samas järjekorras. Need kolm kontot on osa samast Trumpi-vastasest võrgustikust, mis tuvastati juulis:
Sellised identsed posituste seeriad on klassikaline näide automatiseeritud kontodest.
6. Siluettide salaühing
Kõige lihtsamaid bot’e on kõige kergem kindlaks teha, sest nende loojad ei ole vaevunud laadima üles profiilfotot. Kunagi kutsuti selliseid kontosid „munadeks“, sest toona oli profiilifotodeta Twitteri kontode ekraanipilt muna, nüüd seonduvad sellised kontod siluettidega.
Mõnede kasutajate puhul on siluetipiltidel täiesti süütu põhjus, seega ei saa selle kasutamist üksi pidada bot’i tunnuseks. Samas, kui sarnaste kontode nimekiri sarnaste retviitide või laikidega näeb välja selline…
…on see kindel märk bot’idest.
7. Varastatud või jagatud foto
Mõned muud bot’iloojad on põhjalikumad ja püüavad varjata oma anonüümsust teistest allikatest pärit fotodega. Hea test konto usaldusväärsuse kindlaks tegemiseks on otsida profiilipildiga sarnaseid fotosid. Kui kasutate Google Chrome’i, klikkige hiire parempoolse klahviga pildil ning valige „Search Google for Image“.
Kui kasutate teisi veebilehitsejaid, klikkige parempoolse klahviga pildil, valige „Copy Image Address“, kopeerige see aadress Google’i otsingusse ja valige „Search by image“.
Mõlemal juhul saate tulemuseks lehekülje, millel otsituga sarnased fotod. Nende järgi saab näha, kas konto on oma profiilipildi varastanud. Kui paljud sama võrgustiku kontod kasutavad ühte ja sama fotot, ei ole nende kontode taga ei ole päris inimesed:
8. Mida näitab nimi?
Järgmine võimaliku bot’i tunnus on kasutajaviide (kontonimi, mis algab “@” sümboliga). Paljud botid kasutavad kasutajaviitena lihtsalt algoritmi abil loodud tähtede ja numbrite kombinatsiooni. Mõnede teiste kasutajaviited paistavad olevat nimelised, kuid need ei lange kokku kasutajanimega. Mõnedel on tavalised mehenimed, kuid naiste fotod – või vastupidi.
Kõik need viitavad sellele, et konto ei ole päris. Kas need võltskontod toimivad bot’idena, sõltub nende käitumisest.
9. Twitter või Paabel
Mõned bot’idest on poliitilised ja postitavad vaid ühte kindlat vaadet toetavaid postitusi. Samas teised on loodud ärilistel kaalutlustel ja nende eesmärk paistab olevat maksimaalne tulemus sõltumata sisust. Neist viimastest on enamik mittepoliitilised, kuid neid saab kasutada ka poliitilisteks postitusteks.
Sarnastel eesmärkidel loodud bot’ide võrgustikud paistavad sageli silma väga mitmekesise keelekasutusega. Postitusi võib olla nii inglise, hispaania, araabia, suahiili, indoneesia, hiina kui ka vene keeles. Kui keegi päriselus kõiki neid keeli oskaks, oleks tal ilmselt paremat teha kui reklaamida YouTube’i videoid.
10. Reklaam
Reklaamid on klassikaline botnet’i tunnus. Nagu enne märgitud, eksisteerivad mõned botnet’id peamiselt just sellel eesmärgil, ja üksnes aeg-ajalt muutuvad nende postitused poliitilisteks. Sellisel juhul on just reklaamid need, mis nad reedavad.
Hea näide sellest on veider bot’ide võrgustik, mis retviitis poliitilisi postitusi kontolt @every1bets, mis muul ajal oli keskendunud hasartmängudele.
Kontod, mida iseloomustab sarnaste retviitide suur hulk (eriti kui postitusi tehakse paljudes eri keeltes), on suure tõenäosusega reklaami-bot’ide võrgustiku osad, mis on palgatud kasutajate poolt, kes soovivad võimendada või reklaamida oma postitusi.
11. Automatiseertud tarkvara
Veel üks tunnus automatiseeritud konto kindlakstegemiseks on lühendatud URLide kasutamine. Lühendatud URLe kasutatakse enamasti selleks, et jälgida lingi levikut, kuid nende kasutamise sagedus võib olla automatiseeritud postituse tunnus.
Näiteks üks hiljuti avastatud võltskonto nimega “Angee Dixson”, mis kasutas avatarina Saksa supermodelli Lona Rae fotot, jagas suurt hulka paremäärmuslikke postitusi. Kõik neist sisaldasid URLi lühendit ift.tt. Tegu on firma ifttt.com loodud tarkvaraga, mis võimaldab kasutajatel automatiseerida oma postitusi mitmete kriteeriumite alusel – näiteks retviitida postitusi teatud märksõnaga. Ajajoon, mis on täis ift.tt lühendeid, kuulub tõenäoliselt bot’ile.
Teised URLi lühendid võivad samuti viidata automatiseeritud kontodele, kui need lühendid esinevad ajajoonel sageli. Lühend ow.ly näiteks on seotud sotsiaalmeediahaldajaga HooSuite. Twitteri enda vahend TweetDeck võimaldab kasutajatele erinevaid URLi lühendeid, näiteks bit.ly või tinyurl.com.
12. Retviidid ja laigid
Viimase botnet’i tunnuse saab siis, kui võrrelda ühe konkreetse postituse retviite ja laike. Mõned bot’id on programmeeritud laikima ja retviitima samu postitusi; sel juhul on retviitide ja laikide arv pea identne, ja kontode grupid, mis retviidivad ja laigivad samu postitusi, on samuti sarnased nagu selle näite puhul siin:
ProPublica.com vastu suunatud rünnaku retviidid (vasakul) ja laigid (paremal).
Selle näite puhul on retviitide ja laikide erinevus kõigest 11 korral – 0,1 protsendil juhtudest. Täpselt samad kontod laikisid ja retviitisid postitust, samas järjekorras ja samal ajal. 13 000 kasutaja puhul on üsna vähetõenäoline, et tegu oleks kokkusattumusega. See näitab koordineeritud võrgustiku olemasolu, mis on programmeeritud laikima ja retviitima sama rünnakut.
Kokkuvõte
Bot’id on Twitteri lahutamatu osa. Paljud neist on täiesti lubatud ja seaduslikud. Neil, mis ei ole, on ühised jooned.
Kõige sagedasemad tunnused on aktiivsus, anonüümsus ja võimendus. Kuid on ka teisi tunnuseid: varastatud profiilipildid, tähe- ja numbrikombinatsioonist koosnevad kasutajaviited, kokkusobimatud nimed võivad olla võltskonto tunnused, just nagu ka reklaamide hulk või kasutatavate keelte suur variatiivsus.
Kasutajatel, kes suudavad kindlaks teha bot'e, on väiksem tõenäosus saada nende poolt manipuleeritud; nad võivad isegi avastada bot'ide võrgustikke ja lasta need sulgeda. Lõppkokkuvõttes on bot'id olemas selleks, et mõjutada inimesi. Selle artikli eesmärk on aidata inimestel avastada märke bot'idest. •
Ben Nimmo on mõttekoja Atlantic Council Digitaalse uurimislabori infokaitse vanemteadur. Lugu ilmus Digitaalse uurimislabori leheküljel ning avaldatakse autori ja Atlantic Councili loal.
ERR.ee võtab arvamusartikleid ja lugejakirju vastu aadressil [email protected]. Õigus otsustada artikli või lugejakirja avaldamise üle on toimetusel.
Toimetaja: Rain Kooli; Tõlkija: Urve Eslas