Vikipedist Raul Veede: “Entsüklopeediat lugeda on väga hariv!”

Posted on

Raul Veede on eestikeelse Vikitsitaatide projekti kõige usinam kaastööline, aga ka pikaajaline vikipedist. Käesolevas intervjuus räägib Veede tsitaatide jõust, entsüklopeediate tähtsusest ühiskonna arengus ja tehnoloogia arenguga seotud väljakutsetest. See on intervjuu teine osa ning esimest poolt näeb siit.

Sel kümnendil on sinu tähelepanu teravik olnud Vikitsitaatide juures, kus oled alustanud viimase viie aastaga üle 10 000 sisulehekülje ja aidanud projekti elule äratada. Kuidas sa Vikitsitaadid enda jaoks avastasid ja mis sind selle projekti juures tegutsemas hoiab? 

Vikitsitaatide olemasolust teadsin tegelikult juba ammu, aga ei olnud kunagi huvi tundnud. See projekt loodi Vikipeediast veidi hiljem ning alguses loodud sisu kvaliteet oli väga kehv. Võib öelda, et kui meie Eva Lepikuga sinna jõudsime, siis ulus seal kõle tuul ja kedagi teist väga ei olnudki.

Mäletan, et esimest korda jõudsin Vikitsitaatidesse siis, kui oli Marju Lepajõe juubel ja vajasin tsitaati. Avastasin, et temast ei olegi artiklit – tuli see ise kirjutada. Nii hakkasingi vähehaaval Tsitaatides toimetama. Suurema osa ajast me oleme Evaga seal toimetanud kahekesi, vahepeal käib mõni veel ja lisab midagi, paar kaastöölist on sagedamad. Proovisime alguses võtta šnitti ka teiskeelsetest Vikitsitaatide projektidest, kuid peagi selgus, et väga palju pole võtta, sest Vikitsitaatide projekti puhul on jäänud põhialused läbi mõtlemata ja neid ei ole kuskil hiljemgi selgelt paika pandud. Siin ei kehti automaatselt Vikipeedia reeglid. Vikitsitaatides on olulised erinevused võrreldes Vikipeediaga, kuna Vikitsitaadid ei ole entsüklopeedia, vaid tsitaadikogu. Näiteks kas või autoriõiguslik situatsioon on siin täiesti teine, kuna me toetume tsiteerimisõigusele, mitte ei tee sisukokkuvõtteid ega jutusta allikate sisu ümber. See paneb allikaviidete täpsusele ja kontrollitavusele erilise rõhu.

Eestikeelsed Vikitsitaadid on keeleversioonide seas nüüd artikliarvult kuuendal kohal. Vahepeal olime viiendal, aga viimasel aastal-paaril on mul olnud vähem aega ja jaksu seal tegutseda. Alustuseks tootsin aastaid massiliselt märksõnu, et neid kategoriseerides tekiks süsteem; selgus, et see töö kergitas meid kenasti ka n-ö edetabelis. Muidugi on kvaliteet kvantiteedist olulisem, kuid samas tahaks ikkagi end teiste konteksti asetada ja ühtseid kvaliteedimõõdikuid keegi ei kogu, kvantiteedi kohta on Metas aga tabel. Eks iga selline võrdlus teistega tekitab tegijateski adrenaliini, nii et väga ei tahaks enam allapoole langeda. Ikka on uhke tunne, kui Eesti projekt on esimeste seas. Teisalt – kui tahta pühendada rohkem aega kvaliteedile, jääb kvantiteedi jaoks vähem, sellega tuleb leppida. Tegijaid on vähe, kõike korraga ei saa.

Mõned valdkonnad Vikitsitaatides vajavad rohkem katmist, nagu näiteks Eesti kirjandus. Kõigi keemiliste elementide või maailma maadegi kohta võiks olla oma artiklid. Samas kui neid kiiruga teha, siis oleks ikkagi hea, kui lehel oleks ikkagi rohkem kui üks tsitaat ja samuti võiks olla definitsioon. Viimase osas oleme võtnud suuna, et Vikitsitaatides ei pea definitsioon olema tingimata entsüklopeedilises laadis, sest Vikitsitaadid ei ole entsüklopeedia. Näiteks võib kasutada aforistlikku stiili. Kes tahab sissejuhatavaid fakte, leiab need Vikipeediast.

Mis on Vikitsitaatide projekti sõnum? Mis on selle tähtsus? Miks seda peaks kasvatama ja arendama?

Minu teada ei ole keegi kunagi määratlenud, miks Vikitsitaadid üldse on. See oli üks esimesi projekte, mis Vikipeedia kõrvale tehti. Ei küsitud, kellele see on mõeldud või kuidas see on kasutatav ja miks seda teha. Hiljemgi pole olnud keeleversioonide üleseid katseid põhialuseid paika sättida või eesmärke püstitada, igaüks pusib omas nurgas. Oleme püüdnud aru saada, kes võiks olla eesti Vikitsitaatide potentsiaalsed kasutajad, aga me tegelikult ei tea seda, kuna uuringud puuduvad. Minu teada ei ole isegi Wikimedia Foundation kunagi ette võtnud ühtki konkreetselt Vikitsitaatidele suunatud arendust ega uuringut. 

Alguses tundus, et teemegi seda projekti rohkem enda jaoks, kuid nüüd oleme juba kohanud inimesi, kes Vikitsitaate teavad, loevad ja sealt midagi otsivad. Mida rohkem on sisu, seda rohkem on kasutajaid. Ilmselt on tsitaadikogul omajagu kasutusviise hariduses ja mitmesuguste tekstide kirjutamisel, projekti paisudes ka tsitaatide ja viidete täpsuse kontrollimisel, ent kõige peale meie koostajatena küllap ei tulegi. Kes ja milleks kasutavad kõiki neid tsitaadiraamatuid, mis täidavad riiuleid raamatupoodides ja raamatukogudes? Ma ei tea, aga tahaks teada. Ja igasugune tagasiside oleks ülimalt põnev.

Millele keskendud Vikitsitaatide projekti juures? Mida tahaksid ise enim teha ja mida vajab projekt ise?

Meie jaoks on ikkagi oluline autoriõiguste järgimine, et kõikide tsitaatide puhul oleks viidatud autorile ja allikale. Püüame üldse juurutada täpsemat ja korrektsemat tsiteerimiskultuuri. Ei piisa sellest, et on suvaline tsitaat interneti teemal ja selle alla kirjutatud “Oscar Wilde”.

Samuti on oluline, et tsiteerimisel ei rikutaks autoriõigust. Tsiteerida tohib motiveeritud mahus, mida juriidilises keeles tõlgendatakse enamasti nii, et maht peab olema nii väike kui vähegi võimalik. Teisalt on autoriõiguses olemas printsiip, mis ütleb, et autori mõtet ei tohi moonutada. See aga on vastuolus motiveeritud mahu niisuguse tõlgendusega ehk nõudega tsiteerida minimaalses mahus. Tsitaadi kärpimise tõttu kontekstist välja võtmine võib moonutada autori mõtet. Näiteks tsiteeritakse alatasa Tammsaare lausena “Tee tööd ja näe vaeva, siis tuleb ka armastus”, aga paljud ei tea, et sellele Andrese ütlusele järgnes Indreku vastus: “…aga armastus ei tulnd, teda põle tänapäevani Vargamäel.” See muudab autori mõtet kardinaalselt. Miinimumist ei piisa, tsiteerida tuleb mõttega. Seega tuleb meil Vikitsitaatides tihti vaadata üle levinud tsitaadid ja kontrollida nende algupära, tuua välja algne kuju ja kontekst. Sageli peab kontrollima, kust on tsitaadid võetud. Käin mõnikord raamatukogus ja võtan virnade kaupa ajalehti välja, et aru saada, mis tsitaadiga on tegemist ja kas see on ikka korrektne. Ka ajakirjandus ise moonutab tihti algselt öeldut või kirjutatut väljavõtetes ja pealkirjades, kust inimese sõnad võivad lendu minna kujul, mida ta ise kunagi ütelnud poleks.

Oleme püüdnud Vikitsitaatides tutvustada eriti Eesti, aga ka teiste maade naisautoreid ja üldse iga valdkonna naisi, kes on midagi silmapaistvat öelnud – teadlasi, kirjanikke, poliitikuid, aktiviste. Miks me seda teeme? Sest naisi kajastatakse liiga vähe, ühiskondlikus kaanonis, meedias ja ajalugudes domineerivad ikka vaid mehed, neid tsiteeritakse palju sagedamini kui naisi. See ei tähenda aga, et naistel oleks vähem öelda. Seda kallakut üritamegi otsemaks seada. Väga vähe on vikiprojekte, kus naised domineerivad, ent meie Vikitsitaadid on üks selliseid. Meil on isikuartiklites naisi üle 50% ja see osakaal vähehaaval kasvab. Samuti oleme püüdnud kajastada sõbralike naaberriikide Läti ja Soome kirjandust. 

Eva on teinud ühtlasi tohutu töö naiskunstnike teoste kogumisel ja autorsuse kontrollil. Nüüdseks on tal väga hea ülevaade maailma naiskunsti sellest osast, mis on autoriõigusest vaba. Neid oleme mõtestatult illustratsioonidena kasutanud Vikitsitaatide artiklites – sisuliste seoste järgi, mitte nii, nagu inglise ja veel mõneski projektis, kus piltidel pole tihti tekstiga mingit pistmist. Julgen arvata, et meil on üks kõige kvaliteetsemalt illustreeritud vikiprojekte üldse. 

Naisi tõstame esile ka esilehe päevatsitaatides, kus pikka aega avaldasimegi ainult naiste tsitaate, igal kuupäeval tavaliselt uus sünnipäevalaps. Nüüdseks oleme lati taas madalamale lasknud, ent püüame ikkagi hoida naiste osakaalu esilehelgi üle 50%.

Millistele Wikimedia projektidele sa veel rõhku panna tahaksid? Mida tõstaksid esile ja miks?

Peaksime rohkem dokumenteerima Eesti inimesi ja üritusi. Kahjuks avastame sageli alles siis, kui inimene on surnud, et temast puudub Wikimedia Commonsis pilt. Palju lihtsam on teha pilti elus inimesest tema enda nõusolekul kui hakata pärast surma otsima suvalise foto autorit. Oleks hea, kui Vikipeedial oleks selline süsteemne lahendus, näiteks Tartus ja Tallinnas paar inimest, kes Wikimedia Eesti kaudu akrediteerituna käiksid üritustel pilte tegemas.

Mõnikord, kui ma ise lähen kuhugi, kus varem pole käinud, vaatan enne üle Vikipeedia artiklid ja teen siis pilte objektidest, millest on artiklid, aga puudub pilt. Igasugused koolid, huvitavamad tänavad, kultuuritegelaste sünnikohad, raamatukogud… Minu arust võiks üldse raamatukogude valdkonda rohkem kajastada, sest neis on väga palju olulisi inimesi. Sama lugu on laiemalt kohalike nn sädeinimestega, kellest võiks Vikipeedias artiklid olla, kuna niisugused “kohaliku tasandi” inimesed on tähtsad terve ühiskonna jaoks. Eesti kultuur ei sünni ainult Tartu ja Tallinna ülikoolides, suurkirjastustes ja ooperiteatrites, selle aluspõhjaks on ikkagi kultuurimajad ja külaseltsid, kust tulevad nii tegijad kui ka huvilised.

Olen ka mõelnud, et oleks väga huvitav ja kõnekas, kui meil oleks fotosid sellest, kuidas on tsitaate kasutatud avalikus ruumis, näiteks monumentidel ja graffitis. Huvitav oleks uurida ka hauakividel või surmakuulutustes kasutatud tsitaate. Põnev oleks jälgida, keda tsiteeritakse ja kuidas. Milliseid luuletajaid tuntakse (ja kas neid vahel ka segi aetakse)? Milliseid piibli kirjakohti tsiteeritakse ja millises tõlkes? Kuidas see ajapikku muutub?

Üks suure kasutamata potentsiaaliga projekt on Vikisõnastik Saaksime selle täiendamisel eeskuju võtta näiteks ingliskeelsest Vikisõnaraamatust, kus on sõnade juurde lisatud selgelt dateeritud ja viidatud kirjandusnäiteid, milles on Vikisõnastikul ühisosa Vikitsitaatidega. See toob välja sõnade kasutuse läbi ajaloo – oluline ja üpris kõnekas aspekt, mille kajastamist pole isegi Eesti Keele Instituut oma etümoloogiasõnaraamatus korralikult vaevaks võtnud. (erinevalt näiteks Oxfordi etümoloogiasõnaraamatust). Poola Vikisõnaraamatu võiksime võtta eeskujuks mallide kasutamises, mis teevad töö ja lugemise märksa kergemaks.

Esile tahaksin tõsta ka entsüklopeediate teema. Entsüklopeedia kui žanr uusaegses euroopalikus traditsioonis põhineb mõningatel olulistel epistemoloogilistel eeldustel. Näiteks: teaduslikud teadmised on üldjuhul paremad, kuna need on saadud kriitilisel meetodil. Need ei pruugi olla lõplik tõde, kuid kriitilise meetodi abil teadmised täienevad ja muutuvad paremaks. See on tähtis eeldus, mida meie Vikipeedias enamjaolt vaikimisi usume ja jutuks ei võta, kuid tänapäeval sugugi mitte kõik üksmeelselt ei tunnista. Vikipedistid on oma mõttelaadilt konkreetsed inimesed, näevad konkreetseid probleeme ja lahendavad need konkreetselt. Aga meil oleks rohkem vaja sellist üldfilosoofilist vaadet, mis võimaldaks analüüsida, kuidas Vikipeedia toimib epistemoloogilises mõttes, kust tulevad teadmised, miks mõned teadmised on entsüklopeedilised, teised aga mitte, mis võiks olla Vikipeedias ja mis mitte jne. Läbimõeldud lähtekohad võimaldavad teha teadlikke ja põhjendatud valikuid. Selline metatasandil lähenemine ei ole praegu Vikipeedias veel väga tugev.

Olen väikestviisi uurinud Eesti entsüklopeediate ajalugu, mille teemal praegu ilmub minu artiklisari Horisondis (1. osa, 2. osa). Karl August Hermanni entsüklopeedia esimese vihiku avaldamisest möödub tänavu 125 aastat. Eesti ajaloolise kogemuse põhjal võime öelda, et paberentsüklopeediatel on väga suur tähtsus kultuuri ja keele säilitamisel. Paberil rahvusentsüklopeedia, mida ideaalis iga 10–15 aasta järel uuendataks, võiks olla mitte üksnes meie ühiskonna päevapilt ja peegel, vaid ka keele ja kultuuri julgeoleku küsimus. Just rahva seas massiliselt levinud paberentsüklopeedia, mille levikut ühegi võrgu kaudu täielikult kontrollida ei saa, kandis okupatsiooniajal pool sajandit edasi salajast teadmist Eesti Vabariigist ja kinnitas Eesti identiteeti iseseisva riigina. Rahvusentsüklopeediata olnuks Eesti ühiskonna teadmised sellest, mida õigupoolest taastada taheti, olnud taasiseseisvumisel oluliselt nõrgemad. Sellele tuleks mõelda ning eestikeelsete entsüklopeediate ajaloostki tasuks rohkem kirjutada.

Ka Vikipeedia seisukohalt vaadates on väga oluline, et inimestel oleksid igal pool silme ees entsüklopeediad, sest juba praegu on meil probleem, et inimesed ei tea, mis on entsüklopeedia. Mis on entsüklopeediaartikli jaoks kõlbulik teema ja mis ei ole? Kas ma võin Vikipeedias oma koerast kirjutada? Õnneks Eestis praegu veel on suhteliselt suurel osal inimestel olemas ettekujutus sellest, mis on entsüklopeedia, mis üleüldse on entsüklopeediaartikkel ja mis vaatenurgast see peaks olema kirjutatud. Kui see žanritaju kaob, siis oleme Vikipeedias hädas, sest uued kaastöötajad seda enam ei adu. Taju vaikselt juba kahaneb, ühtlasi mõjutab seda protsessi ka tehisintellekti pealetung.

Millised on sinu arvates vikiprojektide tulevikuväljavaated, arvestades tehisintellekti pealetungi? Kas oled vikipedistina juba tundnud tehisintellekti mõju Vikipeedias või ise selle abi kasutanud?

Ma pole väga palju otsinud ja näinud, et seda oleks kasutatud; küllap seda kasutatakse rohkem Vikipeedia poole peal kui väiksemates sõsarprojektides nagu Vikitsitaadid. Kui paljud meie tegevustest AI tulevikus üle võtab, sõltub ikkagi sellest, mis paradigmadele selle tuumaks olev keelemudel üles ehitatud on – eelkõige, kas selle komponentide hulgas on semantika või ei ole. Kui panna mudel paika lihtsalt grammatika ja sõnavara põhjal, siis iseenesest AI toodetud sisule tähendust ei teki. Praeguste keelemudelite tuum seisneb suuresti selles, et väljund koostatakse keskmiselt olemasoleva materjali põhjal. Saadav tulemus ei pruugi olla tingimata halb, aga kas sellel kõigel on ka tegelikult mõttekas tähendus, süsteem kontrollida ei suuda, sest semantikakiht praeguste mudelite põhistruktuuris puudub. Nii võivad teksti tekkida väitlaused, mille koostamisel ei ole pööratud tähelepanu sellele, kas esitatav väide on vastavuses reaalse maailmaga. Niisugust teksti saab sisendina kasutada ainult olukordades, kus kvaliteedi küsimus ei ole väga oluline. Kindlasti ei tohiks seda kasutada näiteks meditsiinis või politseiraportite koostamisel, millele inimene ilma sisu kontrollimata alla kirjutab. Pärast võib selguda, et AI on ise mingi jupi juurde kirjutanud, kuid vastutab ikkagi inimene, mitte AI. Kõik see on oht ka Vikipeedia jaoks, nii otseselt AI abiga artikleid kirjutavate kasutajate kui ka vikiväliste allikate AI mõjul langeva andmekvaliteedi kaudu.

AI tekste saab enamasti ära tunda selle järgi, et need on eriti trafaretsed. Programm kasutab võimalikult palju selliseid võrdlusi, mis on hea stiilitajuga lugeja silmis talumatuseni kulunud. Levinud klišeesid kasutab AI innukalt ja võimendab aina edasi. Ja kuna AI loodud tekste kasutatakse üha sagedamini, siis tulemusena muutume meiegi lugejatena allikate suhtes üha vähem kriitilisemaks. Entsüklopeediad on alati olnud osa teaduse ökosüsteemist ja nende üks oluline roll seisneb selles, et nad on harjutanud inimesi allikatesse kriitiliselt suhtuma: mõtlema, võrdlema, küsima, kahtlema… Mis juhtub, kui need harjumused ära kaovad? AI kasutamine süvendab pealiskaudsust ja nüansimeele kriisi. See tähendab, et inimene mingi teema käsitlemisel ei taju enam nüansse. Kõik on lihtne, ühene ja analüüsi asemel lihtsalt lahmitakse.

Muide, AI üks üpriski tõenäoline mõju on libatsitaatide levik. Inimesed kasutavad tsitaate niigi üsna süüdimatult, kontrollimata, kas keegi midagi ka tegelikult ütles või kirjutas. Kuid AI abiga levivad mitte üksnes inimlikud eksitused ja tahtlikud võltsingud, vaid ka AI-s endas sündivad hallutsinatsioonid. 

Proovisin hiljuti ChatGPT võimekust tsitaadilehtede koostamisel, andes talle ette Vikitsitaatide artiklivormingu, valiku linke üht poliitikut tsiteerivatele uudistele ning käsu tõsta artiklisse üksnes uudistes selle inimese otsekõnena jutumärkide vahel esitatud lauselõigud. Pärast mõningast lihvimist sain tulemuseks igati veenva, vormilt täiesti avaldamisvalmis lehekülje, täis tsitaate, millele poliitik küllap meeleldi alla kirjutanuks. Ainult et vähemasti etteantud uudislugudes neid lauseid polnud.

Nii et kui kirjandit kirjutav õpilane või kõnet koostav poliitik küsib AI-lt sobivat tsitaate, võib tulemus kergesti olla tõepäraselt kõlav väljamõeldis, mis rahvasuus kiirelt liikvele läheb. Lähiaastatel saame kuulda ja lugeda tervet rida Tammsaare, Underi, Ristikivi ja Lennart Meri tsitaate, millest nad ise undki ei näinud. Ja see on siis juba ka Vikitsitaatide probleem.

Kas kõigi nende probleemide valguses on Vikipeedial tulevikku?

Ma arvan, et on küll, kuigi pikas perspektiivis ei oska ma öelda, milline see tulevik on. Suurem osa ühiskondlikke muutusi on olnud ootamatud. Näiteks mingil ajal olid entsüklopeediad CD-plaatidel, kuid nüüd pole selle plaadi jaoks arvutis enam kohtagi.

Ma siiski arvan, et tekst ei kao. Vikipeedia on muidugi väga tekstipõhine ja tänapäeval on levinud info hankimine ka näiteks TikToki lühivideotest. Vikipeedia teadmisi sellises formaadis praegu ei väljastata ja meil puudub isegi audiosüsteem, mis ometigi võimaldaks infot esitada palju mitmekülgsemalt. Näiteks saaks esitada audio- ja videotsitaate, mis on välja võetud mingist suuremast intervjuust või videost. Need on väikesed ja lihtsad asjad, mille järele võib olla nõudlus – ja kui Vikipeedia neid ei paku, siis teeb seda keegi teine. Samas nõuavad niisugused formaadid teistsuguseid oskusi, kui siiamaani meie tekstikirjutajatel on olnud. 

Mida tahaksid lõpetuseks öelda Vikipeedia lugejatele ja/või kaastöölistele?

Inimesed, lugege rohkem raamatuid! Sest ainult niimoodi paraneb keel ja mida rohkem ja erinevaid raamatuid loete, seda rohkem uusi sõnu avastate. Ka ilukirjandus on väga tähtis, sest see tutvustab meile teiste inimeste vaatepunkte – kirjanduse kaudu pääseme niisuguste inimeste pähe, kelle moodi mõtlemist me ise poleks iial ettegi kujutanud. Selles mõttes on kõige harivam lugeda veidraid ja võõraid raamatuid. 

Ka entsüklopeediat lugeda on väga hariv. Näiteks väga valgustav on võtta ette Hermanni omaaegne entsüklopeedia (digituna Kirjandusmuuseumi lehel), sõjaeelne “Eesti rahvaleksikon” (1937–1940) või ka nõukogudeaegne ENE ja mõni uuem teatmeteos ning vaadata kõrvuti, kuidas mõnd teemat on kajastatud. Võib avastada päris huvitavaid asju. Miski on kaotsi läinud, miski kordub läbi ajastute. Võime küsida: kas see, mis sobinud kõigile ühiskondadele ja võimudele, ongi objektiivne tõde, või on selle väärtus hoopis kahtlane? Mis meie enda praegusest ajast selles valguses vaadates peatselt käest pudeneb ja mis on jääv?

Foto: Ivo Kruusamägi

Küsimusi esitas Pille Priks

Intervjuu valmis seerias “Vikipeedilisi vaatlusi

Top