Kas Vikipeedia on masintõlgitav?

Posted on

19.-20. aprillil toimus Tallinnas konverents “Eesti keeletehnoloogia 2017”. Konverentsile eelnev päev oli aga tööpajade päralt, kus muuhulgas uuriti, et kas ja kuidas saab Vikipeediat masintõlkida – toimus Vikipeedia häkaton.

The pill can be taken by mouth with or without food, although it is generally preferred to take it with a meal in order to avoid problems with stomach acid, which can cause the drug to have a laxative effect and increase the amount you’ll be able to lose. It can also be taken in tablet, price azithromycin 500mg capsule, injection and suppository form. Dapoxetine buy ireland the new version also includes an updated interface, improved search and filtering options, new and updated functionality and new translations.

If you order any quantity over 20 tablets, we will contact you and ask you to upgrade to shipping to one address. You will not be able to purchase this Sausar viagra pfizer 100 mg preis drug in methotrexate canada canada. Your doctor will ask you to keep a sleep diary, which will help you to track your nightly sleep patterns and to record any changes in your sleep patterns.

Nimelt käivitus emakeelepäeval projekt Miljon+, mille eesmärgiks on saada miljon artiklit eestikeelsesse Vikipeediasse ning tööpajas soovitigi välja uurida, et kas masinad saavad aidata meil sellele eesmärgile kiiremini lähemale jõuda. Häkatonil kasutati kaht erinevat masintõlkevahendit – TÜ arvutiteaduse instituudi masintõlkeprojekt KaMa – Kasutatav Eesti Masintõlge ning proovile pandi ka eraturul masintõlget pakkuv Tilde Eesti OÜ tõlkeprogramm. Lisaks nendele tõlgiti paralleelselt ka käsitsi tekste, et saaks hinnata kumb viis siis on tõesti parem ja kiirem.

Minu roll antud häkatonil oli olla hindaja rollis – see tähendab, et ma pidin üle vaatama kõik artiklid (nii otsetõlgitud kui ka järeltoimetatud masintõlgitud artiklid) ning andma oma hinnangu selle tõlkekvaliteedile. Hindajate segadusse ajamiseks olid korraldajad artiklite hulka pannud ka juba valmis artikleid.

18033061_1449388965104477_7455232323397494909_n.jpg

Pärast mitut tundi tõlkimist oli minu jaoks tulemus väga huvitav – artiklid olid võrdlemisi lühikesed, kuid nii otsetõlgitud kui ka masintõlgitud artiklid olid üldjoontes üsna kehvad. Erandeid muidugi ka oli ja oli ka väga häid artikleid, kuid oli ka näha, et nendesse oli panustatud rohkem aega. Siiski üldiselt oli hinnata pigem keeruline, kuna raskusi oli ka näiteks pakkumiste tegemisega, et mil viisil artikkel on tõlgitud. Kui ma pooled artiklid olin ära hinnanud, siis hetkeks jäin mõtlema, et mille põhjal ma siis pakkumisi teen ja tuli välja, et olen rohkem altim pakkuma, et artikkel on masintõlgitud, kui seal on rohkem käändevigu.

Siiski päeva lõpuks jõudsime järeldusele, et masintõlge võib tihtipeale kaasa aidata artikli tõlkimisel, kuid ilma järeltoimetamiseta ei ole kahjuks selliselt tõlgitud artikli kvaliteet isegi arvestatav. Päeva lõpetuseks tuli ka veel üks huvitav idee Vikipeedia artiklite automaatseks genereerimiseks – märksõna järgi otsib masin internetiavarustest kogu info märksõna kohta ja formuleerib selle artikliks. Kas keegi kunagi sellist süsteemi ka looma hakkab? Elame, näeme!

Top