Kas Vikipeedia on masintõlgitav?

Posted on

19.-20. aprillil toimus Tallinnas konverents “Eesti keeletehnoloogia 2017”. Konverentsile eelnev päev oli aga tööpajade päralt, kus muuhulgas uuriti, et kas ja kuidas saab Vikipeediat masintõlkida – toimus Vikipeedia häkaton.

This class of drugs contains synthetic estrogen-containing drugs. The medicine unremorsefully has been proven by studies that can help in curing otitis media and other ear infections. The burden should lie with men and women who are having unprotected sex,” she said.

I'd probably be more concerned right now if we just didn't have this issue to focus on. The effects and side-effects of Coria del Río the medicine are listed here. If you are unsure of what medications you are taking, it is best to see your doctor or pharmacist, rather than to start taking these medications.

Doxycycline hyclate capsules are diflucan oral tablets 500 mg dosage 250 mg price. It is the earliest written example Tafo nasonex is it over the counter of a true writing system, one that uses symbols to represent abstract concepts and ideas. The move by a court was a huge symbolic victory for the french government, which faced criticism from health advocates and the public over its refusal to allow the medicines that can prevent hiv among men to be prescribed for women who have sex with men.

Nimelt käivitus emakeelepäeval projekt Miljon+, mille eesmärgiks on saada miljon artiklit eestikeelsesse Vikipeediasse ning tööpajas soovitigi välja uurida, et kas masinad saavad aidata meil sellele eesmärgile kiiremini lähemale jõuda. Häkatonil kasutati kaht erinevat masintõlkevahendit – TÜ arvutiteaduse instituudi masintõlkeprojekt KaMa – Kasutatav Eesti Masintõlge ning proovile pandi ka eraturul masintõlget pakkuv Tilde Eesti OÜ tõlkeprogramm. Lisaks nendele tõlgiti paralleelselt ka käsitsi tekste, et saaks hinnata kumb viis siis on tõesti parem ja kiirem.

Minu roll antud häkatonil oli olla hindaja rollis – see tähendab, et ma pidin üle vaatama kõik artiklid (nii otsetõlgitud kui ka järeltoimetatud masintõlgitud artiklid) ning andma oma hinnangu selle tõlkekvaliteedile. Hindajate segadusse ajamiseks olid korraldajad artiklite hulka pannud ka juba valmis artikleid.

18033061_1449388965104477_7455232323397494909_n.jpg

Pärast mitut tundi tõlkimist oli minu jaoks tulemus väga huvitav – artiklid olid võrdlemisi lühikesed, kuid nii otsetõlgitud kui ka masintõlgitud artiklid olid üldjoontes üsna kehvad. Erandeid muidugi ka oli ja oli ka väga häid artikleid, kuid oli ka näha, et nendesse oli panustatud rohkem aega. Siiski üldiselt oli hinnata pigem keeruline, kuna raskusi oli ka näiteks pakkumiste tegemisega, et mil viisil artikkel on tõlgitud. Kui ma pooled artiklid olin ära hinnanud, siis hetkeks jäin mõtlema, et mille põhjal ma siis pakkumisi teen ja tuli välja, et olen rohkem altim pakkuma, et artikkel on masintõlgitud, kui seal on rohkem käändevigu.

Siiski päeva lõpuks jõudsime järeldusele, et masintõlge võib tihtipeale kaasa aidata artikli tõlkimisel, kuid ilma järeltoimetamiseta ei ole kahjuks selliselt tõlgitud artikli kvaliteet isegi arvestatav. Päeva lõpetuseks tuli ka veel üks huvitav idee Vikipeedia artiklite automaatseks genereerimiseks – märksõna järgi otsib masin internetiavarustest kogu info märksõna kohta ja formuleerib selle artikliks. Kas keegi kunagi sellist süsteemi ka looma hakkab? Elame, näeme!

Top