|
|
Tai, kas tinka žmogui, netinka mašininiam vertimui: žodynų problema (3 dalis) Erika Rimkutė, Jolanta Kovalevskaitė (Šaltinis: „Gimtoji kalba“ 2008 m. nr. 2) Iki šiol lietuvių leksikografai rūpinosi, kaip sudaryti žodynus, kad būtų patenkinti žmonių poreikiai. Tačiau žmonėms skirti tradiciniai žodynai yra sunkiai pritaikomi kuriant kalbos apdorojimo programas, nes neužtenka tik perkelti popierinius ar elektroninius žodynus į mašininio vertimo (MV) sistemą (plačiau apie tai pirmuosiuose dviejuose ciklo straipsniuose; nuo 2008 m. pradžios anglų–lietuvių kalbų MV sistema prieinama internete adresu http://vertimas.vdu.lt/twsas/). MV žodynų rengimas yra viena iš sunkiausių užduočių iš dalies dėl to, kad nėra aiškių standartų, kaip juos rengti (plačiau apie MV skirtų žodynų sudarymą žr. Gerber et al. 1997; Dillinger 2001). Žodynai laikomi viena iš silpniausių ir brangiausių visos MV sistemos dalių, o jų dydis ir kokybė turi didelę įtaką MV kokybei (Arnold 1995; Wood et al. 1987). MV leksikos klaidų atsiranda dėl dviejų priežasčių: 1) MV žodyne nėra verčiamo žodžio ir jo atitikmens; 2) pateikiama per daug verčiamo žodžio atitikmenų, iš kurių parenkamas netinkamas (Thurmair 2006). MV sistemų žodynams būtinas didesnis tikslumas, vienareikšmiškumas nei įprastiems žodynams: jeigu MV sistemai nebus pateikta aiškių taisyklių, kada vartotinas vienas, o kada kitas daugiareikšmio žodžio atitikmuo, netikslumų verčiant nebus išvengta. Sudarant žodynus MV sistemoms reikia naudotis įvairiais šaltiniais: specialistų žiniomis, vienakalbiais ir daugiakalbiais tekstynais, tradiciniais spausdintais žodynais, įvairių tipų elektroniniais žodynais (Dillinger 2001). Šaltinių įvairovė padeda kuo tiksliau apibrėžti žodžio ar žodžių junginio leksinę aplinką ir reikšmių vartojimo aplinkybes. Šiame straipsnyje aprašysime, kuo ypatingi MV skirti žodynai, su kokiais sunkumais susiduriama juos sudarant. Kiek pateikti atitikmenų? Pagrindinis MV skirtų žodynų skirtumas nuo tradicinių –atitikmenų skaičius; naudojama daugiau gramatinių ir semantinių pažymų, kurios padeda apibrėžti, kokiuose kontekstuose kuris atitikmuo vartotinas; į MV žodynus stengiamasi įtraukti daugiau stabiliai vartojamų frazių (apie tai plačiau kitame šio ciklo straipsnyje). Toliau pateikta keletas pavyzdžių, kurie iliustruoja žmonėms ir MV sistemoms skirtų žodynų skirtumus. Plg. veiksmažodį cut, būdvardį gloomy ir daiktavardį part anglų–lietuvių kalbų žodyne „Anglonas“ (1) ir anglų–lietuvių kalbų MV sistemos žodyne (2): (1) Cut: 1) (per)pjauti, pjaustyti, at(si)pjauti; raikyti; atriekti; 2) (džn. refl) į(si)pjauti; 3) (ap)kirpti; (nu)karpyti, apkarpyti; iškirpti (out of); 4) sukirpti (drabužį); 5) pjauti, kirsti (javus); kirsti (mišką); 6) kirsti(s), susikirsti (apie linijas, kelius); 7) eiti skersai, kirsti (across, through); 8) skrosti (vandens paviršių ir pan.); 9) kirsti, pulti (peiliu, kardu ir pan.; at); 10) rėžti, raižyti (stiklą); graviruoti; šlifuoti (brangakmenį); 11) gręžti; kasti (tunelį, kanalą); 12) kaltis, prasikalti (apie dantis); 13) (su)mažinti (išlaidas, infliaciją ir pan.); 14) (su)trumpinti (straipsnį ir pan.); iškirpti (tai, kas nespausdintina, nedemonstruotina filme ir pan.); 15) (su)trumpinti (laiką); 16) įžeisti; įskaudinti; 17) išjungti, atjungti; nutraukti (elektros, dujų ir pan.) tiekimą; aut. išjungti (šviesas); 18) nutraukti (pažintį ir pan.); 19) išlaisvinti (from; t. p. cut free/loose); 20) šnek. nedalyvauti, praleisti; 21) (per)kelti (kortų malką); 22) į(si)rašyti (į plokštelę, juostelę; dainą, muziką); 23) atskiesti (with – kuo); 24) spec. kastruoti (gyvūną); 25) šnek. (pa)bėgti, sprukti; 26) šnek. baigti, liautis (ką daryti). Elektroniniame „Anglono“ žodyne prie veiksmažodžio cut dar pateikiami tokie junginiai: cut along, cut back, cut down, cut in, cut off, cut out, cut up; to cut and come again, to cut and run, to cut up rough/nasty, to cut short, to cut it fine/close, cut it/that out, to cut a few corners, to cut loose, to be cut out for smth, to be cut out to be smb, to cut up nastry/rough. (2) Cut: sumažinti, įpjauti, įsipjauti, trumpėti. Dar pateikiami tokie junginiai su cut: cut back, cut back on, cut from the same cloth, cut glass, cut eye-teeth, cut costs, cut price, cut away, cut dead, cut down, cut into dice, cut into junks, cut into pieces, cut off, cut out, cut out all feather, cut short. (1) Gloomy: 1) tamsus; rūškanas, niūrus; 2) liūdnas; paniuręs, nusiminęs. (2) Gloomy: tamsus; gloomy message – liūdna žinia. (1) Part: 1) dalis; 2) (knygos, leidinio) dalis, sąsiuvinis; (filmo) serija; 3) kūno dalis, organas; 4) (mašinos ir pan.) detalė, (atsarginė) dalis; 5) dalyvavimas; reikalas; 6) pusė; 7) teatr., kin., tel.vaidmuo (t. p. prk.); 8) muz. partija; balsas; 9) amer. (plaukų) skyrimas; 10) pl vietovė, kraštas. Dar pateikiami tokie junginiai: in foreign parts, in/round these parts, a man of (many) parts, on the one part... on the other part, in good part, to take smth in good part, to take in bad/evil part. (2) Part: dalis. Dar pateikiami tokie junginiai: part of speech, part owner, part payment, part time, part from, for my part. Pasirinkti atitikmenis MV žodyne kartais keblu dėl to, kad tradiciniuose dvikalbiuose žodynuose kaip vienas atitikmuo gali būti nurodomi keli žodžiai, pavyzdžiui, anksčiau minėto būdvardžio gloomy atitikmenys mažai kuo skiriasi (ypač antrosios reikšmės). O MV sistemos žodynuose, jeigu neįmanoma patikslinti, kada MV sistemai rinktis vieną, kada kitą atitikmenį, dažniausiai parenkamas universaliausias atitikmuo – šiuo atveju būdvardis tamsus. Kitas gloomy atitikmuo įtraukiamas į frazę gloomy message (liūdna žinia). Nors cut gali turėti net 26 atitikmenis, tačiau į MV žodyną daugiau negu vieną atitikmenį tikslinga įtraukti tik tada, kai galima atskirti juos pagal tam tikrus semantinius arba gramatinius požymius. Rečiau vartojamus atitikmenis stengiamasi pateikti kaip stabiliųjų junginių dėmenis. Palyginus „Anglono“ ir MV žodyno dydžius (atitinkamai 110 000 ir 50 000 anglų kalbos žodžių), matyti, kad MV žodyne atitikmenų daug mažiau, o junginių – beveik tiek pat. Kuo daugiau MV žodyne yra stabiliųjų junginių, tuo mažesnė tikimybė, kad verčiant svetimos kalbos žodžius bus reikalingi reti tų žodžių atitikmenys, kurie dažniausiai iš viso neįtraukiami į MV žodynus. Kadangi stengiamasi palikti tik dažniausius, universaliausius atitikmenis, automatiškai išversti sakiniai kartais būna absurdiški, net ir svetimos kalbos nemokančiam žmogui aiškiai matyti, kad tame kontekste pavartotas netinkamas atitikmuo. Toliau pateiktame sakinyje netinkamai (pažodžiui) išverstas junginys opposite number atskleidžia dar vieną MV skirto ir tradicinio dvikalbio žodyno skirtumą: Russia and Poland will have their highest-level talks for more than a year when the Polish Foreign Minister, Radek Sikorski, meets his opposite number Sergei Lavrov in Brussels on Thursday. Rusija ir Lenkija turės jų aukščiausio lygio derybas daugiau kaip metus, kai Lenkijos Užsienio reikalų ministras, Radek Sikorski, sutiks savo priešingą numerį/skaičių Sergei Lavrov Briuselyje ketvirtadienį. Dvikalbiuose žodynuose kartais randame tiesiog aprašomuoju būdu paaiškintą tam tikro angliško žodžio reikšmę, plg. „Anglone“ pateiktą junginį opposite number: asmuo, einantis tokias pat pareigas kitoje įstaigoje/valstybėje. MV žodyne aprašomasis būdas nėra priimtinas, būtina rasti tikslesnį atitikmenį. Jeigu į MV sistemos žodyną būtų įtraukta po kelis atitikmenis, į lietuvių kalbą išversto teksto apimtis labai padidėtų, o aiškumas tam tikrais atvejais nukentėtų (a). Kita vertus, jei paliekamas tik vienas atitikmuo, jis gali netikti konkrečiame kontekste (b): The trailer then cut to the Queen apparently storming off with an official lifting the large train of her blue velvet cape off the floor. (a) Priekaba/Anonsas tada pjovimas/išjungimas Karalienei, aiškiai/matyt išlekiančiai šalin su oficialiu pakėlimu didelio traukinio jos mėlyno aksominio iškyšulio/pelerinos nuo grindų/aukštų.[i] (b) Priekaba tada pjovimas Karalienei, aiškiai išlekiančia šalin su oficialiu pakėlimu didelio traukinio jos mėlyno aksominio iškyšulio nuo grindų. Tekstą, kuriame pateikti keli atitikmenys, vartotojui (ne profesionaliam vertėjui) turbūt sunkiau suprasti, tačiau čia reikėtų skirti dvi situacijas. 1) Jeigu nurodomi keli beveik priešingus dalykus reiškiantys variantai, kurių vartosena labai priklauso nuo konteksto, vartotojui gali padėti orientuotis bendra sakinio tema (plg. anksčiau pateiktą pavyzdį): jeigu kalbama apie įvykį, susijusį su karaliene, paprastam vartotojui turėtų pakakti bendrųjų žinių suvokti, kokiomis reikšmėmis pavartoti daugiareikšmiai anglų kalbos žodžiai arba homonimai. Dažnai tokiais atvejais gali padėti gimtakalbio kalbos jausmas, pvz.: Vodafone rejected the plans, which will be voted on by shareholders in July. Vodafone atmetė/atstūmė planus, kurie bus pripažinti ant akcininkų liepą. Žmogui, kuriam lietuvių kalba yra gimtoji ar gerai ją mokančiam, bus nesunku suprasti, kad šiame sakinyje su žodžiu planai tegali būti pavartotas žodis atmetė, nes atstumti vartojama kalbant tik apie žmones (čia nekalbama apie tiesioginę šio žodžio reikšmę, pvz., atstumti lovą prie lango). 2) Dažniausiai pasitaiko tokių situacijų, kai pateikiami keli artimų reikšmių angliško žodžio atitikmenys, pvz.: At this moment, what we are seeing is the jostling for airspace by Washington's politicians as they return to their constituencies for the holidays. Šiuo momentu, ką mes matome yra stumdymasis Vašingtono politikų oro erdvei, nes jie sugrįžta į jų rinkimų apygardas šventėms/atostogoms. What is the right policy for the British in these circumstances? Kas yra teisinga/teisi politika/polisas britams šitomis aplinkybėmis? Kaip jau rašyta, MV žodynuose dažniausiai paliekamas vienas angliškų žodžių atitikmuo[ii]. Tačiau tokį variantą iš karto iškyla problema: kaip nuspręsti, kurį atitikmenį (kuriuos atitikmenis) nurodyti, ypač jeigu žodis yra daugiareikšmis arba esama kelių homonimų. Kaip MV žodyne parenkami atitikmenys? Renkantis, kurį iš kelių atitikmenų palikti MV programos žodyne, atsižvelgiama į kelis dalykus: atitikmens vartojimo dažnumą tekstynuose, internetinėse paieškos sistemose, junglumą, vartojimo kontekstų įvairovę. Kartais ne tiek svarbu, kad būtų parinktas tiksliausias tam tikro žodžio atitikmuo; svarbiau kaip pirmąjį žodžio atitikmenį parinkti būtent tą žodį, kuris aprėpia kuo platesnį kontekstą. Panagrinėkime žodį protest ir jo atitikmenis prieštarauti, nesutikti ir protestuoti. Plačiausio junglumo yra atitikmuo prieštarauti – tai įrodo Dabartinės lietuvių kalbos tekstyno (http://donelaitis.vdu.lt) duomenys: prieštarauti įstatymams, Konstitucijai, teisės aktams, sau, vienas kitam, Statutui, žmogaus prigimčiai, moralės normoms, teisingumui, taisyklėms, logikai, protui. Žodis prieštarauti gali būti vartojamas ir su asmenis įvardijančiais žodžiais, ir su kitus dalykus nusakančiomis sąvokomis, plg. prieštarauja veiksmai, nuostata, aktai ir pan. Kitas protest atitikmuo nesutikti vartojamas panašiai kaip ir prieštarauti. Tekstyne išryškėja būdinga prielinksninė konstrukcija: nesutikti su nuomone, asmeniu, sprendimu, siūlymu, kaltinimu, prašymu, išvadomis, teiginiu. Protestuoti vartojamas norint parodyti aktyvų prieštaravimą: protestuoti prieš pabrangimą, karą, reformas, tokį elgesį, santvarką, nuosprendį, siūlymą, sprendimą, NATO plėtrą, okupaciją, prieš sąjungą su Rusija; dėl reikalavimų. Protestuoti ir nesutikti gali tik asmenys, o prieštarauti junglumas apima ir kitas semantines grupes. Tai rodo, kad prieštarauti yra plačiausio junglumo protest atitikmuo, kurį ir reikėtų pateikti MV žodyne. Kitas pavyzdys: cancel ir jo atitikmenys anuliuoti ir panaikinti. Iš Dabartinės lietuvių kalbos tekstyno duomenų paaiškėjo, kad dažniau ir įvairesniuose kontekstuose vartojamas panaikinti, plg.: panaikinti apribojimus, bylą, draudimą, lengvatas, nuosprendį, muitus, testamentą. Pagrindiniai anuliuoti junglumą parodantys žodžiai yra šie: anuliuoti santuoką, rezultatus. Anuliuoti dažnai vartojama kanceliarinėje kalboje, tačiau anglų kalbos teksto vertimas bus suprantamas, jei žodžiui cancel bus pateikiamas tik vienas atitikmuo – panaikinti, nes galima panaikinti ir santuoką, ir rezultatus. Kartais reikia atsižvelgti į tai, kuria kalbos dalimi verčiamas angliškas žodis. Pavyzdžiui, anglų kalbos žodis visit kaip daiktavardis turėtų būti verčiamas daiktavardžiu vizitas (nors galimas atitikmuo ap(si)lankymas), pvz.: premjero vizitas, prezidento vizitas, vadovo vizitas, oficialus vizitas, ... dienų vizitas, savaitės vizitas, vizitas į užsienį, darbo vizito metu, atvyksta su vizitu, su vizitu lankėsi, atvyko oficialaus kelių dienų vizito, vizito išvakarėse. Atitikmuo ap(si)lankymas daug dažniau vartojamas kalbant neoficialiai (išskyrus popiežiaus apsilankymas), plg. pavyzdžius iš tekstyno: apsilankymas pas gydytoją, kaimynus, apsilankymas Graikijoje. Iš pateiktų pavyzdžių matyti, kad vizitas dažniau vartojamas oficialiojoje kalboje, bet dažnai gali pakeisti ir (ap)silankymą. Bet tarp veiksmažodžio visit lietuvių kalbos atitikmenų ap(si)lankyti ir vizituoti yra kitoks skirtumas, plg. šiuos pavyzdžius: apsilankė pas gydytoją, pas prezidentą; vizituoti ligonius, parapijas, pacientus, vizituoja Estijoje, vizituojantis lektorius. Taigi tam tikruose kontekstuose vizituoti įgyja tokią reikšmę, kurios neperteikia apsilankyti. Plg.: vizituoja ligonius (gydytojas) – lanko ligonius (giminaičiai, draugai). Vadinasi, reikalingi abu veiksmažodžio visit lietuviški atitikmenys. Ne visada galima palikti tik vieną atitikmenį, todėl iškyla klausimas, kuriuos papildomus lietuvių kalbos atitikmenis palikti ir kaip nurodyti, kada jie turėtų būti parenkami. Galimi įvairūs atitikmenų parinkimo būdai: jie parenkami remiantis vienakalbių, lygiagrečiųjų tekstynų, žodynų, paieškos sistemų duomenimis. Jeigu žodis turi būti verčiamas dviem atitikmenimis, atskirti, kada kuris vartojamas, padeda gramatinė informacija. Pavyzdžiui, veiksmažodis believe gali būti verčiamas tikėti ir manyti. Atitikmuo manyti dažniausiai pasirenkamas tada, kai believe vartojamas su šalutiniu sakiniu, pvz.: I believe that you are correct (Aš manau, kad jūs esate teisingas). Su kitomis gramatinėmis formomis believe dažniausiai turėtų būti verčiama atitikmeniu tikėti, pvz.: I believe in you (aš tikiu tavimi). Analizuojant veiksmažodžio order vartoseną, išryškėja du gramatiniai skirtumai, kurie padeda pasirinkti tarp dviejų atitikmenų – įsakyti/liepti arba už(si)sakyti. Jei po order yra pasakomas tiesioginis objektas, tada šis žodis verčiamas užsisakyti, pvz.: So I came into this bloody tavern and ordered a glass of whisky (Tokiu būdu aš įėjau į šią kruviną taverną ir užsakiau viskio stiklinę); o jei order vartojamas su bendratimi, tada turėtų būti pasirenkamas atitikmuo įsakyti arba liepti, pvz.: I ordered him to go home (Aš liepiau, kad jis eitų namo). Parenkant atitikmenis labai praverčia semantinė informacija. Kai kurie atitikmenys gali būti vartojami tik su tam tikrų leksinių semantinių grupių žodžiais. Pavyzdžiui, būdvardis right gali būti verčiamas ir teisus, ir teisingas. Abu šie atitikmenys gali būti vartojami kalbant tik apie žmones, o turint omenyje sprendimą, pasirinkimą, variantą, kelią ir pan. galimas tik vienas right vertimo atitikmuo – teisingas. Kitas pavyzdys – būdvardis uncertain. Jį galima versti abejotinas, abejojantis ir kitaip. Jei į MV žodyną būtų įtrauktas tik vienas atitikmuo abejojantis, junginį uncertain future gautume išverstą – abejojanti ateitis. Akivaizdu, kad čia reikalingas kitas žodis – abejotinas. Taigi angliškam žodžiui uncertain reikia pateikti du atitikmenis – kad būtų skiriama abejojantis žmogus ir abejotina ateitis, reputacija, šlovė ir pan. MV žodyne kai kurie žodžiai priklauso tam tikroms semantinėms klasėms: vardai, pinigai, geografiniai pavadinimai, institucijos, laiko aplinkybės, veiksmas, matų vienetai, gyvūnai, savybės ir kt. Remiantis semantine informacija galima nustatyti žodžio junglumą, jo vartojimo sritis. Tačiau ne visus žodžius galima priskirti kuriai nors vienai semantinei grupei. Be to, trūksta išsamesnės semantinės klasifikacijos, skirtos MV žodynams. Dar vienas būdas, padedantis pasirinkti reikiamą atitikmenį, yra stabilieji junginiai. Labai dažnai angliškų žodžių atitikmenys vartojami tik tam tikrose frazėse, pavyzdžiui, pagrindinis keep atitikmuo yra laikyti, bet junginyje keep information veiksmažodžiui keep turi būti parenkamas vienas iš rečiausių šio žodžio atitikmenų saugoti (anglų–lietuvių ir lietuvių–anglų kalbų žodyne „Anglonas“ saugoti nurodomas kaip 15-ta keep reikšmė). Tam, kad į MV žodyną nereikėtų įtraukti daugybės atitikmenų ir vėliau spręsti, kaip MV sistema turėtų juos konkrečiam sakiniui parinkti, paprasčiau į žodyną įtraukti kuo daugiau pastoviųjų junginių. Į MV žodyną įtraukus junginį keep information – saugoti informaciją, verčiant kitus atvejus su keep turėtų užtekti kelių dažniausių atitikmenų. Kodėl MV žodynams svarbūs tekstynai? Sudarant MV žodynus labai svarbu remtis tekstynų duomenimis, nes tekstynuose išryškėja būdingiausi ir dažniausi vartosenos atvejai (Marcinkevičienė 2000). Kai kurie tyrėjai (Pinkham et al. (2002) net mano, kad automatiškai versti galima visai be dvikalbių žodynų, o reikiamus duomenis imti iš tekstynų. MV žodynų sandara priklauso nuo to, kokio pobūdžio tekstams versti yra skirta MV sistema (Dillinger 2001), todėl dažnai tam tikros srities specialiųjų MV žodynų antraštinių žodžių sąrašai sudaromi remiantis specialiųjų tekstynų dažniniais sąrašais ir taip gaunamas konkrečiai sričiai būdingas žodynas. Pavyzdžiui, jeigu kuriama MV sistema, skirta ekonomikos tekstams versti, iš ekonomikos tekstyno sudaromi dažniniai žodžių sąrašai ir jie įtraukiami į specialųjį MV sistemos ekonomikos žodyną. MV žodynai yra ribotos apimties, taigi juos sudarant reikia atsižvelgti į anglų kalbos (jei verčiama iš anglų kalbos) žodžių dažnumą anglų kalbos tekstynuose. Pavyzdžiui, įtraukti į MV sistemos žodyną žodžius, kurių pavartojimo atvejų dažnumas – ne mažiau kaip 5000 kartų (Thurmair 2006). Taip į MV žodynus įtraukiami patys dažniausi žodžiai ir išvengiama retai dabartinėje kalboje vartojamų žodžių, kurie gali būti nurodyti tradiciniuose žodynuose. Vartotojai gaus gana prastos kokybės vertimą, jei MV sistemos žodyne kalbos, iš kurios verčiama, žodžių atitikmenys bus paimti iš tradicinio žmonėms skirto dvikalbio žodyno ir nepatikrinta jų vartosena tekstynuose. Pavyzdžiui, žodžio parents žmonėms skirtuose dvikalbiuose žodynuose galima pateikti abu atitikmenis: ir tėvai, ir gimdytojai, bet MV žodyne reikia nurodyti tik dažnesnį ir įprastesnį atitikmenį tėvai. Toliau pateikiame keletą sunkesnių atvejų: Towards Thursday afternoon they had done it. Ketvirtadienio popietės link jie darė/atliko jį. Towards morning – ryto link; towards evening – vakaro link. Kaip matyti, angliško prielinksnio towards atitikmuo link lietuvių kalboje laikui reikšti nelabai būdingas. Atlikus paiešką tekstynuose, nustatyta, kad tokius junginius kaip towards Thursday afternoon reikėtų versti apie ketvirtadienio popietę; tačiau towards vertimas apie netinka junginiuose towards morning ir towards evening. Šiuo atveju lietuvių kalboje vartojami vienažodžiai prieveiksmiai: paryčiui ir pavakariui. Patikrinus pastarojo žodžio dažnumą paieškos programoje Google, rasta tik keliolika pavakariui atvejų, o sinonimiškas šio žodžio variantas vakarop yra daug dažnesnis ir įprastesnis. Iš pirmo žvilgsnio frazės more than vertimas daugiau už atrodo visiškai aiškus, tačiau panagrinėkime šį sakinį: The feeling was more than mutual. Jautimas/Savijauta buvo daugiau už abipusis. Tam tikrame kontekste minėtą anglų kalbos junginį galima versti daugiau už, pvz., jis padarė daugiau už mane/daugiau nei aš; tačiau ištyrus konstrukcijų daugiau už ir daugiau nei vartoseną Dabartinės lietuvių kalbos tekstyne nustatyta, kad universalesnė ir dažniau vartojama yra konstrukcija daugiau nei, plg. šiuos pavyzdžius: įgulą sudaro daugiau nei vienas pilotas; įrašytas daugiau nei vienas dokumentas; importas daugiau nei 1,5 karto viršija eksportą; siunta sveria daugiau nei 10 kilogramų. Šiuose pavyzdžiuose konstrukcijos daugiau nei negalima pakeisti daugiau už, tai įrodo, kad ji yra universalesnė ir tinkamesnė MV. Kai kuriais atvejais reikia paredaguoti į MV žodyną įtrauktų anglų kalbos žodžių lietuviškus atitikmenis, pavyzdžiui, vietoj įsigijėlio tinkamesnis atitikmuo yra savininkas: If Ford does decide to sell, private-equity firms are thought to be more likely acquirers than other carmakers. Jei Ford nusprendžia parduoti, privačios/privačiai teisingumo/paprastosios akcijos firmos yra galvotos būti labiau tikėtinais įsigijėliais (= savininkais) už kitą carmakers. Pakeitus acquire atitikmenį įsigijėlis savininku, gaunamas geresnis vertimas: Jei Ford nusprendžia parduoti, privačios/privačiai teisingumo/paprastosios akcijos firmos yra galvotos būti labiau tikėtinais savininkais už kitą carmakers. Nelengva sugalvoti tikslius atitikmenis į MV žodyną įtraukiant naujas leksemas, pvz., newsmaker: NBA.com's Matt Wurst writes his column, Read Between The Lines, a look at news, newsmakers, performers and performances from the NBA, WNBA and NBA D-League. Iš konteksto aiškėja, kad newsmaker – tai asmuo, teikiantis žinių apie įžymybes rašantiems žurnalistams, tačiau tokio ilgo aiškinimo negalima įtraukti į MV žodyną, todėl buvo pasirinkta minėtą žodį versti įžymybė: NBA.COM Matt Wurst rašo savo skiltį, Perskaitytą Tarp Linijų/Eilių, žvilgsnio į naujienas, įžymybes, atlikėjus ir renginius/vaidinimą nuo NBA, WNBA ir NBA D-lygos. Reikia pridurti, kad kiekvieną į MV žodyną įtraukiamą anglų kalbos žodį ir jo lietuvišką atitikmenį reikia išanalizuoti gramatiškai, t. y. priskirti tam tikrai gramatinei klasei (nurodyti paradigmą, junglumą). Be to, daiktavardžiams dar reikia nurodyti: tikriniai ar bendriniai, turi daugiskaitos formas ar neturi; būdvardžiams: laipsniuojamas ar nelaipsniuojamas, turi bevardę giminę ar neturi; prieveiksmiams: laipsniuojami ar nelaipsniuojami; veiksmažodžiams: ar turi veikslo formas, ar neturi. Pavyzdžiui, jei MV žodyne yra angliškas žodis worth, bet nenurodomas jo valdymas, tada šis žodis išverčiamas, bet pateikiamas gramatiškai netaisyklingas lietuvių kalbos sakinys, pvz.: Region is worth a stop. Sritis/Regionas yra verta sustojimas. O nurodžius, kad worth lietuvių kalbos atitikmuo reikalauja kilmininko, gaunamas tikslus vertimas: Sritis/Regionas yra verta sustojimo. Dar reikia nepamiršti, kad nemaža žodžių turi po kelis variantus. Kartais atrodo, kad skiriasi tik viena raidė, bet tokio žodžio MV sistema neišverčia. Panagrinėkime išverstą sakinį su žodžiu diktats (diktatai). Šis žodis neišverstas į lietuvių kalbą, nes MV žodyne yra įtrauktas tik žodis dictate, o jo varianto diktat nera: Worse, we cannot do what Washington politicians appear to be doing, which is to blame the collapse of civil society on Iraqi failure to take control when we have made it virtually impossible by our policies and diktats for the government to do so. Blogiau, mes negalime padaryti tai, ką Vašingtono politikai atrodo daryti, kuris yra kaltas pilietinės visuomenės žlugimas ant Irako nesėkmės/gedimo, kad paimtų kontrolę/valdymą, kai mes padarėme jį faktiškai neįmanomą prie mūsų politikos/poliso ir diktats vyriausybei, kad padarytume taip. Kiek reikia plėsti MV sistemos žodynus? Atsakymas į šį klausimą gali būti dvejopas: viena vertus, nuo MV žodyno dydžio priklauso ir į lietuvių kalbą išversto sakinio kokybė: kuo daugiau žodžių įtraukiama į MV žodyną, tuo mažiau lieka neatpažintų žodžių, klaidingai išanalizuotų angliškų sakinių (dažnai neatpažinti žodžiai trukdo MV sistemai išanalizuoti anglišką sakinį). Pvz.: Meanwhile, Hata said, existing damselfish gardens face an uncertain future as global warming continues to negatively impact coral reefs. Tuo tarpu, Hata pasakė, egzistuodamas damselfish sodai yra atsisukus/drąsiai sutinka į abejojančią/abejotiną ateitį, nes globalinis atšilimas tęsia neigiamai paveikti koralų rifus. O štai sakinys, kuriame išverstas prieš tai buvęs neatpažintas žodis: Tuo tarpu, Hata pasakė, egzistuojantys vienuolžuvinių[iii] sodai stovi su abejojančia ateitimi, nes globalinis atšilimas tęsia neigiamai paveikti koralų rifus. Išanalizuotas žodis damselfish, todėl suderinti šalia esantys žodžiai, t. y. egzistuojantys ir sodai, vadinasi, pagerėja viso sakinio vertimo kokybė. Kita vertus, akivaizdu, kad į jokį žodyną neįmanoma įtraukti visų žodžių. Dėl MV sistemų netobulumo ir sunkiai formalizuojamų natūraliosios kalbos ypatybių (daugiareikšmiškumo, metaforų, humoro, ironijos ir pan.) dažnai kuriant MV sistemą apsiribojama tam tikrų temų ar sričių tekstais: juos verčiant naudojamasi ne tik bendruoju MV žodynu, bet ir specialiaisiais (pavyzdžiui, teisės, ekonomikos, sporto) žodynais. Tada labiau tikėtina, kad svetimos kalbos terminai bus išversti tiksliau. Pavyzdžiui, PROMT VER-Dict 2.0 MV sistemos versijoje yra 7 mln. žodžių ir žodžių junginių, pateiktų net 120 specialiųjų žodynų (Prochorov et al. 2006). Be to, kai kuriose MV sistemose (kaip ir minėtoje kompanijos Promt MV sistemoje) vartotojai turi galimybę susikurti savo žodynus ir juos pildyti sau reikalingais žodžiais ar junginiais; gali redaguoti MV sistemoje esančius žodynus, pvz., sukeisti atitikmenis vietomis, vieną ar kelis atitikmenis pažymėti kaip neaktyvius, kad jų nepateiktų verčiant tam tikrus tekstus. Norint gauti labai geros kokybės vertimą, į anglų–lietuvių kalbų MV žodyną reikėtų įtraukti kelis šimtus tūkstančių žodžių (dabartinės anglų–lietuvių MV sistemos versijos žodyno dydis – tik 50 tūkst. žodžių). Tačiau naujų žodžių įtraukimas, suprantama, nepanaikins atitikmenų daugiareikšmiškumo problemos: naujai įtraukti žodžiai gali turėti po kelis atitikmenis. Todėl įtraukiant naujus žodžius, reikia kartu svarstyti, kaip pateikti atitikmenis, išsamiau ištirti gramatinį ir semantinį atitikmenų junglumą. Tai kuo gi skiriasi tradiciniai ir MV žodynai? Kaip matyti iš anksčiau aptartų problemų ir pateiktų pavyzdžių, norint parengti žodyną MV sistemoms reikia nė kiek ne mažiau kruopštumo, laiko ir pastangų negu tada, kai rengiami tradiciniai žmonėms skirti žodynai. Taip pat aišku, kad MV skirtas žodynas nėra tradicinis žodynas, perkeltas į elektroninę terpę. Kadangi visų (kartais keliolikos ar keliasdešimties) tradiciniuose žodynuose pateiktų atitikmenų negalima įtraukti į MV žodynus, mašininis vertimas nėra toks tikslus, koks būna verčiant žmogui, neribojamam apibrėžto atitikmenų skaičiaus: jis gali rinktis iš daugybės žodyne duotų atitikmenų, be to, remdamasis savo kalbos jausmu, patirtimi ir kontekstu gali pasirinkti ir tokį, kurio nepateikia žodynas. Akivaizdžiausi MV ir tradicinių žodynų skirtumai yra šie: MV žodyne dažniausiai pateikiama po vieną atitikmenį vienai ar kelioms svetimos kalbos žodžio reikšmėms; tam parenkami žodžiai, kuriuos galima vartoti įvairiuose kontekstuose; įtraukiama daug pastoviųjų junginių. Jeigu pateikiami keli svetimos kalbos atitikmenys, tada nurodoma papildoma gramatinė ir semantinė informacija, padedanti aiškiai apibrėžti, kur šie žodžiai vartojami, kuo jie skiriasi; arba kai kurie atitikmenys pateikiami kartu su tik tam tikrais pastoviaisiais junginiais. Nemažai šiame straipsnyje aprašytų MV žodynų trūkumų padeda šalinti specialieji žodynai ir galimybė juos pasirinkti. MV kokybė vartotojus dažnai nuvilia. Reikia turėti omenyje, kad MV procesas visada vyksta automatiškai, nėra jokios ankstesnio konteksto analizės. Žmogus yra kūrybinga asmenybė, gebanti interpretuoti, o MV sistema tik naudojasi jai pateikta informacija. Kuo aiškiau ir tiksliau ta informacija aprašyta, tuo geresnio rezultato galima tikėtis. Literatūra Arnold D. J., Balkan L., Meijer S. et al. 1994, Machine Translation: an Introductory Guide. London: Blackwells-NCC (http://www.essex.ac.uk/linguistics/clmt/mtbook/). Dillinger M. 2001, Dictionary Development Workflow for MT: Design and Management (http://www.eamt.org/summitVIII/papers/dillinger.pdf). Gerber L., Yang J. 1997, Systran MT Dictionary Development (http://www.mt-archive.info/MTS-1997-Gerber-2.pdf). Marcinkevičienė R. 2000, Tekstynų lingvistika. Teorija ir praktika. Darbai ir Dienos 24, 7–64. Pinkham, J., Smets M. 2002. Machine translation without a bilingual dictionary (konferencijos the 9th International Conference on Theoretical and Methodological Issues in Machine Translation pranešimų medžiaga), Japonija, 146–156 (http://www.eamt.org/archive/ tmi2002/conference/15_pinkham.pdf). Prochorov A. et al. – Прохоров А., Прохоров Н. 2006, Онлайновый перевод: обзор, сравнение, тестирование: Компьютер пресс, Февраль 2006, 84–87. Thurmair G. 2006, Using corpus information to improve MT quality (konferencijos LREC-2006: Fifth International Conference on Language Resources and Evaluatiojn. Third International Workshop on Language Resources for Translation Work, Research & Training pranešimų medžiaga), Italija, 45–48 (http://www.mt-archive.info/LREC-2006-Thurmair.pdf). Wood M. M., Pollard E., Horsfall H. et al. 1987, Dictionary Organization for Machine Translation: the Experience and Implications of the UMIST Japanese Project (konferencijos the third conference on European chapter of the Association for Computational Linguistics pranešimų medžiaga), Danija, 94–98 (http://acl.ldc.upenn.edu/E/E87/E87-1017.pdf).
|
|