Obavijest i molba – prijevod priručnika i sučelja programa OmegaT na hrvatski jezik

Poštovane kolegice i kolege.

Želim Vas obavijestiti da sam preveo veliki priručnik i korisničko sučelje programa za računalno potpomognuto prevođenje OmegaT. Poveznica za hrvatski prijevod je na stranici http://omegat.sourceforge.net/manual-standard/
Budući da posao nije bio jednostavan, a obavio sam ga bez ičije pomoći, molim Vas za povratne informacije – komentare i poglavito upozorenja na eventualne pogreške. Unaprijed toplo zahvaljujem za svaku primjedbu i molim da „nemate milosti”.
Adresa e-pošte za komentare: denisgracin@gmail.com

Dvije napomene: prijevod još pati od nekih „dječjih boljetica”. Primjerice, neki manji repetitivni dijelovi teksta ostali su neprevedeni zbog „štucanja” u automatskome ubacivanju atributa u prijevod. Nije moja pogreška pa to jednostavno zanemarite.

Jedan od osnovnih problema svodi se na ključnu terminologiju, što zapravo vrijedi za sve jezike osim engleskoga. Primjera radi, ustaljen je i svima razmjerno jasan termin fuzzy match. Prevesti ili ne? Prevesti, bez dvojbe, ali – kako? Moram naglasiti da sam o terminima temeljito razmišljao, neke prepravljao više puta, a usput sam izradio i tematski glosar od više od 1700 termina. Svejedno, držim da to ne znači kraj priče.

* * *

U kratkim crtama, OmegaT je program koji već neko vrijeme zadovoljava sve potrebe profesionalnoga prevođenja, i to za 0 kn. Redovito ga usavršava veći broj predanih i natprosječno kompjuterski pismenih kolega.

Usto ga sve više prihvaćaju i kolege profesionalci, jer je softversko rješenje iznimno stabilno, robusno i jednostavno za korištenje, a osigurava slobodu djelovanja zbog olakšanoga korištenja međunarodno priznatih standardnih formata datoteka prijevodnih memorija i terminoloških/rječničkih baza. Time se dokida ovisnost o strogo određenim, unikatnim i međusobno ne baš kompatibilnim formatima.

Valja napomenuti da nisu u DGT-u tek tako slučajno odabrali OmeguT pa program ne samo da koriste, nego su ga ktome i prilagodili svojim potrebama: http://185.13.37.79/
Štoviše, razvili su i neke dodatne korisne module za OmeguT, a potrudili su se i oko dokumentacije.

Na koncu, 0 kn i sloboda značajni su preduvjeti za širenje korištenja CAT alata, što može biti od velike koristi za sve nas, kako u samoj struci, tako i u obrazovanju.

Pozdravljam sve uz jednu sliku sučelja programa OmegaT na hrvatskome jeziku.

OmegaT HR GUI

Denis Gracin

P.S. Umjesto još jedne zahvale, svima prilažem na poklon terminološku bazu – Lex Agrokor ili Zakon o postupku izvanredne uprave u trgovačkim društvima od sistemskog značaja za Republiku Hrvatsku u formatu xlsx (EN<>HR). Poveznica: OVDJE!
Nadam se da će Vam biti od koristi;)

Jednostavno i praktično izvlačenje terminologije za prevoditelje

Egzekutivni sumarij

Nastavno na prethodni članak, u kratkim ćemo se crtama pozabaviti izvlačenjem terminologije iz tekstova u praksi, s naglaskom na jednostavnost i brzinu.

Odabir metode „čupanja” termina ovisi o raspoloživome vremenu, značaju i namjeni dokumentacije, sklonostima, ali i o brojnim drugim faktorima. U načelu imamo dva osnovna načina izvlačenja terminologije:

  • uglavnom ručni i
  • uglavnom automatski, s pomoću raznih programa.

Oba imaju i prednosti i mane, naravno. Prvi je pouzdaniji, ali zahtijeva više vremena, dok je potonji uobičajeniji zbog bržega ostvarenja rezultata i razmjerne pouzdanosti. Ovaj ćemo blog, između ostaloga, iskoristiti za navođenje ključnih informacija i prikaz osnova rada u oba načina. Izbjegavat ćemo komercijalna programska rješenja koliko god to bude moguće.

Svi i sve protiv korupcije

Pretpostavimo da nam je naručitelj poslao vrlo značajan tekst pod nazivom United Nations Convention against Corruption. Opet imamo PDF i nekih 80 kartica, za što bi nam trebalo nešto više od 13 dana. E, ali i ovaj naš zamišljeni naručitelj veli da na raspolaganju imamo samo tjedan dana. Scenarij je sličan onome iz matematičkoga prikaza nužnosti prethodnoga izvlačenja terminologije. Opet smo prisiljeni na suradnju. Imamo dva prevoditelja pa moramo osigurati ujednačenost prijevoda odnosno terminologije.1 Vrijeme je za posao!

Praksa čini savršeno

Naravno, najprije moramo pripremiti tekst za izvlačenje terminologije.2 Inače vrijedi pravilo da je najpogodniji datotečni format za takve radnje tzv. običan tekst, ilitiga narodski txt. Stoga ćemo najprije obaviti sve potrebne korake da bismo dobili uredno oblikovanu podlogu u formatu txt, tj. ovako nešto:

U ovome ćemo se članku usredotočiti na izvlačenje terminologije iz našega teksta s pomoću softvera, jer vremena za ručni rad nemamo. Na raspolaganju imamo više programa. Prema algoritmu se dijele na statističke i lingvističke, a imamo i kombinirane, tj. hibridne. Jedni su skupi, a drugi sasvim besplatni. Neki su u pravilu „bučni”, jer nude previše kandidata, a neki „tihi” pa preskaču korisne termine. Nije se baš lako snaći.

Da ne kompliciramo, odabrat ćemo poprilično pouzdano, moćno, brzo i jednostavno rješenje pod nazivom Rainbow u okviru programskoga paketa za lokalizaciju i prevođenje Okapi3, koje, između ostaloga, nudi i mogućnost izvlačenja terminologije.

Odgovarajuću inačicu Okapija možemo preuzeti s ove stranice, ovisno o OS-u koji koristite.

Potom ćemo raspakirati datoteku zip i time dobiti mapu sa sljedećim sadržajem:

Dvaput ćemo lijevom tipkom miša pritisnuti datoteku rainbow.exe da bismo otvorili program. Sučelje izgleda ovako:

Učitat ćemo naš txt u program naredbom Input > Add Documents i potom odabrati datoteku4. Evo kako to izgleda kod mene:

Za izvlačenje terminologije biramo Utilities > Term Extraction…, nakon čega se otvara sljedeći prozor za postavke:

U lijevome oknu nemamo što dirati, jer se prozor otvara već postavljen na ono što želimo, tj. Term Extraction, dok za desni dio sva objašnjenja imamo ovdje. Prevoditeljima je ključna postavka najmanjega broja pojavljivanja pojedinačnih termina u tekstu (Minimum number of occurences per term), koja mora biti postavljena barem na dva zbog ujednačenosti u timskome radu na jednome tekstu ili projektu.5

Pritisnemo Execute, malo pričekamo i otvara nam se datoteka terms.txt, u predmetnome slučaju s 417 ponuđenih kandidata. Za primjer pogledajmo prvih 40-ak:

Rezultat nije loš pa stoga nema previše posla u sljedećoj fazi, tj. uređivanju, koje se uglavnom svodi na uklanjanje svega što nisu termini, eventualno dodavanje ili uklanjanje ponekoga prijedloga ili priloga i ne tako rijetko razdvajanje/spajanje. Valja naglasiti da za prevoditelje nužno ne vrijede strogi kanoni klasičnih terminoloških baza. Drugim riječima, normalizacijom zapravo gubimo izravnu vezu s izvornikom i ugrožavamo samu osnovnu svrhu rada – korištenje terminologije u okviru alata za računalno potpomognuto prevođenje upravo u obliku u kojem se ona javlja u radnome materijalu. Time osiguravamo i temelje za vrlo potencijalan koncept pretprevođenja6.

Lopta je u vašem dvoru

Pokušajte, griješite, učite, ali nikako i nikada nemojte odustati od izvlačenja terminologije. Sretno!

____________________________________________

 

Prevoditelji i terminologija… I malo matematike

Citat umjesto uvoda

No terms, no knowledge, no science, no innovation, no prosperity, no hope; in that order. It is as simple as that.1

Terminologija i prevođenje

Svi su prevoditelji svjesni značaja terminologije. Međutim, ne bave se svi terminološkim radom, iako posla i problema s terminologijom redovito imaju preko glave. Izgleda da usto uglavnom nisu upućeni u metode kojima sami mogu doći do potrebnih termina i, što je najbitnije, učinkovito ih koristiti i tako ostvariti ujednačenost i kvalitetu te uštedjeti na vremenu, novcu i živcima.

Kolege najčešće spominju dva razloga2 za izbjegavanje sustavnoga rada na terminologiji. Prvi je složenost (u tehničkome smislu), a drugi nedostatak vremena.

Moja iskustva pokazuju da skoro cijeli proces terminološkoga rada nije nimalo kompliciran. Kažem skoro, jer sve radnje (od izvlačenja termina do konačnoga proizvoda) doista jesu prilično jednostavne, tehnički gledano. Najteži je pak posao utvrđivanja ekvivalenata, i to zbog više uzroka, od kojih nijedan nema veze s tehničkim aspektima rada. O tome ćemo nešto više u narednim člancima.

Terminologija i vrijeme

Najprije ćemo se osvrnuti na drugi razlog, koji me najviše kopka i nikako mi nije jasan. Što zapravo znači kad prevoditelj kaže da nema vremena za rad na terminologiji? Budući da tekst valja prevesti, a u tekstu jest terminologija, koja je u biti temeljni nositelj informacija te uvijek i bez iznimke zahtijeva poseban trud i vrijeme, o čemu se uistinu radi i koje to vrijeme tobože „nemamo”?

Rezultati nekih istraživanja otkrivaju da prevoditelji pri radu u prosjeku ulože i do 40 % vremena u istraživanje terminologije.3 Naravno, sve ovisi o kvaliteti, iskustvu i motivaciji prevoditelja, kao i o vrsti, kakvoći i namjeni dokumentacije. Svejedno, dobar i iskusan prevoditelj lako može relativno objektivno procijeniti koliko mu vremena treba za rješavanje terminoloških problema, a još lakše barem okvirno izračunati sate, dane, tjedne, mjesece i godine posvećene upravo istraživanju termina. Dodamo li tome i nerijetko „recikliranje” materijala za prijevod, činjenica je da smo bez sustavnoga održavanja terminologije zapravo izloženi dupliciranju posla, a time i dodatnim gubicima svih vrsta.

Navedenih 40 % prilično je velik udio u ionako ne baš jednostavnome radu prevoditelja. Pritom valja uzeti u obzir i faktor sve neljudskijih rokova u kombinaciji sa stalnim porastom potreba za prevođenjem. Logika nalaže da treba smanjiti navedeni postotak. Kako? Razmjerno jednostavno i lako.

Pokušat ću pojasniti cijeli proces u osnovnim crtama, uz napomenu da je optimalno rješenje za prevođenje pojedinačnih tekstova ili paketa dokumentacije angažiranje jednoga prevoditelja, uglavnom ujednačenosti i kvalitete radi. Budući da život ipak ne haje za optimalno, vrlo su česti prevoditeljski zadaci koje treba obaviti timski.

Prevođenje i terminologija

Dakle, klijent/naručitelj nam pošalje dokumentaciju za prijevod i najčešće nas odmah (svjesno ili nesvjesno) potiče na pristanak time što veli da ima „samo” 50-ak stranica pa nam određuje rok od sedam dana. Brzim pregledom odmah doznajemo da se ipak radi o 67 stranica, a u naravi pak punih 95 kartica teksta.4

Okvirni gornji prag „domaće” dnevne norme iznosi šest kartica.5 Sve iznad toga itekako je izvedivo, ali ipak samo na kraće staze i uz velike rizike po kvalitetu rada, prijevoda, života i zdravlja. Razvidno je da predmetni posao ne može obaviti jedan prevoditelj, jer 95 (kartica teksta) : 6 (kartica dnevne norme) = 15,83 dana.6 Jedino je rješenje suradnja. Za utjehu, još smo i dobro prošli, jer očito je da ćemo posao dijeliti samo s jednim čovjekom. Međutim, svaka podjela materijala za prijevod nosi sa sobom rizike, i to prvenstveno neujednačenosti terminologije. Mogućnost takvih (vrlo vjerojatnih) manjkavosti treba ukloniti u začetku.7

Prisjetimo se da prevoditelj u načelu uloži i do 40 % vremena na istraživanje terminologije tijekom prevođenja. U našemu slučaju, čak i kad bi imao na raspolaganju onih 15,83 dana, to bi iznosilo punih 6,33 dana. Nemojmo zaboraviti da je rok sedam dana, kao ni to da, osim istraživanja, terminologiju i sav ostali tekst treba i otipkati, oblikovati, dobro provjeriti i riješiti sve ostale popratne tehničke zadatke.

Budući da je naš prevoditelj pametan i svjestan da je ujednačenost ključ kvalitete, zna da najprije mora izraditi terminološku bazu, a za suradnika odabrati kvalitetnoga i iskusnoga kolegu koji poznaje metode korištenja terminologije.

Terminologija i prevođenje u praksi

Nekoć davno, puno prije osobnih računala u svakome domu, na svojoj sam se koži uvjerio da je terminologija najzahtjevniji, najznačajniji i najproblematičniji faktor u prevođenju. Sve brojniji rječnici nudili su mi sve manje i manje pomoći. U nuždi sam s vremenom i, moram obavezno naglasiti, nakon bezbroj pogrešaka i jalovih pokušaja, razvio vještine izrade vlastitih terminoloških baza. Na koncu sam ispolirao proces koji u osnovi čine sljedeće radnje:

  • segmentiranje tekstova,
  • izvlačenje terminologije8,
  • biranje i uređivanje kandidata,
  • istraživanje i upisivanje ekvivalenata i dodatnih informacija,
  • provjera kvalitete parova,
  • pretvaranje gotove terminološke baze u format prikladan za korištenje s alatima za računalno potpomognuto prevođenje,
  • uživanje u korištenju ujednačene i sređene terminologije prilikom rada i
  • na koncu, proizvodnja urednoga i kvalitetnoga prijevoda.

Trud oko izrade terminoloških baza višestruko je isplativ. Ciljano i sustavno prethodno rješavanje terminologije uvijek zahtijeva manje od navedenih 40 % vremena u odnosu na rok, što predstavlja automatsku blagodat.9 Kako god okrenemo, sve do 40 % apsolutno je prihvatljivo. Ne smijemo smetnuti s uma ni već spomenutu činjenicu „oporabe” radnih sadržaja: ono što napravimo danas bit će nam korisno i sutra.

Vratimo se na naš predmetni slučaj. Pretpostavimo da smo u cjelovito sređivanje terminologije iz naših 95 kartica, odnosno u izradu terminološke baze, uložili otprilike 25 % vremena koje imamo na raspolaganju za prijevod. To znači da svu potrebnu terminologiju imamo po isteku jedne četvrtine roka, tj. nakon 1,75 dana. Ostaje nam 5,25 dana za prevođenje 47,5 kartica po čovjeku, što po glavi iznosi 9,04 kartica dnevno. Nije baš bajno, naizgled. Međutim, imamo izrađenu ciljanu terminološku bazu i (skoro) u startu smanjen daljnji utrošak vremena za onih famoznih 40 %.

Terminologija i vrijeme u brojkama

95 kartica : 6 kartica dnevno = 15,83 dana. Neizvedivo za jednu osobu, jer rok je sedam dana.
Sve i da imamo „humanih” 15,83 dana, podijelimo li ih na dvije osobe, dobivamo 7,91 dana po čovjeku. Itekako izvedivo, ALI:

  • svejedno smo i dalje iznad roka od sedam dana, a uvijek valja uzeti u obzir i nepredviđene okolnosti, jer barba Murphy nikad ne odmara i ne zna za milost i
  • budući da posao ne obavlja jedan čovjek, nikako ne možemo očekivati automatsku usklađenost termina i prvoklasan prijevod, zbog čega je prethodna izrada terminološke baze očigledno čista i logična obveza.

Izrada terminološke baze: 25 % od 7 dana = 1,75 dana. Ostaje 5,25 dana za prijevod ili 9,04 kartica po čovjeku dnevno.
Umanjimo li 9,04 kartica za 40 % (zbog izrađene terminološke baze), dnevna norma iznosi 5,42 kartica po glavi.

Ako pak 7 dana umanjimo za 40 %, zapravo trebamo 4,2 dana za prijevod po čovjeku i imamo uvijek zlata vrijedan „višak” od 1,05 dana (5,25 stvarnih dana na raspolaganju umanjenih za 4,2 predviđena radna dana), odnosno više nego dovoljno vremena za kontrolu ujednačenosti i kvalitete konačnoga prijevoda.

In-house benefiti ekstrakcije i menadžmenta

Cijela je priča već sasvim drugačija, jer rok postaje kudikamo humaniji10, a što je najvažnije, možemo se baviti čistim i nepatvorenim prevođenjem, bez učestalih prekida radi istraživanja terminologije (čitaj – bez nepotrebnih frustracija).11 Tok misli u tom je slučaju sasvim drugačiji. Čovjek je i puno sigurniji kad zna da ima dobro postavljen najvažniji temelj i glavni preduvjet za kvalitetu – terminologiju.

Za kraj

Sustav prethodne izrade terminoloških baza koristim već desetljećima jer je nužan, logičan i, što je vrlo bitno – besprijekorno funkcionira. Naravno, nisam jedini na svijetu koji to radi. Svi bi prevoditelji trebali imati naviku posvećivanja dužne pažnje terminološkome radu. Valja spoznati da je isplativiji i mudriji manji redoviti prethodni trud (kao što je redovito pranje i pregled zubi i izvlačenje terminologije) od velike naknadne muke (zubobolja, zubara, plombi, mostova i pogrešaka u prijevodima).

Da stvar bude još jasnija, Jan Roukens i njegova prikladna kȏda:

No terms, no knowledge, no science, no innovation, no prosperity, no hope; in that order. It is as simple as that.

____________________________________________