Mobile menu

UE pune la dispoziţie 1 milion de propoziţii traduse
Thread poster: Tatiana Neamţu

Tatiana Neamţu
Romania
Local time: 12:23
English to Romanian
+ ...
Jan 30, 2008

Aici: http://www.proz.com/post/774280#774280 s-a discutat mai detaliat despre aceste aspecte.
Sunt colegi de pe forumul românesc care au importat baza de date? Merge? Fiind novice în Trados mi se pare un pic cam complicat.

Pentru colegii nevorbitori de limba engleză, UE pune la dispoziţie pe web baza de date (pe mai multe combinaţii lingivstice) ce poate fi importată în CAT (Wordfast, Trados etc) şi folosită ulterior în traduceri.


Direct link Reply with quote
 

Cristiana Coblis  Identity Verified
Romania
Local time: 12:23
Member (2004)
English to Romanian
+ ...
n-am început încă să le import Jan 31, 2008

N-am avut timp zilele astea. Dar voi încerca în weeekend. Încă nu mi-am instalat nici SP2 la Trados... Da, şi eu cred că va face figuri din cauza mărimii. Probabil ar fi mai practic de lucrat cu ele tot pe bucăţi. Am TM-uri care conţin peste 50.000 de TU, deci au în jur de 10 Mb, dar nu este o dimensiune colosală. La dimensiunea asta încă lucrez fără probleme cu ele, timpul de căutare în Trados nu e sesizabil şi "unealta" face faţă tehnic.

Ei bine, acum e cazul să facă o vitejie CAT-urile noastre pe care unii dintre noi au dat o căruţă de bani Să vedem cât merită de fapt. Ba eu n-am de gând să menajez CAT-ul, ci o să-l forţez chiar să văd cât poate Dacă nu poate, înseamnă că nu e suficient de bun şi să facă bine să devină.

Oricum, date fiind tendinţele de pe piaţa traducerilor, este un capital bun. Probabil ştiţi că se fac mişcări de ambele părţi ale oceanului de organizare a unor servere sau chiar a unor burse pentru TM-uri. Nu e deloc de neglijat, practic au devenit resurse mult mai importante decât CAT-urile şi e de aşteptat ca valoarea unui TM bun să crească, fapt de altfel firesc. Cunoştinţele umane valorează mai mult decât "unealta" şi nu ar fi normal să se deprecieze, ci să se aprecieze

M-am uitat mai atent pe pagina JRC http://langtech.jrc.it/DGT-TM.html Pentru română sunt aproximativ 650.000 de TU, nu e deloc rău, mai ales pentru cei care lucrează cu texte UE. Problema e că sunt răspândite prin cele 12 volume a câte 100 Mb bucata, deci probabil ar fi mai practic de folosit ceva pentru a căuta prin ele, pentru că şi traducerea în alte limbi ajută mult. Dar voi încerca să import partea pe română, să vedem. O să vă dau de ştire ce se întâmplă.

[Editat la 2008-01-31 06:27]


Direct link Reply with quote
 

Cristiana Coblis  Identity Verified
Romania
Local time: 12:23
Member (2004)
English to Romanian
+ ...
O eventuală soluţie Copernic Desktop Jan 31, 2008

Detalii: http://inttranews.inttra.net/cgi-bin/news.cgi?action=aff_art&art_id=27864

HTH


Direct link Reply with quote
 

Tatiana Neamţu
Romania
Local time: 12:23
English to Romanian
+ ...
TOPIC STARTER
Combinaţiile de limbi trebuiau separat Jan 31, 2008

Păi tocmai asta mi se pare şi mie aiurea că nu au făcut separat combinaţiile de limbi. La un moment dat nici nu mai eram sigură dacă înţeleg sau nu bine ce-i acolo.

Cristiana, îmi pare rău, eu folosesc Copernic, dar nu pricep cum m-ar ajuta aici What am I missing?


Direct link Reply with quote
 

Cristiana Coblis  Identity Verified
Romania
Local time: 12:23
Member (2004)
English to Romanian
+ ...
indexare şi căutare Jan 31, 2008

Tatiana Neamţu wrote:
Cristiana, îmi pare rău, eu folosesc Copernic, dar nu pricep cum m-ar ajuta aici What am I missing?


Sunt două soluţii: una ar fi importarea TU-urilor din respectivele TMX-uri şi căutarea prin memoria rezultată cu concordance (setarea ca memorie de referinţă), iar alta ar fi simpla indexare a lor şi căutarea prin ele cu ajutorul unui instrument de indexare/căutare (ex: Copernic). Eu în momentul de faţă nu o exclud pe a doua, deşi ambele s-ar putea să ridice probleme tehnice.

Pentru cineva care lucrează texte UE ar fi mai practică prima, pentru proiecte de altă natură nu ar merita efortul şi ar fi mai simplă a doua opţiune. Din câte am înţeles alţii au reuşit atât să importe TMX-urile, cât şi varianta a doua, cu indexarea. Depinde cum preferă fiecare.

Acum... asta e părerea mea de non-techie, God know what is best Poate îşi dau şi alţii cu părerea


Direct link Reply with quote
 

Monica Tuduce  Identity Verified
Luxembourg
Local time: 11:23
Partial member
Italian to Romanian
+ ...
Experienţa mea Jan 31, 2008

Am reuşit să descarc foarte greu toate cele 9 volume. Într-adevăr, era mult mai bine dacă le indexau pe limbi, nu aşa la grămadă. Nu mă pricep la baze de date, deci nu ştiu cum se putea face asta din punct de vedere tehnic.

Am compus mai întâi o memorie pe combinaţia IT-RO, a mers relativ repede, nu avea exagerat de multe unităţi, iar importul în Trados a luat cam 10-15 minute.
Am folosit funcţia Concordance ca să văd ce e prin ea: am remarcat destul de multe greşeli, unităţi traduse parţial, jumătate in italiană şi jumătate în română. Deci, mă bazez pe ea cu multă circumspecţie.

Când am încercat acelaşi lucru pe combinaţia FR-RO, totul a mers bine până la importul în Trados. L-am lăsat să lucreze cam 2 ore şi jumătate, dădea semne de blocare, importul mergea foarte greu, iar pe la unitatea 380.000 (nu am fost atentă câte are în total, dar deja e foarte mult) am renunţat şi am oprit importul. Urmează să construiesc câte o memorie separată folosind câte un volum sau cel mult două. Presupun că pe combinaţia EN-RO e şi mai rău sau similar. Însă dacă voi proceda aşa, vor rezulta 4-5 memorii. Din câte ştiu eu, Trados nu poate lucra decât cu o memorie principală, o a doua fiind folosită doar a referinţă, nefiind editabilă (nu sunt sigură, iar acum nu am reuşit să îmi dau seama exact cum). Deci nu văd o soluţie pentru a putea folosi simultan toate memoriile importate în acest fel.

Trebuie să văd şi eu Copernicul, ce ştie el face


Direct link Reply with quote
 

Maria Tulbure  Identity Verified
Local time: 12:23
Member (2005)
English to Romanian
+ ...
Experienţa mea Jan 31, 2008

Acum... asta e părerea mea de non-techie, God know what is best Poate îşi dau şi alţii cu părerea

[/quote]

Redau mai jos experienta mea:

1. Am descărcat cele 12 volume de aici: http://langtech.jrc.it/DGT-TM.html#Download

2. Am extras perechile de limbi care ma interesau respectând instructiunile de extragere, care se gasesc la aceeaşi adresă. Am respectat intocmai instrucţiunile si nu am avut nicio problema la extragere.

3. Am creat o memorie de traducere nouă (EN-RO) în Trados, apoi am importat pe rând fiecare fişier .tmx obţinut în urma extragerii. Pentru primele 11 am setat la 'Import mode': 'Large import file (with reorganisation)', iar la 'Existing translation units': 'Merge'. La al 12-lea fişier, pentru că TM avea deja peste 400.000 TU am setat 'Small import (no reorganisation)' şi 'Overwrite'. Am obţinut o memorie de traducere cu 496.000 TU. În final am încercat să reorganizez toată această memorie, dar Tradosul nu a rezistat decât până pe la 150.000 TU. Oricum memoria mea a fost reorganizată la importul fiecăruia din cele 11 fişiere. Am încercat să folosesc această memorie ca memorie principală şi nu am avut probleme, dar nu am mai lucrat până acum cu o memorie atât de mare şi nu ştiu cât este de sigură din punct de vedere tehnic şi cu ce surprize ne putem trezi. Ca memorie de referinţă pentru concordance cred că nu pune probleme. Am testat-o şi este OK.

4. Am testat şi metoda de consultare a bazei de date independent de traducere. Pentru asta am descărcat ApSIC Xbench de aici: http://www.apsic.com/en/products_xbench.html
Am importat cele 12 fişiere .tmx. Am testat şi căutarea cu acest instrument; merge foarte bine. Nu pune nicio problemă.

Consider că merită acest efort în special pentru cei care traduc documente UE.



[Edited at 2008-01-31 12:55]


Direct link Reply with quote
 

Cristiana Coblis  Identity Verified
Romania
Local time: 12:23
Member (2004)
English to Romanian
+ ...
Tehnic cică ar trebui să ţină Jan 31, 2008

Mulţumim pentru mesaje. Super O să trec şi eu la treabă cât de curând.

Din câte îmi amintesc, cică Trados ar trebui să ţină până pe la 1-2 milioane de TU. După asta s-ar putea să pună probleme de stabilitate. Vom vedea la următoarea tură de memorii făcute publice

Interesant este că acest pas al DGT pune oarecare presiune asupra altor instituţii cu megabaze de data de traduceri realizate din bani publici. Aşteptăm ca un exemplu bun să fie urmat şi de alţii (UNESCO, Banca Mondială, hai să zicem că la NATO nu ne aşteptăm prea curând).


Direct link Reply with quote
 

Mihaela BUFNILA  Identity Verified
Romania
Local time: 12:23
English to Romanian
+ ...
Wordfast Side Story Feb 2, 2008

În primul rând, parafrazând, aceasta nu-i o bază de date, cine-o atinge, atinge un om. Ea s-a clădit prin munca colegilor noştri şi lor trebuie să le mulţumim înainte de toate.

Când întâlneşti deva de genul “Having regard to Council Regulation (EC) No 384/96 of 22 December 1995 on protection against dumped imports from countries not members of the European Community(1) and in particular Article 9 thereof” tradus “Având în vedere Regulamentul nr. 384/96 al Consiliului din 22 decembrie 1995 privind protecţia împotriva importurilor care fac obiectul unui dumping din partea ţărilor care nu sunt membre ale Comunităţii Europene, în special articolul 9”, vorba lui Google, you’re feeling lucky.

Din punct de vedere tehnic, importul în Wordfast nu constituie o problemă. Fişierele se extrag pe perechi de limbi cu ajutorul aplicaţiei prevăzute în pachet. Fişierele .tmx sunt recunoscute de Wordfast şi apoi convertite în formatul specific .txt. Totul ar fi perfect din acest punct de vedere dacă literele „ş” şi „ţ” nu ar avea un comportament ostil – sunt redate printr-un alt font, ceea ce mă face să cred că au fost importate la origine – şi atunci când sunt aduse la un numitor comun (Courier New) în TM deschisă cu Word, memoria dispare cu totul. Soluţia manuală, de a schimba literele în textul curăţat e cam medievală, dar eu alta nu ştiu. Poate cei cu mai multă experienţă pot oferi o soluţie mai sprintenă.

O a doua problemă ar fi faptul că memoria nu poate fi gestionată prin editorul Wordfast, care la deschiderea memoriei direct în document, nu prezintă decât o înşiruire de coduri numerice reprezentând codificarea perechilor extrase. Deci suita de funcţii specifice de gestionare cu care este echipat editorului TM Wordfast este inoperantă.

Chiar cu aceste neajunsuri, baza de date este extrem de valoroasă pentru căutarea în context de exemplu, nu în primul rând pentru rezolvarea problemelor terminologice, unde există mai multe opţiuni (IATE, glosarele pe specialităţi) ci mai ales pentru poziţionarea terminologiei într-un cadru lingvistic firesc şi limpede ca cristalul.


Direct link Reply with quote
 
kosson
Local time: 12:23
English to Romanian
referitor la ț și ș Feb 2, 2008

De obicei ț-urile și ș-urile nu apar la textele codate ISO-8859-1 fiind inlocuite cu patratele sau alte artefacte. Asta nu înseamnă ca s-au pierdut. Daca software-ul ar avea vreo opțiune de encoding ISO--8859-2 sau UTF8 s-ar rezolva problema, caracterele fiind redate corect.

Sper să vă ajute informația

P.S. Salutati domnului Ovidiu de la Nicolaie (vecinul)


Direct link Reply with quote
 

Mihaela BUFNILA  Identity Verified
Romania
Local time: 12:23
English to Romanian
+ ...
Mulţumesc Feb 2, 2008

kosson wrote:

De obicei ț-urile și ș-urile nu apar la textele codate ISO-8859-1 fiind inlocuite cu patratele sau alte artefacte. Asta nu înseamnă ca s-au pierdut. Daca software-ul ar avea vreo opțiune de encoding ISO--8859-2 sau UTF8 s-ar rezolva problema, caracterele fiind redate corect.



Am încercat, nu merge!


Direct link Reply with quote
 

Dan Marasescu  Identity Verified
Romania
Local time: 11:23
Member (2003)
English to Romanian
+ ...
Despre utilitatea memoriei Feb 4, 2008

Am fost puţin surprins de mişcarea Comisiei, dar acum nu mai sunt. De fapt, tot conţinutul memoriilor e public şi nu există, deci, probleme de confidenţialitate. Dacă cineva ar avea nervii suficient de tari şi mult timp la dispoziţie, ar putea ajunge cam la acelaşi rezultat descărcând şi aliniind documentele disponibile în EurLex.

Riscul, dacă există vreun risc, e mai degrabă de partea traducătorilor, cărora le lipsesc informaţii importante pentru folosirea judicioasă a traducerilor. Memoria faraonică a Comisiei a fost extrasă din Euramis (European Advanced Multilingual Information System). Instrumentul a fost dezvoltat iniţial de către Comsie, căreia i s-au alăturat în timp şi celelalte instituţii. Nu e vorba de o armă secretă - există de altfel scurte prezentări în unele documente publice ale Comisiei (http://ec.europa.eu/dgs/translation/bookshelf/tools_and_workflow_en.pdf) - ci numai de o armă unică prin dimensiuni şi prin natura activităţii de traducere în cadrul instituţiilor.

Euramis nu stochează numai acte legislative, deşi cred că selecţia publică făcută de Comisie se limitează la acquis, ci cuprinde şi documente interne sau documente de lucru ale celor trei instituţii mari. Este conceput ca un instrument interinstituţional, dar nu reuşeşte să uniformizeze suficient traducerile, limbajul standard şi terminologia specifică din cauza faptului că la memoria Euramis contribuie permanent minimum 125 de traducători pentru fiecare pereche de limbi, la contribuţia cărora se adaugă şi documente traduse înainte de aderare. Vor apărea, prin urmare, mai multe variante de traducere pentru acelaşi lucru şi varianta cea mai bună va fi greu de ales.

Traducătorii instituţiilor nu lucrează deschizând în Trados toată memoria disponibilă în Euramis, din motive tehnice dar şi de gestionare a memoriei. E puţin probabil ca un traducător extern să fie suficient de experimentat pentru a hotărî care e varianta ideală într-un anumit context. Complicaţia derivă din procedurile de legiferare (în principal codecizia).

În cazul nostru (la Consiliu), există o unitate Trados/Euramis care pregăteşte memoria pentru fiecare document. Funcţiile de căutare, analiză şi aliniere din Euramis produc o statistică a celor mai relevante documente şi segmente pentru documentul în cauză. Apoi, un funcţionar versat, care cunoaşte foarte bine traseele documentelor, hotărăşte care documente sunt prioritare şi trebuie să intre în memoria noastră de lucru pentru fiecare document. Dacă instituţiile nu vor face o astfel de selecţie şi pentru traducătorii externi, bestia poate deveni de nestăpânit.

Alt lucru care reduce utilitatea memoriei pentru traducătorii externi este faptul că e bazată exclusiv pe legislaţie, în condiţiile în care instituţiile evită cu îndârjire externalizarea documentelor legislative.

Sper că cele de mai sus nu sună a descurajare şi că memoria va fi utilă cât mai multora.

Dan


Direct link Reply with quote
 

Cristiana Coblis  Identity Verified
Romania
Local time: 12:23
Member (2004)
English to Romanian
+ ...
publicarea memoriei şi utilitatea ei Feb 5, 2008

Din câte am înţeles eu din discuţiile de la ultimul seminar FIT Europe privind copyrightul asupra memoriilor şi nu numai, Comisia are o interpretare interesantă a drepturilor asupra memoriilor. Anume, ei consideră că o memorie a formată practic din două texte, textul sursă şi textul ţintă, iar drepturile asupra ei sunt ca atare partajate de autorii respectivelor texte sursă şi ţintă. În cazul de faţă, nu există vreo dilemă, pentru că atât textele sursă, cât şi ţintă sunt publice, aşadar era logic ca, urmând raţionamentul lor, şi memoria în care acestea sunt aliniate şi organizate în perechi de fraze să fie tot publică.

După acelaşi raţionament, ar fi logic ca şi alte instituţii publice să facă accesibile memoriile lor care îndeplinesc aceleaşi criterii. La fel cum au făcut publice diferite glosare multilingve, uneori colosale, instituţiile publice nu ar trebui să trateze diferit memoriile de traduceri bazate pe texte publice.

Acestea fiind spuse, Dan are dreptate în privinţa utilităţii limitate a memoriei. E adevărat că ar fi fost mai utilă înainte de 2007, când încă se traducea acquis-ul la noi şi când mai recurgeam la alinierea de documente de pe Eurlex . După ianuarie 2007, nu s-a mai tradus legislaţia în ţară, ci numai alte tipuri de documente, de obicei publicaţii, situri web, diferite alte documente de ordin general.

Dar, după mine, memoria rămâne utilă ca precedent pentru alte instituţii şi ca referinţă pentru traducători. Personal nu mă aştept să folosesc vreun 100% match, dacă îl voi găsi vreodată în textele externalizate de instituţii, dar ca referinţă pentru a lămuri anumite aspecte va fi foarte utilă, la fel cum e şi IATE.

Apropo, am înţeles că ar exista un ghid stilistic interinstituţional pentru limba română. Ultima dată când am căutat, nu l-am găsit şi cine mi-a promis linkul nu s-a ţinut de cuvânt sau nu l-a putut trimite... Are cineva un link?


Direct link Reply with quote
 

Dan Marasescu  Identity Verified
Romania
Local time: 11:23
Member (2003)
English to Romanian
+ ...
Ghiduri Feb 5, 2008

Interinstitutional Style Guide (pentru redactare)
http://publications.europa.eu/code/en/en-000500.htm

Ghidul practic comun (pentru traducătorii tuturor instituţiilor)
http://ec.europa.eu/translation/language_aids/freelance/documents/joint_practical_guide/ro.pdf

Guide for Freelance Translators (pentru traducătorii externi ai Comisiei)
http://ec.europa.eu/translation/language_aids/freelance/documents/freelance_guide_en.pdf


Direct link Reply with quote
 

Cristiana Coblis  Identity Verified
Romania
Local time: 12:23
Member (2004)
English to Romanian
+ ...
Minunat, mersi mult! Feb 5, 2008

Dan Marasescu wrote:
Ghidul practic comun (pentru traducătorii tuturor instituţiilor)
http://ec.europa.eu/translation/language_aids/freelance/documents/joint_practical_guide/ro.pdf


Exact asta căutam. Mulţumesc.


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Lucica Abil[Call to this topic]

You can also contact site staff by submitting a support request »

UE pune la dispoziţie 1 milion de propoziţii traduse

Advanced search






PerfectIt consistency checker
Faster Checking, Greater Accuracy

PerfectIt helps deliver error-free documents. It improves consistency, ensures quality and helps to enforce style guides. It’s a powerful tool for pro users, and comes with the assurance of a 30-day money back guarantee.

More info »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »



All of ProZ.com
  • All of ProZ.com
  • Term search
  • Jobs