Mobile menu

Creare una TM bilingue con Winalign?
Thread poster: Joris Bogaert

Joris Bogaert  Identity Verified
Italy
Local time: 01:17
Italian to Dutch
+ ...
Sep 9, 2006

Salve,

Avrei bisogno di creare una TM partendo da una traduzione già fatta. Possiedo il TM monolingua del cliente (vale a dire source e target identici - italiano/italiano).

Il formato del documento di riferimento (che possiedo sia nella lingua 'source' che 'target') è in Acrobat (PDF), e sono ca. 470 pagine, ma il testo è esportabile (niente scan) in word. Devo aggiornare e completare la TM mediante Tageditor. Lavoro con Trados Freelance 6.5.

Cercando alcuni riferimenti su proz, ho trovato un bel articolo sull'uso di Winalign: http://www.proz.com/translation-articles/articles/593/1/WinAlign-Beginners'-Guide
Ma ho anche visto che esiste un 'aligner' peraltro gratuito: http://sourceforge.net/projects/bitext2tmxstrumenti simili

Cosa mi potete consigliare, è abbastanza efficiente per questo compito? Scusatemi la domanda forse ingenua, ma ho ancora poca dimestichezza con Trados e i suoi componenti... di solito uso un altro CAT.

Grazie per i vs. consigli!

Joris


Direct link Reply with quote
 

gianfranco  Identity Verified
Brazil
Local time: 21:17
Member (2001)
English to Italian
+ ...
Problemi nell'estrazione da PDF Sep 9, 2006

Joris,

Joris Bogaert wrote:
fatta. Possiedo il TM monolingua del cliente (vale a dire source e target identici - italiano/italiano).

Non capisco cosa sia questa TM con italiano-italiano. Non ha senso. E' forse un file che ti hanno dato per sovrascrivere la lingua target?
Insomma, un file .txt in cui tradurre a mano?


La tua TM può essere creata convertendo i due file PDF come segue:

1. Copia tutto il contenuto dei PDF in file Word che salvi come RTF, anche in varie sessioni, per esempio, una sessione e un file per ogni capitolo.

2. Apri questi file RTF con WinAlign, verifica e perfeziona l'allineamento e WinAlign.

3. Salva il tutto in un file txt che puoi usare, importandolo in una memoria vuota per popolarla e per lavorarci.




Cosa mi potete consigliare, è abbastanza efficiente per questo compito? Scusatemi la domanda forse ingenua, ma ho ancora poca dimestichezza con Trados e i suoi componenti... di solito uso un altro CAT.


Fin qui nessun problema. In teoria.

In pratica, tirando fuori il testo dai file PDF vedrai che è spezzato a ogni ritorno a capo, e probabilmente ti occorre ricostruire le frasi intere eliminando manualmente tutti i caratteri di ritorno a capo superflui.

Credo di avere visto in giro la citazione di una utility che fa questo lavoro, ma non ricordo il nome. Ora provo a cercarla nei forum...


* * * *

Intanto, occorre fare un'altra domanda. In che formato è il file da tradurre?
Oppure devi proprio scrivere in quella famosa memoria ita-ita?

In altre parole, il compito che ti hanno assegnato è di lavorare in quel file, oppure si tratta di un escamotage, ma esiste un file vero da tradurre, in altro formato?

ciao
Gianfranco


Direct link Reply with quote
 

Joris Bogaert  Identity Verified
Italy
Local time: 01:17
Italian to Dutch
+ ...
TOPIC STARTER
Aggiornamento da una versione (italiana) precendente Sep 9, 2006

Ciao Gianfranco,

Grazie per il tuo intervento.
Da quello che ho capito io, il cliente mi ha dato una memoria aggiornata tra la vecchia e la nuove versione del documento in lingua italiana. Io possiedo quindi le versioni 'vecchie' dei file pdf sia in lingua italiana che in olandese. La cosidetta 'Memoria IT-NL' lo è soltanto 'pro forma':

dixit:
"è la memoria da utilizzare insieme a TagEditor per la traduzione dei file con estensione ttx. La memoria di traduzione non è già una memoria ITALIANO/OLANDESE ma all'inizio è una memoria ITALIANO/ITALIANO in quanto per l'impossibilità di tempo per allineare tutte le lingue che dobbiamo tradurre abbiamo ideato il sistema di allineare l'italianao precedente (vecchia versione) conse stesso e succesivamente importarlo in una memoria ITALIANO-OLANDESE.
I file salvati in formati Tageditor (ttx) contengono invece il nuovo testo da tradurre (nuova versione, quindi) già esportato e salvato in formato Tageditor dai File in Pagemaker (....) Quando si comincia a tradurre in TagEditor, la memorie presenterà le differenze tra il testo del segmento aperto rispetto all'italiano precedente presente nella memorie, mostrando le differenze (parole, numeri.. da riportare nel segmento target e punteggiatura) e in base a queste indicazioni sarà possibile riconoscere quale corrispondente traduzione recuperare dai file pdf olandese della versione precedente all'interno del segmento 'target' facendo attenzione a riportare tutti i tag del segmento sorgente tranne quelli che spezzano le parole italiane....

Il testo del manuale, già tradotto nella versione precedente, deve essere recuperato integralmente e non ritradotto o cambiato tranne che per i riferimenti numerici (....)".

Uff..... Vorrei sapere se allineando la traduzione IT-NL della versione precedente, posso aiutarmi in qualche modo a svolgere questo lavoro. Leggendo queste istruzioni, ma gira la testa e ho paura di procedere e/o fare errori...
Grazie!


Direct link Reply with quote
 

gianfranco  Identity Verified
Brazil
Local time: 21:17
Member (2001)
English to Italian
+ ...
Prova con un capitolo e valuta l'utilità dell'allineamento Sep 9, 2006

Joris Bogaert wrote:
...
Vorrei sapere se allineando la traduzione IT-NL della versione precedente, posso aiutarmi in qualche modo a svolgere questo lavoro. Leggendo queste istruzioni, ma gira la testa e ho paura di procedere e/o fare errori...


La vecchia versione italiana e olandese, se le estrai, aggiusti il formato e ti crei la TM, potrebbe essere d'aiuto, ma nessuno può sapere a priori quanto. Nota che dipende anche dal numero e dal tipo di tag presenti perché potrebbero interferire con il 'matching' e non troveresti molte frasi, pur esistenti, soprattutto se il nuovo documento è stato sottoposto a intenso lavoro di riformattazione.


In sostanza, il tuo cliente non ha voluto fare un allineamento, per risparmiare il suo tempo, ma ti presenta una TM bizzarra che non serve a niente. Spero che non ti stiano proponendo questa memoria come un aiuto alla traduzione, con conseguente riduzione della tariffa piena!!!

Quello che ti suggeriscono è di usare la frase italiana che viene fuori, o potrebbe venire fuori (se la formattazione non interferisce) per... "aiutarti a trovare l'olanddese", ma questo lo devi fare tu, a mano.
Praticamente devi andare a vedere nel file PDF italiano dove si trova la frase, probabilmente con una funzione manuale di ricerca nel PDF, e poi, quando la trovi, andare a vedere dove si trova la corrispondente frase in olandese, contando sull'allineamento dei due manuali. A questo punto devi copiare o digitare la frase olandese, rispettando le tag del documento nuovo.

Forse fai prima a seguire il progredire del testo a occhio, sperando che la struttura della nuova versione sia simile a quella vecchia.

In ogni caso, non ti stanno dando nessuna TM e non è noto, a priori, il grado di utilità di un tuo eventuale laborioso lavoro di allineamento.
Il mio unico consiglio è forse quello di affrontare il problema con un solo capitolo e vedere che risultati ottieni, i tempi di lavorazione per l'allineamento e il livello di matching con la corrispondente sezione del nuovo manuale.

Questa sarebbe l'unica prova vera della possibile utilità di un lavoro simile esteso all'intero documento. A quel punto potrai valutare se proseguire con l'allineamento o procedere a vista, cercando il testo che ti occorre nelle vecchie versioni italiana e olandese.

ciao
Gianfranco


Direct link Reply with quote
 

gianfranco  Identity Verified
Brazil
Local time: 21:17
Member (2001)
English to Italian
+ ...
Utility per sistemare il testo estratto da PDF Sep 9, 2006

Joris,

ho trovato il vecchio forum in cui veniva citato l'utility di cui ho scritto sopra.
Si tratta di Autounbreak, lo trovi in
http://digital.hollmen.dk/products/autounbreak/index.htm

ed è stato citato in http://www.proz.com/post/406118#406118 , in
questa http://www.proz.com/post/398470#398470 e altre ancora.


ciao
Gianfranco


Direct link Reply with quote
 

Joris Bogaert  Identity Verified
Italy
Local time: 01:17
Italian to Dutch
+ ...
TOPIC STARTER
Traduzione problematica... Sep 10, 2006

Gianfranco Manca wrote:
In sostanza, il tuo cliente non ha voluto fare un allineamento, per risparmiare il suo tempo, ma ti presenta una TM bizzarra che non serve a niente. Spero che non ti stiano proponendo questa memoria come un aiuto alla traduzione, con conseguente riduzione della tariffa piena!!!


Grazie mille Gianfranco!

Ho fatto proprio come mi hai consigliato: ho copiato un capitolo dai file pdf ‘source’ e ‘target’, e ho creato 2 documenti Word in formato RTF. Quindi ho usato Autounbreak per ‘pulire’ i file rtf, per poi importali in Winalign. Il risultato è stato un po’ deludente (probabilmente ciò è anche dovuto alla mia totale inesperienza con queste applicazioni, ho usato le impostazioni 'standard' comunque) anche se molto istruttivo. Ca. il 60-70% delle frasi non vengono allineate per bene, e spesso non riesco neanche a collegarli insieme perché 'source' e 'target' non rientrano nello schermo...

Il fatto è che il mio cliente (cliente nuovo) mi ha fatto capire che c'era un match del 80% tra la vecchia e la nuova versione da recuperare da pdf. Purtroppo anche la tariffa è stata quindi ridotta del ca. 60% rispetto a quella mia abituale per un lavoro ‘no match’ (intendo dire che in generale accetto lo sconto in base alle percentuali di ripetizioni)… ma da formato elettronico e compatibile con un CAT software. Solo a mia esplicita richiesta ho ricevuto un LOG complessivo dei file ttx:

Analyse Total (91 files):

Match Types Segments Words Percent Placeables
XTranslated 0 0 0 0
Repetitions 1,506 6,239 9 1,097
100% 3,875 25,986 37 243
95% - 99% 573 8,742 13 489
85% - 94% 502 7,300 10 570
75% - 84% 282 3,233 5 282
50% - 74% 588 5,222 8 554
No Match 1,295 12,861 18 890
Total 8,621 69,583 100 4,125

Chars/Word 5.55
Chars Total 386,831

Inoltre, il cliente mi ha scritto: “Il conteggio complessivo delle parole è di 70.173 (80% - 100% match / 20% da tradurre)”…

Infatti, le altre ca. 1600 parole sono tratte dalle 85 piccole tabelle (formato Adobe Table 3.0 di Pagemaker 7) che fanno parte del presente incarico. Mi chiedo peraltro come il mio cliente li ha conteggiati, anche perché queste tabelle non sono semplicemente da copiare in un documento Word poiché Word li legge come immagini. Mi tocca quindi creare un file ex-novo speculare nel quale dovrò inserire la traduzione di ogni tabella. In pratica, non potrò usufruire di un CAT tool… quindi non capisco come mai il mio cliente parli di 80% di ripetizioni…

Mi sono visto presentato un PO da firmare e restituire (non l’ho ancora né firmato né restituito) con ‘una tantum’ un po’ approssimativo.

Non riesco a valutare l'immensità del lavoro (i file ttx corrispondono a 467 pagine in pdf!!) né a determinare la tariffa adeguata… Dovendo copiare da un file pdf per trasformare la TM IT-IT in una TM IT-NL, mi viene da pensare che le ripetizioni non giustificano uno sconto del ca. 60% rispetto alla mia tariffa ‘normale’.

Sta valutando di aprire una trattativa sul prezzo, ma sinceramente -avendo poca esperienza con questi formati e rielaborazioni 'problematici'- non so bene cosa chiedere...

Grazie ancora per i tuoi preziosi consigli, Gianfranco!

Joris


Direct link Reply with quote
 

gianfranco  Identity Verified
Brazil
Local time: 21:17
Member (2001)
English to Italian
+ ...
La loro riduzione mi sembra eccessiva Sep 10, 2006

Joris Bogaert wrote:
...
Il fatto è che il mio cliente (cliente nuovo) mi ha fatto capire che c'era un match del 80% tra la vecchia e la nuova versione da recuperare da pdf.
...


Probabilmente esiste un livello simile di 'similarità', ma non di "matches", perché non esiste una TM e te li devi andare a cercare a mano, con o senza il trucco della TM ita-ita che non aiuta di molto, come avevo sospettato.
Anzi, il lavoro di ricerca che loro ti propongono, in realtà potrebbe essere più lungo che non seguendo i due documenti a occhio.

Anche io non vedo, dai numeri dell'analisi, un livello di ripetizione pari all'80%. Vedo un 9% di ripetizioni e un 37% di match al 100% (che però non hai a disposizione in una TM), e il resto sono fuzzy matches (anche quelli senza TM).

A occhio e croce, considerando che anche le ripetizioni non sono eliminabili tout-court dal lavoro, e che nel tuo caso non c'é una vera TM, potresti proporre un una tariffa ridotta del 30-40% ma solo su una frazione del volume totale (il 46%, pari al 9%+37%), ma non molto di più.

In sostanza:
30-40% di sconto sul 46% del volume
Tariffa piena sul restante 54%

Risulta, complessivamente una riduzione del 20% (non del 60%) sul totale.

In sostanza, hai molto materiale di riferimento, usabile in qualche modo, ma non si è mai applicato uno sconto del 60% giustificato dal materiale di riferimento. Un 20% sarebbe più ragionevole, se effettivamente la quantità e similarità giustifica una tua maggiore produttività.

Tieni presente che questo materiale non ti abbrevia di molto il lavoro perché il cliente ti impone il vincolo di rispettare rigorosamente il contenuto della vecchia versione, quindi ti forza a cercare tutto, manualmente, per mantenerlo nella nuova versione, che di fatto è un rallentamento rispetto al tuo lavoro di traduzione normale. Vogliono la precisione, ma non hanno alcun motivo per applicare riduzioni tanto elevate alla tua tariffa.

Se applichi una riduzione più ragionevole, in virtù del fatto che hai comunque molto materiale di riferimento già tradotto, in qualche modo disponibile, e in molti casi forse facile da recuperare, ti rimarrebbe da decidere se procedere a vista oppure provare a effettuare un allineamento completo.

Si tratta di un lavoro lungo e tedioso ma potrebbe essere un investimento di tempo (nota, tempo TUO!!) che nel seguito del progetto ti consentirà di procedere con una maggiore speditezza. Al limite, potrebbe essere un lavoro che dai in appalto, in toto o in parte, e che alla fine recuperi in produttività, avendo una TM vera in mano. Potresti risparmiare tempo su quel 37% dei matches (che sono ancora misteriosi nel modo in cui sono stati ottenuti dal cliente).

ciao e in bocca al lupo
Gianfranco



[Edited at 2006-09-10 16:45]


Direct link Reply with quote
 

Angie Garbarino  Identity Verified
Spain
Local time: 01:17
Member (2003)
French to Italian
+ ...
Knock knock Sep 10, 2006

Posso?

Solo per ringraziare per avermi fatto sapere dell'esistenza di questo unbreak, mi ha risolto un problema che mi stava facendo perdere un sacco di tempo.

Buona domenica sera e buon inizio di settimana

Ciao

Angio


Direct link Reply with quote
 

Joris Bogaert  Identity Verified
Italy
Local time: 01:17
Italian to Dutch
+ ...
TOPIC STARTER
Grazie Gianfranco! Sep 10, 2006

Gianfranco Manca wrote:
Risulta, complessivamente una riduzione del 20% (non del 60%) sul totale.

Tieni presente che questo materiale non ti abbrevia di molto il lavoro perché il cliente ti impone il vincolo di rispettare rigorosamente il contenuto della vecchia versione, quindi ti forza a cercare tutto, manualmente, per mantenerlo nella nuova versione, che di fatto è un rallentamento rispetto al tuo lavoro di traduzione normale. Vogliono la precisione, ma non hanno alcun motivo per applicare riduzioni tanto elevate alla tua tariffa.

Se applichi una riduzione più ragionevole, in virtù del fatto che hai comunque molto materiale di riferimento già tradotto, in qualche modo disponibile, e in molti casi forse facile da recuperare, ti rimarrebbe da decidere se procedere a vista oppure provare a effettuare un allineamento completo.

Si tratta di un lavoro lungo e tedioso ma potrebbe essere un investimento di tempo (nota, tempo TUO!!) che nel seguito del progetto ti consentirà di procedere con una maggiore speditezza. Al limite, potrebbe essere un lavoro che dai in appalto, in toto o in parte, e che alla fine recuperi in produttività, avendo una TM vera in mano. Potresti risparmiare tempo su quel 37% dei matches (che sono ancora misteriosi nel modo in cui sono stati ottenuti dal cliente).

ciao e in bocca al lupo
Gianfranco


Grazie Gianfranco! Sei stato molto gentile e chiaro. Mi hai chiarito molto le idee! Farò una nuova proposta al mio cliente e valuterò in seguito se accettare a meno il lavoro.

Buon inizio di settimana!
A risentirci!

Joris


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Simone Catania[Call to this topic]

You can also contact site staff by submitting a support request »

Creare una TM bilingue con Winalign?

Advanced search






LSP.expert
You’re a freelance translator? LSP.expert helps you manage your daily translation jobs. It’s easy, fast and secure.

How about you start tracking translation jobs and sending invoices in minutes? You can also manage your clients and generate reports about your business activities. So you always keep a clear view on your planning, AND you get a free 30 day trial period!

More info »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »



All of ProZ.com
  • All of ProZ.com
  • Term search
  • Jobs