Allineamento file per creare TM
Thread poster: gianfranco
gianfranco
gianfranco  Identity Verified
Brazil
Local time: 12:11
Member (2001)
English to Italian
+ ...
Jun 25, 2005

Cari colleghi,
sono alle prese con un grosso lavoro di allineamento. Qualcosa come 300.000 parole in due lingue.

Sto utilizzando WinAlign di Trados e, come al solito, mi fa venire i nervi.

Conoscete bene, per esperienza diretta, altri programmi che siano in grado di allineare gorssi file in Word/RTF senza rischiare la follia?

In generale, l'allineamento mi pare il parente povero di tutti gli strumenti che abbiamo.
Prima di provare tutti i progr
... See more
Cari colleghi,
sono alle prese con un grosso lavoro di allineamento. Qualcosa come 300.000 parole in due lingue.

Sto utilizzando WinAlign di Trados e, come al solito, mi fa venire i nervi.

Conoscete bene, per esperienza diretta, altri programmi che siano in grado di allineare gorssi file in Word/RTF senza rischiare la follia?

In generale, l'allineamento mi pare il parente povero di tutti gli strumenti che abbiamo.
Prima di provare tutti i programmi di allineamento, Wordfast, Wordfisher, DejaVu, chi mi saprebbe dare un consiglio da dove cominciare per non perdere troppo tempo?

Grazie
Gianfranco
Collapse


 
Maurizio Valente
Maurizio Valente  Identity Verified
Italy
English to Italian
+ ...
In memoriam
Caro Gianfranco, Jun 25, 2005

io mi trovo benissimo con Logiterm www.terminotix.com, che però costa una cifretta; ma ne vale la pena, è una scheggia e quasi sempre riesce a compensare la mancanza di pezzi nella lingua di origine o di destinazione (allineamento "intelligente")


Gianfranco Manca wrote:

Cari colleghi,
sono alle prese con un grosso lavoro di allineamento. Qualcosa come 300.000 parole in due lingue.

Sto utilizzando WinAlign di Trados e, come al solito, mi fa venire i nervi.

Conoscete bene, per esperienza diretta, altri programmi che siano in grado di allineare gorssi file in Word/RTF senza rischiare la follia?

In generale, l'allineamento mi pare il parente povero di tutti gli strumenti che abbiamo.
Prima di provare tutti i programmi di allineamento, Wordfast, Wordfisher, DejaVu, chi mi saprebbe dare un consiglio da dove cominciare per non perdere troppo tempo?

Grazie
Gianfranco



 
gianfranco
gianfranco  Identity Verified
Brazil
Local time: 12:11
Member (2001)
English to Italian
+ ...
TOPIC STARTER
Descrizione del mio problema con WinAlign Jun 25, 2005

Grazie Maurizio,
ho visitato il sito di Terminotix, e ho trovato una pagina molto interessante che puo' essere utile per tutti,
http://www.terminotix.com/eng/index.htm

A parte questo, il programma di allineamento viene chiamato "Alignment Robot" e non mi e' chiaro come funzioni.
Il sito dice:


How does the Alignment Robot work?

The Alignment Robot from Terminotix first of all locates pairs of documents of which one is the translation of the other. It then creates bitexts for each pair (a sentence-by-sentence alignment of the original text and the translation). This is done quickly and automatically.

If installed on the LogiTerm or LogiTermWeb server, the robot can be set up to run automatically every day, before the LogiTerm databases are indexed and backed-up. It therefore helps to automate some of your document management tasks and increases your firm's productivity... and may even prevent a good number of headaches!

The Alignment Robot from Terminotix is available for Windows servers.


Non viene neppure detto quanto costa, e pare che sia accoppiato ad altri loro programmi.
Non pare essere un progamma di allineamento stand-alone, che si possa acquistare e utilizzare da solo...

Mi potresti dire qualcosa di più?


* * *

Descrizione dei miei problemi con WinAlign.


Questo programma promette un allineamento "intelligente" (come A.Robot), ma poi.. non lo fa. Riposrto dal manuale di WinAlign:


Structure Recognition

When linking source and target texts, WinAlign makes use of the fact that documents are usually structured and divided into various sections. For example, when a document is created in Microsoft Word, it usually contains structural elements identified by style names. The chapter title may be identified by the Heading 1 style. The same formatting must be preset in the translated text as in the source. Other text formats, such as SGML/HTML, FrameMaker, Interleaf and Ventura, use tags for
this purpose. WinAlign uses this information to create a structure tree for the source and target documents, and allows you to interactively influence how this tree is built. Even when the document pairs do not have a clear structure, WinAlign can use font sizes and paragraph numbering to perform structure recognition.


Insomma, dovrebbe allineare i segmenti riconoscendo, o tentando di riconoscere gli accoppiamenti in base ad alcune caratteristiche, stile, font, numerazione, contenuto, lunghezza, ecc...
In pratica NON LO FA!!!

- Il primo allineamento, cosidetto 'intelligente', dopo poche righe incomincia ad essere sballato e piu' si va avanti e piu' e' disallineato, con i segmenti che si trovano a distanza di varie schermate l'uno dall'altro.
- E' vero, come dicono, che e' possibile intervenire manualmente, ma deve essere fatto, in pratica, per tutti i segmenti, fin quasi dall'inizio, ed e' tutto a base di mouse, senza shortcut da tastiera. Occorre proprio scollegare il link errato e ricollevare quello corretto, a mano, con una procedura lentissima e laboriosa.

- Se i due segmenti sono distanti, non e' facile navigare tra i due segmenti corrispondenti. Il programma e' lento e si perde il punto su cui si vuole lavorare.

- Non e' possibile rimuovere blocchi di segmenti in eccesso (ovvero presenti in una lingue e assenti nell'altra)

E poi, essendo i file grossi,ogni tanto si blocca e ci perdo il lavoro fatto, quindi devo salvare continuamente e lavorare con il patema d'animo che in ogni istante posso perdere il lavoro non salvato. Aaaaarghh!!!!


Per un file di 10 pagine, o 15, si potrebbe avere pazienza, ma io ho una quantita' di testo enorme in un pacco di file grossi. Da diventare matto.

Dovrei dividere ogni file in 10 file minori e lavorare su queste porzioni, ma dividendo non so se mi lascio una parte da allineare in un file entro un'altro. Mi spiego?


Insomma, quello che mi occorre sarebbe:
  • Un programma che faccia "veramente" un tentativo di allineamento intelligente (ma ciò non è essenziale se vengono soddisfatti i requisiti seguenti)

  • Poter intervenire manualmente dove occorre aggiustare, possibilmente con tasti funzione, e senza dover fare migliaia di puntamenti e click col mouse

  • Poter spostare o eliminare blocchi interi, poiché talvolta i due documenti non sono perfettamente corrispondenti.

  • Un programma in grado di gestire file grossi senza andare in crash ogni pochi mimuti!!



    Chiedo troppo? a me pare che un programma di allineamento serio dovrebbe fare quanto sopra, altrimenti e' un giocattolo buono solo per file di poche paginette.

    Qualcuno conosce un programma simile?

    ciao e grazie
    Gianfranco




    [Edited at 2005-06-25 10:25]

     
  • Maurizio Valente
    Maurizio Valente  Identity Verified
    Italy
    English to Italian
    + ...
    In memoriam
    Alignment Robot è probabilmente un modulo di Logiterm ... Jun 25, 2005

    ... che invece permette di fare anche altre cose.

    Logiterm fa proprio quello che tu desideri. Ed è veloce, molto veloce, permette di allineare anche un pdf contro un file di excel, di allineare anche 20 coppie di documenti source-target in una botta sola. A volte fa fetecchia, ma in genere funziona (c'è solo da fare qualche ritocco manuale qua e là)


    Gianfranco Manca wrote:

    Grazie Maurizio,
    ho visitato il sito di Terminotix, e ho trovato una pagina molto interessante che puo' essere utile per tutti,
    http://www.terminotix.com/eng/index.htm






    [Edited at 2005-06-25 10:25]


     
    Ilde Grimaldi
    Ilde Grimaldi  Identity Verified
    Local time: 16:11
    Member (2003)
    English to Italian
    + ...
    Logiterm più "wf Aligner" di Wordfisher Jun 25, 2005

    anch'io ho comprato e uso Logiterm (pur avendo Trados, Dèjà Vu, wordfast, SDLX e StarTransit).

    Una volta ottenuto il suo allineamento, per gli aggiustamenti per me la soluzione più comoda è aprire il file html in Word. Ne viene fuori una tabella e uso la barra degli strumenti "wf Aligner" di Wordfisher per unire o dividere le celle. Ci sono appunto delle iconcine che corrispondono a delle macro per operazioni in allineamenti tabella di Word.

    Wordfisher in sé ha anc
    ... See more
    anch'io ho comprato e uso Logiterm (pur avendo Trados, Dèjà Vu, wordfast, SDLX e StarTransit).

    Una volta ottenuto il suo allineamento, per gli aggiustamenti per me la soluzione più comoda è aprire il file html in Word. Ne viene fuori una tabella e uso la barra degli strumenti "wf Aligner" di Wordfisher per unire o dividere le celle. Ci sono appunto delle iconcine che corrispondono a delle macro per operazioni in allineamenti tabella di Word.

    Wordfisher in sé ha anche la funzione di allineamento, ma è solo meccanica, non intelligente (Logiterm se trova qualcosa che gli sembra non sia ben allineata la lascia vuota e poi riprende più oltre), ma Wordfisher è un programma per Word, si può utilizzare solo per i file aperti nell'applicazione Word.

    Ah, poi per creare la memoria Trados:
    1) applico una macro per eliminare i codici tipici di Logiterm
    e
    2) applico la macro Wordfisher per trasformare una tabella in formato segmentato Trados, da cleanare in una memoria nuova.

    In alternativa a 2) applico una macro che trasforma i testi in tabella in formato di memoria esportata Trados*, che quindi si può importare in una memoria Trados)

    cioè questo (per questo post devo mettere lo spazio prima di segno maggiore e segno minore, altrimenti lo interpreta come html e non lo visualizza proprio)
    < TrU >
    < Seg L=EN-US >xxxx
    < Seg L=IT-IT >xxxx
    < /TrU >

    [Edited at 2005-06-25 11:24]
    Collapse


     
    Robert Tucker (X)
    Robert Tucker (X)
    United Kingdom
    Local time: 15:11
    German to English
    + ...
    Frankenstein Jun 25, 2005

    http://www.wilandra.com/~hans/

    I did succeed in aligning two short html files with it. However, I have only been able to get it to save as a Trados txt file and, since I do not possess Trados, have not been able to test this result.

    I cannot vouch for its stability or otherwise with large files.

    Possibly one to try out when you have plenty of time and patience.


     
    gianfranco
    gianfranco  Identity Verified
    Brazil
    Local time: 12:11
    Member (2001)
    English to Italian
    + ...
    TOPIC STARTER
    Thank you Jun 25, 2005

    Robert Tucker wrote:
    ...
    I cannot vouch for its stability or otherwise with large files.

    Possibly one to try out when you have plenty of time and patience.



    I have here 6 large files, in Italian and English, the first is 13500 segments. Other files are even larger...
    The sheer scale of the alignment project makes of every glitch or annoyance a major problem.

    I do have a lot of alignment experience, it is just that I cannot cope any more with WinAlign's glitches, instability, lack of features and bad usability.
    This program is only good if the files are basically already aligned, and not too large.

    If you need to move around blocks of text (which is not possible) or the files are slightly misaligned and large, WinAlign is useless.


    Gianfranco


     
    Massimo Rippa
    Massimo Rippa  Identity Verified
    Italy
    Local time: 16:11
    English to Italian
    + ...
    Tienici aggiornati Jun 26, 2005

    Non uso gli strumenti suggeriti dagli altri colleghi, ma sono molto interessato nel caso dovessero rivelarsi più profiqui di Winalign.

    Purtroppo Winalign è una croce e una delizia. Se i file originali sono strutturati bene, il tool funziona bene e può farti risparmiare giornate di lavoro di traduzione. Altre volte invece ti fa perdere ore e richiede operazioni manuali molto simili al cucire palloni in una fabbrica del sud est asiatico (l'iterfaccia ricorda proprio il cucire).
    ... See more
    Non uso gli strumenti suggeriti dagli altri colleghi, ma sono molto interessato nel caso dovessero rivelarsi più profiqui di Winalign.

    Purtroppo Winalign è una croce e una delizia. Se i file originali sono strutturati bene, il tool funziona bene e può farti risparmiare giornate di lavoro di traduzione. Altre volte invece ti fa perdere ore e richiede operazioni manuali molto simili al cucire palloni in una fabbrica del sud est asiatico (l'iterfaccia ricorda proprio il cucire).
    Alcuni suggerimenti di base che mi sento di darti dopo aver svolto alcuni lavori di allineamento piuttosto grossi:

    1) La versione 5 o 5.5 secondo me è molto più stabile delle versioni 6 o 6.5
    2) Più aumentano le dimensioni dei file da allineare, più lo strumento diventa inaffidabile. Per questo, spesso è molto utile fare un editing preliminare dei file, risolvendo i problemi più marcati, spezzettando il file in più file secondari, inserendo tutte le eventuali tabelle in file separati, eliminando la grafica e rimuovendo i tratti source o target che non hanno corrispondenze nell'altro file. Lo so che queste sono operazioni time consuming e frustranti, che non dovrebbero essere richieste a un traduttore o a un linguista, ma oramai la mia esperienza in lavori di alignement grossi mi suggerisce che sono indispensabili. In genere, mi metto d'accordo con l'agenzia nel determinare le ore spese solo alla fine del progetto, così che tutte le difficoltà affrontate possano essere giustamente retribuite. Una volta fatto questo il lavoro è molto più smooth, e il tool funziona abbastanza bene.
    3) Alcune caratteristiche del programma che potrebbero aiutarti: eseguire il commit dei segmenti può essere utile come passaggio preliminare per l'operazione "Realign structure level from active unit", anche se in genere l'esecuzione del commit tra due segmenti indebolisce la corrispondenza dei segmenti contigui. Nella versione 6.5 vedo che ci sono più opzioni per il commit rispetto alle versioni precedenti. L'opzione "Realign structure level from active unit" può essere la chiave di volta, cerca di imparare a usarla. Per familiarizzarti, non farlo MAI quando hai già allineato parecchi segmenti di file di grandi dimensioni, ma cerca di prendere confidenza con questa funzione eseguendola all'inizio della verifica dei file, dopo aver eseguito il commit dei segmenti chiave.
    Infine, come già detto il tool a volte è utilissimo, altre volte richiede una quantità di tempo ben superiore alla traduzione ex-novo. Anche se spesso farlo funzionare a dovere richiede un approccio empirico (la guida secondo me è completamente useless), secondo me è tra gli strumenti per traduttori che avrà più sviluppi nei prossimi anni. Se userai altri strumeti facci sapere come ti sei trovato, se hai da darci altri suggerimenti sull'uso di WinAlign, credo che saranno ben accetti comunque.

    Ciao e buon lavoro.
    Collapse


     
    Maurizio Valente
    Maurizio Valente  Identity Verified
    Italy
    English to Italian
    + ...
    In memoriam
    Mamma mia, Jun 26, 2005

    da quello che dici mi è già passata la voglia di cimentarmi con Winalign. E' roba da virtuosisti ...

    Massimo Rippa wrote:

    Non uso gli strumenti suggeriti dagli altri colleghi, ma sono molto interessato nel caso dovessero rivelarsi più ...

    Ciao e buon lavoro.


     
    Massimo Rippa
    Massimo Rippa  Identity Verified
    Italy
    Local time: 16:11
    English to Italian
    + ...
    Hehehe... Jun 26, 2005

    Maurizio Valente wrote:

    da quello che dici mi è già passata la voglia di cimentarmi con Winalign. E' roba da virtuosisti ...



    Ciao Maurizio
    Piuttosto, è roba da artigiani. Secondo me noi traduttori siamo degli atigiani della parola che dobbiamo a volte usare i nostri strumenti in combinazione con formule magiche. (Mi ricordo in particolare quando usavo ancora lo strumento di alignment di IBM TM2)
    A parte i paradossi, WinAlign è uno strumento medio basso, che con un po' di lavoro preliminare rende bene. Se qualcuno è sicuro (dopo aver comparato il lavoro) che altri tool rendano meglio, non esiti a farcelo sapere...


     
    gianfranco
    gianfranco  Identity Verified
    Brazil
    Local time: 12:11
    Member (2001)
    English to Italian
    + ...
    TOPIC STARTER
    Riporterò qui i risultati Jun 27, 2005

    Grazie a tutti coloro che si sono offerti di aiutarmi, anche scrivendomi in privato.

    Data la mole del lavoro, intendo studiare rapidamente i vari strumenti disponibili e verificare per ognuno di essi:
  • funzionalità
  • stabilità
  • usabilità e interfaccia


    Al momento ho a disposizione o conto di esaminare:
  • WinAlign 5.5
  • +Tools di Wordfast 5
  • DejaVu 3, da aggiornare a DVX
  • SDLX (ma solo se l'allineament... See more
  • Grazie a tutti coloro che si sono offerti di aiutarmi, anche scrivendomi in privato.

    Data la mole del lavoro, intendo studiare rapidamente i vari strumenti disponibili e verificare per ognuno di essi:
  • funzionalità
  • stabilità
  • usabilità e interfaccia


    Al momento ho a disposizione o conto di esaminare:
  • WinAlign 5.5
  • +Tools di Wordfast 5
  • DejaVu 3, da aggiornare a DVX
  • SDLX (ma solo se l'allineamento fa parte del demo, non so ancora)
  • Frankestein (prova gratuita, shareware)
  • Wordfisher (60 gg prova, poi 30$)
  • TS2000 Align (prodotto non più sviluppato da Cypresoft e diponibile gratuitamente)
  • aligner.py (suggerito qui sotto da Robert Tucker)


    Alcuni li ho già provati, altri no. Ci mettero' un po' di giorni, ma torno con un resoconto di tutto quanto troverò utile riportare nell'interesse generale.

    ciao
    Gianfranco




    Massimo Rippa wrote:
    ...Purtroppo Winalign è una croce e una delizia. Se i file originali sono strutturati bene, il tool funziona bene e può farti risparmiare giornate di lavoro di traduzione. Altre volte invece ti fa perdere ore e richiede operazioni manuali molto simili al cucire palloni in una fabbrica del sud est asiatico (l'iterfaccia ricorda proprio il cucire).

    Massimo, hai ragione!!! sembra di lavorare con ago e filo

    Grazie per tutti gli altri tuoi consigli. Gianfranco




    [Edited at 2005-06-27 14:04] ▲ Collapse


  •  
    Robert Tucker (X)
    Robert Tucker (X)
    United Kingdom
    Local time: 15:11
    German to English
    + ...
    A Python aligner Jun 27, 2005

    One of the simplest alignment tools available, but it can align parallel texts sentence to sentence.

    The fact that the tmx produced is suitable for OmegaT just means that it is tmx 1.1.

    The tmx produced can of course be edited by Olifant, Heartsome TMX Editor or any TMX editor incorporated with or otherwise available for the major CAT tools.

    aligner.py
    ... See more
    One of the simplest alignment tools available, but it can align parallel texts sentence to sentence.

    The fact that the tmx produced is suitable for OmegaT just means that it is tmx 1.1.

    The tmx produced can of course be edited by Olifant, Heartsome TMX Editor or any TMX editor incorporated with or otherwise available for the major CAT tools.

    aligner.py

    http://www.marcprior.de/linux/align.html

    (Although on a Linux page, it is in fact written more ready for use on Windows)
    Collapse


     


    To report site rules violations or get help, contact a site moderator:


    You can also contact site staff by submitting a support request »

    Allineamento file per creare TM






    Anycount & Translation Office 3000
    Translation Office 3000

    Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

    More info »
    CafeTran Espresso
    You've never met a CAT tool this clever!

    Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

    Buy now! »