Traduire HTML avec Wordfast
Thread poster: Vladimir Dragnev

Vladimir Dragnev  Identity Verified
Bulgaria
Local time: 03:51
Member (2006)
French to Bulgarian
+ ...
Oct 5, 2005

Bonjour,

La question a été probablement évoquée dans les forums, mais mon cas est un peu spécial. J'ai Wordfast depuis peu de temps et je ne l'ai utilisé jusque là que pour la traduction de quelques petits document sous word. Or, j'ai environ 7000 mots à traduire vers le bulgare sous html. Le problème apparaît lorsque je nettoie le texte : j'obtiens une jolie succession de points d'interrogation au lieu de caractères cyrilliques. Voici comment je procède :
1. J'ouvre le fichier html avec Word
2. Je le "tagge" (d'ailleurs cela se fait presque automatiquement)avec + Tools
3. Je sélecte la TM et les langues source et cible (FR-FR et BG-01) et je l'enregistre. Premier problème : selon le manuel je dois l'enregistrer comme texte brut ou texte seul (Word 2003 oblige : ps d'unicode) et je ne vois nulle part appraître Text only. J'ai Plain text, texte RTF, Text with layout..., mais pas de Text only. Il est vrai que jusque là j'ai toujours utilisé une version française d'Office, mais récemment j'ai dû installer Office 2003 en anglais. Je choisis donc Plain text qui me paraît le plus adéquat.
4. J'édite la TM (Export TM as TMX) à cause du bulgare (c'est dans le manuel) et j'enregistre.
5.Je démarre la segmentation et la session de traduction. Après avoir terminé, je nettoie (Tools, Clean up) et ... bonjour les points d'interrogation. Est-ce que vous pourriez me dire où je me suis trompé et éventuellemnt m'indiquer un lien (en français, please !) qui pourrait m'aider à faire la trad correctement.

Merci d'avance,
Vladimir

[Edited at 2005-10-05 16:39]

[Edited at 2005-10-05 17:28]


Direct link Reply with quote
 

sylver  Identity Verified
Local time: 08:51
English to French
Une piste ou deux. Oct 5, 2005

Vladimir Dragnev wrote:

Bonjour,

La question a été probablement évoquée dans les forums, mais mon cas est un peu spécial. J'ai Wordfast depuis peu de temps et je ne l'ai utilisé jusque là que pour la traduction de quelques petits document sous word. Or, j'ai environ 7000 mots à traduire vers le bulgare sous html. Le problème apparaît lorsque je nettoie le texte : j'obtiens une jolie succession de points d'interrogation au lieu de caractères cyrilliques. Voici comment je procède :
1. J'ouvre le fichier html avec Word
2. Je le "tagge" (d'ailleurs cela se fait presque automatiquement)
3. Je sélecte la TM et les langues source et cible (FR-FR et BG-01) et je l'enregistre. Premier problème : selon le manuel je dois l'enregistrer comme texte brut ou texte seul (Word 2003 oblige) et je ne vois nulle part appraître Texte only. J'ai Plaintexte, texte RTF, with laout..., mais pa de Texte only. Il est vrai que jusque là j'ai toujours utilisé une version française d'Office, mais récemment j'ai dû installer Office 2003 en anglais. Je choisis donc Plaintexte qui me paraît le plus adéquat.
4. J'édite la TM (Exort TM as TMX) à cause du bulgare (c'est dans le manuel) et j'enregistre.
5.Je démarre la segmentation et la session de traduction. Après avoir terminé, je nettoie (Tools, Clean up) et ... bonjour les points d'interrogation. Est-ce que vous pourriez me dire où je me suis trompé et éventuellemnt m'indiquer un lien (en français, please !) qui pourrait m'aider à faire la trad correctement.

Merci d'vance,
Vladimir


Une question. Est ce que tu obtiens les points d'interrogation après, quand tu ouvres le fichier html ou directement dans Word?

Le fichier HTML?

Bon pour commencer, il y a deux problèmes séparés:
1: la TM
2: Le texte traduit.

Les options que tu choisis pour la TM n'influencent pas le texte final. Si au cours de la traduction la TM retourne des segments traduis sans ??? ou autre caractère bizarre, la TM n'est pas en cause.

Si les ??? apparaissent bien dans le fichier HTML, ton problème peut venir d'un charset mal défini.

(meta HTTP-EQUIV="content-type" CONTENT="text/html; charset=UTF-8")

UTF-8 devrait faire l'affaire.

Si le problème se produit *dans le fichier Word* juste après le clean up, le plus simple c'est de ne pas nettoyer le fichier de la façon standard, mais de faire un chercher/remplacer pour supprimer tout le texte caché

Chercher: *
(option: font: hidden)
Remplacer:
Wildcard activé

Cela devrait te donner un texte "propre" avec le code encore protégé. Change le charset (encodage), enregistre sous "Plain text", et choisi l'encodage UTF-8. Ajoute l'extension dont tu as besoin (htm, html, php, asp...c'est tout du texte simple), et ton texte devrait s'ouvrir sans points d'interrogation.

Personnellement, je préfère toujours tagger le texte avant même de l'ouvrir dans Word. Utilise Rainbow ou +Tools pour tagger le texte à l'avance, ouvre le dans Word et traduit comme d'habitude.


[Edited at 2005-10-05 16:43]


Direct link Reply with quote
 

Vladimir Dragnev  Identity Verified
Bulgaria
Local time: 03:51
Member (2006)
French to Bulgarian
+ ...
TOPIC STARTER
Merci, Silvain Oct 5, 2005

sylver wrote:



Une question. Est ce que tu obtiens les points d'interrogation après, quand tu ouvres le fichier html ou directement dans Word?

Le fichier HTML?

Bon pour commencer, il y a deux problèmes séparés:
1: la TM
2: Le texte traduit.

Les options que tu choisis pour la TM n'influencent pas le texte final. Si au cours de la traduction la TM retourne des segments traduis sans ??? ou autre caractère bizarre, la TM n'est pas en cause.

Si les ??? apparaissent bien dans le fichier HTML, ton problème peut venir d'un charset mal défini.

(meta HTTP-EQUIV="content-type" CONTENT="text/html; charset=UTF-8")

UTF-8 devrait faire l'affaire.

Si le problème se produit *dans le fichier Word* juste après le clean up, le plus simple c'est de ne pas nettoyer le fichier de la façon standard, mais de faire un chercher/remplacer pour supprimer tout le texte caché

Chercher: *
(option: font: hidden)
Remplacer:
Wildcard activé

Cela devrait te donner un texte "propre" avec le code encore protégé. Change le charset (encodage), enregistre sous "Plain text", et choisi l'encodage UTF-8. Ajoute l'extension dont tu as besoin (htm, html, php, asp...c'est tout du texte simple), et ton texte devrait s'ouvrir sans points d'interrogation.

Personnellement, je préfère toujours tagger le texte avant même de l'ouvrir dans Word. Utilise Rainbow ou +Tools pour tagger le texte à l'avance, ouvre le dans Word et traduit comme d'habitude.


[Edited at 2005-10-05 16:43]


J'ai été bête de ne pas préciser où se produit le problème. Non, sous Word tout va bien, les points d'inrerrogation apparaissent dans le fichier HTML. Donc c'est la manière d'enregidstrer le fichier qui est en cause. Je n'ai pas encore essayé, mais je pense que ton explication suffira à la résolution du problème.

Je viens de télécharger Rainbow et dès maintenant je vais tagger les fichier avant de les ouvrir avac Word. D'ailleurs, j'ai lu les explications sur ton site, elles sont très claires et utiles, mais j'y ai peiné un bout de temps : tu ne pense pas à les "traduire" en français ?

Je te dois une sacrée chandelle : grâce à toi (et à ma susceptibilité)j'ai appris un tas de choses sur les reptiles, je vais apprendre à traduire des fichiers html avec Wordfast et l'anglais en plus.

Vladimir


Direct link Reply with quote
 

sylver  Identity Verified
Local time: 08:51
English to French
Traduire... Oct 6, 2005

Vladimir Dragnev wrote:

...

Je viens de télécharger Rainbow et dès maintenant je vais tagger les fichier avant de les ouvrir avac Word. D'ailleurs, j'ai lu les explications sur ton site, elles sont très claires et utiles, mais j'y ai peiné un bout de temps : tu ne pense pas à les "traduire" en français ?

Je te dois une sacrée chandelle : grâce à toi (et à ma susceptibilité)j'ai appris un tas de choses sur les reptiles, je vais apprendre à traduire des fichiers html avec Wordfast et l'anglais en plus.

Vladimir


Content que ca te serve.

Pour ce qui est de traduire, j'y ai pense, mais a vrai dire, c'est pas vraiment viable.

Il y a + de 35000 mots sur le site, soit presque 20 jours de travail a temps plein... et tout ce contenu est gratos.

Sans compter que la plupart des traducteurs (pas tous, je sais) parlent un anglais suffisant. Mes clients parlent tous l'anglais, et entre nous, je ne crois pas que ce type de contenu les interesse au plus haut point, si ce n'est le fait que je sache me depatouiller en cas de besoin.

J'ai deja eu des gens qui m'ont propose de traduire tout ca...mais ils ne l'ont jamais fait, probablement pour les raisons precitees.

Donc, quand j'ai du temps, je prefere le passer a rediger de nouveaux articles plutot que de traduire les anciens articles. Plus amusant et souvent plus rapide. Ou a faire du marketing pour le site que j'ai drolement neglige les 8 derniers mois.


Direct link Reply with quote
 
Séverine Salomo
France
Local time: 02:51
English to French
+ ...
Onglet Tag manquant !! Jan 9, 2012

Bonjour,
Je suis nouvelle utilisatrice de Plus Tools depuis aujourd'hui !
J'ai suivi les conseils vus sur ce forum mais j'ai quelques questions :
J'ouvre un fichier HTML dans Word qui apparaît avec les codes puisqu'une fenêtre me fait choisir le codage (Windows par défaut). Mais quand je lance Wordfast, il ne me propose pas de tagger le texte avec Plus Tools, il comme directement à traduire les segments.
Par contre, si je vais d'abord dans Plus Tools, je peux sélectionner mon document mais je n'ai pas d'onglet Tag, j'ai Tweak à la place. Là j'ai une ligne CreateTw4winStyles qui me tagge le texte en faisant Run on selected files. Mon document est taggé et enregistré en .doc.
Ma question, comment faire pour que Wordfast me propose directement de tagger le document et que pensez-vous de l'onglet Tweak et de cette procédure ?
Merci de vos conseils avisés, ils m'ont beaucoup aidés aujourd'hui pour l'installation et le démarrage !
Séverine


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Andriy Bublikov[Call to this topic]

You can also contact site staff by submitting a support request »

Traduire HTML avec Wordfast

Advanced search






PDF Translation - the Easy Way
TransPDF converts your PDFs to XLIFF ready for professional translation.

TransPDF converts your PDFs to XLIFF ready for professional translation. It also puts your translations back into the PDF to make new PDFs. Quicker and more accurate than hand-editing PDF. Includes free use of Infix PDF Editor with your translated PDFs.

More info »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

More info »



All of ProZ.com
  • All of ProZ.com
  • Term search
  • Jobs