Les machines arrivent!
Thread poster: TTV
TTV  Identity Verified
France
Member
German to French
Sep 16, 2003

Je reprends le titre utilisé par la collègue qui a mis le lien ci-dessous dans le forum allemand. C'est un article passionnant.

http://www.spiegel.de/spiegel/0,1518,265667,00.html

L'amusant c'est que comme elle je n'arrive pas à obtenir un lien immédiatement utilisable. Il faut donc copier TOUT le lien ci-dessus.

[Edited at 2003-09-16 13:23]


Direct link Reply with quote
 

LegalTransform  Identity Verified
United States
Local time: 08:30
Member (2002)
Spanish to English
+ ...
Here is the link Sep 16, 2003

Click here

Direct link Reply with quote
 

Jean-Marie Le Ray  Identity Verified
Italy
Local time: 14:30
Member
Italian to French
+ ...
Vraiment passionnant !... Sep 16, 2003

TTV wrote:

...C'est un article passionnant...



Surtout pour ceux qui n'y pigent que dalle, comme moi, par exemple !
Alors les traducteurs de l'allemand au français, à vos plumes ! Vous croyez pas qu'on va vous payer à rien faire, non ?
A la limite, on se contenterait juste d'une petite synthèse, genre, voilà de quoi ça parle, en gros.
Moi, en voyant le titre, tout ce qui m'est venu en tête, c'est Terminator !!! (lire 3...).
D'ailleurs, c'est peut-être de ça qu'ça cause !
Ciao, Jean-Marie


Direct link Reply with quote
 
TTV  Identity Verified
France
Member
German to French
TOPIC STARTER
Tentative de synthèse Sep 16, 2003

La synthèse n'est pas mon fort, en plus c'est mon jour de repos aujourd'hui +=)

L'HINDI en 4 SEMAINES

"Un allemand fait fureur en Californie avec des programmes de traduction"

C'est donc l'histoire d'un informaticien allemand, Franz Joseph Och, 31 ans, qui travaille en Californie où il développe un logiciel de traduction automatique qui apparamment "laisse tous ses concurrents loin derrière". Il a récemment "gagné" un "concours" organisé par le Pentagone qui a besoin de tels outils dans le cadre de la lutte anti-terroriste. Le concours consistait à fournir le plus rapidement possible un logiciel capable de traduire d'hindi en anglais.

Son "système" est, comme beaucoup d'autres systèmes actuels, basé essentiellement sur l'alignement de textes sources et cibles (tiens, ça rappelle quelque chose...). Plutôt que "d'apprendre" à l'ordinateur les règles de grammaire etc., on mise sur la statistique et la puissance de calcul. Comme le dit Och "Nous n'expliquons pas à l'ordinateur comment il doit traduire, nous le laissons simplement apprendre par lui-même".

Le "point fort" du système d'Och serait les modèles statistiques qu'il utilise, en fonction desquels "l'ordinateur s'oriente dans la mer des textes alignés".

Enfin, l'article précise que le résultat "est loin d'être parfait". Och lui-même admet que "les textes ne sont pas beaux à lire". Mais ils sont apparamment suffisamment compréhensibles pour les besoins concernés. Sinon, le journaliste précise que "jamais un ordinateur ne pourra traduire un poême".

OUF, me voilà rassuré. Je me reconvertirai dans la traduction de haïkus +:)

Ce n'est qu'un petit résumé partiel de l'article, je vous conseille de demander à Och de le traduire en entier...

Plus sérieusement, j'aimerai savoir si JCEC a entendu parler de ça et ce qu'il en pense.




[Edited at 2003-09-16 16:35]

[Edited at 2003-09-16 16:35]

[Edited at 2003-09-16 16:37]


Direct link Reply with quote
 

sylver  Identity Verified
Local time: 20:30
English to French
Pas de quoi paniquer Sep 16, 2003

TTV wrote:

La synthèse n'est pas mon fort, en plus c'est mon jour de repos aujourd'hui +=)
...

Son "système" est, comme beaucoup d'autres systèmes actuels, basé essentiellement sur l'alignement de textes sources et cibles (tiens, ça rappelle quelque chose...). Plutôt que "d'apprendre" à l'ordinateur les règles de grammaire etc., on mise sur la statistique et la puissance de calcul. Comme le dit Och "Nous n'expliquons pas à l'ordinateur comment il doit traduire, nous le laissons simplement apprendre par lui-même".

Le "point fort" du système d'Och serait les modèles statistiques qu'il utilise, en fonction desquels "l'ordinateur s'oriente dans la mer des textes alignés".

Enfin, l'article précise que le résultat "est loin d'être parfait". Och lui-même admet que "les textes ne sont pas beaux à lire". Mais ils sont apparamment suffisamment compréhensibles pour les besoins concernés. Sinon, le journaliste précise que "jamais un ordinateur ne pourra traduire un poême".

OUF, me voilà rassuré. Je me reconvertirai dans la traduction de haïkus +:)

Ce n'est qu'un petit résumé partiel de l'article, je vous conseille de demander à Och de le traduire en entier...

Plus sérieusement, j'aimerai savoir si JCEC a entendu parler de ça et ce qu'il en pense.

Je ne connais pas ce système en particulier, mais l'approche statistique existe depuis un baille (Ouaips, c'est pas jeune) et fonctionne sur un système de probabilité (Style, le terme "blabla", à coté des termes "blibli" et "bloblo" , a été traduit par le terme "burp" 300 fois, et par le terme "bip" 4 fois seulement. donc y a des chances que la bonne traduction soit "burp" et non pas "bip")

Certes, les capacités de traitement se sont vraiment améliorées. Plus la base de données est importante, plus tu as de chances d'obtenir quelque chose qui colle. Comme tu utilises des textes liés, en principe, la terminologie devrait aller, plus ou moins. Néamoins, il ne s'agit que d'un jeu de probabilités, et bien entendu, les gaffes peuvent être remarquables. Sans compter que la procédure suppose que, pour chaque mot source (ou groupe de mot selon l'algo), un mot cible existe, ce qui est loin d'être le cas.

C'est bon pour obtenir une idée générale, mais la méthode statistique seule est incapable de produire une traduction authentique, parce que justement, ce ne sont que des probabilités, et que nous savons parfaitement qu'un seul mot incorrect peut changer le sens d'une phrase, et que les formes gramaticales peuvent être délicates - très délicates. Rate une double négation, et tu peux dire adieux au sens.

Sans compter que cette méthode repose entièrement sur les textes alignés qui sont présentés à la machine. Ces textes, qui, compte tenu du volume nécessaire, sont plus ou moins fiable (sans compter que l'alignement desdit textes à intérêt d'être fait par des traducteurs humains, et ça représente un paquet de travail), et pas nécessairement adéquats pour le nouveau document, ce qui diminue d'autant l'efficacité potentielle de la méthode. Tant que les nouvelles phrases sont des 100% match par rapport à des entrées existantes, pas trop de problèmes, mais les fuzzy eux, doivent être rapiécés, et les no-match sont un carnage.

Donc, en gros, je doute qu'un truc fonctionnant entièrement sur la méthode statistique puisse faire mieux qu'une vague approximation du sens.


Direct link Reply with quote
 
TTV  Identity Verified
France
Member
German to French
TOPIC STARTER
Paniquer ? Ah ça non! Sep 16, 2003

Je me suis toujours refusé à (ne) paniquer +:)

N'empêche, les sommes considérables engagées dans le développement de ce genre de systèmes m'impressionnent. C'est le sens du "progrès". La traduction est encore, finalement, une activité "artisanale" et essentiellement "humaine", là où beaucoup d'autres ont disparu. On se demande donc jusqu'à quel point elle résistera à "l'informatisation globale". C'est fou cette manie de vouloir faire faire par des machines ce que des hommes font très bien. Enfin, le débat n'est pas nouveau.


Direct link Reply with quote
 

JCEC  Identity Verified
Canada
Local time: 08:30
Member
English to French
À bientôt Sep 17, 2003

TTV wrote:
Plus sérieusement, j'aimerai savoir si JCEC a entendu parler de ça et ce qu'il en pense.

JCEC a quelques idées sur la question et sera bientôt de retour sur vos écrans.

Bonne soirée,

John


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Andriy Bublikov[Call to this topic]

You can also contact site staff by submitting a support request »

Les machines arrivent!

Advanced search






PDF Translation - the Easy Way
TransPDF converts your PDFs to XLIFF ready for professional translation.

TransPDF converts your PDFs to XLIFF ready for professional translation. It also puts your translations back into the PDF to make new PDFs. Quicker and more accurate than hand-editing PDF. Includes free use of Infix PDF Editor with your translated PDFs.

More info »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search