https://www.proz.com/forum/french/87467-google_traducteur_automatique.html

Google, traducteur automatique
Thread poster: Jean-Marie Le Ray
Jean-Marie Le Ray
Jean-Marie Le Ray  Identity Verified
France
Local time: 06:07
Member
Italian to French
+ ...
Oct 24, 2007

Il y a un an et demi, j'avais rédigé un article sur la traduction automatique après avoir découvert que Google s'était lancé là-dedans et, en moins de 10 ans, avait réussi à faire mieux qu'IBM ou Systran, ce qui est quand même une sacrée performance.
Pour autant le service gratuit de traduction automatisée de Google utilisait encore Systran, tout comme Yahoo Babelfish. Les traductions fournies par les deux outils étaient donc les mêmes.
Ce n'est plus le cas, Google vien
... See more
Il y a un an et demi, j'avais rédigé un article sur la traduction automatique après avoir découvert que Google s'était lancé là-dedans et, en moins de 10 ans, avait réussi à faire mieux qu'IBM ou Systran, ce qui est quand même une sacrée performance.
Pour autant le service gratuit de traduction automatisée de Google utilisait encore Systran, tout comme Yahoo Babelfish. Les traductions fournies par les deux outils étaient donc les mêmes.
Ce n'est plus le cas, Google vient de laisser tomber Systran au profit de sa propre technologie, avec selon moi un gain évident en terme de qualité (relative, comme toujours en TA, mais pas moins pertinente).
J'ai donc écrit un nouveau billet où je compare les résultats de Systran et Google en utilisant les mêmes textes, dans les deux sens.
En outre ce qui me frappe c'est que la technologie de Systran ne bouge pas depuis des lustres, alors que celle de Google est clairement évolutive, "apprenante" même, ce qui fait que la qualité de ses trads est destinée à augmenter chaque jour davantage.
Si vous avez la curiosité d'analyser le comparatif, merci de votre retour d'info.

Jean-Marie
http://adscriptum.blogspot.com/2007/10/google-traducteur-automatique.html
Collapse


 
remyrosf
remyrosf
Local time: 06:07
English to French
Froid dans le dos... Oct 24, 2007

Merci Jean-Marie.

Les essais que j'ai effectués font froid dans le dos : les progrès sont impressionnants. Des pans entiers de la traduction professionnelle vont sans doute disparaître d'ici une dizaine d'années (à commencer par la traduction "pour information").

Serait-il donc temps de préparer notre reconversion ?

Cordialement,

Rémy
Jean-Marie Le Ray wrote:

Il y a un an et demi, j'avais rédigé un article sur la traduction automatique après avoir découvert que Google s'était lancé là-dedans et, en moins de 10 ans, avait réussi à faire mieux qu'IBM ou Systran, ce qui est quand même une sacrée performance.
Pour autant le service gratuit de traduction automatisée de Google utilisait encore Systran, tout comme Yahoo Babelfish. Les traductions fournies par les deux outils étaient donc les mêmes.
Ce n'est plus le cas, Google vient de laisser tomber Systran au profit de sa propre technologie, avec selon moi un gain évident en terme de qualité (relative, comme toujours en TA, mais pas moins pertinente).
J'ai donc écrit un nouveau billet où je compare les résultats de Systran et Google en utilisant les mêmes textes, dans les deux sens.
En outre ce qui me frappe c'est que la technologie de Systran ne bouge pas depuis des lustres, alors que celle de Google est clairement évolutive, "apprenante" même, ce qui fait que la qualité de ses trads est destinée à augmenter chaque jour davantage.
Si vous avez la curiosité d'analyser le comparatif, merci de votre retour d'info.

Jean-Marie
http://adscriptum.blogspot.com/2007/10/google-traducteur-automatique.html


 
Agnès Levillayer
Agnès Levillayer
Italy
Local time: 06:07
Italian to French
+ ...
Principe intéressant Oct 24, 2007

mais je pense que nous avons encore un bel avenir devant nous... Comme le souligne aussi quelques commentaires de cet article:
http://pisani.blog.lemonde.fr/2007/10/24/traductions-a-la-google-power-matters/#comments
dès que les textes soumis sont le fruit d'une écriture originale dont il n'y a aucune trace dans la grande mémoire de Go
... See more
mais je pense que nous avons encore un bel avenir devant nous... Comme le souligne aussi quelques commentaires de cet article:
http://pisani.blog.lemonde.fr/2007/10/24/traductions-a-la-google-power-matters/#comments
dès que les textes soumis sont le fruit d'une écriture originale dont il n'y a aucune trace dans la grande mémoire de Google, le résultat est plutôt charabia, c'est le moins qu'on puisse dire...
Ça permet d'avoir une idée générale du sujet traité, un point c'est tout et je pense que la fonction restera "à usage interne" type dégrossissage.
Je pense qu'il est difficile d'imaginer qu'un jour proche ou lointain tout ce que le cerveau humain peut produire comme textes trouvera son équivalent en appuyant sur le bouton d'un moteur de recherche.


P.S. Merci JM pour tes articles et tes interrogations qui nous obligent à sortir de notre routine, c'est toujours très stimulant.
Collapse


 
Jean-Marie Le Ray
Jean-Marie Le Ray  Identity Verified
France
Local time: 06:07
Member
Italian to French
+ ...
TOPIC STARTER
Mise en perspective Oct 24, 2007

Agnès Levillayer wrote:

Merci JM pour tes articles et tes interrogations qui nous obligent à sortir de notre routine, c'est toujours très stimulant.



Agnès,

Bon, ben déjà ça ça fait plaisir à entendre, parce qu'il y a des moments où je me demande si quelqu'un me lit !

Sur le principe, maintenant, il est clair qu'un outil comme celui de Google ne remet pas - totalement - en cause notre profession, mais un peu (et même plus qu'un peu, à terme), certainement.

N'oublions pas qu'il y a plusieurs marchés de la traduction, plusieurs types de clients, plusieurs exigences, etc., dont une bonne partie pourra se satisfaire de ce type de solutions dès qu'elles gagneront en pertinence.

Et avec Google je crains que ça n'aille vite, comme le souligne Rémy.

Sur Google translate, des options de modification sont possibles, y compris sur le dictionnaire, où chacun peut saisir sa solution si le résultat proposé ne lui convient pas.

Voilà pourquoi je parle des capacités "apprenantes" de Google, car soyez sûr que tout ça est passé au crible, évalué, adopté, etc.

Maintenant, pour ce qui est des traces "dans la grande mémoire de Google", une ressource inépuisable encore inexploitée - au plan de l'analyse statistique et de la traduction - de Google réside dans son programme de numérisation des bibliothèques. Or ces inventaires abritent une portion énorme du patrimoine culturel et linguistique de l'humanité, dont les traductions. Imaginez tous les classiques...

Prenons un seul exemple qui m'est cher : Victor Hugo. Qui a écrit des millions de mots, dont tous ont été traduits dans plusieurs langues. Hugo = 1 mémoire.
Prenez la Bible, le livre le plus traduit de l'histoire de l'humanité = 1 mémoire.
Le Coran, etc.

Et des centaines de milliers de livres déjà traduit, et des centaines de milliers d'auteurs = des milliers de milliers de mémoire.

Et lorsque le traitement par reconnaissance optique sera jugé d'une qualité acceptable pour ces millions de livres, ce seront des mémoires de milliards de milliards de mots qui seront disponibles et exploitables.

Or tout ça n'est pas de la science-fiction, c'est déjà en cours. Les capacités de calcul sont gigantesques. Bientôt il sera possible d'analyser - c'est déjà possible, mais commercialement parlant - n'importe quelle conversation pour la retranscrire dans sa langue et la traduire à la volée, etc.

Et je pourrais continuer avec d'autres innovations, d'autres champs de recherche, etc.

Voilà ce à quoi me fait penser la traduction automatique aujourd'hui. Sur ce je vais manger, je poursuivrai une autre fois...

J-M

P.S. A propos de qualité acceptable du traitement par reconnaissance optique, voir ici : http://arstechnica.com/news.ars/post/20071024-hands-on-with-googles-ocropus-open-source-scanning-software.html



[Modifié le 2007-10-24 19:35]


 
NMR (X)
NMR (X)
France
Local time: 06:07
French to Dutch
+ ...
C'est vrai que ce n'est pas mal Oct 24, 2007

Je viens d'essayer le même paragraphe sous Google et sous Babelfish. Le premier résultat est compréhensible, le deuxième non.
Heureusement il n'y a pas encore le (hollandais) néerlandais, j'y échappe encore pour quelques mois.

Jean-Marie Le Ray wrote:

Agnès Levillayer wrote:

Merci JM pour tes articles et tes interrogations qui nous obligent à sortir de notre routine, c'est toujours très stimulant.



Agnès,

Bon, ben déjà ça ça fait plaisir à entendre, parce qu'il y a des moments où je me demande si quelqu'un me lit !

Mais si, mais si, Victor !


 
Said Kaljanac a.k.a. SARAJ
Said Kaljanac a.k.a. SARAJ  Identity Verified
Belgium
Local time: 06:07
Bosnian to French
+ ...
Aucune inquiétude Oct 25, 2007

Il est vrai que la traduction automatique est de plus en plus évoluée et peut même "faire froid dans le dos", comme le dit si bien Rémy, cependant je pense qu'il n'y a vraiment pas de quoi s'inquiéter.

Les segments entiers proposés par les mémoires de traduction ne sont que des "clones" et par conséquent manquent d'originalité et de style. En outre, ces petits clones comiques peuvent induire en erreur le client et je ne pense pas que tous les bons commerçants voudraient c
... See more
Il est vrai que la traduction automatique est de plus en plus évoluée et peut même "faire froid dans le dos", comme le dit si bien Rémy, cependant je pense qu'il n'y a vraiment pas de quoi s'inquiéter.

Les segments entiers proposés par les mémoires de traduction ne sont que des "clones" et par conséquent manquent d'originalité et de style. En outre, ces petits clones comiques peuvent induire en erreur le client et je ne pense pas que tous les bons commerçants voudraient courir le risque d'endosser une telle responsabilité.

Voici un petit test très simple, traduisez-moi en anglais:

"Je suis une femme."

Essayez de traduire en français:

"He's gay."

Collapse


 
Emmanuelle Riffault
Emmanuelle Riffault  Identity Verified
Australia
Local time: 14:07
Member (2004)
German to French
+ ...
S'inquiéter ou ne pas s'inquiéter Oct 25, 2007

Bonjour Jean-Marie,
Je me joins à Agnès pour te remercier de tes interventions

Je ne suis pas du genre à m'inquiéter pour un rien, mais je pense tout de même que cette évolution va influencer notre métier.

Un exemple : j'ai déjà été contactée pour un travail pour l'Union européenne. Quel sentiment d'horreur quand j'ai reçu les textes modèles ! Tout était traduit en automatique et le b
... See more
Bonjour Jean-Marie,
Je me joins à Agnès pour te remercier de tes interventions

Je ne suis pas du genre à m'inquiéter pour un rien, mais je pense tout de même que cette évolution va influencer notre métier.

Un exemple : j'ai déjà été contactée pour un travail pour l'Union européenne. Quel sentiment d'horreur quand j'ai reçu les textes modèles ! Tout était traduit en automatique et le boulot du "traducteur" était en fait un boulot de "réparateur" pour corriger toutes les erreurs (encore) commises par le pauvre ordinateur.

Serons-nous un jour réduits à la relecture, ce travail que je n'accepte aujourd'hui que si je connais le traducteur et que j'ai confiance en lui ?

Emmanuelle
Collapse


 
Said Kaljanac a.k.a. SARAJ
Said Kaljanac a.k.a. SARAJ  Identity Verified
Belgium
Local time: 06:07
Bosnian to French
+ ...
Relecture... buerk... Oct 25, 2007

Emmanuelle Daburger-Riffault wrote:

Bonjour Jean-Marie,
Je me joins à Agnès pour te remercier de tes interventions

Je ne suis pas du genre à m'inquiéter pour un rien, mais je pense tout de même que cette évolution va influencer notre métier.

Un exemple : j'ai déjà été contactée pour un travail pour l'Union européenne. Quel sentiment d'horreur quand j'ai reçu les textes modèles ! Tout était traduit en automatique et le boulot du "traducteur" était en fait un boulot de "réparateur" pour corriger toutes les erreurs (encore) commises par le pauvre ordinateur.

Serons-nous un jour réduits à la relecture, ce travail que je n'accepte aujourd'hui que si je connais le traducteur et que j'ai confiance en lui ?

Emmanuelle


Une relecture prend parfois plus de temps que de traduire.


 
Emmanuelle Riffault
Emmanuelle Riffault  Identity Verified
Australia
Local time: 14:07
Member (2004)
German to French
+ ...
Justement... Oct 25, 2007

Said Kaljanac a.k.a. SARAJ wrote:
Une relecture prend parfois plus de temps que de traduire.


Justement et je reprends ton "beurk" : quel travail ingrat...
Salut Saïd !

Emmanuelle


 
Said Kaljanac a.k.a. SARAJ
Said Kaljanac a.k.a. SARAJ  Identity Verified
Belgium
Local time: 06:07
Bosnian to French
+ ...
thread hijacked :-p Oct 25, 2007

Emmanuelle Daburger-Riffault wrote:


Salut Saïd !



Salut Emmanuelle, ça va?


 
remyrosf
remyrosf
Local time: 06:07
English to French
Mea culpa Oct 29, 2007

Chers collègues,

Ma première réaction était sans doute quelque peu excessive. J'ai effectué de nombreux essais et les progrès sont loin d'être "impressionnants" comme je le disais il y a quelques jours.

Voici quelques exemples (de l’anglais vers le français).

1. Malgré sa mémoire de traduction de plusieurs milliards de mots, Google Traduction est incapable de traduire correctement certaines expressions idiomatiques comptant parmi les plus connu
... See more
Chers collègues,

Ma première réaction était sans doute quelque peu excessive. J'ai effectué de nombreux essais et les progrès sont loin d'être "impressionnants" comme je le disais il y a quelques jours.

Voici quelques exemples (de l’anglais vers le français).

1. Malgré sa mémoire de traduction de plusieurs milliards de mots, Google Traduction est incapable de traduire correctement certaines expressions idiomatiques comptant parmi les plus connues (ce que parvient à faire le logiciel Power Translator) :

It’s raining cats and dogs : Il pleut des chats et des chiens
Food for thought : de la nourriture pour la pensée
From rags to riches : de chiffons à la richesse

2. Google Traduction est incapable de traduire le langage courant le plus élémentaire :
Texte original : « How about a glass of wine. Don't tell me you've never had alcohol? You're nearly eighteen. » (Barbara W. Klaser).
Traduction Google : « Ou d'un verre de vin. Ne pas me dire que vous n'avez jamais eu l'alcool? Vous êtes près de dix-huit ans. »

3. Le système Google s’est nourri des documents des Nations Unies. Il parvient donc à traduire correctement des passages qu’il a « en mémoire » (comme Trados et autres), c'est-à-dire simplement répéter ce qu’il a dans sa base de données. Mais les résultats sont moins convaincants pour des textes portant sur les Nations Unies mais dont il ne possède pas la traduction humaine en stock :
Texte original : « Kofi Annan yesterday used his final speech as the United Nations secretary general to deliver a parting shot at the Bush administration, accusing the US of committing human rights abuses in the name of fighting terror.
After three years of increasingly vocal opposition to the war on Iraq, Mr Annan's speech yesterday amounted to a broad condemnation of the neoconservative ideology guiding America's foreign policy under George Bush - a clear break with protocol for a departing UN chief. »
Traduction Google : « Kofi Annan a utilisé hier son dernier discours en tant que secrétaire général des Nations Unies pour fournir une séparation fusillés à l'administration Bush, accusant les Etats-Unis d'avoir commis des violations des droits humains au nom du combat contre la terreur.
Après trois années de plus en plus d'opposition à la guerre en Irak, le discours de M. Annan hier équivalait à une large condamnation de l'idéologie néo guidant la politique étrangère de l'Amérique sous George Bush - une nette rupture avec le départ d'un protocole des Nations Unies chef. »

Inutile de dire que cette traduction ne convient même pas à la révision : il faut tout reprendre.

4. Je n’ai pas pu résister à la tentation de faire traduire un document du domaine financier (ma spécialité) par notre cher Google.
Texte original. « Stellar quarterly results from Microsoft lent support to the continuing surge in technology shares while upbeat guidance from Countrywide Financial raised hopes that mortgage lenders might recover from the housing slump sooner than expected.
Expectations of another interest rate cut next week, when the Federal Reserve’s Open Market Committee meets, also helped bolster market sentiment. The futures market has priced in a 100 per cent likelihood of at least a 25 basis point rate cut. »
Traduction Google : « Stellar résultats trimestriels de Microsoft a prêté appui à la poursuite de la flambée des technologies part optimiste alors que les conseils de Countrywide Financial suscité l'espoir que les prêteurs hypothécaires pourraient remettre de la récession de logement plus tôt que prévu.
Attentes d'une autre baisse des taux d'intérêt la semaine prochaine, lorsque la Réserve fédérale de l'Open Market Committee se réunit, a également contribué à renforcer le sentiment du marché. Le marché à terme a un prix à 100% probabilité d'au moins 25 points de base le taux réduit. »

Là encore, il n’est même pas possible d’envisager une révision : le plus court est de tout retraduire.

Cordialement,

Rémy


[Edited at 2007-10-29 12:38]
Collapse


 
Sophie Dzhygir
Sophie Dzhygir  Identity Verified
France
Local time: 06:07
German to French
+ ...
Si si, progrès impressionnants Oct 30, 2007

Ce qui est impressionnant, ce n'est pas forcément le résultat final à l'heure actuelle, c'est la progression ! Et du reste, il n'y a pas que Google sur le coup, même si c'est un des seuls outils que tout un chacun peut aller essayer librement.

J'ai travaillé à deux reprise de la façon évoquée par Emmanuelle (relecture de traduction automatique), pour un gros client qui a son propre outil. La première fois je ne savais pas trop ce que c'était, la deuxième fois, je savais
... See more
Ce qui est impressionnant, ce n'est pas forcément le résultat final à l'heure actuelle, c'est la progression ! Et du reste, il n'y a pas que Google sur le coup, même si c'est un des seuls outils que tout un chacun peut aller essayer librement.

J'ai travaillé à deux reprise de la façon évoquée par Emmanuelle (relecture de traduction automatique), pour un gros client qui a son propre outil. La première fois je ne savais pas trop ce que c'était, la deuxième fois, je savais que ça allait être rébarbatif, mais j'ai voulu le refaire pour me tenir au courant de l'avancée de la technologie. Je crois qu'il vaut mieux savoir et ne pas se mettre d'œillères, plutôt que de découvrir ça avec stupeur dans quelques années ! Et donc pour en revenir à nos moutons, la qualité est impressionnante. Certes, très loin d'être parfaite, mais disons que dans au moins la moitié des segments, à moins de tenir absolument à faire du style (ce dont le client en l'occurrence n'a pas besoin), il n'y a rien à retoucher, la traduction proposée est exploitable. La plupart du temps, les modifications à apporter sont mineures. Et puis de temps en temps, au milieu de nulle part, une grosse bourde, une phrase complètement ratée. Donc, l'intervention humaine reste encore nécessaire, mais quand je vois la qualité que la machine est capable de produire (elle sait par exemple reformuler les phrases en inversant les propositions, parfois en se plantant, mais parfois tout juste !), je me dis que ça ne peut que progresser et que certains domaines de la traductions vont sûrement évoluer vers ça : de la traduction automatique relue rapidement par des humains.

Alors on est bien d'accord, dès qu'on va vers des choses plus rédactionnelles, y'a moins de chances que la traduction automatique progresse aussi bien et y'a sûrement de la place encore pour longtemps pour nous autres (et de même dans le technique pointu). Perso je ne suis pas pessimiste, je pense qu'il restera encore beaucoup de travail pour les traducteurs, surtout ceux qui pourront apporter de la valeur ajoutée (et puis n'oublions pas que nos observations portent souvent sur les traductions anglais-français, mais je ne suis pas convaincue que tout ça évolue si vite avec les autres paires de langues...), mais il ne faut pas le nier non plus, ça a un réel impact. Le client pour lequel j'ai bossé, ce sont des millions de mots traduits chaque année (d'ailleurs vous vous doutez bien qu'il ne développerait pas son propre système pour 500 mots par-ci par-là !), donc y'a quand même à la clé une diminution du volume en vue.
Collapse


 
Jean-Marie Le Ray
Jean-Marie Le Ray  Identity Verified
France
Local time: 06:07
Member
Italian to French
+ ...
TOPIC STARTER
Impressionnant, c'est mon avis Oct 30, 2007

Sophie Dzhygir wrote:

Ce qui est impressionnant, ce n'est pas forcément le résultat final à l'heure actuelle, c'est la progression !

Et donc pour en revenir à nos moutons, la qualité est impressionnante. Certes, très loin d'être parfaite, mais disons que dans au moins la moitié des segments, à moins de tenir absolument à faire du style (ce dont le client en l'occurrence n'a pas besoin), il n'y a rien à retoucher, la traduction proposée est exploitable. La plupart du temps, les modifications à apporter sont mineures. Et puis de temps en temps, au milieu de nulle part, une grosse bourde, une phrase complètement ratée. Donc, l'intervention humaine reste encore nécessaire, mais quand je vois la qualité que la machine est capable de produire (elle sait par exemple reformuler les phrases en inversant les propositions, parfois en se plantant, mais parfois tout juste !), je me dis que ça ne peut que progresser et que certains domaines de la traductions vont sûrement évoluer vers ça : de la traduction automatique relue rapidement par des humains.



Une synthèse claire et réaliste. Voir cet exemple : http://findingoutanddoing.blogspot.com/2007/10/testing-new-google-translation.html

Impressionnant aussi car malgré la jeunesse de Google dans ce domaine (moins de 10 ans, ne l'oublions pas), les capacités "apprenantes" de l'outil vont progresser rapidement aussi.

Enfin, sur les exemples pris par Umberto Eco avec Altavista, l'édition originale est sortie en Italie en 2003 (je n'ai lu pour l'instant aucune des deux versions, mais je ne pense pas que les exemples fournis dans l'ouvrage en français aient été actualisés) (si quelqu'un peut confirmer/infirmer, merci d'avance), et 4 ans d'écart en années-Internet, ça compte !

Jean-Marie


 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Andriy Bublikov[Call to this topic]

You can also contact site staff by submitting a support request »

Google, traducteur automatique






CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »