Mobile menu

Extracteur terminologique
Thread poster: Jean-Marie Le Ray

Jean-Marie Le Ray  Identity Verified
Italy
Local time: 15:40
Member
Italian to French
+ ...
Jan 25, 2007

Bonjour,

Je voudrais savoir si quelqu'un d'entre vous a déjà eu l'occasion d'utiliser un extracteur terminologique, et si oui, quelles sont ses impressions sur la pertinence de l'outil.
Merci d'avance,

Jean-Marie Le Ray
http://www.adscriptor.com


Direct link Reply with quote
 

Cristina Mazzucchelli  Identity Verified
Italy
Local time: 15:40
English to Italian
+ ...
Useful, but... Jan 25, 2007

Bonjour Jean-Marie,

I hope my post will be accepted, even though I am writing it in English.
I haven't been using my French actively for about one year now, and I don't feel as confident when I write about this kind of topics as when I use English.
So, I hope you'll accept my apologies!

Getting back to terminology extraction tools, I have been so lucky to write my dissertation for the MSc course I attented on terminology extraction and therefore I was able to try out some of these tools and in particular:
- SDL Trados Multiterm Extract
- SDLX PhraseFinder
- Wordfast PlusTools
- Synthema Terminology Wizard (which is especially designed for ENIT translation and terminology extraction).

Not going too too much into detail here, generally I can tell you that:

- they are useful tools, as they help you building up thorought subject-specific glossaries that can be directly used with your TMs;

- in most cases are easy to be used and quite fast;

- in most cases are quite expensive (except for PlusTools that is completely free and easy to be downloaded - but according to me this tool is very basic and doesn't have a lot of features the other ones have... it's basic but useful and handy when one's starting to work with terminology extraction!);

- even though they are easy to be used, the whole process that involves terminology extraction, also implies what I call a "pre-process" (gathering a corpus linguistics or finding a relevant one) and a "post-process" (validating terminology and storing it in a relevant database - if the software does not do this automatically) and is therefore quite lenghty.
Most of the times translators do not have that much time to research and gather terminology before starting to work on a text, so if you are working on a tight deadline you would never be able to have enough time to perform terminology extraction!

These were just a few basic considerations, I hope I gave you a basic insight of terminology extraction tools!
If you need any more information on a specific tool, please contact me!

Good luck with TE!

Cristina


Direct link Reply with quote
 

Jean-Marie Le Ray  Identity Verified
Italy
Local time: 15:40
Member
Italian to French
+ ...
TOPIC STARTER
Grazie mille :-) Jan 25, 2007

Cristina Mazzucchelli wrote:

So, I hope you'll accept my apologies!



No problem at all

Thanks a lot, Cristina.

Merci à Cristina, qui me dit en gros qu'elle a trouvé utiles, rapides et faciles à utiliser les 4 outils étudiés dans le cadre d'un cours qu'elle a fréquenté, même si Plustools est plutôt basique (mais c'est celui qui coûte le moins cher).
Elle me dit également que l'extraction pure doit être précédée d'un pré-traitement (pour préparer le corpus) et suivie d'un post-traitement (pour valider les choix de l'outil) ce qui ralentit considérablement l'ensemble de l'opération.
Raison pour laquelle les traducteurs qui travaillent toujours plus ou moins dans l'urgence ne sont pas vraiment en mesure de profiter des bienfaits de l'extracteur...

Un avis très intéressant. D'autres retours ?

J-M


Direct link Reply with quote
 

Bruno Magne  Identity Verified
Local time: 10:40
English to French
+ ...
Fusion Jan 26, 2007

Bonjour, Jean-Marie

cela faisait longtemps que tu ne pointais pas ton museau du côté de chez nous. J'espère qeut tout marche bien pour toi. et qcette nouvelle année est partie du bon pied.

Pour répondre à ta quesion, le seul outil que je connaisse pour l'avoir utilisé est le logiciel concurrent de Trados, Fusion. J'ai profité d'une promotion l'année dernière pour acquérir une licence perpétuelle à un prix vraiment très bas. J'ai fait plusieurs essais avec la fonction Extraction. Comme outil, c'est rapide. Le problème est de savoir configurer les seuils de répétiion d'un mot pourqu'il puisse être extrait. Mais d'une chose, on n'échappe pas: le traitement après coup. Il faut que tu analyses mot par mot (et souvent ça dépasse le millier de mots) pour décider si le mot mérite vraiment d'entrer dans le dictionnaire. Ça m'a amusé plusieurs fois et puis je me suis découragé.

La leçon que j'ai tirée de tout cela, c'est rien ne vaut la construction d'un dico (ou d'iun glossaire si on n'est pas puriste) au fur et à mesure du travail de traduction. Moi, par exemple, qui travaille essentiellement sur les documents juridiques et financiers dans la paire Anglais-Français, je rofite de chaque nouveau fichier pour engranger plusieurs dizaines de mots dont je sais qu'ils reviendront dans des documents ultérieurs.

Comme le fait remarquer avec raison Cristina, ce genre de logiciel est horriblement cher. Questio rapport qualité/prix, je considère que c'est gasiller de l'argent que des les acheter. ã moins que tu ne deviennes un expert et que tu commercialises ta production.

Ciao

BrunO

[Edited at 2007-01-26 04:04]


Direct link Reply with quote
 

sylver  Identity Verified
Local time: 21:40
English to French
Un autre Jan 26, 2007

Ils ont mis un post sur ce forum il y a quelques jours concernant un extracteur bilingue en ligne (stade expérimental).

Je ne retrouve plus le post et je crois qu'il a été effacé -c'est de la pub, après tout - mais j'ai quand même testé le logiciel avec 2 petit fichiers, source et traduction.

J'ai reçu après quelques heures un petit fichier texte contenant les résultats suivants:

Diversity en NOUN NOUN diversity Diversité fr NOUN NOUN diversité 75
better reception en NOUN ADJ NOUN good reception meilleure réception fr NOUN ADJ NOUN meilleur réception 100
two mini-antennas designed for en NOUN ADJ NOUN PASTPART PREP two mini-antennas design for deux mini-antennes conçues fr NOUN ADJ NOUN ADJ deux mini-antenne concevoir 76
signal en NOUN NOUN signal signal fr NOUN NOUN signal 100
Diversity mode en NOUN NOUN NOUN diversity mode mode Diversité fr NOUN NOUN NOUN mode diversité 88
Put en VERB VERB put Mettez fr VERB VERB mettre 100
iPod or Sony PSP en NOUN NOUN ANDOR NOUN NOUN iPod or Sony PSP iPod ou Sony PSP fr NOUN NOUN ANDOR NOUN NOUN iPod ou Sony PSP 89
can automatically convert en VERB AUX ADV VERB can automatically convert peut convertir automatiquement fr VERB VERB VERB_INF ADV pouvoir convertir automatiquement 100
recording en NOUN NOUN record enregistrements fr NOUN NOUN enregistrement 100

Pour un résultat d'extraction, c'est putôt bon. Bien sûr le test à été fait avec des fichiers Word très simples, mais je pense que ça vaut le coup de le tester de façon sérieuse si tu es à la recherche d'un extracteur termino.

Le logiciel s'appelle Similis et l'extracteur est accessible à www.lingua-et-machina.com. Il faut cliquer sur "Experimental Services".

En ce qui concerne l'extracteur de +Tools, il est très très rudimentaire, et fonctionne avec une seule langue à la fois. Voilà un échantillon de résultat avec les paramètres par défaut:

and iPod are registered trademarks
and product names are trademarks
and record
another
antennas
Apple Computer Inc PSP is
are registered trademarks of Apple
are trademarks of the respective
brands and product names are
change without notice Made in
designed
Edit
enhancement products for your computer
Enjoy
favourite
features
from

En modifiant les paramètres pour n'extraire que les mots isolés:
Apple
channels
Computer
Control
Digital
Enjoy
experience
Guide
XXXX
Other
product
reception
record
registered
remote
remove
shows
specifications
Technology
trademarks
TVDuo
Twice
Video
Watch
without


[Edited at 2007-01-26 05:39]


Direct link Reply with quote
 
David Turner  Identity Verified
Local time: 15:40
French to English
+ ...
Build Lexicon de Déjà Vu DVX Jan 26, 2007

DVX comporte un outil intégré de ce type (Build Lexicon) qui permet d'établir assez rapidement un lexique multi-lingue (une langue source, plusieurs langues cibles) des termes clés d'un projet multi-lingue, multi-fichiers, multi-format (Word, Excel, Powerpoint, HTML, etc.).
Il est très utile sur des projets partagés par plusieurs traducteurs ou même lorsqu'on travaille tout seul.
Les termes ainsi générés assurent une cohérence terminologue et accélérent considérablement le processus de traduction en étant proposés et assemblés automatiquement par la fonction AutoAssemble.

David Turner

[Edited at 2007-01-26 08:32]

[Edited at 2007-01-26 08:59]


Direct link Reply with quote
 

Jean-Marie Le Ray  Identity Verified
Italy
Local time: 15:40
Member
Italian to French
+ ...
TOPIC STARTER
Embarras du choix Jan 26, 2007

Merci à tous pour vos remarques,

En fait mon idée serait de mettre de l'ordre dans ma base terminologique autant que bordélique (normal pour un bordel...ais), qui a atteint des proportions gigantesques après 10 ans de téléchargements plus ou moins quotidiens.
En gros ce sont 7 ou 8 millions de fichiers (je compte plus), des milliers de glossaires et de fichiers bilingues ou plus (essentiellement EN-FR-IT, et accessoirement ES) répartis sur pratiquement 1 To.
Donc pour l'instant je trouve n'importe quel terme à la volée grâce à mon moteur de recherche interne, mais je me dis qu'il y a là un gisement brut totalement inexploité qui gagnerait à l'être (et moi aussi par la même occasion, pourquoi pas).
Je cherche donc à comprendre comment organiser ça au mieux, et l'extraction terminologique me semble être un passage obligé.
Merci donc pour vos conseils.
Jean-Marie


Direct link Reply with quote
 

Adrien Esparron
France
Local time: 15:40
Member (2007)
German to French
+ ...
Il faudrait la pointure ad hoc ! Jan 26, 2007

C'est pas Graves pour un Bordelais ...

Jean-Marie Le Ray wrote:

En gros ce sont 7 ou 8 millions de fichiers (je compte plus), des milliers de glossaires et de fichiers bilingues ou plus (essentiellement EN-FR-IT, et accessoirement ES) répartis sur pratiquement 1 To.
Je cherche donc à comprendre comment organiser ça au mieux, et l'extraction terminologique me semble être un passage obligé.



Bigre, c'est pas du petit bras, là !


J'irais chercher une solution de ce côté :

http://www.acetic.fr/demo.htm

Ne sais cependant pas si Tropes et Zoom répondent à ta problématique. A examiner cependant, je crois.

Olivier


Direct link Reply with quote
 

Jean-Marie Le Ray  Identity Verified
Italy
Local time: 15:40
Member
Italian to French
+ ...
TOPIC STARTER
Certes, le tout est de trouver la bonne pointure :-) Jan 26, 2007

Olivier,

Je ne connaissais pas la solution que tu mentionnes, mais elle m'a l'air plutôt orientée analyse sémantique, or je suis plutôt intéressé par la mise en concordance de corpus terminologiques.
J'ai découvert durant mes recherches l'eXtraction Terminology Suite™ de Temis ( http://www.temis-group.com/index.php?id=89&selt=1 ), j'ai demandé des infos, sous réserve que le prix soit adapté à mes poches, ce sur quoi j'ai tendance à nourrir quelques doutes
J-M


Direct link Reply with quote
 

sylver  Identity Verified
Local time: 21:40
English to French
Mettre de l'ordre Jan 26, 2007

Jean-Marie Le Ray wrote:

Olivier,

Je ne connaissais pas la solution que tu mentionnes, mais elle m'a l'air plutôt orientée analyse sémantique, or je suis plutôt intéressé par la mise en concordance de corpus terminologiques.
J'ai découvert durant mes recherches l'eXtraction Terminology Suite™ de Temis ( http://www.temis-group.com/index.php?id=89&selt=1 ), j'ai demandé des infos, sous réserve que le prix soit adapté à mes poches, ce sur quoi j'ai tendance à nourrir quelques doutes
J-M


Dis donc, le volume est carrément faramineux!

Je crois qu'il faut que tu définisses plus clairement ce que tu as et ce que tu veux obtenir, puis déterminer une séquence de travail pour traiter les fichiers.

* Quel est le résultat à atteindre?
Des glossaires de type "source - cible - commentaire"?
Des mémoires de traduction Wordfast/Trados/DV/SDLX/...?
Autre format?

* De quels types de fichiers s'agit-t'il?
(Word, xls, HTML, RTF, texte, XML, PDF...)
Je suppose que tu as un peu de tout, mais autant commencer par définir les types et l'importance relative.

* Format d'origine?
Format interne des fichiers (bilingues? Mise en page complexe? tableaux,...)

Si ça t'intéresse, tu peux m'envoyer quelques fichiers typiques par email et je te dirais ce que j'en pense. Sans voir les fichiers, c'est pas facile de proposer une solution qui tienne la route.


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Andriy Bublikov[Call to this topic]

You can also contact site staff by submitting a support request »

Extracteur terminologique

Advanced search






CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use SDL Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

More info »
LSP.expert
You’re a freelance translator? LSP.expert helps you manage your daily translation jobs. It’s easy, fast and secure.

How about you start tracking translation jobs and sending invoices in minutes? You can also manage your clients and generate reports about your business activities. So you always keep a clear view on your planning, AND you get a free 30 day trial period!

More info »



All of ProZ.com
  • All of ProZ.com
  • Term search
  • Jobs