Numériser des fichiers image non éditables dans Windows XP
Thread poster: Philippe Etienne

Philippe Etienne  Identity Verified
Spain
Local time: 22:06
Member
English to French
Feb 23, 2006

Bonjour/soir à tous les francophones de tous les continents,

J'ai récemment découvert dans Windows XP un moyen de convertir en fichiers Word des textes au format image (bmp, jpg, etc.) ou des pdf où le texte n'est pas sélectionnable, et ce sans installer de logiciel d'OCR. Peut-être étais-je le seul à ne pas savoir que c'était faisable dans Windows XP, mais à tout tazar, je vous soumets la chose.
Ma méthode est pataude, il doit y avoir un moyen plus élégant, mais bon...

Contexte: j'utilise presque systématiquement Trados quel que soit le texte, pas nécessairement pour un hypothétique match dans 5 ans, mais plutôt pour faciliter la relecture. Je suis en effet infichu de relire deux documents côte à côte de manière productive. Par conséquent, je fuis comme la grippe aviaire tout doc papier ou image, justement pour éviter de relire en l'absence de source et cible facilement repérables dans des couleurs différentes.

Mais la dure loi du business m'impose parfois de prendre des jobs dont je sais qu'ils vont être pénibles...

Scénario: vous recevez un texte à traduire par mail, mais il s'agit d'une image ou d'un pdf. Le client a scanné un fax ou un doc papier bien propre, la qualité de l'impression est bonne, le formatage pas trop recherché et le texte bien lisible, mais avec plein de chiffres et d'adresses et de références à ne pas traduire. donc vous vous dites: "oh, ce serait top d'OCRiser ce truc, je pourrais utiliser Trados et ne pas perdre mon temps sur des c**ries de chiffres et d'adresses".

Jusqu'à présent, je me dépatouillais avec un programme d'OCR inclus dans Winfax Expert, mais cette édition limitée ne m'enchantait guère. Jusqu'au jour où j'ai double-cliqué sur une image .tif. Depuis, ma vie a changé.

Comme je n'aime pas écrire deux fois la même chose, je koopicool le contenu d'un mail que j'ai envoyé à une collègue pour expliquer ma méthode. On est des potes et on se tutoie (on a fait le semi-marathon de Marrakech ensemble, 483e sur 581 seniors H, la classe, mais là n'est pas mon propos), d'où le ton léger employé. D'avance, je présente mes excuses aux lecteurs sensibles.

"L'OCR de Windows est dans l'outil qui s'appelle Microsoft Office Document Imaging (il s'ouvre par défaut pour les images .tif)
Recherche sur ton disque système MSPVIEW.EXE. Chez moi, il est dans C:\Program Files\Fichiers communs\Microsoft Shared\MODI\11.0\MSPVIEW.EXE.
Crée un raccourci sur le Bureau (ou où tu veux).
Si tu as une image (non .tif, sinon trop facile) ou un pdf image (où tu ne peux pas sélectionner le texte), dans Acrobat reader: ouvre l'image ou le pdf, clique sur Fichier> imprimer, choisis comme imprimante Microsoft Office Document Image Writer et enregistre le fichier en .tif. Après, double clique sur le fichier .tif créé et Microsoft Office Document Imaging s'ouvre. Clique sur l'icône avec un oeil. Une fois l'OCR terminé, clique sur l'icône avec une flèche et le symbole de Word (à côté de l'icône avec un oeil) pour ouvrir le document numérisé dans Word."


Voilà, j'espère que cette méthode profitera à ceux qui hésitent à dépenser des mégabuques pour un logiciel qu'ils vont utiliser 3 fois par an.
Pour info, le moteur de reconnaissance est celui de Scansoft/Nuance (Omnipage) et marche plutôt bien, sur des pages propres bien entendu.

Bon travail,
Philippe


Direct link Reply with quote
 

Elodie Rousseau
Mexico
Local time: 15:06
English to French
+ ...
Un grand merci, Philippe !!! Feb 23, 2006

Je reçois quelques fois des PDF au texte non sélectionnable, et j'en étais encore à taper le texte à la main et même en tapant vite, je perdais un temps fou. Et j'ai jamais pu faire fonctionner le OCR venant avec mon scanner, alors ton message était plus que bienvenu.

En fait, je n'ai pas trouvé le fichier dont tu parles, et impossible d'avoir Microsoft Office Document Image Writer comme imprimante, mais j'ai fini par trouver une méthode plus simple, qui pourra peut-être servir à d'autres.

Je vais tout simplement dans Démarrer -> Tous les programmes -> Outils microsoft office ->Microsoft Office Document Imaging

De là, j'ouvre le pdf que j'ai préablement sauvegardé en fichier TIFF, je clique sur "reconnaître texte avec OCR" (ou similaire mon OS est en espagnol), puis "envoyer texte à word" et le tour est joué.

Et merci encore.

Elodie


Direct link Reply with quote
 

RB Translations  Identity Verified
Australia
Local time: 08:06
English to Italian
+ ...
Génial Feb 24, 2006

Merci merci merci!
Je ne cesse de me surprendre du nombre de choses que je pourrais faire avec mon ordinateur, si seulement je savais qu’elles sont possibles!
Enfin, merci beaucoup, je travaille très souvent avec des fax et des documents images et je crois que cela va beaucoup m’aider.


Direct link Reply with quote
 

Elodie Rousseau
Mexico
Local time: 15:06
English to French
+ ...
Office Document Image Writer comme imprimante ? Feb 24, 2006

Bon, en fait, je viens de me rendre compte que ma méthode était moyennement pratique quand le fichier PDF comportait plusieurs pages, car en passant en TIFF, chaque page est sauvegardée séparement.

Comment je peux faire pour configurer Office Document Image Writer comme une des imprimantes ?

Merci d'avance.

Elodie


Direct link Reply with quote
 

René VINCHON  Identity Verified
France
Member
German to French
+ ...
Oui mais Feb 24, 2006

Merci beaucoup Philippe, mais pour n'induire personne en erreur, il faut préciser que MODI n'est pas un utilitaire de Windows XP, mais d'Office XP. Pour ceux qui ont des versions antérieures d'Office, ça ne marche pas +:)

C'est mon cas et j'ai donc acheté pour une trentaine d'euros ABBYY PDF Transformer, rapide et efficace. N'oubliez pas de préciser mon nom lors de la commande, je touche une grosse commission sur chaque vente.

Et bravo pour le marathon, finir un marathon, quelle que soit la place, est déjà un bel exploit.


Direct link Reply with quote
 

Adrien Esparron
Local time: 22:06
Member (2007)
German to French
+ ...
La bonne version suffit Feb 24, 2006

Elodie Rousseau wrote:

Comment je peux faire pour configurer Office Document Image Writer comme une des imprimantes ?



Possédant toutes les versions de MS Office depuis le début, je crois sauf erreur que ODIW, autrement dit une imprimante virtuelle, n'existe qu'à partir de Office 2003, comme le laisse supposer le lien suivant :

http://www.01net.com/editorial/270403/office-2003-exporter-un-document-sous-forme-d-image/

Sur mon ordi de bureau j'ai Office XP Pro et s'il y a Imaging, il n'y a pas le Writer (j'utilise mon scanner et un OCR).

Sur mon portable j'ai Office 2003 et il y a aussi le Writer.

Les deux ordis sont XP Pro, on s'en doutait.

Bon, si tu as les bonnes versions, les bonnes installations et les bonnes configurations, tu as ton Writer tout bêtement dans la liste des imprimantes ... Fichier/Imprimer, liste déroulante des imprimantes installées.

Zou et Zoum la Boum. Pas plus compliqué de faire du scanner (OCR et lycée de Versailles) sans en avoir !

J'ai quatre captures d'écran prouvant que ce n'est pas plus sorcier que cela. Si tu les souhaites, je peux te les passer en pièce jointe JPG sur une adresse de courrier perso.

Tu verras, c'est tout bête.

Bonne soirée, du moins ici,

Adrien


Direct link Reply with quote
 

Philippe Etienne  Identity Verified
Spain
Local time: 22:06
Member
English to French
TOPIC STARTER
Merci pour ces rectifications Feb 25, 2006

Dans le mille René, c'est Office qui contient ces utilitaires et dans le mille Adrien, j'ai bien Office 2003 (standard). Désolé pour la méprise, l'idée ne m'a pas effleuré... Et je tourne sur Windows XP Home.
C'est peut-être pourquoi Elodie n'y arrive pas si elle a une version précédente. Au passage merci Elodie d'avoir précisé où se trouve Microsoft Office Document Imaging, c'est plus élégant que la recherche de l'exécutable...

René, je suis flatté, mais je n'ai couru que le semi (21,097km), je suis incapable de terminer un marathon avec un seul entrainement dominical...

Bien cordialement,
Philippe


Direct link Reply with quote
 

Adrien Esparron
Local time: 22:06
Member (2007)
German to French
+ ...
Précisions Feb 25, 2006

Philippe Etienne wrote:

Désolé pour la méprise, l'idée ne m'a pas effleuré... Et je tourne sur Windows XP Home.



Pas de souci Philippe ! En discutant personnellement avec Elodie (j'avais promis des captures et les ai envoyées), j'ai moi-même pris conscience que je pouvais éventuellement installer le Writer de la version 2003 de mon portable en complément de ma version XP sur l'ordi de bureau (je souhaite y conserver la version XP). Si on fait bien attention à cette installation "très" personnalisée, c'est bon !

Je peux naturellement envoyer ces captures à toute personne intéressée et souhaitant y voir "plus clair".

Très cordialement à tous,

Adrien


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Andriy Bublikov[Call to this topic]

You can also contact site staff by submitting a support request »

Numériser des fichiers image non éditables dans Windows XP

Advanced search






LSP.expert
You’re a freelance translator? LSP.expert helps you manage your daily translation jobs. It’s easy, fast and secure.

How about you start tracking translation jobs and sending invoices in minutes? You can also manage your clients and generate reports about your business activities. So you always keep a clear view on your planning, AND you get a free 30 day trial period!

More info »
Déjà Vu X3
Try it, Love it

Find out why Déjà Vu is today the most flexible, customizable and user-friendly tool on the market. See the brand new features in action: *Completely redesigned user interface *Live Preview *Inline spell checking *Inline

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search