Numériser des fichiers image non éditables dans Windows XP Thread poster: Philippe Etienne
|
Bonjour/soir à tous les francophones de tous les continents, J'ai récemment découvert dans Windows XP un moyen de convertir en fichiers Word des textes au format image (bmp, jpg, etc.) ou des pdf où le texte n'est pas sélectionnable, et ce sans installer de logiciel d'OCR. Peut-être étais-je le seul à ne pas savoir que c'était faisable dans Windows XP, mais à tout tazar, je vous soumets la chose. Ma méthode est pataude, il doit y avoir un moyen plus élégant, mais ... See more Bonjour/soir à tous les francophones de tous les continents, J'ai récemment découvert dans Windows XP un moyen de convertir en fichiers Word des textes au format image (bmp, jpg, etc.) ou des pdf où le texte n'est pas sélectionnable, et ce sans installer de logiciel d'OCR. Peut-être étais-je le seul à ne pas savoir que c'était faisable dans Windows XP, mais à tout tazar, je vous soumets la chose. Ma méthode est pataude, il doit y avoir un moyen plus élégant, mais bon... Contexte: j'utilise presque systématiquement Trados quel que soit le texte, pas nécessairement pour un hypothétique match dans 5 ans, mais plutôt pour faciliter la relecture. Je suis en effet infichu de relire deux documents côte à côte de manière productive. Par conséquent, je fuis comme la grippe aviaire tout doc papier ou image, justement pour éviter de relire en l'absence de source et cible facilement repérables dans des couleurs différentes. Mais la dure loi du business m'impose parfois de prendre des jobs dont je sais qu'ils vont être pénibles... Scénario: vous recevez un texte à traduire par mail, mais il s'agit d'une image ou d'un pdf. Le client a scanné un fax ou un doc papier bien propre, la qualité de l'impression est bonne, le formatage pas trop recherché et le texte bien lisible, mais avec plein de chiffres et d'adresses et de références à ne pas traduire. donc vous vous dites: "oh, ce serait top d'OCRiser ce truc, je pourrais utiliser Trados et ne pas perdre mon temps sur des c**ries de chiffres et d'adresses". Jusqu'à présent, je me dépatouillais avec un programme d'OCR inclus dans Winfax Expert, mais cette édition limitée ne m'enchantait guère. Jusqu'au jour où j'ai double-cliqué sur une image .tif. Depuis, ma vie a changé. Comme je n'aime pas écrire deux fois la même chose, je koopicool le contenu d'un mail que j'ai envoyé à une collègue pour expliquer ma méthode. On est des potes et on se tutoie (on a fait le semi-marathon de Marrakech ensemble, 483e sur 581 seniors H, la classe, mais là n'est pas mon propos), d'où le ton léger employé. D'avance, je présente mes excuses aux lecteurs sensibles. "L'OCR de Windows est dans l'outil qui s'appelle Microsoft Office Document Imaging (il s'ouvre par défaut pour les images .tif) Recherche sur ton disque système MSPVIEW.EXE. Chez moi, il est dans C:\Program Files\Fichiers communs\Microsoft Shared\MODI\11.0\MSPVIEW.EXE. Crée un raccourci sur le Bureau (ou où tu veux). Si tu as une image (non .tif, sinon trop facile) ou un pdf image (où tu ne peux pas sélectionner le texte), dans Acrobat reader: ouvre l'image ou le pdf, clique sur Fichier> imprimer, choisis comme imprimante Microsoft Office Document Image Writer et enregistre le fichier en .tif. Après, double clique sur le fichier .tif créé et Microsoft Office Document Imaging s'ouvre. Clique sur l'icône avec un oeil. Une fois l'OCR terminé, clique sur l'icône avec une flèche et le symbole de Word (à côté de l'icône avec un oeil) pour ouvrir le document numérisé dans Word." Voilà, j'espère que cette méthode profitera à ceux qui hésitent à dépenser des mégabuques pour un logiciel qu'ils vont utiliser 3 fois par an. Pour info, le moteur de reconnaissance est celui de Scansoft/Nuance (Omnipage) et marche plutôt bien, sur des pages propres bien entendu. Bon travail, Philippe ▲ Collapse | | | Un grand merci, Philippe !!! | Feb 23, 2006 |
Je reçois quelques fois des PDF au texte non sélectionnable, et j'en étais encore à taper le texte à la main et même en tapant vite, je perdais un temps fou. Et j'ai jamais pu faire fonctionner le OCR venant avec mon scanner, alors ton message était plus que bienvenu. En fait, je n'ai pas trouvé le fichier dont tu parles, et impossible d'avoir Microsoft Office Document Image Writer comme imprimante, mais j'ai fini par trouver une méthode plus simple, qui pourra peut-être s... See more Je reçois quelques fois des PDF au texte non sélectionnable, et j'en étais encore à taper le texte à la main et même en tapant vite, je perdais un temps fou. Et j'ai jamais pu faire fonctionner le OCR venant avec mon scanner, alors ton message était plus que bienvenu. En fait, je n'ai pas trouvé le fichier dont tu parles, et impossible d'avoir Microsoft Office Document Image Writer comme imprimante, mais j'ai fini par trouver une méthode plus simple, qui pourra peut-être servir à d'autres. Je vais tout simplement dans Démarrer -> Tous les programmes -> Outils microsoft office ->Microsoft Office Document Imaging De là, j'ouvre le pdf que j'ai préablement sauvegardé en fichier TIFF, je clique sur "reconnaître texte avec OCR" (ou similaire mon OS est en espagnol), puis "envoyer texte à word" et le tour est joué. Et merci encore. Elodie ▲ Collapse | | |
Merci merci merci! Je ne cesse de me surprendre du nombre de choses que je pourrais faire avec mon ordinateur, si seulement je savais qu’elles sont possibles! Enfin, merci beaucoup, je travaille très souvent avec des fax et des documents images et je crois que cela va beaucoup m’aider. | | | Office Document Image Writer comme imprimante ? | Feb 24, 2006 |
Bon, en fait, je viens de me rendre compte que ma méthode était moyennement pratique quand le fichier PDF comportait plusieurs pages, car en passant en TIFF, chaque page est sauvegardée séparement. Comment je peux faire pour configurer Office Document Image Writer comme une des imprimantes ? Merci d'avance. Elodie | |
|
|
René VINCHON (X) France German to French + ...
Merci beaucoup Philippe, mais pour n'induire personne en erreur, il faut préciser que MODI n'est pas un utilitaire de Windows XP, mais d'Office XP. Pour ceux qui ont des versions antérieures d'Office, ça ne marche pas +:) C'est mon cas et j'ai donc acheté pour une trentaine d'euros ABBYY PDF Transformer, rapide et efficace. N'oubliez pas de préciser mon nom lors de la commande, je touche une grosse commission sur chaque vente. Et bravo pour le marathon, finir un ma... See more Merci beaucoup Philippe, mais pour n'induire personne en erreur, il faut préciser que MODI n'est pas un utilitaire de Windows XP, mais d'Office XP. Pour ceux qui ont des versions antérieures d'Office, ça ne marche pas +:) C'est mon cas et j'ai donc acheté pour une trentaine d'euros ABBYY PDF Transformer, rapide et efficace. N'oubliez pas de préciser mon nom lors de la commande, je touche une grosse commission sur chaque vente. Et bravo pour le marathon, finir un marathon, quelle que soit la place, est déjà un bel exploit. ▲ Collapse | | | Platary (X) Local time: 11:38 German to French + ... La bonne version suffit | Feb 24, 2006 |
Elodie Rousseau wrote: Comment je peux faire pour configurer Office Document Image Writer comme une des imprimantes ? Possédant toutes les versions de MS Office depuis le début, je crois sauf erreur que ODIW, autrement dit une imprimante virtuelle, n'existe qu'à partir de Office 2003, comme le laisse supposer le lien suivant : http://www.01net.com/editorial/270403/office-2003-exporter-un-document-sous-forme-d-image/ Sur mon ordi de bureau j'ai Office XP Pro et s'il y a Imaging, il n'y a pas le Writer (j'utilise mon scanner et un OCR). Sur mon portable j'ai Office 2003 et il y a aussi le Writer. Les deux ordis sont XP Pro, on s'en doutait. Bon, si tu as les bonnes versions, les bonnes installations et les bonnes configurations, tu as ton Writer tout bêtement dans la liste des imprimantes ... Fichier/Imprimer, liste déroulante des imprimantes installées. Zou et Zoum la Boum. Pas plus compliqué de faire du scanner (OCR et lycée de Versailles) sans en avoir ! J'ai quatre captures d'écran prouvant que ce n'est pas plus sorcier que cela. Si tu les souhaites, je peux te les passer en pièce jointe JPG sur une adresse de courrier perso. Tu verras, c'est tout bête. Bonne soirée, du moins ici, Adrien | | | Merci pour ces rectifications | Feb 25, 2006 |
Dans le mille René, c'est Office qui contient ces utilitaires et dans le mille Adrien, j'ai bien Office 2003 (standard). Désolé pour la méprise, l'idée ne m'a pas effleuré... Et je tourne sur Windows XP Home. C'est peut-être pourquoi Elodie n'y arrive pas si elle a une version précédente. Au passage merci Elodie d'avoir précisé où se trouve Microsoft Office Document Imaging, c'est plus élégant que la recherche de l'exécutable... René, je suis flatté, mais je n... See more Dans le mille René, c'est Office qui contient ces utilitaires et dans le mille Adrien, j'ai bien Office 2003 (standard). Désolé pour la méprise, l'idée ne m'a pas effleuré... Et je tourne sur Windows XP Home. C'est peut-être pourquoi Elodie n'y arrive pas si elle a une version précédente. Au passage merci Elodie d'avoir précisé où se trouve Microsoft Office Document Imaging, c'est plus élégant que la recherche de l'exécutable... René, je suis flatté, mais je n'ai couru que le semi (21,097km), je suis incapable de terminer un marathon avec un seul entrainement dominical... Bien cordialement, Philippe ▲ Collapse | | | Platary (X) Local time: 11:38 German to French + ...
Philippe Etienne wrote: Désolé pour la méprise, l'idée ne m'a pas effleuré... Et je tourne sur Windows XP Home. Pas de souci Philippe ! En discutant personnellement avec Elodie (j'avais promis des captures et les ai envoyées), j'ai moi-même pris conscience que je pouvais éventuellement installer le Writer de la version 2003 de mon portable en complément de ma version XP sur l'ordi de bureau (je souhaite y conserver la version XP). Si on fait bien attention à cette installation "très" personnalisée, c'est bon ! Je peux naturellement envoyer ces captures à toute personne intéressée et souhaitant y voir "plus clair". Très cordialement à tous, Adrien | | | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » Numériser des fichiers image non éditables dans Windows XP CafeTran Espresso | You've never met a CAT tool this clever!
Translate faster & easier, using a sophisticated CAT tool built by a translator / developer.
Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools.
Download and start using CafeTran Espresso -- for free
Buy now! » |
| Trados Business Manager Lite | Create customer quotes and invoices from within Trados Studio
Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |