copia da pdf a word
Thread poster: Elena Simonelli

Elena Simonelli  Identity Verified
Spain
Local time: 16:51
English to Italian
+ ...
Jan 31, 2008

Buongiorno colleghi,
ho un problema che potrebbe essere banale ma non so come risolverlo...
Sto cercando di copiare un testo da un pdf a word e mi escono dei segni strani al posto dei normali caratteri: punti interrogativi, righe, trattini, cancelletti, %, eccetera.
Se invece copio in un file di solo testo, tutti quadratini.
Vi è mai successo?


 

europe1234
Italy
French to Italian
+ ...
da pdf a word Jan 31, 2008

Elena
Ti consiglio l'uso del sito "zamzar" per effettuare queste modifiche. Buon lavoro!


 

Sandra Bertolini  Identity Verified
Italy
Local time: 16:51
German to Italian
+ ...
lingue con lettere "strane" Jan 31, 2008

Solitamente accade con le lingue che hanno lettere accentate o particolari tipo ü, ó, ø che non fanno parte della tastiera normale: te ne accorgi se questo è il caso sostituendo ad es. % con ñ e ti rendi conto che effettivamente il testo ha un senso.
A me è capitato alle volte con i testi in tedesco e risolvo appunto così con un sostituisci tutto e ho il mio testo perfetto.

Se vuoi provo ad estrartelo con Acrobat per vedere se si riesce a mantenere il format originale.

Ciao

Sandra


 

Elena Simonelli  Identity Verified
Spain
Local time: 16:51
English to Italian
+ ...
TOPIC STARTER
accenti... Jan 31, 2008

No, non succede solo con gli accenti e i caratteri particolari, ma proprio con tutte le lettere... Se vuoi fare un tentativo te lo mando volentieri... Grazie!

 

Sandra Bertolini  Identity Verified
Italy
Local time: 16:51
German to Italian
+ ...
prova Jan 31, 2008

Mandamelo pure e proviamo.

Ciao

Sandra


 

Elena Simonelli  Identity Verified
Spain
Local time: 16:51
English to Italian
+ ...
TOPIC STARTER
zamzar Jan 31, 2008

Gentile Europe,
ti ringrazio tanto per la tua telefonata e per l'aiuto.
Purtroppo da Zamzar ho avuto gli stessi segni... mi sa che faccio prima a stampare e riscrivere.
Grazie comunque!


 

Leonardo Musumeci  Identity Verified
Italy
Local time: 16:51
English to Italian
+ ...
prova a convertire il testo Jan 31, 2008

Elena Simonelli wrote:

Gentile Europe,
ti ringrazio tanto per la tua telefonata e per l'aiuto.
Purtroppo da Zamzar ho avuto gli stessi segni... mi sa che faccio prima a stampare e riscrivere.
Grazie comunque!


Se il testo contiene caratteri strani significa che il pdf non è in formato testo ( vedi ad esempio: http://www.biblio.polimi.it/tesi/index_2006.html )

Prova ad usare un software per l'estrazione di testo:

http://www.foolabs.com/xpdf/about.html

(open source, qui sopra si parla di unix/linux ma c'è anche per windows....)

altri programmi utili e gratuiti:

http://forum.zeusnews.com/viewtopic.php?t=12467

L'ideale sarebbe avere qualcuno che usa Linuxicon_smile.gif la procedura si semplifica moltissimo:

http://tinyurl.com/27tqoj


In alternativa puoi usare Gmail e trasformare il documento in html molto velocemente, anche e soprattutto se è protetto:

http://exploit.blogosfere.it/2006/02/pdf-protetti-gm.html


 

A_Nespoli  Identity Verified
Italy
Local time: 16:51
Member (2007)
German to Italian
+ ...
link Jan 31, 2008

qui c'è un altro link con degli ocr freeware che potrebbero fare al caso tuo.

http://www.anarchia.com/categorie-gratis/Programmi-Ocr-Gratis.html

gli OCR sono appunto i programmi che estraggono il testo dal file immagine.
Quelli freeware per windows li ho provati e non sono granché, dopo è necessario perderci parecchio tempo per risistemare i caratteri che non sono stati riconosciuti o per correggere gli errori, ma se per un lavoro soltanto non vale la pena della spesa.

Il passaggio dall'html è un'alternativa, ma rimane il problema della formattazione. Cioè se nel file pdf hai immagini o tabelle ci vuole cmq parecchio tempo.

Altrimenti se ti servirà spesso quelli a pagamento che su windows funzionano meglio sono Omnipage e ABBYfinereader.

ciao


 

A_Nespoli  Identity Verified
Italy
Local time: 16:51
Member (2007)
German to Italian
+ ...
scusa Jan 31, 2008

A_Nespoli wrote:

qui c'è un altro link con degli ocr freeware che potrebbero fare al caso tuo.

http://www.anarchia.com/categorie-gratis/Programmi-Ocr-Gratis.html

gli OCR sono appunto i programmi che estraggono il testo dal file immagine.
Quelli freeware per windows li ho provati e non sono granché, dopo è necessario perderci parecchio tempo per risistemare i caratteri che non sono stati riconosciuti o per correggere gli errori, ma se per un lavoro soltanto non vale la pena della spesa.

Il passaggio dall'html è un'alternativa, ma rimane il problema della formattazione. Cioè se nel file pdf hai immagini o tabelle ci vuole cmq parecchio tempo.

Altrimenti se ti servirà spesso quelli a pagamento che su windows funzionano meglio sono Omnipage e ABBYfinereader.

ciao


scusa sono un po' cotta...ho chiaramente lasciato la frase a metà: ' se per un lavoro soltanto non vale la pena della spesa per un programma commerciale'


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

copia da pdf a word

Advanced search






Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

More info »
memoQ translator pro
Kilgray's memoQ is the world's fastest developing integrated localization & translation environment rendering you more productive and efficient.

With our advanced file filters, unlimited language and advanced file support, memoQ translator pro has been designed for translators and reviewers who work on their own, with other translators or in team-based translation projects.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search