copia da pdf a word
Thread poster: Elena Simonelli

Elena Simonelli  Identity Verified
Spain
Local time: 20:19
English to Italian
+ ...
Jan 31, 2008

Buongiorno colleghi,
ho un problema che potrebbe essere banale ma non so come risolverlo...
Sto cercando di copiare un testo da un pdf a word e mi escono dei segni strani al posto dei normali caratteri: punti interrogativi, righe, trattini, cancelletti, %, eccetera.
Se invece copio in un file di solo testo, tutti quadratini.
Vi è mai successo?


Direct link Reply with quote
 
europe1234
Italy
French to Italian
+ ...
da pdf a word Jan 31, 2008

Elena
Ti consiglio l'uso del sito "zamzar" per effettuare queste modifiche. Buon lavoro!


Direct link Reply with quote
 

Sandra Bertolini  Identity Verified
Italy
Local time: 20:19
German to Italian
+ ...
lingue con lettere "strane" Jan 31, 2008

Solitamente accade con le lingue che hanno lettere accentate o particolari tipo ü, ó, ø che non fanno parte della tastiera normale: te ne accorgi se questo è il caso sostituendo ad es. % con ñ e ti rendi conto che effettivamente il testo ha un senso.
A me è capitato alle volte con i testi in tedesco e risolvo appunto così con un sostituisci tutto e ho il mio testo perfetto.

Se vuoi provo ad estrartelo con Acrobat per vedere se si riesce a mantenere il format originale.

Ciao

Sandra


Direct link Reply with quote
 

Elena Simonelli  Identity Verified
Spain
Local time: 20:19
English to Italian
+ ...
TOPIC STARTER
accenti... Jan 31, 2008

No, non succede solo con gli accenti e i caratteri particolari, ma proprio con tutte le lettere... Se vuoi fare un tentativo te lo mando volentieri... Grazie!

Direct link Reply with quote
 

Sandra Bertolini  Identity Verified
Italy
Local time: 20:19
German to Italian
+ ...
prova Jan 31, 2008

Mandamelo pure e proviamo.

Ciao

Sandra


Direct link Reply with quote
 

Elena Simonelli  Identity Verified
Spain
Local time: 20:19
English to Italian
+ ...
TOPIC STARTER
zamzar Jan 31, 2008

Gentile Europe,
ti ringrazio tanto per la tua telefonata e per l'aiuto.
Purtroppo da Zamzar ho avuto gli stessi segni... mi sa che faccio prima a stampare e riscrivere.
Grazie comunque!


Direct link Reply with quote
 

Leonardo Musumeci  Identity Verified
Italy
Local time: 20:19
English to Italian
+ ...
prova a convertire il testo Jan 31, 2008

Elena Simonelli wrote:

Gentile Europe,
ti ringrazio tanto per la tua telefonata e per l'aiuto.
Purtroppo da Zamzar ho avuto gli stessi segni... mi sa che faccio prima a stampare e riscrivere.
Grazie comunque!


Se il testo contiene caratteri strani significa che il pdf non è in formato testo ( vedi ad esempio: http://www.biblio.polimi.it/tesi/index_2006.html )

Prova ad usare un software per l'estrazione di testo:

http://www.foolabs.com/xpdf/about.html

(open source, qui sopra si parla di unix/linux ma c'è anche per windows....)

altri programmi utili e gratuiti:

http://forum.zeusnews.com/viewtopic.php?t=12467

L'ideale sarebbe avere qualcuno che usa Linux la procedura si semplifica moltissimo:

http://tinyurl.com/27tqoj


In alternativa puoi usare Gmail e trasformare il documento in html molto velocemente, anche e soprattutto se è protetto:

http://exploit.blogosfere.it/2006/02/pdf-protetti-gm.html


Direct link Reply with quote
 

A_Nespoli  Identity Verified
Italy
Local time: 20:19
Member (2007)
German to Italian
+ ...
link Jan 31, 2008

qui c'è un altro link con degli ocr freeware che potrebbero fare al caso tuo.

http://www.anarchia.com/categorie-gratis/Programmi-Ocr-Gratis.html

gli OCR sono appunto i programmi che estraggono il testo dal file immagine.
Quelli freeware per windows li ho provati e non sono granché, dopo è necessario perderci parecchio tempo per risistemare i caratteri che non sono stati riconosciuti o per correggere gli errori, ma se per un lavoro soltanto non vale la pena della spesa.

Il passaggio dall'html è un'alternativa, ma rimane il problema della formattazione. Cioè se nel file pdf hai immagini o tabelle ci vuole cmq parecchio tempo.

Altrimenti se ti servirà spesso quelli a pagamento che su windows funzionano meglio sono Omnipage e ABBYfinereader.

ciao


Direct link Reply with quote
 

A_Nespoli  Identity Verified
Italy
Local time: 20:19
Member (2007)
German to Italian
+ ...
scusa Jan 31, 2008

A_Nespoli wrote:

qui c'è un altro link con degli ocr freeware che potrebbero fare al caso tuo.

http://www.anarchia.com/categorie-gratis/Programmi-Ocr-Gratis.html

gli OCR sono appunto i programmi che estraggono il testo dal file immagine.
Quelli freeware per windows li ho provati e non sono granché, dopo è necessario perderci parecchio tempo per risistemare i caratteri che non sono stati riconosciuti o per correggere gli errori, ma se per un lavoro soltanto non vale la pena della spesa.

Il passaggio dall'html è un'alternativa, ma rimane il problema della formattazione. Cioè se nel file pdf hai immagini o tabelle ci vuole cmq parecchio tempo.

Altrimenti se ti servirà spesso quelli a pagamento che su windows funzionano meglio sono Omnipage e ABBYfinereader.

ciao


scusa sono un po' cotta...ho chiaramente lasciato la frase a metà: ' se per un lavoro soltanto non vale la pena della spesa per un programma commerciale'


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

copia da pdf a word

Advanced search






BaccS – Business Accounting Software
Modern desktop project management for freelance translators

BaccS makes it easy for translators to manage their projects, schedule tasks, create invoices, and view highly customizable reports. User-friendly, ProZ.com integration, community-driven development – a few reasons BaccS is trusted by translators!

More info »
Déjà Vu X3
Try it, Love it

Find out why Déjà Vu is today the most flexible, customizable and user-friendly tool on the market. See the brand new features in action: *Completely redesigned user interface *Live Preview *Inline spell checking *Inline

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search