Convertor bun PDF -> DOC (Word)
Thread poster: wordbridge

wordbridge  Identity Verified
Romania
Local time: 10:09
English to Romanian
+ ...
Jan 5, 2014

La mulţi ani şi la cât mai multe proiecte bune în 2014!
Am şi eu o problemă cu convertirea documentelor din format PDF în format .doc (Word). În ultima perioadă am primit documente de tradus mai mari, în format .pdf şi cu foarte multe imagini. Clientul a cerut ca ca documentul tradus să păstreze forma şi imaginile originalului. Până acum nu am întâmpinat probleme la convertirea documentelor din format .pdf în .doc, folosind Adobe Acrobat X Pro şi Abby Fine Reader, însă documentele erau mai mici ca şi dimensiune. Însă, pe documentele mai mari (peste 50 de pagini), ambele programe afectează mult calitatea materialului rezultat, pozele nu se văd, iar textul este plin de simboluri fiind imposibilă înţelegerea acestuia. Voi ce programe de convertire folosiţi?!

[Edited at 2014-01-05 08:21 GMT]


 

Bogdan Dusa  Identity Verified
Romania
Local time: 10:09
English to Romanian
+ ...
Abby Fine Reader... Jan 5, 2014

... daca am avut documente mai mici. Cand am avut documente mai mari, am apelat la un expert in DTP (ce spui acolo e deja treaba de DTP), informand clientul ca trebuie sa plateasca un tarif suplimentar pentru DTP (a fost de acord fara probleme).
Ca traducator, nu ar trebui sa faci tot tu convertirea in Word. Fie o face clientul, tu primind doar materialul de tradus, fie apelezi tu la serviciile unui profesionist, dar taxand suplimentar clientul pentru acest serviciu.

Succes!


 

George Luca  Identity Verified
Local time: 10:09
German to Romanian
+ ...
Fișiere PDF ilicite Jan 5, 2014

Deoarece și eu folosesc aceleași programe de conversie pdf în doc/docx , care produc fișiere de bună calitate chiar și pentru documente foarte mari (800-1500 pagini), cred că problema nu este imputabilă aplicațiilor de conversie ci modului în care au fost create fișierele pdf.
Dacă ele provin din conversia directă a fișierelor doc/dox în pdf, după experiența mea, procesul este perfect reversibil utilizând Adobe Acrobat X Pro și nu mai este nevoie de nici un fel de curățare a fișierului doc/docx rezultat, imaginile și textul păstrându-se perfect. Este necesară doar selectarea corectă a limbii sursă înainte de exportul în format doc/docx. Totuși trebuie făcută încercarea de a salva atât ca fișier doc cât și ca fișier docx și trebuie văzut care arată mai bine.
Același tip de fișiere pdf convertite cu Abby Fine Reader 11 necesită mai multă muncă de curățare, formatare și eliminare a tag-urilor.
Dacă însă fișierele pdf au fost create prin scanare sau cele create prin convertirea directă în pdf conțin și părți create prin scanare atunci începe coșmarul. Singura metodă pe care eu am găsit-o este convertirea cu Abby Fine Reader și apoi munca intensă de DTP.

Rezultatul unui proces de convertire pdf în doc/docx depinde de calitatea documentului pdf și de aplicația cu care acesta a fost creat. Se poate întâmpla ca într-un document convertit să apară imaginii sau text care nu erau vizibile în documentul pdf sursă.
Ținând cont de datele de intrare ale problemei (calitate slabă în cazul documentelor mari) s-ar putea încerca următoarele:
1. Împărțirea fișierului pdf mare în mai multe fișiere mici (cu un pdf-splitter sau cu Adobe Acrobat X Pro) și apoi convertirea în doc/docx.
2. Deschiderea fișierului mare în Studio și salvarea fără traducerea a fișierului țintă pentru a vedea cum arată sau dacă Studio știe să facă conversia.
3. Convertirea fișierului pdf într-un fișier xml (cu Infix PDF Editor), traducerea și reimportul în pdf (uneori funcționează).
4. Încercarea de convertire a fișierului pdf în fișier doc/docx cu un program gratuit sau online (pierdere de timp după părerea mea, cele două programe de conversie menționate sunt, după părerea mea, pe departe cele mai bune).
5. Încercarea de convertire a fișierului pdf în fișier doc/docx, cu aceleași aplicații, dar instalate pe un calculator mai performant.
Concluzia este că totul depinde de calitatea fișierelor pdf, adică de modul în care ele au fost create. Principiul Garbage in, Grabage out (GIGO)se aplică și aici.
Încercările mele de a obține fișiere editabile de la clienții mei în locul fișierelor pdf nu au fost absolut niciodată încununate de succes. Mai mult, uneori mi se trimit fișiere pdf criptate (există programe bune de decriptare pe internet).
Poate punctul meu de vedere asupra fișierelor pdf ilicite este cam lung, dar trebuia să-mi vărs cumva năduful pe fișierele pdf create neprofesionist.
George Luca


 

Dan Ilioiu  Identity Verified
Romania
Local time: 10:09
English to Romanian
+ ...
Totul depinde de calitatea pdf-ului Jan 5, 2014

Rezultatul OCR-ului nu are nicio legătură cu numărul de pagini.

Problema este, aşa cum a spus colegul de mai sus/jos, calitatea scanării. Cere-i clientului să facă scanarea cel puţin la 300 dpi, grayscale sau color (după cum vrea să fie fişierul final). Fişierele pdf rezultate vor fi destul de mari, aşa că, dacă sistemul pe care se face OCR-ul nu este foarte dotat, va dura mai mult.

Dintre programele comerciale, Abby mi se pare a fi cel mai bun program OCR. Am mai lucrat şi cu IRIS şi OmniPage. Şi acesta din urmă e bun, Abby mi se pare mai rapid.

Sigur, ideal ar fi să se plătească această operaţie, dar nu întotdeauna se poate.

Evident, mai contează şi calitatea matrialului original. Un scan făcut după o pagină de ziar de acum 20 de ani nu va da un rezultat bun, indiferent de rezoluţia scanării.

Un an nou superior!


 

Bernd Müller (X)
Germany
Local time: 09:09
German to Romanian
+ ...
Adobe Acrobat Professional Jan 5, 2014

Adobe Acrobat Professional, de ex. 7

 

Ovidiu Martin Jurj
Romania
Local time: 10:09
German to Romanian
+ ...
Cu Abbyy, dar pe bucăţi Jan 6, 2014

Şi eu zic că Abbyy merge cel mai bine, dar ca să îţi iasă un fişier Word pe care să poţi într-adevăr lucra, este nevoie uneori să-l pui pe Abbyy să-l citească pe bucăţi. Adică marchezi o bucată de text, deci _doar_ text, click dreapta şi la tipul de sector seletezi că e text, iar Abbyy îl marchează cu verde; apoi îl pui pe Abbyy să-l citească şi copiezi bucata rezultată şi o lipeşti într-un Word deschis separat în prealabil; apoi ştergi în Abbyy sectorul selectat şi selectezi următorul sector, care nu e text, e tabel, să zicem; click dreapta şi selectezi că e tabel şi-l dai lui Abby să-l citească. Apoi copiezi rezultatul şi îl lipeşti în Word etc. Deci nu faci convertirea întregului fişier deodată, cu export din Abbyy direct în Word, că atunci iese ce se nimereşte. Îl converteşti pe bucăţi şi apoi prelucrezi suplimentar Wordul, ca să semene cu originalul. Pozele le copiezi şi le inserezi tot manual în Word, după ce iniţial ai creat tabel pt. asta şi bagi poza în tabel şi apoi ascunzi liniile la tabel.

Da, ştiu că e migălos, mai ales la fişiere de zeci şi sute de pagini. Am avut discuţii interminabile cu SRLul exploatator local cu care colaborez, fiindcă nu vrea să plătească suplimentar această activitate, deşi este timp şi muncă în plus; ba mai mult: patronului îi venise ideea "genială" ca înainte de orice comandă să convertim _gratuit_ fişierele, ca să-i dea clientului nr. de caractere exact şi preţul exact dinainte, că aşa ar fi chipurile cel mai corect; dar i-am zis că eu nu am de gând aşa ceva, mai ales la documente mari şi mai ales la client nou, care după ce îi faci convertirea moca şi îi dai şi preţul exact, se răzgândeşte şi se duce să-şi traducă la dumperi; din fericire, în cele din urmă omul a abandonat ideea cu convertirea moca în prealabil fără să aibă o comandă fermă.

Totuşi, dacă faci gură, uneori nu e tocmai degeaba: la ultimul proiect de peste 500 de pagini, după ce i-am zis că o să ne ia câteva cincinale numai să-l convertim, s-a învăţat minte şi a pus clientul să convertească documentul în Word; asta nu e neapărat o soluţie, fiindcă uneori clientul habar nu are ce trebuie să facă, îţi face un Word mai rău decât Abbyy dintr-odată, pe care nu poţi lucra nici atât; din fericire, de data asta clientul şi-a făcut treaba cum trebuie şi fişierul a fost convertit bine şi s-a putut lucra pe el.

În contrast, SRLurile neexploatatoare de aici de pe proz de regulă dau fişierele gata convertite, impecabil, chiar numai să lucrezi pe ele; e cu totul altceva. Evident că au profesionişti care fac asta, cum spune şi Bogdan; şi cum e şi normal, fiindcă şi eu sunt de părere că asta nu este treaba traducătorului.

La mulţi ani şi numai bine în 2014!


 

wordbridge  Identity Verified
Romania
Local time: 10:09
English to Romanian
+ ...
TOPIC STARTER
De acord Jan 6, 2014

Bogdan Dusa wrote:

... daca am avut documente mai mici. Cand am avut documente mai mari, am apelat la un expert in DTP (ce spui acolo e deja treaba de DTP), informand clientul ca trebuie sa plateasca un tarif suplimentar pentru DTP (a fost de acord fara probleme).
Ca traducator, nu ar trebui sa faci tot tu convertirea in Word. Fie o face clientul, tu primind doar materialul de tradus, fie apelezi tu la serviciile unui profesionist, dar taxand suplimentar clientul pentru acest serviciu.

Succes!


sunt in totalitate de acord cu tine. Multumesc!


 

Alina - Maria Chiteala  Identity Verified
Romania
Local time: 10:09
Member (2011)
English to Romanian
+ ...
Incearca si Jan 6, 2014

Solid converter - eu am obtinut rezultate mai bune cu el decat cu Abby.

 

cameliaim  Identity Verified
Spain
Local time: 09:09
Member (2005)
Spanish to Romanian
+ ...
Nitro Jan 6, 2014

Eu sunt destul de mulțumită cu Nitro (eu am Nitro Reader 3), ca alternativă la Adobe, care are nevoie de o eternitate să se încarce, deși ce-i drept, niciodată nu am folosit fișiere atât de mari. În rest, merită încercat.
Baftă mare și mult de muncă în noul an!


 

wordbridge  Identity Verified
Romania
Local time: 10:09
English to Romanian
+ ...
TOPIC STARTER
Nu functioneaza Jan 29, 2014

Ovidiu Martin Jurj wrote:

Şi eu zic că Abbyy merge cel mai bine, dar ca să îţi iasă un fişier Word pe care să poţi într-adevăr lucra, este nevoie uneori să-l pui pe Abbyy să-l citească pe bucăţi. Adică marchezi o bucată de text, deci _doar_ text, click dreapta şi la tipul de sector seletezi că e text, iar Abbyy îl marchează cu verde; apoi îl pui pe Abbyy să-l citească şi copiezi bucata rezultată şi o lipeşti într-un Word deschis separat în prealabil; apoi ştergi în Abbyy sectorul selectat şi selectezi următorul sector, care nu e text, e tabel, să zicem; click dreapta şi selectezi că e tabel şi-l dai lui Abby să-l citească. Apoi copiezi rezultatul şi îl lipeşti în Word etc. Deci nu faci convertirea întregului fişier deodată, cu export din Abbyy direct în Word, că atunci iese ce se nimereşte. Îl converteşti pe bucăţi şi apoi prelucrezi suplimentar Wordul, ca să semene cu originalul. Pozele le copiezi şi le inserezi tot manual în Word, după ce iniţial ai creat tabel pt. asta şi bagi poza în tabel şi apoi ascunzi liniile la tabel.

Da, ştiu că e migălos, mai ales la fişiere de zeci şi sute de pagini. Am avut discuţii interminabile cu SRLul exploatator local cu care colaborez, fiindcă nu vrea să plătească suplimentar această activitate, deşi este timp şi muncă în plus; ba mai mult: patronului îi venise ideea "genială" ca înainte de orice comandă să convertim _gratuit_ fişierele, ca să-i dea clientului nr. de caractere exact şi preţul exact dinainte, că aşa ar fi chipurile cel mai corect; dar i-am zis că eu nu am de gând aşa ceva, mai ales la documente mari şi mai ales la client nou, care după ce îi faci convertirea moca şi îi dai şi preţul exact, se răzgândeşte şi se duce să-şi traducă la dumperi; din fericire, în cele din urmă omul a abandonat ideea cu convertirea moca în prealabil fără să aibă o comandă fermă.

Totuşi, dacă faci gură, uneori nu e tocmai degeaba: la ultimul proiect de peste 500 de pagini, după ce i-am zis că o să ne ia câteva cincinale numai să-l convertim, s-a învăţat minte şi a pus clientul să convertească documentul în Word; asta nu e neapărat o soluţie, fiindcă uneori clientul habar nu are ce trebuie să facă, îţi face un Word mai rău decât Abbyy dintr-odată, pe care nu poţi lucra nici atât; din fericire, de data asta clientul şi-a făcut treaba cum trebuie şi fişierul a fost convertit bine şi s-a putut lucra pe el.

În contrast, SRLurile neexploatatoare de aici de pe proz de regulă dau fişierele gata convertite, impecabil, chiar numai să lucrezi pe ele; e cu totul altceva. Evident că au profesionişti care fac asta, cum spune şi Bogdan; şi cum e şi normal, fiindcă şi eu sunt de părere că asta nu este treaba traducătorului.

La mulţi ani şi numai bine în 2014!


Abbyy nu funcţionează din păcate nici dacă documentul sursă este "spart" în părţi mai mici şi apoi convertit.


 

Bernd Müller (X)
Germany
Local time: 09:09
German to Romanian
+ ...
ReadIris, Jan 30, 2014

Avantaj:
mai ieftin decât altele, şi extrem de rapid & la fel de corect, cam ca toate- adică: niciodată 100%.

Dezavantajul :
Nu poţi seta decât recunoaşterea unei singure limbi; deci nu se poate folosi pt. texte bi- sau multilinguale.


 

Dan Ilioiu  Identity Verified
Romania
Local time: 10:09
English to Romanian
+ ...
Nu e nevoie de aşa ceva Jan 30, 2014

Ovidiu Martin Jurj wrote:
Adică marchezi o bucată de text, deci _doar_ text, click dreapta şi la tipul de sector seletezi că e text, iar Abbyy îl marchează cu verde; apoi îl pui pe Abbyy să-l citească şi copiezi bucata rezultată şi o lipeşti într-un Word deschis separat în prealabil;


Dacă nu e nevoie de păstrarea formatării, într-adevăr, se selectează manual zonele de interes din tot documentul, în funcţie de tipul lor: text, tabel, imagine.
Alternativ, dacă docuemtnul nu conţine multe brizbrizuri, se poate folosi funcţia "Read document" sau "Read Page" şi apoi se şterg zonele care nu sunt de interes.

Se setează ca format de ieşire MS Word şi se alege Plain Text.
Apoi se poate face OCR pe tot documentul.

Repet: calitatea rezultatului depinde foarte mult de calitatea scanării.

Se salvează şi gata. Rezultă un fişier doc, cu text simplu, tabele şi imagini, care poate fi formatat ulterior după preferinţe. Se recomandă deschiderea fişierului în Word şi salvarea lui ca doc sau docx din Word. Fişierul doc generat de Abbyy e un fel de rtf cu extensie doc.

Eu folosesc această procedură aproape exclusiv şi am prelucrat fişiere de sute de pagini alb/negru (mai mari de 150 MB).

Succes!

[Edited at 2014-01-30 05:42 GMT]


 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Lucica Abil[Call to this topic]

You can also contact site staff by submitting a support request »

Convertor bun PDF -> DOC (Word)

Advanced search






SDL MultiTerm 2019
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2019 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2019 you can automatically create term lists from your existing documentation to save time.

More info »
Déjà Vu X3
Try it, Love it

Find out why Déjà Vu is today the most flexible, customizable and user-friendly tool on the market. See the brand new features in action: *Completely redesigned user interface *Live Preview *Inline spell checking *Inline

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search