Pages in topic:   [1 2] >
PDF Converter - czy ktoś ma wyrobione zdanie?
Thread poster: Maciej Andrzejczak

Maciej Andrzejczak  Identity Verified
Poland
Local time: 02:06
Member (2005)
English to Polish
+ ...
May 21, 2007

Akurat reklamowany na prozie produkt

http://www.digitalriver.com/dr/sat5/ec_MAIN.Entry17c?CID=0&PN=5&SP=10007&SID=19198&PID=855994&ClickID=cf7xx4vp4ewxsplxaliqzii4lxakiefzlkq&CUR=840&DSP=&PGRP=0&ABCODE=&CACHE_ID=0

Czy ktos to wypróbował, pracuje etc? Warto, nie warto i czemu. Dzięki z góry za info
MA


Direct link Reply with quote
 

Tomasz Sieniuć  Identity Verified
Poland
Local time: 02:06
Member (2005)
German to Polish
+ ...
Każdy swoje chwali... May 21, 2007

ja używam Solid Convertera, cena ta sama. Ale wiem, że działa, tzn. wyciąga z PDF-a co się da. Ano właśnie: w którą stronę chcesz konwertować? Bo to czasami różnica.

Pozdrawiam,
Tomek


Direct link Reply with quote
 

Andrzej Lejman  Identity Verified
Local time: 02:06
German to Polish
+ ...
Używałem przez jakiś czas May 22, 2007

Dobrze radzi sobie z dokumentami PDF o prostej strukturze,
najlepiej z Wordami zapisanymi jako PDF.
Sprawa ma się gorzej, gdy chodzi o pedeefy tworzone w z dokumentów spisanych w różnych programach DTP.
Wadą jest to, że nie masz żadnego wpływu na przebieg konwersji - jest tylko pasek postępu, który informuje o zaawansowaniu konwersji.
Pod tym względem o wiele większe możliwości daje Finereeder. No ale to jakby porównywać Wordpada z Wordem...
Generalnie jednak, za tę cenę narzędzie przydatne w wielu sytuacjach.

Pozdrawiam

Andrzej


Direct link Reply with quote
 

Jerzy Czopik  Identity Verified
Germany
Local time: 02:06
Member (2003)
Polish to German
+ ...
Abbyy Finereader May 22, 2007

Jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle.
Poza tym Abbyy ma ogromną bazę językową i dzięki temu czyta równie dobrze niemieckie jak i polskie dokumenty.

I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można.

Jak zawsze - powyższe to IMHO i bardzo subiektywnie
Jerzy


Direct link Reply with quote
 

Mariusz Studzinski
Local time: 02:06
English to Polish
+ ...
Podzielam zdanie Jerzego May 22, 2007

Jerzy Czopik wrote:

[FineReader] jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle.


Wypróbowałem już chyba większość tego typu konwerterów dostępnych na rynku i żaden nie ma takiej funkcjonalności jak FineReader. Jednak by uzyskać idealny efekt końcowy trzeba poświęcić trochę czasu na ręczne poprawki - automatyka FineReadera czasami daje zaskakujące rezultaty. Z pewnością jednak żaden automat nie poradzi sobie ze skomplikowanymi dokumentami tak jak FineRader + Użytkownik.


Direct link Reply with quote
 

Szymon Metkowski  Identity Verified
Poland
Local time: 02:06
Member (2006)
German to Polish
+ ...
Ja też fine reader :) May 22, 2007

Nic dodać nic ująć, chociaż nie polecam automatyki w tym programie.

Jeśli chodzi o konwersję w drugą stronę to jaws pdf creator (działa jak drukarka, więc współpracuje z każdym programem).


Direct link Reply with quote
 

Jerzy Czopik  Identity Verified
Germany
Local time: 02:06
Member (2003)
Polish to German
+ ...
Tylko po co? May 22, 2007

Szymon Metkowski wrote:

Nic dodać nic ująć, chociaż nie polecam automatyki w tym programie.

Jeśli chodzi o konwersję w drugą stronę to jaws pdf creator (działa jak drukarka, więc współpracuje z każdym programem).

Skoro można Acrobatem

Jerzy
PS
Ten (Acrobat) czasami pozwoli zapisać PDF jako rtf, wtedy jest szybciej, niż konwertować czymkolwiek.


Direct link Reply with quote
 

Gwidon Naskrent  Identity Verified
Poland
Local time: 02:06
English to Polish
+ ...
Można jeszcze prościej May 22, 2007

http://www.foolabs.com/xpdf/download.html - pdftotext

Trzeba odróżnić dwie rzeczy - PDF już zocerowany, skonwertowany z jakieś innej aplikacji, albo złożony ze skanów. W obu przypadkach inne są techniki konwersji.

Przy pdfach zocerowanych może jeszcze dojść problem polskich (niemieckich, francuskich) znaków diakrytycznych, które niekoniecznie musiały być zapisane w źródle jako ISO/UTF-8 (wystarczy że konwertowano z LaTeXa).


Direct link Reply with quote
 

Szymon Metkowski  Identity Verified
Poland
Local time: 02:06
Member (2006)
German to Polish
+ ...
Acrobat drogi jest May 24, 2007

Jerzy Czopik wrote:

Skoro można Acrobatem



Jeżeli ktoś (tak jak ja) robi pdf-y od wielkiego dzwonu (najczęściej faktury i CV to nie opłaca się inwestować w Acrobata.


Direct link Reply with quote
 
Leoo
Poland
Local time: 02:06
German to Polish
OCR --> Problemy ze złożenim tekstu po tłumaczeniu Sep 9, 2008

Witam,


miałem nadzieję, że wyczytam wszystko na forum, ale o parę rzeczy muszę się jednak dopytać.
Myślałem, że tylko ja mam problemy z konwertowaniem plików z PDF - do Worda, ale okazuje się, wcale to nie takie hop, jesli chce się otrzymać plik, który pózniej nie będzie sprawiał problemów, tak przynajmiej wynika z opisów.
Krótki opis;
1. Przepuściłem PDF przez OCR (FineReader), instr.obsługi (ok.65), nie wszystko na raz tylko w 3 kawałkach, akurat tak wyszło (nieważne) / nieważne również dlaczego nie otrzymałem gotowego tekstu w pliku np.Worda, tylko robię to sam
2.Przetłumaczyłem tekst w Tradosie (każdy z tych kawałków oddzielnie), a następnie zrobiłem Clean Up (nie obyło się bez problemów), zdarzało się że nie mogłem zamknąć jedn.tłumaczeniowej podczas tłumaczenia (raz czy dwa), chyba stąd wziął się ten problem

---------------------------- !!
3. Mam teraz te 3 kawałki (z różnymi dziwnymi podziałami stron), każdy z tych kawałków nie wiem dlaczego ma różne marginesy (jak próbuję je poprawić, aby każdy z nich miał takie same ustawienia robi się masło maslane, gdyż wtedy nie mogę ich ze soba połączyć)
Nie udało mi się sklecić tego w jedną całość, gdyż po wklejeniu (zwykłe kopiowanie) np. cz.II do I (jako powiedzmy dok. główny) dok.Word po jakims czasie całkiem się wiesza, nie mówić już o zburzeniu całej struktury akapitów oraz myślników w instr.


Dla wyjadaczy problem ten wyda się śmieszny, ale chciałbym się zapytać co miał na myśli Pan Jerzy stosując przytoczony przeze mnei sposób postępowania (właściwie mógłbym napisać do Pana Jurka, ale chyba po to właśnie jest to forum, żeby dzielić się informacjami:

"....I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można."

Co daje mi taki sposób postępowania? co oznacza, że można go sformatować w Wordzie (po wyłaczeniu formatowania w FineReader)
---------------------------------------------------
Może ktos ma pomysł na przepuszczanie plików przez różne programu OCR bez psucia całej struktury marginesów i akpitów?


Pozdrawiam
Kuba




Jerzy Czopik wrote:

Jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle.
Poza tym Abbyy ma ogromną bazę językową i dzięki temu czyta równie dobrze niemieckie jak i polskie dokumenty.

I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można.

Jak zawsze - powyższe to IMHO i bardzo subiektywnie
Jerzy


Direct link Reply with quote
 

Lenard Zwick  Identity Verified
Poland
Local time: 02:06
Polish to Hungarian
+ ...
Re.: OCR --> Problemy ze złożenim tekstu po tłumaczeniu Sep 11, 2008

Myślę, że JC chodziło o wyborze docelowego formatu OCR - w Abby możesz wybrać zapisanie wyniku w pliku .txt - i wtedy "utracisz" wszelkie "fikuśne" szczegóły formatowania - w .txt po prostu takowych nie ma.
Ja przynajmniej tak postępuję, jeśli z OCR w Wordzie otrzymuję "sieczkę".
A otwierając .txt w Wordzie możesz dowolnie formatować tekst, i zapisać już w formacie .doc.
Pozdro,
Lenard


Direct link Reply with quote
 

Jabberwock  Identity Verified
Poland
Local time: 02:06
Member (2004)
English to Polish
Różne poziomy Sep 11, 2008

Lenard Zwick wrote:

Myślę, że JC chodziło o wyborze docelowego formatu OCR - w Abby możesz wybrać zapisanie wyniku w pliku .txt - i wtedy "utracisz" wszelkie "fikuśne" szczegóły formatowania - w .txt po prostu takowych nie ma.
Ja przynajmniej tak postępuję, jeśli z OCR w Wordzie otrzymuję "sieczkę".
A otwierając .txt w Wordzie możesz dowolnie formatować tekst, i zapisać już w formacie .doc.


Nie ma takiej potrzeby, można zapisać od razu w Wordzie z usunięciem całego formatowania. Co ważniejsze, poziomów formatowania jest kilka - jest to użyteczne, gdy chcemy np. zachować pogrubienia, różne rodzaje/wielkości fontów, itp., a usunąć całą strukturę dokumentu.


Direct link Reply with quote
 

Jerzy Czopik  Identity Verified
Germany
Local time: 02:06
Member (2003)
Polish to German
+ ...
LZ podał dokładnie to, co miałem na myśli Sep 11, 2008

Ponieważ każdy konwerter, z którym spotkałem się do tej pory, przy konwertowaniu do Worda z usiłowaniem zachowania formatów robi sieczkę, bo wstawia setki podziałów sekcji, podziałów strony, kolumny itp. oraz robi ramki tekstowe, doszedłem do wniosku, że optymalnym rozwiązaniem jest uzyskanie samego tekstu i zrobienie formatowania samemu.
Wobec tego zapisuję plik z OCR wybierając opcję "Usuń całe formatowanie i ilustracje" (albo rzeczywiście format *.txt jako format docelowy), a potem robię formatowanie w Wordzie. Z reguły jest to dość proste. Sformatowanie kilkudziesięciu stron w układzie jednokolumnowym z ilustracjami nie powinno zająć więcej niż dwie-trzy godziny, pod warunkiem oczywiście, że nie robimy wszystkiego na piechotę.
Dlatego po otwarciu niesformatowanego pliku z OCR najpierw proponuję zaznaczyć cały tekst (CTRL+A), następnie przypisać mu styl normalny i nacisnąć na koniec CTRL+SPACE, aby przywrócić z całą pewnością wszystkie atrybuty formatowania do stanu zerowego (czyli wszystko jest sformatowane stylem normalnym bez jakichkolwiek modyfikacji czegokolwiek). Dopasowuję styl normalny do potrzeb dokumentu (Arial, TNR czy inna czcionka, jej wielkość, ustawienia akapitu itp.). Potem ustawienia marginesów, nagłówków i stopek. A później definiuję style wg potrzeb...
Z wielką przyjemnością pokażę to na konferencji w PL w przyszłym roku.
Jeżeli zbierze się nas dość na pałłale w Gnieźnie, to i tam mogę pokazać

Pozdrawiam
Jerzy


Direct link Reply with quote
 

Andrzej Mierzejewski  Identity Verified
Poland
Local time: 02:06
Polish to English
+ ...
Fine Reader Sep 11, 2008

Nie wiem, czy to zgodne z zasadami ProZ, ale poinformuję, że w jednym z miesięczników komputerowych (wydanie 9/2008) jest płyta zawierająca m. in. Fine Reader 6 Sprint.
Jeżeli zasady nie pozwalają, to proszę usunąć ten post. Jeżeli nie, to rozumiem, że będę mógł podać tytuł tego miesięcznika.

AM


Direct link Reply with quote
 

Jerzy Czopik  Identity Verified
Germany
Local time: 02:06
Member (2003)
Polish to German
+ ...
Być może nadchodzi pomoc Sep 11, 2008

W miesięczniku Chip przeczytałem informację o dodatku do OpenOffice 3.0 (aktualnie dostępne w późnej wersji beta), mogącym otworzyć pliki PDF (do wersji 1.4). Bliższe informacje tutaj: http://extensions.services.openoffice.org/node/974

Jeżeli ten dodatek faktycznie otworzy PDF w OpenOffice w edytowalnej formie, to zniknie większość naszych problemów, bo plik OO można tłumaczyć potem jak każdy inny edytowalny plik wybraną przez siebie metodą.
Oczywiście w przypadku skanów w PDF-ie nic się nie zmieni.


Direct link Reply with quote
 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

PDF Converter - czy ktoś ma wyrobione zdanie?

Advanced search






TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »
SDL MultiTerm 2017
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2017 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2017 you can automatically create term lists from your existing documentation to save time.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search