Pages in topic:   [1 2] >
PDF Converter - czy ktoś ma wyrobione zdanie?
Thread poster: Maciej Andrzejczak
Maciej Andrzejczak
Maciej Andrzejczak  Identity Verified
Poland
Local time: 02:57
Member
English to Polish
+ ...
May 21, 2007

Akurat reklamowany na prozie produkt

http://www.digitalriver.com/dr/sat5/ec_MAIN.Entry17c?CID=0&PN=5&SP=10007&SID=19198&PID=855994&ClickID=cf7xx4vp4ewxsplxaliqzii4lxakiefzlkq&CUR=840&DSP=&PGRP=0&ABCODE=&CACHE_ID=0

Czy ktos to wypróbowa�
... See more
Akurat reklamowany na prozie produkt

http://www.digitalriver.com/dr/sat5/ec_MAIN.Entry17c?CID=0&PN=5&SP=10007&SID=19198&PID=855994&ClickID=cf7xx4vp4ewxsplxaliqzii4lxakiefzlkq&CUR=840&DSP=&PGRP=0&ABCODE=&CACHE_ID=0

Czy ktos to wypróbował, pracuje etc? Warto, nie warto i czemu. Dzięki z góry za info
MA
Collapse


 
Tomasz Sieniuć
Tomasz Sieniuć  Identity Verified
Poland
Local time: 02:57
German to Polish
+ ...
Każdy swoje chwali... May 21, 2007

ja używam Solid Convertera, cena ta sama. Ale wiem, że działa, tzn. wyciąga z PDF-a co się da. Ano właśnie: w którą stronę chcesz konwertować? Bo to czasami różnica.

Pozdrawiam,
Tomek


 
Andrzej Lejman
Andrzej Lejman  Identity Verified
Poland
Local time: 02:57
Member (2004)
German to Polish
+ ...
Używałem przez jakiś czas May 22, 2007

Dobrze radzi sobie z dokumentami PDF o prostej strukturze,
najlepiej z Wordami zapisanymi jako PDF.
Sprawa ma się gorzej, gdy chodzi o pedeefy tworzone w z dokumentów spisanych w różnych programach DTP.
Wadą jest to, że nie masz żadnego wpływu na przebieg konwersji - jest tylko pasek postępu, który informuje o zaawansowaniu konwersji.
Pod tym względem o wiele większe możliwości daje Finereeder. No ale to jakby porównywać Wordpada z Wordem...
Generaln
... See more
Dobrze radzi sobie z dokumentami PDF o prostej strukturze,
najlepiej z Wordami zapisanymi jako PDF.
Sprawa ma się gorzej, gdy chodzi o pedeefy tworzone w z dokumentów spisanych w różnych programach DTP.
Wadą jest to, że nie masz żadnego wpływu na przebieg konwersji - jest tylko pasek postępu, który informuje o zaawansowaniu konwersji.
Pod tym względem o wiele większe możliwości daje Finereeder. No ale to jakby porównywać Wordpada z Wordem...
Generalnie jednak, za tę cenę narzędzie przydatne w wielu sytuacjach.

Pozdrawiam

Andrzej
Collapse


 
Jerzy Czopik
Jerzy Czopik  Identity Verified
Germany
Local time: 02:57
Member (2003)
Polish to German
+ ...
Abbyy Finereader May 22, 2007

Jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle.
Poza tym Abbyy ma ogromną bazę językową i dzięki temu czyta równie dobrze niemieckie jak i polskie dokumenty.

I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik
... See more
Jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle.
Poza tym Abbyy ma ogromną bazę językową i dzięki temu czyta równie dobrze niemieckie jak i polskie dokumenty.

I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można.

Jak zawsze - powyższe to IMHO i bardzo subiektywnie
Jerzy
Collapse


 
Mariusz Studzinski
Mariusz Studzinski
Local time: 02:57
English to Polish
+ ...
Podzielam zdanie Jerzego May 22, 2007

Jerzy Czopik wrote:

[FineReader] jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle.


Wypróbowałem już chyba większość tego typu konwerterów dostępnych na rynku i żaden nie ma takiej funkcjonalności jak FineReader. Jednak by uzyskać idealny efekt końcowy trzeba poświęcić trochę czasu na ręczne poprawki - automatyka FineReadera czasami daje zaskakujące rezultaty. Z pewnością jednak żaden automat nie poradzi sobie ze skomplikowanymi dokumentami tak jak FineRader + Użytkownik.


 
Szymon Metkowski
Szymon Metkowski  Identity Verified
Poland
Local time: 02:57
German to Polish
+ ...
Ja też fine reader :) May 22, 2007

Nic dodać nic ująć, chociaż nie polecam automatyki w tym programie.

Jeśli chodzi o konwersję w drugą stronę to jaws pdf creator (działa jak drukarka, więc współpracuje z każdym programem).


 
Jerzy Czopik
Jerzy Czopik  Identity Verified
Germany
Local time: 02:57
Member (2003)
Polish to German
+ ...
Tylko po co? May 22, 2007

Szymon Metkowski wrote:

Nic dodać nic ująć, chociaż nie polecam automatyki w tym programie.

Jeśli chodzi o konwersję w drugą stronę to jaws pdf creator (działa jak drukarka, więc współpracuje z każdym programem).

Skoro można Acrobatem

Jerzy
PS
Ten (Acrobat) czasami pozwoli zapisać PDF jako rtf, wtedy jest szybciej, niż konwertować czymkolwiek.


 
Gwidon Naskrent
Gwidon Naskrent  Identity Verified
Poland
Local time: 02:57
English to Polish
+ ...
Można jeszcze prościej May 22, 2007

http://www.foolabs.com/xpdf/download.html - pdftotext

Trzeba odróżnić dwie rzeczy - PDF już zocerowany, skonwertowany z jakieś innej aplikacji, albo złożony ze skanów. W obu przypadkach inne są techniki konwersji.

Przy pdfach zocerowanych może jeszcze dojść problem polskich (niemieckich, francuskich) znaków diakrytycznych, które niekoniecznie musiały być
... See more
http://www.foolabs.com/xpdf/download.html - pdftotext

Trzeba odróżnić dwie rzeczy - PDF już zocerowany, skonwertowany z jakieś innej aplikacji, albo złożony ze skanów. W obu przypadkach inne są techniki konwersji.

Przy pdfach zocerowanych może jeszcze dojść problem polskich (niemieckich, francuskich) znaków diakrytycznych, które niekoniecznie musiały być zapisane w źródle jako ISO/UTF-8 (wystarczy że konwertowano z LaTeXa).
Collapse


 
Szymon Metkowski
Szymon Metkowski  Identity Verified
Poland
Local time: 02:57
German to Polish
+ ...
Acrobat drogi jest May 24, 2007

Jerzy Czopik wrote:

Skoro można Acrobatem



Jeżeli ktoś (tak jak ja) robi pdf-y od wielkiego dzwonu (najczęściej faktury i CV to nie opłaca się inwestować w Acrobata.


 
Leoo
Leoo
Poland
Local time: 02:57
German to Polish
OCR --> Problemy ze złożenim tekstu po tłumaczeniu Sep 9, 2008

Witam,


miałem nadzieję, że wyczytam wszystko na forum, ale o parę rzeczy muszę się jednak dopytać.
Myślałem, że tylko ja mam problemy z konwertowaniem plików z PDF - do Worda, ale okazuje się, wcale to nie takie hop, jesli chce się otrzymać plik, który pózniej nie będzie sprawiał problemów, tak przynajmiej wynika z opisów.
Krótki opis;
1. Przepuściłem PDF przez OCR (FineReader), instr.obsługi (ok.65), nie wszystko na raz tylko w 3 k
... See more
Witam,


miałem nadzieję, że wyczytam wszystko na forum, ale o parę rzeczy muszę się jednak dopytać.
Myślałem, że tylko ja mam problemy z konwertowaniem plików z PDF - do Worda, ale okazuje się, wcale to nie takie hop, jesli chce się otrzymać plik, który pózniej nie będzie sprawiał problemów, tak przynajmiej wynika z opisów.
Krótki opis;
1. Przepuściłem PDF przez OCR (FineReader), instr.obsługi (ok.65), nie wszystko na raz tylko w 3 kawałkach, akurat tak wyszło (nieważne) / nieważne również dlaczego nie otrzymałem gotowego tekstu w pliku np.Worda, tylko robię to sam
2.Przetłumaczyłem tekst w Tradosie (każdy z tych kawałków oddzielnie), a następnie zrobiłem Clean Up (nie obyło się bez problemów), zdarzało się że nie mogłem zamknąć jedn.tłumaczeniowej podczas tłumaczenia (raz czy dwa), chyba stąd wziął się ten problem

---------------------------- !!
3. Mam teraz te 3 kawałki (z różnymi dziwnymi podziałami stron), każdy z tych kawałków nie wiem dlaczego ma różne marginesy (jak próbuję je poprawić, aby każdy z nich miał takie same ustawienia robi się masło maslane, gdyż wtedy nie mogę ich ze soba połączyć)
Nie udało mi się sklecić tego w jedną całość, gdyż po wklejeniu (zwykłe kopiowanie) np. cz.II do I (jako powiedzmy dok. główny) dok.Word po jakims czasie całkiem się wiesza, nie mówić już o zburzeniu całej struktury akapitów oraz myślników w instr.


Dla wyjadaczy problem ten wyda się śmieszny, ale chciałbym się zapytać co miał na myśli Pan Jerzy stosując przytoczony przeze mnei sposób postępowania (właściwie mógłbym napisać do Pana Jurka, ale chyba po to właśnie jest to forum, żeby dzielić się informacjami:

"....I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można."

Co daje mi taki sposób postępowania? co oznacza, że można go sformatować w Wordzie (po wyłaczeniu formatowania w FineReader)
---------------------------------------------------
Może ktos ma pomysł na przepuszczanie plików przez różne programu OCR bez psucia całej struktury marginesów i akpitów?


Pozdrawiam
Kuba




Jerzy Czopik wrote:

Jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle.
Poza tym Abbyy ma ogromną bazę językową i dzięki temu czyta równie dobrze niemieckie jak i polskie dokumenty.

I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można.

Jak zawsze - powyższe to IMHO i bardzo subiektywnie
Jerzy
Collapse


 
Lenard Zwick
Lenard Zwick  Identity Verified
Poland
Local time: 02:57
Polish to Hungarian
+ ...
Re.: OCR --> Problemy ze złożenim tekstu po tłumaczeniu Sep 11, 2008

Myślę, że JC chodziło o wyborze docelowego formatu OCR - w Abby możesz wybrać zapisanie wyniku w pliku .txt - i wtedy "utracisz" wszelkie "fikuśne" szczegóły formatowania - w .txt po prostu takowych nie ma.
Ja przynajmniej tak postępuję, jeśli z OCR w Wordzie otrzymuję "sieczkę".
A otwierając .txt w Wordzie możesz dowolnie formatować tekst, i zapisać już w formacie .doc.
Pozdro,
Lenard


 
Jaroslaw Michalak
Jaroslaw Michalak  Identity Verified
Poland
Local time: 02:57
Member (2004)
English to Polish
SITE LOCALIZER
Różne poziomy Sep 11, 2008

Lenard Zwick wrote:

Myślę, że JC chodziło o wyborze docelowego formatu OCR - w Abby możesz wybrać zapisanie wyniku w pliku .txt - i wtedy "utracisz" wszelkie "fikuśne" szczegóły formatowania - w .txt po prostu takowych nie ma.
Ja przynajmniej tak postępuję, jeśli z OCR w Wordzie otrzymuję "sieczkę".
A otwierając .txt w Wordzie możesz dowolnie formatować tekst, i zapisać już w formacie .doc.


Nie ma takiej potrzeby, można zapisać od razu w Wordzie z usunięciem całego formatowania. Co ważniejsze, poziomów formatowania jest kilka - jest to użyteczne, gdy chcemy np. zachować pogrubienia, różne rodzaje/wielkości fontów, itp., a usunąć całą strukturę dokumentu.


 
Jerzy Czopik
Jerzy Czopik  Identity Verified
Germany
Local time: 02:57
Member (2003)
Polish to German
+ ...
LZ podał dokładnie to, co miałem na myśli Sep 11, 2008

Ponieważ każdy konwerter, z którym spotkałem się do tej pory, przy konwertowaniu do Worda z usiłowaniem zachowania formatów robi sieczkę, bo wstawia setki podziałów sekcji, podziałów strony, kolumny itp. oraz robi ramki tekstowe, doszedłem do wniosku, że optymalnym rozwiązaniem jest uzyskanie samego tekstu i zrobienie formatowania samemu.
Wobec tego zapisuję plik z OCR wybierając opcję "Usuń całe formatowanie i ilustracje" (albo rzeczywiście format *.txt jako format do
... See more
Ponieważ każdy konwerter, z którym spotkałem się do tej pory, przy konwertowaniu do Worda z usiłowaniem zachowania formatów robi sieczkę, bo wstawia setki podziałów sekcji, podziałów strony, kolumny itp. oraz robi ramki tekstowe, doszedłem do wniosku, że optymalnym rozwiązaniem jest uzyskanie samego tekstu i zrobienie formatowania samemu.
Wobec tego zapisuję plik z OCR wybierając opcję "Usuń całe formatowanie i ilustracje" (albo rzeczywiście format *.txt jako format docelowy), a potem robię formatowanie w Wordzie. Z reguły jest to dość proste. Sformatowanie kilkudziesięciu stron w układzie jednokolumnowym z ilustracjami nie powinno zająć więcej niż dwie-trzy godziny, pod warunkiem oczywiście, że nie robimy wszystkiego na piechotę.
Dlatego po otwarciu niesformatowanego pliku z OCR najpierw proponuję zaznaczyć cały tekst (CTRL+A), następnie przypisać mu styl normalny i nacisnąć na koniec CTRL+SPACE, aby przywrócić z całą pewnością wszystkie atrybuty formatowania do stanu zerowego (czyli wszystko jest sformatowane stylem normalnym bez jakichkolwiek modyfikacji czegokolwiek). Dopasowuję styl normalny do potrzeb dokumentu (Arial, TNR czy inna czcionka, jej wielkość, ustawienia akapitu itp.). Potem ustawienia marginesów, nagłówków i stopek. A później definiuję style wg potrzeb...
Z wielką przyjemnością pokażę to na konferencji w PL w przyszłym roku.
Jeżeli zbierze się nas dość na pałłale w Gnieźnie, to i tam mogę pokazać

Pozdrawiam
Jerzy
Collapse


 
Andrzej Mierzejewski
Andrzej Mierzejewski  Identity Verified
Poland
Local time: 02:57
Polish to English
+ ...
Fine Reader Sep 11, 2008

Nie wiem, czy to zgodne z zasadami ProZ, ale poinformuję, że w jednym z miesięczników komputerowych (wydanie 9/2008) jest płyta zawierająca m. in. Fine Reader 6 Sprint.
Jeżeli zasady nie pozwalają, to proszę usunąć ten post. Jeżeli nie, to rozumiem, że będę mógł podać tytuł tego miesięcznika.

AM


 
Jerzy Czopik
Jerzy Czopik  Identity Verified
Germany
Local time: 02:57
Member (2003)
Polish to German
+ ...
Być może nadchodzi pomoc Sep 11, 2008

W miesięczniku Chip przeczytałem informację o dodatku do OpenOffice 3.0 (aktualnie dostępne w późnej wersji beta), mogącym otworzyć pliki PDF (do wersji 1.4). Bliższe informacje tutaj: http://extensions.services.openoffice.org/node/974

Jeżeli ten dodatek faktycznie otworzy PDF w OpenOffice w edytowalnej formie, to zniknie większość naszych problemów, bo plik O
... See more
W miesięczniku Chip przeczytałem informację o dodatku do OpenOffice 3.0 (aktualnie dostępne w późnej wersji beta), mogącym otworzyć pliki PDF (do wersji 1.4). Bliższe informacje tutaj: http://extensions.services.openoffice.org/node/974

Jeżeli ten dodatek faktycznie otworzy PDF w OpenOffice w edytowalnej formie, to zniknie większość naszych problemów, bo plik OO można tłumaczyć potem jak każdy inny edytowalny plik wybraną przez siebie metodą.
Oczywiście w przypadku skanów w PDF-ie nic się nie zmieni.
Collapse


 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

PDF Converter - czy ktoś ma wyrobione zdanie?






Trados Business Manager Lite
Create customer quotes and invoices from within Trados Studio

Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.

More info »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »