Pages in topic: [1 2] > | PDF Converter - czy ktoś ma wyrobione zdanie? Thread poster: Maciej Andrzejczak
| | Każdy swoje chwali... | May 21, 2007 |
ja używam Solid Convertera, cena ta sama. Ale wiem, że działa, tzn. wyciąga z PDF-a co się da. Ano właśnie: w którą stronę chcesz konwertować? Bo to czasami różnica. Pozdrawiam, Tomek | | | Andrzej Lejman Poland Local time: 02:57 Member (2004) German to Polish + ... Używałem przez jakiś czas | May 22, 2007 |
Dobrze radzi sobie z dokumentami PDF o prostej strukturze, najlepiej z Wordami zapisanymi jako PDF. Sprawa ma się gorzej, gdy chodzi o pedeefy tworzone w z dokumentów spisanych w różnych programach DTP. Wadą jest to, że nie masz żadnego wpływu na przebieg konwersji - jest tylko pasek postępu, który informuje o zaawansowaniu konwersji. Pod tym względem o wiele większe możliwości daje Finereeder. No ale to jakby porównywać Wordpada z Wordem... Generaln... See more Dobrze radzi sobie z dokumentami PDF o prostej strukturze, najlepiej z Wordami zapisanymi jako PDF. Sprawa ma się gorzej, gdy chodzi o pedeefy tworzone w z dokumentów spisanych w różnych programach DTP. Wadą jest to, że nie masz żadnego wpływu na przebieg konwersji - jest tylko pasek postępu, który informuje o zaawansowaniu konwersji. Pod tym względem o wiele większe możliwości daje Finereeder. No ale to jakby porównywać Wordpada z Wordem... Generalnie jednak, za tę cenę narzędzie przydatne w wielu sytuacjach. Pozdrawiam Andrzej ▲ Collapse | | | Jerzy Czopik Germany Local time: 02:57 Member (2003) Polish to German + ... Abbyy Finereader | May 22, 2007 |
Jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle. Poza tym Abbyy ma ogromną bazę językową i dzięki temu czyta równie dobrze niemieckie jak i polskie dokumenty. I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik... See more Jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle. Poza tym Abbyy ma ogromną bazę językową i dzięki temu czyta równie dobrze niemieckie jak i polskie dokumenty. I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można. Jak zawsze - powyższe to IMHO i bardzo subiektywnie Jerzy ▲ Collapse | |
|
|
Podzielam zdanie Jerzego | May 22, 2007 |
Jerzy Czopik wrote: [FineReader] jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle. Wypróbowałem już chyba większość tego typu konwerterów dostępnych na rynku i żaden nie ma takiej funkcjonalności jak FineReader. Jednak by uzyskać idealny efekt końcowy trzeba poświęcić trochę czasu na ręczne poprawki - automatyka FineReadera czasami daje zaskakujące rezultaty. Z pewnością jednak żaden automat nie poradzi sobie ze skomplikowanymi dokumentami tak jak FineRader + Użytkownik. | | | Ja też fine reader :) | May 22, 2007 |
Nic dodać nic ująć, chociaż nie polecam automatyki w tym programie. Jeśli chodzi o konwersję w drugą stronę to jaws pdf creator (działa jak drukarka, więc współpracuje z każdym programem). | | | Jerzy Czopik Germany Local time: 02:57 Member (2003) Polish to German + ... Tylko po co? | May 22, 2007 |
Szymon Metkowski wrote: Nic dodać nic ująć, chociaż nie polecam automatyki w tym programie. Jeśli chodzi o konwersję w drugą stronę to jaws pdf creator (działa jak drukarka, więc współpracuje z każdym programem). Skoro można Acrobatem Jerzy PS Ten (Acrobat) czasami pozwoli zapisać PDF jako rtf, wtedy jest szybciej, niż konwertować czymkolwiek. | | | Można jeszcze prościej | May 22, 2007 |
http://www.foolabs.com/xpdf/download.html - pdftotext Trzeba odróżnić dwie rzeczy - PDF już zocerowany, skonwertowany z jakieś innej aplikacji, albo złożony ze skanów. W obu przypadkach inne są techniki konwersji. Przy pdfach zocerowanych może jeszcze dojść problem polskich (niemieckich, francuskich) znaków diakrytycznych, które niekoniecznie musiały być... See more http://www.foolabs.com/xpdf/download.html - pdftotext Trzeba odróżnić dwie rzeczy - PDF już zocerowany, skonwertowany z jakieś innej aplikacji, albo złożony ze skanów. W obu przypadkach inne są techniki konwersji. Przy pdfach zocerowanych może jeszcze dojść problem polskich (niemieckich, francuskich) znaków diakrytycznych, które niekoniecznie musiały być zapisane w źródle jako ISO/UTF-8 (wystarczy że konwertowano z LaTeXa). ▲ Collapse | |
|
|
Acrobat drogi jest | May 24, 2007 |
Jerzy Czopik wrote: Skoro można Acrobatem Jeżeli ktoś (tak jak ja) robi pdf-y od wielkiego dzwonu (najczęściej faktury i CV to nie opłaca się inwestować w Acrobata. | | | Leoo Poland Local time: 02:57 German to Polish OCR --> Problemy ze złożenim tekstu po tłumaczeniu | Sep 9, 2008 |
Witam, miałem nadzieję, że wyczytam wszystko na forum, ale o parę rzeczy muszę się jednak dopytać. Myślałem, że tylko ja mam problemy z konwertowaniem plików z PDF - do Worda, ale okazuje się, wcale to nie takie hop, jesli chce się otrzymać plik, który pózniej nie będzie sprawiał problemów, tak przynajmiej wynika z opisów. Krótki opis; 1. Przepuściłem PDF przez OCR (FineReader), instr.obsługi (ok.65), nie wszystko na raz tylko w 3 k... See more Witam, miałem nadzieję, że wyczytam wszystko na forum, ale o parę rzeczy muszę się jednak dopytać. Myślałem, że tylko ja mam problemy z konwertowaniem plików z PDF - do Worda, ale okazuje się, wcale to nie takie hop, jesli chce się otrzymać plik, który pózniej nie będzie sprawiał problemów, tak przynajmiej wynika z opisów. Krótki opis; 1. Przepuściłem PDF przez OCR (FineReader), instr.obsługi (ok.65), nie wszystko na raz tylko w 3 kawałkach, akurat tak wyszło (nieważne) / nieważne również dlaczego nie otrzymałem gotowego tekstu w pliku np.Worda, tylko robię to sam 2.Przetłumaczyłem tekst w Tradosie (każdy z tych kawałków oddzielnie), a następnie zrobiłem Clean Up (nie obyło się bez problemów), zdarzało się że nie mogłem zamknąć jedn.tłumaczeniowej podczas tłumaczenia (raz czy dwa), chyba stąd wziął się ten problem ---------------------------- !! 3. Mam teraz te 3 kawałki (z różnymi dziwnymi podziałami stron), każdy z tych kawałków nie wiem dlaczego ma różne marginesy (jak próbuję je poprawić, aby każdy z nich miał takie same ustawienia robi się masło maslane, gdyż wtedy nie mogę ich ze soba połączyć) Nie udało mi się sklecić tego w jedną całość, gdyż po wklejeniu (zwykłe kopiowanie) np. cz.II do I (jako powiedzmy dok. główny) dok.Word po jakims czasie całkiem się wiesza, nie mówić już o zburzeniu całej struktury akapitów oraz myślników w instr. Dla wyjadaczy problem ten wyda się śmieszny, ale chciałbym się zapytać co miał na myśli Pan Jerzy stosując przytoczony przeze mnei sposób postępowania (właściwie mógłbym napisać do Pana Jurka, ale chyba po to właśnie jest to forum, żeby dzielić się informacjami: "....I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można." Co daje mi taki sposób postępowania? co oznacza, że można go sformatować w Wordzie (po wyłaczeniu formatowania w FineReader) --------------------------------------------------- Może ktos ma pomysł na przepuszczanie plików przez różne programu OCR bez psucia całej struktury marginesów i akpitów? Pozdrawiam Kuba Jerzy Czopik wrote: Jest IMHO nie do pobicia - jak podaje Andrzej, dzięki możliwości ingerencji w proces masz duży wpływ na wyniki konwersji. W Finereaderze można na przykład odznaczyć rozpoznawanie takich miejsc, gdzie są stemple albo jakieś grafiki, które i tak zostaną zinterpretowane źle. Poza tym Abbyy ma ogromną bazę językową i dzięki temu czyta równie dobrze niemieckie jak i polskie dokumenty. I co najważniejsze - pozwala zapisać tekst BEZ żadnego formatowania i grafik. Taki goły tekst można dość szybko sformatować w Wordzie, a potem podczas CAT-owania tego tekstu nie ma najmniejszych problemów, czego o tekstach formatowanych przez narzędzia typu OCR powiedzieć nie można. Jak zawsze - powyższe to IMHO i bardzo subiektywnie Jerzy ▲ Collapse | | | Lenard Zwick Poland Local time: 02:57 Polish to Hungarian + ... Re.: OCR --> Problemy ze złożenim tekstu po tłumaczeniu | Sep 11, 2008 |
Myślę, że JC chodziło o wyborze docelowego formatu OCR - w Abby możesz wybrać zapisanie wyniku w pliku .txt - i wtedy "utracisz" wszelkie "fikuśne" szczegóły formatowania - w .txt po prostu takowych nie ma. Ja przynajmniej tak postępuję, jeśli z OCR w Wordzie otrzymuję "sieczkę". A otwierając .txt w Wordzie możesz dowolnie formatować tekst, i zapisać już w formacie .doc. Pozdro, Lenard | | | Jaroslaw Michalak Poland Local time: 02:57 Member (2004) English to Polish SITE LOCALIZER Różne poziomy | Sep 11, 2008 |
Lenard Zwick wrote: Myślę, że JC chodziło o wyborze docelowego formatu OCR - w Abby możesz wybrać zapisanie wyniku w pliku .txt - i wtedy "utracisz" wszelkie "fikuśne" szczegóły formatowania - w .txt po prostu takowych nie ma. Ja przynajmniej tak postępuję, jeśli z OCR w Wordzie otrzymuję "sieczkę". A otwierając .txt w Wordzie możesz dowolnie formatować tekst, i zapisać już w formacie .doc. Nie ma takiej potrzeby, można zapisać od razu w Wordzie z usunięciem całego formatowania. Co ważniejsze, poziomów formatowania jest kilka - jest to użyteczne, gdy chcemy np. zachować pogrubienia, różne rodzaje/wielkości fontów, itp., a usunąć całą strukturę dokumentu. | |
|
|
Jerzy Czopik Germany Local time: 02:57 Member (2003) Polish to German + ... LZ podał dokładnie to, co miałem na myśli | Sep 11, 2008 |
Ponieważ każdy konwerter, z którym spotkałem się do tej pory, przy konwertowaniu do Worda z usiłowaniem zachowania formatów robi sieczkę, bo wstawia setki podziałów sekcji, podziałów strony, kolumny itp. oraz robi ramki tekstowe, doszedłem do wniosku, że optymalnym rozwiązaniem jest uzyskanie samego tekstu i zrobienie formatowania samemu. Wobec tego zapisuję plik z OCR wybierając opcję "Usuń całe formatowanie i ilustracje" (albo rzeczywiście format *.txt jako format do... See more Ponieważ każdy konwerter, z którym spotkałem się do tej pory, przy konwertowaniu do Worda z usiłowaniem zachowania formatów robi sieczkę, bo wstawia setki podziałów sekcji, podziałów strony, kolumny itp. oraz robi ramki tekstowe, doszedłem do wniosku, że optymalnym rozwiązaniem jest uzyskanie samego tekstu i zrobienie formatowania samemu. Wobec tego zapisuję plik z OCR wybierając opcję "Usuń całe formatowanie i ilustracje" (albo rzeczywiście format *.txt jako format docelowy), a potem robię formatowanie w Wordzie. Z reguły jest to dość proste. Sformatowanie kilkudziesięciu stron w układzie jednokolumnowym z ilustracjami nie powinno zająć więcej niż dwie-trzy godziny, pod warunkiem oczywiście, że nie robimy wszystkiego na piechotę. Dlatego po otwarciu niesformatowanego pliku z OCR najpierw proponuję zaznaczyć cały tekst (CTRL+A), następnie przypisać mu styl normalny i nacisnąć na koniec CTRL+SPACE, aby przywrócić z całą pewnością wszystkie atrybuty formatowania do stanu zerowego (czyli wszystko jest sformatowane stylem normalnym bez jakichkolwiek modyfikacji czegokolwiek). Dopasowuję styl normalny do potrzeb dokumentu (Arial, TNR czy inna czcionka, jej wielkość, ustawienia akapitu itp.). Potem ustawienia marginesów, nagłówków i stopek. A później definiuję style wg potrzeb... Z wielką przyjemnością pokażę to na konferencji w PL w przyszłym roku. Jeżeli zbierze się nas dość na pałłale w Gnieźnie, to i tam mogę pokazać Pozdrawiam Jerzy ▲ Collapse | | |
Nie wiem, czy to zgodne z zasadami ProZ, ale poinformuję, że w jednym z miesięczników komputerowych (wydanie 9/2008) jest płyta zawierająca m. in. Fine Reader 6 Sprint. Jeżeli zasady nie pozwalają, to proszę usunąć ten post. Jeżeli nie, to rozumiem, że będę mógł podać tytuł tego miesięcznika. AM | | | Jerzy Czopik Germany Local time: 02:57 Member (2003) Polish to German + ... Być może nadchodzi pomoc | Sep 11, 2008 |
W miesięczniku Chip przeczytałem informację o dodatku do OpenOffice 3.0 (aktualnie dostępne w późnej wersji beta), mogącym otworzyć pliki PDF (do wersji 1.4). Bliższe informacje tutaj: http://extensions.services.openoffice.org/node/974 Jeżeli ten dodatek faktycznie otworzy PDF w OpenOffice w edytowalnej formie, to zniknie większość naszych problemów, bo plik O... See more W miesięczniku Chip przeczytałem informację o dodatku do OpenOffice 3.0 (aktualnie dostępne w późnej wersji beta), mogącym otworzyć pliki PDF (do wersji 1.4). Bliższe informacje tutaj: http://extensions.services.openoffice.org/node/974 Jeżeli ten dodatek faktycznie otworzy PDF w OpenOffice w edytowalnej formie, to zniknie większość naszych problemów, bo plik OO można tłumaczyć potem jak każdy inny edytowalny plik wybraną przez siebie metodą. Oczywiście w przypadku skanów w PDF-ie nic się nie zmieni. ▲ Collapse | | | Pages in topic: [1 2] > | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » PDF Converter - czy ktoś ma wyrobione zdanie? Trados Business Manager Lite | Create customer quotes and invoices from within Trados Studio
Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.
More info » |
| Wordfast Pro | Translation Memory Software for Any Platform
Exclusive discount for ProZ.com users!
Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value
Buy now! » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |