Brak polskich znaków w eksporcie do Worda z DejaVu
Thread poster: Oryctes
Oryctes
Local time: 21:34
English to Polish
+ ...
Aug 30, 2009

Właśnie wykonałem swoje pierwsze tłumaczenie z użyciem DejaVu i mam problem: po wyeksportowaniu tłumaczenia do Worda okazuje się, że w przypisach polskie litery zostały zastąpione rozmaitymi egzotycznymi znaczkami. Efekt ten nie występuje w tekście głównym, gdzie również występują polskie słowa. Byłbym zobowiązany za podpowiedź, jak uporać się z tym problemem.

Direct link Reply with quote
 

Wolfgang Jörissen  Identity Verified
Belize
Member
Dutch to German
+ ...
Trochę wiecej informacji poprosimy Aug 31, 2009

Normalne to nie jest, powinno to działac. Ale zanim ktokolwiek może Ci pomoc, proszę podac, z jaka wersja Word-a pracujesz, jaki filter używałeś do importowania i jaki build Deja Vu używaz. I - właśnie padnie mi do głowy: w jakiej czcionce oryginalny tekst był napisany w Wordzie? Może spróbuj zmienic czcionkę. A jeśli nic nie pomozy, to mogę na razie tylko sugerowac zastapic wszystkie błędne znaki (mówisz, że są one rozmaite, więc z paroma akcjami zastąpienia powinno się zrobic) przez odpowiednie polskie.

Direct link Reply with quote
 

Grzegorz Gryc  Identity Verified
Local time: 21:34
French to Polish
+ ...
Parę słów więcej... Aug 31, 2009

Wolfgang Jörissen wrote:

Normalne to nie jest, powinno to działac. Ale zanim ktokolwiek może Ci pomoc, proszę podac, z jaka wersja Word-a pracujesz, jaki filter używałeś do importowania

Normalnie importuję do DVX po przepuszczeniu przez Tradosa (bilingual RTF/DOC//TTX).
W zasadzie nigdy nie mam problemów, a RTF/DOC są zwykle lepsze niż obrabiane bezpośrednio w Tradosie.

i jaki build Deja Vu używaz.

Oczywiście ostatni jest najlepszy

I - właśnie padnie mi do głowy: w jakiej czcionce oryginalny tekst był napisany w Wordzie? Może spróbuj zmienic czcionkę.

Mhm.
To może być powód.
Jeżeli czcionka nie jest czcionką Unicode, nie ma siły, żeby polskie literki były wyświetlane poprawnie, to problem niezależny od narzędzia CAT.

A jeśli nic nie pomozy, to mogę na razie tylko sugerowac zastapic wszystkie błędne znaki (mówisz, że są one rozmaite, więc z paroma akcjami zastąpienia powinno się zrobic) przez odpowiednie polskie.

Mhm.
Albo, jeśli czcionka jest "dziwna" zamień ją globalnie na jakąś standardową wyglądającą podobnie, może wystarczy.

Zdrówkot
GG


Direct link Reply with quote
 
Oryctes
Local time: 21:34
English to Polish
+ ...
TOPIC STARTER
więcej informacji Aug 31, 2009

Używam DejaVu 7.0.284 oraz Worda 97. Nie dokonywałem żadnych zmian w filtrach, więc DejaVu wykorzystał zapewne filtr dla doc. bo taki format miał plik źródłowy. Stosowałem czcionkę New Times Roman. Co ciekawe, polskich liter (z wyjątkiem ó) brakuje tylko w przypisach.

Próbowałem zastąpić je w Wordzie przy sprawdzaniu pisowni, ale Word wcale nie uznaje wyrazów z tymi znakami za błędne, tak jakby widział je jako prawidłowe litery.
Nie da się również zastąpić ich za pomocą funkcji "znajdź i zastąp", ponieważ przy wpisywaniu tych znaków do okienka "znajdź" uzyskuję normalną polską literę, której program nie znajduje w tekście: np. zamiast "Ż" mam taką górną kreskę, więc próbuję ją zastąpić wpisując w okno "znajdź" alt+cntrl+shift+z, bo taki jest skrót klawiaturowy dla tej kreski, ale zamiast kreski pojawia się właśnie "Ż". W przeciwieństwie do modułu sprawdzania pisowni, który traktuje górną kreskę jak "Ż", moduł wyszukiwania uznaje ją za inny znak, więc szukając "Ż" nie jestem w stanie wyszukać i zastąpić owych górnych kresek. Pozostaje mozolne wyszukiwanie i zastąpowanie wszystkich znaczków po jednym, co jest dość czasochłonne.


Direct link Reply with quote
 

Piotr Bienkowski  Identity Verified
Poland
Local time: 21:34
Member (2005)
English to Polish
+ ...
Jakieś 10 lat temu miałem podobny problem :-) Sep 1, 2009

Oryctes wrote:

Właśnie wykonałem swoje pierwsze tłumaczenie z użyciem DejaVu i mam problem: po wyeksportowaniu tłumaczenia do Worda okazuje się, że w przypisach polskie litery zostały zastąpione rozmaitymi egzotycznymi znaczkami. Efekt ten nie występuje w tekście głównym, gdzie również występują polskie słowa. Byłbym zobowiązany za podpowiedź, jak uporać się z tym problemem.


I po wypróbowaniu wszelkich możliwych konwersji wpadłem na pomysł hackerski. Zapisywałem plik jako RTF, otwierałem w edytorze tekstowym (wtedy był to NoteTab Pro) i zamieniałem coś w okolicach tekstu fcharset dla używanej w dokumencie czcionki. Tylko teraz już nie pamiętam, czy to była zamiana fcharset0 na fcharset250 czy fcharset252... Ale działało!

Oczywiście nikt nie powinien musieć wykonywać takich karkołomnych zabiegów, aby uzyskać dokument z poprawnie wyświetlanymi polskimi znakami. To była moja krótka przygoda z DejaVu, bo niedługo po "opatentowaniu" tego "wynalazku" pożegnałem się z tamtą firmą.

Pozdrawiam,

Piotr


Direct link Reply with quote
 

Grzegorz Gryc  Identity Verified
Local time: 21:34
French to Polish
+ ...
Stare DV i RTF... Sep 1, 2009

Piotr Bienkowski wrote:


I po wypróbowaniu wszelkich możliwych konwersji wpadłem na pomysł hackerski. Zapisywałem plik jako RTF, otwierałem w edytorze tekstowym (wtedy był to NoteTab Pro) i zamieniałem coś w okolicach tekstu fcharset dla używanej w dokumencie czcionki. Tylko teraz już nie pamiętam, czy to była zamiana fcharset0 na fcharset250 czy fcharset252... Ale działało![/quote]
fcharset238
Mnie się zwykle nie chciało dłubać i otwierałem to w Wordzie 95, gdzie to było czytelniejsze.
To ostatni Word, który kanonicznie obsługuje RTF, więc służy mi interwencyjnie do dzisiaj

W dzisiejszym Wordzie można spróbować zaznaczyć wszystkie przypisy, znaleźć w menu lub na tych kretyńskich wstążkach opcję Popraw uszkodzony tekst, a jak Łotr już poprawi tekst, samemu ręcznie poprawić formatowanie, które Łotr przy okazji psuje.

Oczywiście nikt nie powinien musieć wykonywać takich karkołomnych zabiegów, aby uzyskać dokument z poprawnie wyświetlanymi polskimi znakami.

To akurat jest często sprawa nieprawidłowej struktury RTF, który np. pobiera domyślny charset z systemu i podobne.

To była moja krótka przygoda z DejaVu, bo niedługo po "opatentowaniu" tego "wynalazku" pożegnałem się z tamtą firmą.

DV3 i starsze pracowały na 256-znakowych stronach kodowych i to było rzeczywiście potwornie wkurzające, zwłaszcza w dokumentach wielojęzycznych, które na wyjściu nigdy nie były poprawne, jeśli w środku był zestaw Western, CE, greka itp.
Do tego stopnia, że w pewnym momencie w desperacji kupiłem SDLX, żeby tylko nie dotykać Tradosa, który w moich głównych parach językowych nie nadawał się wtedy domyślnie absolutnie do niczego.
Ale jak DVX się ustabilizował w końcu 2004, z przyjemnością SDLX wypieprzyłem, bo co to za CAT, który nie ma nawet fuzzy terminology recognition

Ogólnie, obecnie DVX wypuszcza RTF o niebo lepsze niż Trados rozumiany jako klasyczna nakładka na Worda, ponieważ nie próbuje "poprawiać" struktury pliku i nie gra nieudolnie na stylach.
Ma to tę przykrą konsekwencję, że jak na wejściu jest śmieć, nawet niewidoczny, może się ujawnić i na wyjściu.

Ja teksty, które podejrzewam o śmieciowość (czyli OCR, gnioty fatalnie sformatowane na pierwszy rzut oka itp.) czyszczę najpierw CodeZapperem (patrz binaria grupy dejavu-l na yahoogroups), potem przetwarzam w Tradosie (o ile do tłumaczenia nadaje się IMHO słabo, to świetne narzędzie do przygotowania tekstu i korekty), a potem tłukę w DVX.
Jeżeli z czymkolwiek mam po drodze problemy, to zazwyczaj z Tradosem, ktory mi psuje czcionki.

PS.
Podstawowa sprawa.
Jesteś w stanie w tych przypisach wprowadzić polskie literki "z ręki"?

Zdrówkot
GG


Direct link Reply with quote
 

Grzegorz Gryc  Identity Verified
Local time: 21:34
French to Polish
+ ...
Wersje... Sep 1, 2009

Oryctes wrote:

Używam DejaVu 7.0.284

Skąd Ty to wydobyłeś?
Ta wersja DVX jest już mocno archaiczna, to jakoś koniec 2004 czy początek 2005, o ile pamiętam.
Jest bezpłatny upgrade do 7.5.303.

oraz Worda 97.

A Word 97 był taką dziwną hybrydą na pół Unicode, która opisywane przez Ciebie problemy wyprawiała bardzo często, o ile nie był nałożony SP3 lub SP3a, nie pamiętam już dokładnie.

Jaką masz wersję językową Windows i Office?

[...]

Próbowałem zastąpić je w Wordzie przy sprawdzaniu pisowni, ale Word wcale nie uznaje wyrazów z tymi znakami za błędne, tak jakby widział je jako prawidłowe litery.
Nie da się również zastąpić ich za pomocą funkcji "znajdź i zastąp", ponieważ przy wpisywaniu tych znaków do okienka "znajdź" uzyskuję normalną polską literę, której program nie znajduje w tekście: np. zamiast "Ż" mam taką górną kreskę, więc próbuję ją zastąpić wpisując w okno "znajdź" alt+cntrl+shift+z, bo taki jest skrót klawiaturowy dla tej kreski, ale zamiast kreski pojawia się właśnie "Ż". W przeciwieństwie do modułu sprawdzania pisowni, który traktuje górną kreskę jak "Ż", moduł wyszukiwania uznaje ją za inny znak, więc szukając "Ż" nie jestem w stanie wyszukać i zastąpić owych górnych kresek. Pozostaje mozolne wyszukiwanie i zastąpowanie wszystkich znaczków po jednym, co jest dość czasochłonne.

Wszystko jasne, to błąd Worda.
Coś mu się popieprzyło w stronach kodowych i miesza 1250, 1252 i Unicode.
IMHO, używając tylko Worda 97 sam tego nie naprawisz automatycznie, o ile dobrze pamiętam.

Zdrówkot
GG

[Edited at 2009-09-01 09:23 GMT]


Direct link Reply with quote
 
Oryctes
Local time: 21:34
English to Polish
+ ...
TOPIC STARTER
serdeczne dzięki! Sep 1, 2009

Bardzo wszystkim dziękuję za podpowiedzi - będę teraz wiedział gdzie szukać rozwiązania. Też tak sobie myślę, że to Word mi bruździ, i pewnie wypadałoby uaktualnić soft. Dziękuję i pozdrawiam

Direct link Reply with quote
 

Grzegorz Gryc  Identity Verified
Local time: 21:34
French to Polish
+ ...
Office Sep 2, 2009

Oryctes wrote:

Bardzo wszystkim dziękuję za podpowiedzi - będę teraz wiedział gdzie szukać rozwiązania. Też tak sobie myślę, że to Word mi bruździ, i pewnie wypadałoby uaktualnić soft. Dziękuję i pozdrawiam


Jeśli możesz, wytrzaśnij skądś Office 2003.
DVX wpółpracuje z nim lepiej niż z Office 2007.
Zresztą większości znanych mi ludzi też z 2003 wygodniej.

Zdrówkot
GG


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

Brak polskich znaków w eksporcie do Worda z DejaVu

Advanced search






Across v6.3
Translation Toolkit and Sales Potential under One Roof

Apart from features that enable you to translate more efficiently, the new Across Translator Edition v6.3 comprises your crossMarket membership. The new online network for Across users assists you in exploring new sales potential and generating revenue.

More info »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search