Trados - analiza; liczba słów
Thread poster: maciejm
maciejm
maciejm  Identity Verified
Poland
Local time: 10:38
English to Polish
+ ...
Dec 1, 2007

Jakoś nigdy do tej pory nie zastanawiałem się nad tym jak "działa" obliczanie liczby słów przy pomocy funkcji "Analyse" w Tradosie. Problem pojawił się przy okazji ostatniego zlecenia. Zlecenie to obejmowało cztery pliki .ttx, których treść była ze sobą bardzo ściśle powiązana (instrukcje obsługi trzech wersji pewnej maszyny oraz jako czwarty plik aneks do tych instrukcji).

Z otrzymanej analizy, wynikało, że plik nr 1 zawiera:

... See more
Jakoś nigdy do tej pory nie zastanawiałem się nad tym jak "działa" obliczanie liczby słów przy pomocy funkcji "Analyse" w Tradosie. Problem pojawił się przy okazji ostatniego zlecenia. Zlecenie to obejmowało cztery pliki .ttx, których treść była ze sobą bardzo ściśle powiązana (instrukcje obsługi trzech wersji pewnej maszyny oraz jako czwarty plik aneks do tych instrukcji).

Z otrzymanej analizy, wynikało, że plik nr 1 zawiera:

Segments -Words-Percent-Placeables
No Match 429 - 2,328 - 43 - 27

plik nr 2:

No Match 44 - 273 - 8 - 0

plik nr 3:

No Match 9 - 51 - 2 - 0

plik nr 4:

No Match 95 - 739 - 44 - 0

Razem:

No Match 577 - 3,391 - 23 - 27


Podałem tylko liczbę No Match, bo głównie na tej podstawie określam ile czasu może mi zająć wykonanie danej pracy.

Oczywiście zacząłem od pliku nr 3 (51 NM), żeby już po chwili (tak naiwny myślałem) mieć satysfakcję, że już jeden cały plik mam za sobą - tym bardziej, że w pliku tym było jeszcze tylko 287 Repetitions i w ogóle nie było Fuzzy Matches. Pół godziny później zacząłem coś podejrzewać, a po następnej godzinie postanowiłem zrobić własną analizę. W tym celu zaimportowałem otrzmaną przez klienta pamięć (plik .txt do pustej pamięci (żeby mieć stan pamięci sprzed rozpoczęcia pracy) i przy włączonej takiej pamięci przeprowadziłem analizę wszystkich 4 plików (kopii plików źródłowych, żeby znowu mieć stan sprzed rozpoczęcia pracy). Ku mojemu zdziwieniu zgadzala się tylko ogólna liczba wszystkich słów i segmentów, natomiast liczba słów NM wyniosła ok. 2700, czyli mniej, pozmieniały się też zupełnie liczby słów w poszczególnych kategoriach Fuzzy Matches. Tym razem plik nr 3 miał mieć ok. 1500 słów NM i był w tej kategorii (NM)najdłuższy.
Następnym krokiem było zrobienie analizy każdego z 4 plików osobno (warunki takie jak powyżej, pamięć jaką otrzymałem od klienta, bez uzupełnień o segmenty, które już zrobiłem sam oraz pliki źródłowe). Tym razem po podsumowaniu słów NM wyszło ogółem 4500. Całkowita liczba słów/segmentów po podsumowaniu zgadzała się.

Po zakończeniu pracy nad plikiem nr 3, co zajęło mi ogółem ok. 3 godzin, czyli nie było to żadną miarą 51 słów,wykonałem kolejną analizę ( bo wpadłem w panikę, że skoro "51 NM" zajęło mi 3 godziny, to ile mi zajmie plik nr 1 z 2,328 NM, a nie wspomniałem jeszcze, że ogólna liczba wszystkich słów we wszystkich kategoriach wynosiła prawie 15 tysięcy, za to termin 2 dni, a do tego akurat praca w Dęblinie. Tym razem przepuściłem wszystkie 4 pliki source przez analizę za pomocą pamięci powstałej już po przetłumaczeniu jednego pliku. Jak się spodziewałem, w pliku gotowym, liczba słów NM wyniosła zero, no bo juz go przetłumaczyłem, za to plik nr 1 nie miał już 2,328 NM, tylko około 350 (sic!) i bardzo duży procent Fuzzy Matches.

Skontaktowałem się ze zleceniodawcą wspominając, o tym ile czasu zajęło mi przetłumaczenie "krótkiego" pliku i poprosiłem o ponowną analizę. W odpowiedzi poinformowali mnie, że po ich powtórnej analizie liczba NM wyniosła 3506, czyli o 115 więcej niż poprzednio, ale za to liczba Fuzzy Matches wynosi ogółem trochę mniej (już nie pamiętam o ile). Ale tym razem wydruku swojej powtórnej analizy nie przysłali. Ponieważ, jak juz wspomniałem, w jednej z moich analiz ogólna liczba NM była o wiele niższa niż podana przez zleceniodawcę, tematu dłużej nie drążyłem.

W czasie pracy nad pozostałymi plikami okazało się, że tym razem praca idzie bardzo szybko. Termin został dotrzymany, natomiast ja zupełnie nie mam pojęcia ile tych nowych słów (a przecież od tego w głównej mierze zależy nasze honorarium) przetłumaczyłem i na ile uczciwe są te Tradosowe analizy. Używam Tradosa 6.5, a nie wiem jakiej wersji używa zleceniodawca - może to ma też jakieś znaczenie? Może w ogóle przyjąłem gdzieś fałszywe założenia i powinienem te analizy przeprowadzać w inny sposób?

Oprócz tego, chciałem przy okazji zapytać, jaka jest różnica pomiędzy "Repetitions", a "100 % Matches" i z góry przeprosić, jeżeli moje pytania świadczą o ignorancji, bo faktycznie, cała moja wiedza na ten temat pochodzi z praktyki i z tego, co mi czasami bardziej doświadczeni w tej materii podpowiedzą.

M
Collapse


 
Andrzej Lejman
Andrzej Lejman  Identity Verified
Poland
Local time: 10:38
Member (2004)
German to Polish
+ ...
Nie podejmuję się rozwikłać zagadki, Dec 1, 2007

natomiast mogę odpowiedzieć na ostatnie pytanie.

100% matches to segmenty w tekście w 100% zgodne z istniejącymi segmentami w pamięci. Natomiast repetitions to segmenty niewystępujące w TM, a za to powtarzające się w tekście.

Pozdrawiam

Andrzej


 
Jaroslaw Michalak
Jaroslaw Michalak  Identity Verified
Poland
Local time: 10:38
Member (2004)
English to Polish
SITE LOCALIZER
Zagadka? Dec 1, 2007

W takich wynikach analizy nie widzę nic zaskakującego - rzecz cała wynika z traktowania powtórzeń.

Trados jako "no match" liczy tylko pierwsze wystąpienie segmentu - każde następne wystąpienie identycznego segmentu liczone jest jako powtórzenie. Dlatego oczywiście w pierwszym pliku musiało wystąpić najwięcej NM, bo pozostałe pliki zawierały takie same segmenty. Gdybyś tłumaczył pliki w kolejności, w której je analizowałeś, nie byłoby żadnego z
... See more
W takich wynikach analizy nie widzę nic zaskakującego - rzecz cała wynika z traktowania powtórzeń.

Trados jako "no match" liczy tylko pierwsze wystąpienie segmentu - każde następne wystąpienie identycznego segmentu liczone jest jako powtórzenie. Dlatego oczywiście w pierwszym pliku musiało wystąpić najwięcej NM, bo pozostałe pliki zawierały takie same segmenty. Gdybyś tłumaczył pliki w kolejności, w której je analizowałeś, nie byłoby żadnego zaskoczenia. Ponieważ jednak zacząłeś od pliku trzeciego, to musiałeś przetłumaczyć owe 51 NM oraz wszystkie powtórzenia występujące w pliku pierwszym i trzecim. Stąd nagły "wzrost" segmentów do przetłumaczenia. I na odwrót, skoro przetłumaczyłeś powtórzenia w pliku trzecim, to przy ponowej analizie pliku pierwszego liczba NM znacznie się zmniejszyła.

Rozbieżności w poszczególnych analizach trudno mi wyjaśnić nie widząc konkretnych plików, podejrzewam jednak, że mogły się różnić warunki początkowe (np. procent zgodności segmentów, rodzaj eksportu TM itd.).
Collapse


 
Jerzy Czopik
Jerzy Czopik  Identity Verified
Germany
Local time: 10:38
Member (2003)
Polish to German
+ ...
Interpretacja analizy Dec 2, 2007

Jabberwock już prawie wszystko wyłożył.
Dorbną uwagę mam tylko do repetitions - pierwsze wystąpienie danego segmentu będzie wliczane do jakiejś kategorii match, niekoniecznie no match, może być i 100% - w każdym razie w "match" siedzi ten segment tylko raz. Pozostałe jego wystąpienia są repetitions.

Zrobiłeś poważny błąd, podając tutaj tylko wyniki analizy NM. Gdybyś popatrzył na całą analizę, to wątpliwy plik miał na pewno dużą liczbę powtórze�
... See more
Jabberwock już prawie wszystko wyłożył.
Dorbną uwagę mam tylko do repetitions - pierwsze wystąpienie danego segmentu będzie wliczane do jakiejś kategorii match, niekoniecznie no match, może być i 100% - w każdym razie w "match" siedzi ten segment tylko raz. Pozostałe jego wystąpienia są repetitions.

Zrobiłeś poważny błąd, podając tutaj tylko wyniki analizy NM. Gdybyś popatrzył na całą analizę, to wątpliwy plik miał na pewno dużą liczbę powtórzeń. Pierwszy plik natomiast miał powtórzeń bardzo mało. Dlatego zasadniczo przy zleceniach o dużej liczbie powtórzeń trzeba robić od pierwszego pliku, to wtedy zgadza się poczucie wkładu pracy i liczba słów. Albo świadomie wybieram na początek największy plik, aby go zepchnąć i mieć potem z górki.

J.
Collapse


 
maciejm
maciejm  Identity Verified
Poland
Local time: 10:38
English to Polish
+ ...
TOPIC STARTER
Dzięki :-) Dec 3, 2007

Dziękuje za wyczerpujące odpowiedzi. W takim razie jest juz wszystko jasne. Z liczbą powtórzeń jest tak jak pisze Jerzy. Po prostu chyba po raz pierwszy miałem kilka aż tak podobnych do siebie plików za jednym razem i nauka z tego jest taka, że w takim przypadku kolejność pracy ma jednak znaczenie.
Pozdrawiam,
M


 
Wojciech Froelich
Wojciech Froelich  Identity Verified
Poland
Local time: 10:38
English to Polish
100% to 100% Dec 3, 2007

Jerzy Czopik wrote:

Dorbną uwagę mam tylko do repetitions - pierwsze wystąpienie danego segmentu będzie wliczane do jakiejś kategorii match, niekoniecznie no match, może być i 100% - w każdym razie w "match" siedzi ten segment tylko raz. Pozostałe jego wystąpienia są repetitions.


Kolejne wystąpienie „setki” nie zostanie zaliczone do „repetitions”. Wyląduje w „setkach”.
Natomiast kolejne wystąpienia niższych „matchy” będą lądować w „repetitions”, co jest niekoniecznie spójne z tym, co można znaleźć w dokumentacji Tradosa...

W.


 
Wojciech Froelich
Wojciech Froelich  Identity Verified
Poland
Local time: 10:38
English to Polish
Dla całkowitego nakładu pracy? Dec 3, 2007

maciejm wrote:

Dziękuje za wyczerpujące odpowiedzi. W takim razie jest juz wszystko jasne. Z liczbą powtórzeń jest tak jak pisze Jerzy. Po prostu chyba po raz pierwszy miałem kilka aż tak podobnych do siebie plików za jednym razem i nauka z tego jest taka, że w takim przypadku kolejność pracy ma jednak znaczenie.


Dla całkowitego nakładu pracy kolejność chyba jednak nie ma znaczenia?

W.


 
Jerzy Czopik
Jerzy Czopik  Identity Verified
Germany
Local time: 10:38
Member (2003)
Polish to German
+ ...
Poważnie?? Dec 3, 2007

Wojciech Froelich wrote:

Jerzy Czopik wrote:

Dorbną uwagę mam tylko do repetitions - pierwsze wystąpienie danego segmentu będzie wliczane do jakiejś kategorii match, niekoniecznie no match, może być i 100% - w każdym razie w "match" siedzi ten segment tylko raz. Pozostałe jego wystąpienia są repetitions.


Kolejne wystąpienie „setki” nie zostanie zaliczone do „repetitions”. Wyląduje w „setkach”.
Natomiast kolejne wystąpienia niższych „matchy” będą lądować w „repetitions”, co jest niekoniecznie spójne z tym, co można znaleźć w dokumentacji Tradosa...

W.

Skąd to masz - dla mnie nie jest to logiczne...

J.


 
Jaroslaw Michalak
Jaroslaw Michalak  Identity Verified
Poland
Local time: 10:38
Member (2004)
English to Polish
SITE LOCALIZER
Ależ... Dec 3, 2007

Czy nielogiczne? To zależy od zapatrywań - przecież po zakończeniu pracy mamy (chcemy mieć?) same 100%, a nie część setek, część powtórzeń. Dla mnie akurat takie rozwiązanie jest sensowne...

 
Wojciech Froelich
Wojciech Froelich  Identity Verified
Poland
Local time: 10:38
English to Polish
Wystarczy zrobić prosty test Dec 4, 2007

Jerzy Czopik wrote:

Wojciech Froelich wrote:

Kolejne wystąpienie „setki” nie zostanie zaliczone do „repetitions”. Wyląduje w „setkach”.
Natomiast kolejne wystąpienia niższych „matchy” będą lądować w „repetitions”, co jest niekoniecznie spójne z tym, co można znaleźć w dokumentacji Tradosa...


Skąd to masz - dla mnie nie jest to logiczne...


Przygotowałem specjalny pliczek i przetestowałem. Baza z jednym segmentem, w pliku cztery zdania, dwa identyczne dające 100%, dwa identyczne dające fuzzy. Zgadnij jaki był rozkład w logu

Wracając do dokumentacji — od dawna w tradosowej dokumentacji stoi, że repetycja to każde drugie i kolejne wystąpienie no-matcha. O fuzzy nawet się nie zająknęli...


 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

Trados - analiza; liczba słów






CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »