Mobile menu

Trados - analiza; liczba słów
Thread poster: maciejm

maciejm  Identity Verified
Poland
Local time: 08:52
English to Polish
+ ...
Dec 1, 2007

Jakoś nigdy do tej pory nie zastanawiałem się nad tym jak "działa" obliczanie liczby słów przy pomocy funkcji "Analyse" w Tradosie. Problem pojawił się przy okazji ostatniego zlecenia. Zlecenie to obejmowało cztery pliki .ttx, których treść była ze sobą bardzo ściśle powiązana (instrukcje obsługi trzech wersji pewnej maszyny oraz jako czwarty plik aneks do tych instrukcji).

Z otrzymanej analizy, wynikało, że plik nr 1 zawiera:

Segments -Words-Percent-Placeables
No Match 429 - 2,328 - 43 - 27

plik nr 2:

No Match 44 - 273 - 8 - 0

plik nr 3:

No Match 9 - 51 - 2 - 0

plik nr 4:

No Match 95 - 739 - 44 - 0

Razem:

No Match 577 - 3,391 - 23 - 27


Podałem tylko liczbę No Match, bo głównie na tej podstawie określam ile czasu może mi zająć wykonanie danej pracy.

Oczywiście zacząłem od pliku nr 3 (51 NM), żeby już po chwili (tak naiwny myślałem) mieć satysfakcję, że już jeden cały plik mam za sobą - tym bardziej, że w pliku tym było jeszcze tylko 287 Repetitions i w ogóle nie było Fuzzy Matches. Pół godziny później zacząłem coś podejrzewać, a po następnej godzinie postanowiłem zrobić własną analizę. W tym celu zaimportowałem otrzmaną przez klienta pamięć (plik .txt do pustej pamięci (żeby mieć stan pamięci sprzed rozpoczęcia pracy) i przy włączonej takiej pamięci przeprowadziłem analizę wszystkich 4 plików (kopii plików źródłowych, żeby znowu mieć stan sprzed rozpoczęcia pracy). Ku mojemu zdziwieniu zgadzala się tylko ogólna liczba wszystkich słów i segmentów, natomiast liczba słów NM wyniosła ok. 2700, czyli mniej, pozmieniały się też zupełnie liczby słów w poszczególnych kategoriach Fuzzy Matches. Tym razem plik nr 3 miał mieć ok. 1500 słów NM i był w tej kategorii (NM)najdłuższy.
Następnym krokiem było zrobienie analizy każdego z 4 plików osobno (warunki takie jak powyżej, pamięć jaką otrzymałem od klienta, bez uzupełnień o segmenty, które już zrobiłem sam oraz pliki źródłowe). Tym razem po podsumowaniu słów NM wyszło ogółem 4500. Całkowita liczba słów/segmentów po podsumowaniu zgadzała się.

Po zakończeniu pracy nad plikiem nr 3, co zajęło mi ogółem ok. 3 godzin, czyli nie było to żadną miarą 51 słów,wykonałem kolejną analizę ( bo wpadłem w panikę, że skoro "51 NM" zajęło mi 3 godziny, to ile mi zajmie plik nr 1 z 2,328 NM, a nie wspomniałem jeszcze, że ogólna liczba wszystkich słów we wszystkich kategoriach wynosiła prawie 15 tysięcy, za to termin 2 dni, a do tego akurat praca w Dęblinie. Tym razem przepuściłem wszystkie 4 pliki source przez analizę za pomocą pamięci powstałej już po przetłumaczeniu jednego pliku. Jak się spodziewałem, w pliku gotowym, liczba słów NM wyniosła zero, no bo juz go przetłumaczyłem, za to plik nr 1 nie miał już 2,328 NM, tylko około 350 (sic!) i bardzo duży procent Fuzzy Matches.

Skontaktowałem się ze zleceniodawcą wspominając, o tym ile czasu zajęło mi przetłumaczenie "krótkiego" pliku i poprosiłem o ponowną analizę. W odpowiedzi poinformowali mnie, że po ich powtórnej analizie liczba NM wyniosła 3506, czyli o 115 więcej niż poprzednio, ale za to liczba Fuzzy Matches wynosi ogółem trochę mniej (już nie pamiętam o ile). Ale tym razem wydruku swojej powtórnej analizy nie przysłali. Ponieważ, jak juz wspomniałem, w jednej z moich analiz ogólna liczba NM była o wiele niższa niż podana przez zleceniodawcę, tematu dłużej nie drążyłem.

W czasie pracy nad pozostałymi plikami okazało się, że tym razem praca idzie bardzo szybko. Termin został dotrzymany, natomiast ja zupełnie nie mam pojęcia ile tych nowych słów (a przecież od tego w głównej mierze zależy nasze honorarium) przetłumaczyłem i na ile uczciwe są te Tradosowe analizy. Używam Tradosa 6.5, a nie wiem jakiej wersji używa zleceniodawca - może to ma też jakieś znaczenie? Może w ogóle przyjąłem gdzieś fałszywe założenia i powinienem te analizy przeprowadzać w inny sposób?

Oprócz tego, chciałem przy okazji zapytać, jaka jest różnica pomiędzy "Repetitions", a "100 % Matches" i z góry przeprosić, jeżeli moje pytania świadczą o ignorancji, bo faktycznie, cała moja wiedza na ten temat pochodzi z praktyki i z tego, co mi czasami bardziej doświadczeni w tej materii podpowiedzą.

M


Direct link Reply with quote
 

Andrzej Lejman  Identity Verified
Local time: 08:52
German to Polish
+ ...
Nie podejmuję się rozwikłać zagadki, Dec 1, 2007

natomiast mogę odpowiedzieć na ostatnie pytanie.

100% matches to segmenty w tekście w 100% zgodne z istniejącymi segmentami w pamięci. Natomiast repetitions to segmenty niewystępujące w TM, a za to powtarzające się w tekście.

Pozdrawiam

Andrzej


Direct link Reply with quote
 

Jabberwock  Identity Verified
Poland
Local time: 08:52
Member (2004)
English to Polish
Zagadka? Dec 1, 2007

W takich wynikach analizy nie widzę nic zaskakującego - rzecz cała wynika z traktowania powtórzeń.

Trados jako "no match" liczy tylko pierwsze wystąpienie segmentu - każde następne wystąpienie identycznego segmentu liczone jest jako powtórzenie. Dlatego oczywiście w pierwszym pliku musiało wystąpić najwięcej NM, bo pozostałe pliki zawierały takie same segmenty. Gdybyś tłumaczył pliki w kolejności, w której je analizowałeś, nie byłoby żadnego zaskoczenia. Ponieważ jednak zacząłeś od pliku trzeciego, to musiałeś przetłumaczyć owe 51 NM oraz wszystkie powtórzenia występujące w pliku pierwszym i trzecim. Stąd nagły "wzrost" segmentów do przetłumaczenia. I na odwrót, skoro przetłumaczyłeś powtórzenia w pliku trzecim, to przy ponowej analizie pliku pierwszego liczba NM znacznie się zmniejszyła.

Rozbieżności w poszczególnych analizach trudno mi wyjaśnić nie widząc konkretnych plików, podejrzewam jednak, że mogły się różnić warunki początkowe (np. procent zgodności segmentów, rodzaj eksportu TM itd.).


Direct link Reply with quote
 

Jerzy Czopik  Identity Verified
Germany
Local time: 08:52
Member (2003)
Polish to German
+ ...
Interpretacja analizy Dec 2, 2007

Jabberwock już prawie wszystko wyłożył.
Dorbną uwagę mam tylko do repetitions - pierwsze wystąpienie danego segmentu będzie wliczane do jakiejś kategorii match, niekoniecznie no match, może być i 100% - w każdym razie w "match" siedzi ten segment tylko raz. Pozostałe jego wystąpienia są repetitions.

Zrobiłeś poważny błąd, podając tutaj tylko wyniki analizy NM. Gdybyś popatrzył na całą analizę, to wątpliwy plik miał na pewno dużą liczbę powtórzeń. Pierwszy plik natomiast miał powtórzeń bardzo mało. Dlatego zasadniczo przy zleceniach o dużej liczbie powtórzeń trzeba robić od pierwszego pliku, to wtedy zgadza się poczucie wkładu pracy i liczba słów. Albo świadomie wybieram na początek największy plik, aby go zepchnąć i mieć potem z górki.

J.


Direct link Reply with quote
 

maciejm  Identity Verified
Poland
Local time: 08:52
English to Polish
+ ...
TOPIC STARTER
Dzięki :-) Dec 3, 2007

Dziękuje za wyczerpujące odpowiedzi. W takim razie jest juz wszystko jasne. Z liczbą powtórzeń jest tak jak pisze Jerzy. Po prostu chyba po raz pierwszy miałem kilka aż tak podobnych do siebie plików za jednym razem i nauka z tego jest taka, że w takim przypadku kolejność pracy ma jednak znaczenie.
Pozdrawiam,
M


Direct link Reply with quote
 

Wojciech Froelich  Identity Verified
Poland
Local time: 08:52
English to Polish
100% to 100% Dec 3, 2007

Jerzy Czopik wrote:

Dorbną uwagę mam tylko do repetitions - pierwsze wystąpienie danego segmentu będzie wliczane do jakiejś kategorii match, niekoniecznie no match, może być i 100% - w każdym razie w "match" siedzi ten segment tylko raz. Pozostałe jego wystąpienia są repetitions.


Kolejne wystąpienie „setki” nie zostanie zaliczone do „repetitions”. Wyląduje w „setkach”.
Natomiast kolejne wystąpienia niższych „matchy” będą lądować w „repetitions”, co jest niekoniecznie spójne z tym, co można znaleźć w dokumentacji Tradosa...

W.


Direct link Reply with quote
 

Wojciech Froelich  Identity Verified
Poland
Local time: 08:52
English to Polish
Dla całkowitego nakładu pracy? Dec 3, 2007

maciejm wrote:

Dziękuje za wyczerpujące odpowiedzi. W takim razie jest juz wszystko jasne. Z liczbą powtórzeń jest tak jak pisze Jerzy. Po prostu chyba po raz pierwszy miałem kilka aż tak podobnych do siebie plików za jednym razem i nauka z tego jest taka, że w takim przypadku kolejność pracy ma jednak znaczenie.


Dla całkowitego nakładu pracy kolejność chyba jednak nie ma znaczenia?

W.


Direct link Reply with quote
 

Jerzy Czopik  Identity Verified
Germany
Local time: 08:52
Member (2003)
Polish to German
+ ...
Poważnie?? Dec 3, 2007

Wojciech Froelich wrote:

Jerzy Czopik wrote:

Dorbną uwagę mam tylko do repetitions - pierwsze wystąpienie danego segmentu będzie wliczane do jakiejś kategorii match, niekoniecznie no match, może być i 100% - w każdym razie w "match" siedzi ten segment tylko raz. Pozostałe jego wystąpienia są repetitions.


Kolejne wystąpienie „setki” nie zostanie zaliczone do „repetitions”. Wyląduje w „setkach”.
Natomiast kolejne wystąpienia niższych „matchy” będą lądować w „repetitions”, co jest niekoniecznie spójne z tym, co można znaleźć w dokumentacji Tradosa...

W.

Skąd to masz - dla mnie nie jest to logiczne...

J.


Direct link Reply with quote
 

Jabberwock  Identity Verified
Poland
Local time: 08:52
Member (2004)
English to Polish
Ależ... Dec 3, 2007

Czy nielogiczne? To zależy od zapatrywań - przecież po zakończeniu pracy mamy (chcemy mieć?) same 100%, a nie część setek, część powtórzeń. Dla mnie akurat takie rozwiązanie jest sensowne...

Direct link Reply with quote
 

Wojciech Froelich  Identity Verified
Poland
Local time: 08:52
English to Polish
Wystarczy zrobić prosty test Dec 4, 2007

Jerzy Czopik wrote:

Wojciech Froelich wrote:

Kolejne wystąpienie „setki” nie zostanie zaliczone do „repetitions”. Wyląduje w „setkach”.
Natomiast kolejne wystąpienia niższych „matchy” będą lądować w „repetitions”, co jest niekoniecznie spójne z tym, co można znaleźć w dokumentacji Tradosa...


Skąd to masz - dla mnie nie jest to logiczne...


Przygotowałem specjalny pliczek i przetestowałem. Baza z jednym segmentem, w pliku cztery zdania, dwa identyczne dające 100%, dwa identyczne dające fuzzy. Zgadnij jaki był rozkład w logu

Wracając do dokumentacji — od dawna w tradosowej dokumentacji stoi, że repetycja to każde drugie i kolejne wystąpienie no-matcha. O fuzzy nawet się nie zająknęli...


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

Trados - analiza; liczba słów

Advanced search






WordFinder
The words you want Anywhere, Anytime

WordFinder is the market's fastest and easiest way of finding the right word, term, translation or synonym in one or more dictionaries. In our assortment you can choose among more than 120 dictionaries in 15 languages from leading publishers.

More info »
SDL MultiTerm 2017
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2017 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2017 you can automatically create term lists from your existing documentation to save time.

More info »



All of ProZ.com
  • All of ProZ.com
  • Term search
  • Jobs