Pages in topic:   [1 2] >
Как это работает? Статистика повторов
Thread poster: Alexander Onishko

Alexander Onishko  Identity Verified
Member (2007)
Russian to English
+ ...
Sep 8, 2010

Вот выдала программа такую статистику -

ICE 100% Matches 100-95% 95-85% 85-75% 75-50% 50-0% Repetitions

Объясните пожалуйста 2 момента -

1. В чём разница между ICE, 100% Matches, и Repetitions ?

2. И как оно, собственно говоря, считает 100% Matches? Если в тексте 2 раза встречается предложение "Маша ела кашу", а в ТМ такого предложения нет? Это что же? В 100% Matches добавится 6 слов, а в 50-0% ничего? Или в 100% Matches добавится 3 слова и в 50-0% 3 слова?

Заранее спасибо!


 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 19:32
Member (2008)
English to Russian
+ ...
могу ошибаться... Sep 8, 2010

Alexander Onishko wrote: 1. В чём разница между ICE, 100% Matches, и Repetitions ?

ICE — это не просто 100%, но и в том же контексте (по идее, система смотрит на соседние сегменты и использует метаданные сегментов в ТМ). В некоторых программах оно еще называется "хю" (XU) или Context Match.
100% — оно и в Африке...
Repetition — это все, что попадается второй и последующие разы (абсолютно все позиции, при первом обнаружении включенные в 99% и ниже, однако, бывают и чудеса).
2. И как оно, собственно говоря, считает 100% Matches? Если в тексте 2 раза встречается предложение "Маша ела кашу", а в ТМ такого предложения нет? Это что же? В 100% Matches добавится 6 слов, а в 50-0% ничего? Или в 100% Matches добавится 3 слова и в 50-0% 3 слова?

Если Маши нет в ТМ, то первое вхождение Маши с кашей пойдет в No-match, все остальные в Repetitions. Если Маша с кашей есть в ТМ и еще и совпадают соседние сегменты, то это ICE.

Как-то так...
Однако Статистика Trados не совпадает с данными Logoport. Последний как-то иначе обрабатывает внутренние повторы (иначе смотрит на ICE и 100).

[Редактировалось 2010-09-08 08:31 GMT]


 

Alexander Onishko  Identity Verified
Member (2007)
Russian to English
+ ...
TOPIC STARTER
>>> Sep 8, 2010

Большое спасибо, Сергей!

 

yanadeni (X)  Identity Verified
Canada
Local time: 12:32
French to Russian
+ ...
У меня тоже вопрос. Sep 10, 2010

Если программа выдала статистику по файлу (без подключения ТМ) - 52% повторений. Это как?

Если у меня 5000 сегментов, из которых 52% - повторения. Сколько сегментов мне надо планировать на перевод? При полном отсутствии ТМ мне по-любому придётся переводить всё. Где-то "Маша ела кашу" я переведу в первый раз. Но я не знаю, сколько раз оно у меня в тексте встречается. Может, 2 раза, а может, 20. И все эти 2 (или 22) сегмента будут входить в эти 52% повторений.

Как тогда планировать свою работу и пользоваться статистикой "кошки"?


 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 20:32
English to Russian
Все просто Sep 10, 2010

Yana Deni wrote:


Если программа выдала статистику по файлу (без подключения ТМ) - 52% повторений. Это как?

Если у меня 5000 сегментов, из которых 52% - повторения. Сколько сегментов мне надо планировать на перевод? При полном отсутствии ТМ мне по-любому придётся переводить всё. Где-то "Маша ела кашу" я переведу в первый раз. Но я не знаю, сколько раз оно у меня в тексте встречается. Может, 2 раза, а может, 20. И все эти 2 (или 22) сегмента будут входить в эти 52% повторений.

Как тогда планировать свою работу и пользоваться статистикой "кошки"?


Это означает, что в тексте содержится 52% внутренних повторов предложений. И рекомендованная в свое время Trados Inc. (мир их памяти) практика такова: 30% от тарифа для [внутренних] повторов и 100% совпадений [с базой].

Подробнее здесь.

[Редактировалось 2010-09-10 05:10 GMT]


 

yanadeni (X)  Identity Verified
Canada
Local time: 12:32
French to Russian
+ ...
... Sep 11, 2010

У меня не о тарифах вопрос, а о планировании времени работы над файлом.
Одно дело - перевести 4000 сегментов примерно одинаковой длины и с предсказуемой терминологией, другое - 2000.

То, что мне программа выдала 52%, в них уже входят first occurences "внутренних повторов" или нет?


 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 20:32
English to Russian
Да... Sep 12, 2010

...входят

 

ingeniero  Identity Verified
Ukraine
Local time: 19:32
English to Russian
+ ...
Нет... Sep 12, 2010

Yana Deni wrote:
То, что мне программа выдала 52%, в них уже входят first occurences "внутренних повторов" или нет?


...не входят, если я правильно понимаю Ваш вопрос.

Если, например, Ваш текст состоит из 4 строк "Маша ела кашу", то при анализе Вы получите 3 No match (25%) (первое вхождение) и 9 Repetitions (75%) (3 оставшиеся вхождения), а не 12 Repetitions (100%), что имело бы место при учете первого вхождения в Repetitions. И это вполне характеризует Ваши затраты на перевод: один раз Вы фразу переведете, а 3 раза подставите из памяти.


 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 20:32
English to Russian
Все не просто... Sep 12, 2010

...а очень просто — подсчитываете количество эквивалентных слов (с учетом к-тов для повторов и совпадений) и по ним уже считаете трудоемкость проекта.

 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 19:32
Member (2008)
English to Russian
+ ...
еще раз... Sep 12, 2010

Yana Deni wrote:
У меня не о тарифах вопрос, а о планировании времени работы над файлом.

Получаем у кошки статистику. Применяем к ней коэффициенты и получаем "эффективные" (приведенные или как-то там еще называемые) слова, т.е. "в пересчете на no-match").
Живой пример:

Context TM - 0 сл. (x0,0)
Repetitions - 28 сл. (x0,15)
100% Matches - 459 сл. (x0,15)
95% - 99% - 272 сл. (x0,3)
85% - 94% - 558 сл. (x0,5)
75% - 84% - 289 сл. (x0,75)
50% - 74% - 0 сл. (x1,0)
No Match - 1122 сл. (x1,0)
Total words - 2728 сл.

Умножив и сложив, мы получим: 1705 эффективных слов (приведенных к no-match). При вполне средней принятой нагрузке в 2500 сл. в день мы потратим на наши 1705 сл. 2/3 дня.

Открою тайну. Используемые коэффициенты касаются не тарифа, а затраченного времени, а потом уже, как следствие, и тарифа.icon_wink.gif

[Редактировалось 2010-09-12 13:54 GMT]


 

yanadeni (X)  Identity Verified
Canada
Local time: 12:32
French to Russian
+ ...
специфика текста Sep 12, 2010

У меня меню на много-много дней (с соответствующими повторами). Там не 2500 в день, а гораздо меньше выйдет, с учётом поиска рецептов (сходу так не переведёшь Harvest Salad) и аналогов в другой культуре.
То, что я пока увидела, перенеся поячеечно текст из пдф в ворд (мартышкина работа!!!), как-то не особо зарядило меня оптимизмом.

И вообще я не робот, чтобы для меня коэффициэнты работали. Есть простые тексты, которые как орешки переводятся, а есть такие, над которыми несколько раз на дню покурить выходишь и переводишь в 3 раза медленнее обычного.


 

Vadim Smyslov  Identity Verified
Russian Federation
Local time: 03:32
English to Russian
+ ...
Курить - здоровью вредить Sep 13, 2010

Yana Deni wrote:
Есть простые тексты, которые как орешки переводятся, а есть такие, над которыми несколько раз на дню покурить выходишь и переводишь в 3 раза медленнее обычного.


На то и статистика, чтобы давать оценку.
Напоминаю цепочку ложь-наглая ложь-статистика.
По делу, коэффициенты ПРИМЕРНО соответствуют экономии трудозатрат. То есть, если коэффициенты определены правильно, то эквивалентный объем, пересчитанный с учетом повторов и займет столько времени, сколько сплошной новый текст того же объема без ТМ.
Другое дело, что заказчик норовить эти коэффициенты уменьшить, а переводчику выгодно их увеличить, или вообще использовать ТМ там, где заказчик это не имел в виду.
А то, что тексты бывают сами по себе очень разные по скорости, это всем понятно. Соответственно должна изменяться и оплата.
Задачей переводчика в данном случае становится не просто опираться на эквивалентный объем, но и смотреть, как он формируется коэффициентами, особенно с новыми заказчиками.
Здесь же всплывает тема переводить или не переводить (оплачены или не оплачены) 100-% совпадения.


 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 20:32
English to Russian
В зоопарке тигру недокладывают мяса! Спасайте... Sep 13, 2010

...хищника, пока не поздно! ©

Yana Deni wrote:

И вообще я не робот, чтобы для меня коэффициэнты работали. Есть простые тексты, которые как орешки переводятся, а есть такие, над которыми несколько раз на дню покурить выходишь и переводишь в 3 раза медленнее обычного.


Коллега, Вы спросили — Вам ответили. Очень подробно. Разные люди.

Теперь оказывается, что отвечали не так и вообще не о том.

Зачем тогда было спрашивать? Попытка делегировать ответственность за возможные собственные ошибки к комьюнити (это известный трюк в психологии)?

[Редактировалось 2010-09-13 05:01 GMT]

[Редактировалось 2010-09-13 05:21 GMT]


 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 20:32
English to Russian
Да проще все... Sep 13, 2010

...чем нам пытаются впарить.

Коллега raskas, тут налицо ситуация, когда (со слов аскерши) тексты имеют повышенную сложность (для аскерши?). Если все это соответствует — то можно биться за отмену к-в, упирая на этот факт.

Если же это следствие недостатка персонального опыта — то можно воспринять это как дар свыше и возможность прокачать имеющиеся скилзы. Выклянчив чуть больше времени.


 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 19:32
Member (2008)
English to Russian
+ ...
... Sep 13, 2010

Yana Deni wrote: сходу так не переведёшь Harvest Salad

Когда там у нас урожай? В августе? (по укр. - серпень...) Значит будет «Салат "Летний"»... Дополнительные размышления и креатив типа «Время урожая», «Танец дождя на закате» или «Уставшее сердце пингвина» — +15%.
Yuriy Vassilenko wrote: Зачем тогда было спрашивать?

Я всегда рекомендую исходить из таких соображений: не нравится ответ — не задавай вопрос.

А про оценку человеко-часов я уже сказал. И после меня еще 2 раза сказали.icon_wink.gif


 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Как это работает? Статистика повторов

Advanced search


Translation news in Russian Federation





SDL MultiTerm 2019
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2019 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2019 you can automatically create term lists from your existing documentation to save time.

More info »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search