Pages in topic:   [1 2] >
Как это работает? Статистика повторов
Thread poster: Alexander Onishko

Alexander Onishko  Identity Verified
Local time: 02:48
Member (2007)
Russian to English
+ ...
Sep 8, 2010

Вот выдала программа такую статистику -

ICE 100% Matches 100-95% 95-85% 85-75% 75-50% 50-0% Repetitions

Объясните пожалуйста 2 момента -

1. В чём разница между ICE, 100% Matches, и Repetitions ?

2. И как оно, собственно говоря, считает 100% Matches? Если в тексте 2 раза встречается предложение "Маша ела кашу", а в ТМ такого предложения нет? Это что же? В 100% Matches добавится 6 слов, а в 50-0% ничего? Или в 100% Matches добавится 3 слова и в 50-0% 3 слова?

Заранее спасибо!


Direct link Reply with quote
 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 02:48
Member (2008)
English to Russian
+ ...
могу ошибаться... Sep 8, 2010

Alexander Onishko wrote: 1. В чём разница между ICE, 100% Matches, и Repetitions ?

ICE — это не просто 100%, но и в том же контексте (по идее, система смотрит на соседние сегменты и использует метаданные сегментов в ТМ). В некоторых программах оно еще называется "хю" (XU) или Context Match.
100% — оно и в Африке...
Repetition — это все, что попадается второй и последующие разы (абсолютно все позиции, при первом обнаружении включенные в 99% и ниже, однако, бывают и чудеса).
2. И как оно, собственно говоря, считает 100% Matches? Если в тексте 2 раза встречается предложение "Маша ела кашу", а в ТМ такого предложения нет? Это что же? В 100% Matches добавится 6 слов, а в 50-0% ничего? Или в 100% Matches добавится 3 слова и в 50-0% 3 слова?

Если Маши нет в ТМ, то первое вхождение Маши с кашей пойдет в No-match, все остальные в Repetitions. Если Маша с кашей есть в ТМ и еще и совпадают соседние сегменты, то это ICE.

Как-то так...
Однако Статистика Trados не совпадает с данными Logoport. Последний как-то иначе обрабатывает внутренние повторы (иначе смотрит на ICE и 100).

[Редактировалось 2010-09-08 08:31 GMT]


Direct link Reply with quote
 

Alexander Onishko  Identity Verified
Local time: 02:48
Member (2007)
Russian to English
+ ...
TOPIC STARTER
>>> Sep 8, 2010

Большое спасибо, Сергей!

Direct link Reply with quote
 
xxxyanadeni  Identity Verified
Canada
Local time: 19:48
French to Russian
+ ...
У меня тоже вопрос. Sep 10, 2010

Если программа выдала статистику по файлу (без подключения ТМ) - 52% повторений. Это как?

Если у меня 5000 сегментов, из которых 52% - повторения. Сколько сегментов мне надо планировать на перевод? При полном отсутствии ТМ мне по-любому придётся переводить всё. Где-то "Маша ела кашу" я переведу в первый раз. Но я не знаю, сколько раз оно у меня в тексте встречается. Может, 2 раза, а может, 20. И все эти 2 (или 22) сегмента будут входить в эти 52% повторений.

Как тогда планировать свою работу и пользоваться статистикой "кошки"?


Direct link Reply with quote
 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 02:48
English to Russian
Все просто Sep 10, 2010

Yana Deni wrote:


Если программа выдала статистику по файлу (без подключения ТМ) - 52% повторений. Это как?

Если у меня 5000 сегментов, из которых 52% - повторения. Сколько сегментов мне надо планировать на перевод? При полном отсутствии ТМ мне по-любому придётся переводить всё. Где-то "Маша ела кашу" я переведу в первый раз. Но я не знаю, сколько раз оно у меня в тексте встречается. Может, 2 раза, а может, 20. И все эти 2 (или 22) сегмента будут входить в эти 52% повторений.

Как тогда планировать свою работу и пользоваться статистикой "кошки"?


Это означает, что в тексте содержится 52% внутренних повторов предложений. И рекомендованная в свое время Trados Inc. (мир их памяти) практика такова: 30% от тарифа для [внутренних] повторов и 100% совпадений [с базой].

Подробнее здесь.

[Редактировалось 2010-09-10 05:10 GMT]


Direct link Reply with quote
 
xxxyanadeni  Identity Verified
Canada
Local time: 19:48
French to Russian
+ ...
... Sep 11, 2010

У меня не о тарифах вопрос, а о планировании времени работы над файлом.
Одно дело - перевести 4000 сегментов примерно одинаковой длины и с предсказуемой терминологией, другое - 2000.

То, что мне программа выдала 52%, в них уже входят first occurences "внутренних повторов" или нет?


Direct link Reply with quote
 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 02:48
English to Russian
Да... Sep 12, 2010

...входят

Direct link Reply with quote
 

ingeniero  Identity Verified
Ukraine
Local time: 02:48
English to Russian
+ ...
Нет... Sep 12, 2010

Yana Deni wrote:
То, что мне программа выдала 52%, в них уже входят first occurences "внутренних повторов" или нет?


...не входят, если я правильно понимаю Ваш вопрос.

Если, например, Ваш текст состоит из 4 строк "Маша ела кашу", то при анализе Вы получите 3 No match (25%) (первое вхождение) и 9 Repetitions (75%) (3 оставшиеся вхождения), а не 12 Repetitions (100%), что имело бы место при учете первого вхождения в Repetitions. И это вполне характеризует Ваши затраты на перевод: один раз Вы фразу переведете, а 3 раза подставите из памяти.


Direct link Reply with quote
 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 02:48
English to Russian
Все не просто... Sep 12, 2010

...а очень просто — подсчитываете количество эквивалентных слов (с учетом к-тов для повторов и совпадений) и по ним уже считаете трудоемкость проекта.

Direct link Reply with quote
 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 02:48
Member (2008)
English to Russian
+ ...
еще раз... Sep 12, 2010

Yana Deni wrote:
У меня не о тарифах вопрос, а о планировании времени работы над файлом.

Получаем у кошки статистику. Применяем к ней коэффициенты и получаем "эффективные" (приведенные или как-то там еще называемые) слова, т.е. "в пересчете на no-match").
Живой пример:

Context TM - 0 сл. (x0,0)
Repetitions - 28 сл. (x0,15)
100% Matches - 459 сл. (x0,15)
95% - 99% - 272 сл. (x0,3)
85% - 94% - 558 сл. (x0,5)
75% - 84% - 289 сл. (x0,75)
50% - 74% - 0 сл. (x1,0)
No Match - 1122 сл. (x1,0)
Total words - 2728 сл.

Умножив и сложив, мы получим: 1705 эффективных слов (приведенных к no-match). При вполне средней принятой нагрузке в 2500 сл. в день мы потратим на наши 1705 сл. 2/3 дня.

Открою тайну. Используемые коэффициенты касаются не тарифа, а затраченного времени, а потом уже, как следствие, и тарифа.

[Редактировалось 2010-09-12 13:54 GMT]


Direct link Reply with quote
 
xxxyanadeni  Identity Verified
Canada
Local time: 19:48
French to Russian
+ ...
специфика текста Sep 12, 2010

У меня меню на много-много дней (с соответствующими повторами). Там не 2500 в день, а гораздо меньше выйдет, с учётом поиска рецептов (сходу так не переведёшь Harvest Salad) и аналогов в другой культуре.
То, что я пока увидела, перенеся поячеечно текст из пдф в ворд (мартышкина работа!!!), как-то не особо зарядило меня оптимизмом.

И вообще я не робот, чтобы для меня коэффициэнты работали. Есть простые тексты, которые как орешки переводятся, а есть такие, над которыми несколько раз на дню покурить выходишь и переводишь в 3 раза медленнее обычного.


Direct link Reply with quote
 
Vadim Smyslov  Identity Verified
Russian Federation
Local time: 09:48
English to Russian
+ ...
Курить - здоровью вредить Sep 13, 2010

Yana Deni wrote:
Есть простые тексты, которые как орешки переводятся, а есть такие, над которыми несколько раз на дню покурить выходишь и переводишь в 3 раза медленнее обычного.


На то и статистика, чтобы давать оценку.
Напоминаю цепочку ложь-наглая ложь-статистика.
По делу, коэффициенты ПРИМЕРНО соответствуют экономии трудозатрат. То есть, если коэффициенты определены правильно, то эквивалентный объем, пересчитанный с учетом повторов и займет столько времени, сколько сплошной новый текст того же объема без ТМ.
Другое дело, что заказчик норовить эти коэффициенты уменьшить, а переводчику выгодно их увеличить, или вообще использовать ТМ там, где заказчик это не имел в виду.
А то, что тексты бывают сами по себе очень разные по скорости, это всем понятно. Соответственно должна изменяться и оплата.
Задачей переводчика в данном случае становится не просто опираться на эквивалентный объем, но и смотреть, как он формируется коэффициентами, особенно с новыми заказчиками.
Здесь же всплывает тема переводить или не переводить (оплачены или не оплачены) 100-% совпадения.


Direct link Reply with quote
 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 02:48
English to Russian
В зоопарке тигру недокладывают мяса! Спасайте... Sep 13, 2010

...хищника, пока не поздно! ©

Yana Deni wrote:

И вообще я не робот, чтобы для меня коэффициэнты работали. Есть простые тексты, которые как орешки переводятся, а есть такие, над которыми несколько раз на дню покурить выходишь и переводишь в 3 раза медленнее обычного.


Коллега, Вы спросили — Вам ответили. Очень подробно. Разные люди.

Теперь оказывается, что отвечали не так и вообще не о том.

Зачем тогда было спрашивать? Попытка делегировать ответственность за возможные собственные ошибки к комьюнити (это известный трюк в психологии)?

[Редактировалось 2010-09-13 05:01 GMT]

[Редактировалось 2010-09-13 05:21 GMT]


Direct link Reply with quote
 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 02:48
English to Russian
Да проще все... Sep 13, 2010

...чем нам пытаются впарить.

Коллега raskas, тут налицо ситуация, когда (со слов аскерши) тексты имеют повышенную сложность (для аскерши?). Если все это соответствует — то можно биться за отмену к-в, упирая на этот факт.

Если же это следствие недостатка персонального опыта — то можно воспринять это как дар свыше и возможность прокачать имеющиеся скилзы. Выклянчив чуть больше времени.


Direct link Reply with quote
 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 02:48
Member (2008)
English to Russian
+ ...
... Sep 13, 2010

Yana Deni wrote: сходу так не переведёшь Harvest Salad

Когда там у нас урожай? В августе? (по укр. - серпень...) Значит будет «Салат "Летний"»... Дополнительные размышления и креатив типа «Время урожая», «Танец дождя на закате» или «Уставшее сердце пингвина» — +15%.
Yuriy Vassilenko wrote: Зачем тогда было спрашивать?

Я всегда рекомендую исходить из таких соображений: не нравится ответ — не задавай вопрос.

А про оценку человеко-часов я уже сказал. И после меня еще 2 раза сказали.


Direct link Reply with quote
 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Как это работает? Статистика повторов

Advanced search


Translation news in Russian Federation





CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use SDL Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

More info »
memoQ translator pro
Kilgray's memoQ is the world's fastest developing integrated localization & translation environment rendering you more productive and efficient.

With our advanced file filters, unlimited language and advanced file support, memoQ translator pro has been designed for translators and reviewers who work on their own, with other translators or in team-based translation projects.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search