Небольшой мануальчик по вёрстке для CAT
Thread poster: mikhailo

mikhailo
Local time: 23:27
English to Russian
+ ...
May 8

Видя живой интерес к вопросу со стороны отдельных лиц, набросал небольшую инструкцию по верстке документов для программ автоматизированного перевода (CAT).
Старался кратенько, ибо если тему разжёвывать до мелочей и с иллюстрациями может получиться хороший гроссбух, читать который современная молодёжь вряд ли станет.

Как всегда замечания и предложения по усовершенствованию are welcome.
http://transfiles.ru/g5453


 

A.Petrova

Local time: 23:27
English to Russian
Повторите, пожалуйста Jun 6

Не могли бы Вы еще раз выложить файл, пожалуйста!

 

VIP9N
Local time: 23:27
Russian to English
+ ...
Ссылка Jun 6

A.Petrova wrote:
Не могли бы Вы еще раз выложить файл, пожалуйста!


Надеюсь, Михайло не обидится. Я скачал созданный и предлагаемый им материал по ссылке в Городе переводчиков и полностью прочёл его.
https://mega.nz/#!ithBAA6C!mtOaQBSdLGeaSQ95w9mveFndX2dkFsEbJFNw4k5f6QY
Скажу, что направление и посылы очень верные.

Единственно, кто бы ещё начинающим втолковал, что правильное использование OCR-систем для САТ-ов подразумевает исключительно сохранение сути распознанного (чистый ТХТ с последующим форматированием руками), а не формы, когда «распознанный» ворд невозможно нормально дальше обрабатывать в САТ-ах.


 

A.Petrova

Local time: 23:27
English to Russian
Спасибо! Jun 6

Огромное спасибо, Михайло и VIP9N! Интересный материал.
VIP9N wrote:
Единственно, кто бы ещё начинающим втолковал, что правильное использование OCR-систем для САТ-ов подразумевает исключительно сохранение сути распознанного (чистый ТХТ с последующим форматированием руками), а не формы, когда «распознанный» ворд невозможно нормально дальше обрабатывать в САТ-ах.

Думаю, те, кто работает с этими самыми начинающими и растолковывают, по мере возникновения соответствующих проблем)) А бывают и начинающие догадливые...


 

VIP9N
Local time: 23:27
Russian to English
+ ...
Бывают, конечно Jun 7

A.Petrova wrote:
...Думаю, те, кто работает с этими самыми начинающими и растолковывают, по мере возникновения соответствующих проблем)) А бывают и начинающие догадливые...


Только, как показывает моя личная статистика последних лет 15-20 (когда началось действительно массовое использование OCR), этих догадливых, обычно, процентов 10-12 из 100 набирается.

Как правило, диалоги со случайными заказчиками идут вот так:
- Здравствуйте, нам вас рекомендовали такие-то. У нас есть в перевод такие-то документы. Страниц 20-30 по такой-то цене до такого-то числа. Возьмёте?
- Да, здравствуйте. Сроки нормальные. А в каком виде виде у вас исходный оригинал?
- В электронном. Можем прислать на почту.
- Это хорошо, но я спрашиваю в редактируемом или нет. Это Ворд или картинка, картинка в пдф?
- Ну, в пдф. А какая разница? Кидаете в Файнридер и через 10 секунд у вас редактируемый Ворд.
- Не всё так просто. Вам же нужно качественно и достаточно быстро сделать, правильно? В общем, вы отправьте на электронку, я гляну и вам отпишусь.

А дальше всё просто. Если там какая-нибудь мелочь с несложным форматированием (например, устав компании «Рога и копыта» или бухбаланс табличный или договор и т.д.) и цена-сроки устраивает, то соглашаешься, ибо форматирования там немного. Но если, например, это кредитное соглашение, страниц на 150-200, которое юридические секретари «вылизывали» пару дней (со всеми перекрёстными ссылками-сносками), а потом отдали в срочный перевод на сторону в виде пдф (пусть и реального, не графического), то от такого заказа лучше воздержаться. Просто только от трети до половины предлагаемого срока потребуется на то, чтобы воспроизвести такой док в Ворде. Да и не особо интересно мне форматированием заниматься, если честно. У форматирования лишь один существенный плюс. Пока форматируешь, успеваешь изучить весь документ в целом.

Бывает и известные в Москве бюро присылают настолько отвратительно распознанные доки (с кучей паразитных кодов и битыми строками (когда одно предложение оказывается разнесённым на несколько несвязанных строк)), что диву даёшься. Случалось, когда в работу присылали документы на французском без диакритики вовсе (а зачем, у нас ведь «ё» тоже как бы на отшибе живёт, так же, наверное, и у французов, не? Они что, все эти значки реально над буквами пишут?icon_smile.gif ) и с кучей ошибок распознавания. Объяснения, что эти моменты замедляют работу (вам приходится намного больше раз прочитывать одно и то же, догадываться что там изначально было написано, а сегменты ваших TMX просто не видятся системой) просто не катят. Процентов 10 заказчиков только смутно понимают о чём вообще речь идёт.

Поэтому наставление от Михайло - хороший документ, как ни крути.


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Небольшой мануальчик по вёрстке для CAT

Advanced search


Translation news in Russian Federation





SDL MultiTerm 2019
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2019 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2019 you can automatically create term lists from your existing documentation to save time.

More info »
WordFinder Unlimited
For clarity and excellence

WordFinder is the leading dictionary service that gives you the words you want anywhere, anytime. Access 260+ dictionaries from the world's leading dictionary publishers in virtually any device. Find the right word anywhere, anytime - online or offline.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search