Pages in topic:   [1 2 3 4] >
Полезные советы (Tips and Tricks)
Thread poster: Eugene Gulak

Eugene Gulak  Identity Verified
Ukraine
Local time: 10:19
Member (2007)
English to Russian
+ ...
May 24, 2009

Предлагаю в этой ветке делиться и обсуждать нестандартные, недокументированные приемы работы в самых разных программах для переводчиков, которыми мы все в большей или меньшей степени пользуемся.

Толчком для создания этой темы послужила давняя ветка Сергея Туманова http://www.proz.com/forum/russian/104908-И_заплакали_тут_все_швамбраны_и_швабранки.html. На мой взгляд, очень даже здорово описан (и проиллюстрирован!) процесс работы со злобным Мультитермом.

Наверняка, у каждого из нас за годы работы накопились какие-то приемы, способы, методы борьбы с неподдающимся, сопротивляющимся, вроде бы, материалом, позволяющие этот самый материал обработать и вернуть заказчику в лучшем виде.

Наверняка, перед каждым из нас в свое время стояла какая-нибудь не вполне тривиальная задача, решение которой, на первый взгляд, требовало значительных ручных усилий, но, после некоторых размышлений, экспериментов и т.д., находился способ, позволяющий разрешить ее с минимальными затратами.

Давайте поделимся друг с другом этими приемами работы. На дворе, вроде бы, кризис. По моим субъективным ощущениям, работы стало меньше, а свободного времени - больше (дай-то Бог, чтобы я ошибался). Если есть у кого-то время, давайте попробуем описать каждый свою технологию решения той или иной задачи. Trados, Multiterm, SDLX, DejaVu, MemoQ, Transit, Metatexis, Across, XBench и т.д. - все приветствуется!

В качестве примера попробую описать один из таких способов в следующем постинге.


Direct link Reply with quote
 

Eugene Gulak  Identity Verified
Ukraine
Local time: 10:19
Member (2007)
English to Russian
+ ...
TOPIC STARTER
Конвертация двуязычного файла Trados Word в TagEditor TTX May 24, 2009

Вот, например, присылает заказчик комплект двуязычных файлов в формате Word, да еще и предварительно переведенных (подставлены 100-процентные и частичные совпадения). А мне, например, не нравится работать в вордовском формате, я предпочитаю TagEditor (или, например, на редактуру приходят такие файлы, а я бы хотел воспользоваться QA-чекером, который работает только в TagEditor). В лоб конвертировать вордовский двуязычный файл в TTX у меня никогда не получалось. Каждый раз говорит, ошибка, мол, This file cannot be processed as TTX because it was saved as a bilingual document in Word или что-то в этом роде.

В этом случае можно воспользоваться SDLX.

1. Конвертируем полученный двуязычный вордовский файл в SDLX. Для этого можно щелкнуть правой кнопкой мыши в Проводнике нужный файл и выбрать из контекстного меню Translate with SDLX (это в том случае, если в SDLX изначально активирован параметр Enable SDLX items on context menu - я не помню, активируется ли он по умолчанию при установке или его нужно включить вручную).
Если же такого пункта в контекстном меню нет, нужно запустить SDLX, открыть модуль Edit, выбрать Fle - New Translation и указать в открывшемся диалоговом окне двуязычный файл Word, установив соответствующие параметры.
Открывается файл .itd с двумя колонками - исходным текстом и текстом перевода, в котором сохранены 100-процентные и частичные совпадения из исходного двуязычного файла Word.

2. Конвертируем файл .itd SDLX в формат TagEditor:
File - Trados - Export to TRADOStag TTX format.

И все! Открываем полученный файл в TagEditor, вносим необходимые изменения, сохраняем и закрываем.

Если заказчик хочет получить нечищенный вордовский файл, выполняем обратную процедуру.
Открываем файл .itd, который получился у нас на первом этапе конвертации вордовского файла в SDLX.
Выбираем File - Trados - Harvest exported TRADOStag TTX translation. Все изменения, которые были внесены в TagEditor, переносятся в itd-файл.
Выбираем File - Create Translation.
Получаем двуязычный нечищенный вордовский файл. Его можно смело отправлять заказчику, который даже и не заподозрит, что вы работали в каких-то других программах, помимо Ворда.

Вот такая вот история.

[Редактировалось 2009-05-24 23:41 GMT]


Direct link Reply with quote
 

Nadezhda & Vatslav Yehurnovy  Identity Verified
Ukraine
Local time: 10:19
Member (2008)
English to Russian
+ ...
Работа в Idiom Workbench без использования оной программы May 25, 2009

Одно время буквально "сыпались" заказы в такой вот программе, как Idiom Workbench. Причем мелкие и скопом. А обучать пользоваться этой весьма своеобразной программой весь наш семейно-кумовской подряд было и некогда, и не рационально.

Соответственно, началось использование дядюшки Рисёча. Выяснилось следующее:
1. Файлы присылались в формате *.xlz
2. На самом деле, это хитрым образом замаскированный файл в формате *.zip
3. Если этот файл распаковать, имеем нечто в формате *.xlf
4. А вот этот файл уже понимает SDLX, точнее, его XLIFF Wizard.
5. Теперь имеем файл *.itd, правда, вместо отсутствующего текста перевода стоит {\0} или что-то около того, а теги тоже идут открытым текстом и нужно быть внимательным, чтобы их не покорежить.
6. Если SDLX "не нравится", или если уже на похожую тематику есть традосовская память и ее неохота перегонять в SDLX - можно воспользоваться мастером Convert SDLX to TagEditor, перевести все в Тагедиторе и выполнить обратную операцию: Harvest exported TRADOStag TTX.
7. Файл *.itd с переводом чистим с помощью Project Wizard или еще как-нибудь и вуаля, имеем *.xlf уже с переводом.
8. Архивируем результат в формате *.zip и переименовываем его в *.xlz
9. При необходимости открываем файл в Idiom Workbench и "всем скопом" сегментам присваиваем статус "Translated" или "Approved". Экспортируем как *.xlz и вручаем довольному соблюдением единства терминологии заказчику.
Ну и в самом Idiom'е можно проверить и соблюдение тегов, и орфографию, и т.п.

Весь процесс конвертирования "туда" занимает не более 2-3 минут, "обратно" - примерно столько же. Вся прелесть еще и в том, что в формате *.itd уже можно всячески делить огромный файл на части и сливать воедино кучу мелких кусочков. Но это уже из области документированного


Direct link Reply with quote
 

Eugene Gulak  Identity Verified
Ukraine
Local time: 10:19
Member (2007)
English to Russian
+ ...
TOPIC STARTER
Склеивание itd-файлов May 25, 2009

Nadezhda & Vatslav Yehurnovy wrote:

Вся прелесть еще и в том, что в формате *.itd уже можно всячески делить огромный файл на части и сливать воедино кучу мелких кусочков. Но это уже из области документированного


Насколько мне известно, в SDLX можно разделить один большой файл на несколько мелких, а впоследствии склеить эти мелкие в один исходный большой. А вот обратной процедуры разработчики по непонятным мне причинам не предусмотрели. Присылает, например, заказчик пару сотен файлов itd хоть на перевод, хоть на редактуру, и каждый файл состоит из 5-10 сегментов. Геморрой невероятный.

Возможно, есть какой-нибудь простой способ объединения этой сотни файлов в один, но я его не нашел. Если кто знает, поделитесь, пожалуйста. Я же пока придумал вот что (немного похоже на почесывание правого уха левой рукой, но работает).

1. При помощи мастера SDL Exchange пакетно конвертируем файлы itd в формат ttx (Convert SDLX to TagEditor).
2. С помощью приблуды SDL Trados Glue (входит в состав SDL Trados 2007, насчет более ранних версий не помню) склеиваем получившиеся файлы ttx в один мастер-файл (чтоб разработчики всю жизнь выбирали файлы в таких неудобных окнах!).
3. С помощью того же SDL Exchange конвертируем получившийся мастер-файл ttx в формат itd.
4. Открываем большой itd в SDLX и работаем. Есть и здесь свои маленькие радости. Сегменты, которые были заблокированы в исходных itd-файлах, при использовании этой процедуры не экспортируются. Поэтому, если, например, заказчик не оплачивает 100-процентные совпадения, их можно просто пакетно заблокировать перед конвертацией маленьких itd в ttx (SDLX - Utilities - Lock segments - 100% matched). В большом склеенном файле их не будет. Можно также в полном объеме воспользоваться преимуществами функции Autopropagation - файл-то один, значит все повторения будут автоматически подставляться, что в случае с сотней файлов не получается.
5. По завершении работы выполняем обратную процедуру. При помощи SDL Exchange конвертируем готовый itd-файл обратно в ttx (Export SDLX back to TagEditor). Получившийся мастер-файл открывать не нужно, иначе почему-то возникает еще один мастер-файл с разрешением .ttx.ttx и можно запутаться, с каким же из них работать дальше.
6. Расклеиваем большой мастер-файл ttx при помощи SDL Trados Glue (Unglue). Получившиеся мелкие ttx-файлы тоже не пытаемся открыть, потому что все равно не получится (по крайней мере, мне он все время говорит Error reading TTX file: Expected end of tag 'Raw' - черт его знает, что это значит). В конце концов, SDL ведь все равно не гарантирует корректной работы Trados Glue (Note that the SDL Trados Glue is not part of the official SDLX or SDL Trados product offering and is not officially covered by SDL Trados support. Use at your own risk - странноватое заявление, не правда ли?) С другой стороны, нам и не нужно открывать ttx-файлы: нужно ведь получить исходные itd.
8а. При помощи SDL Exchange собираем урожай из ttx-файлов (Harvest TagEditor in to SDLX) и читаем сообщение: Files processed: 0. The TTX file was not generated from an ITD file.
Поэтому прежде чем приступать к 8 пункту после расклеивания большого мастер-файла ttx, нужно немного пошаманить с маленькими ttx-файлами.
7. Файл ttx, как известно, по сути представляет собой xml-файл, который, в свою очередь, является не более чем обычным текстовым файлом. Поэтому его можно открыть в любом текстовом редакторе (том же ноутпэде) и немножко поредактировать.
Весь фокус тут в том, что SDLX при конвертации в TagEditor запоминает файл-источник, чтобы впоследствии сообразить, куда же импортировать сделанные в TagEditor переводы. Поэтому в заголовке экспортированного ttx-файла присутствует приблизительно такая строка: SourceDocumentPath="path_filename.itd", где path и filename - путь к файлу и его имя соответственно. Однако же после манипуляций с Trados Glue в качестве файла-источника в заголовке ttx уже указывается несколько иное: SourceDocumentPath="path_filename.itd.ttx". SDLX, естественно, не понимает, что это его исходный файл, и отфутболивает его.
Поэтому все, что нужно сделать, - это открыть ttx-файл в текстовом редакторе и поменять строку ".itd.ttx" на ".itd".
Понятно, что вручную проделывать это с сотней файлов нецелесообразно. Имеет смысл воспользоваться какой-нибудь grep-утилитой, способной производить множественный поиск-замену в пакетном режиме. Я пользуюсь для этих целей PowerGrep. Однако в сети существует множество бесплатных подобных программ. Достаточно набрать в гугле "search and replace in multiple files".
8б. После такой замены SDL Exchange корректно импортирует все ttx-файлы обратно. Готово!

Несмотря на такое длинное описание, вся процедура конвертирования туда-обратно, склеивания и расклеивания, поиска-замены и т.д. занимает всего лишь несколько минут. Времени же в результате экономится несопоставимо больше.

В качестве альтернативы можно, конечно, экспортировать itd-файлы в Дежа Вю и работать там. Но это отдельная тема, потому что сделать это в лоб тоже получается не всегда.


Direct link Reply with quote
 

Eugene Gulak  Identity Verified
Ukraine
Local time: 10:19
Member (2007)
English to Russian
+ ...
TOPIC STARTER
Idiom - SDLX May 25, 2009

Nadezhda & Vatslav Yehurnovy wrote:

1. Файлы присылались в формате *.xlz
2. На самом деле, это хитрым образом замаскированный файл в формате *.zip
3. Если этот файл распаковать, имеем нечто в формате *.xlf


Реально попробовал, получилось! Спасибо!
Вот только в пакете xlz, помимо файла xlf, заказчик еще прислал два файла: .xml и .tbx. Как я понимаю, в этих файлах зашиты ТМ и ТВ. Как их оттуда вытащить? Есть какие-нибудь идеи? Файлы, по сути, xml.


Direct link Reply with quote
 

Nadezhda & Vatslav Yehurnovy  Identity Verified
Ukraine
Local time: 10:19
Member (2008)
English to Russian
+ ...
Идея не может не есть :) May 26, 2009

Eugene Gulak wrote:

Вот только в пакете xlz, помимо файла xlf, заказчик еще прислал два файла: .xml и .tbx. Как я понимаю, в этих файлах зашиты ТМ и ТВ. Как их оттуда вытащить? Есть какие-нибудь идеи? Файлы, по сути, xml.

Идея есть, но она довольно громоздкая и подразумевает использование самого Идиома.
1. Открыть в Idiom присланный пакет, ТМ и ТВ будут автоматически созданы в служебных папках Idiom.
2. Открыть эти созданные ТМ (и, наверное, ТВ, но мне ТВ не присылали) "в лоб" с помощью любой СУБД, например, MS Access.
3. В числе прочего, в базе данных ТМ есть замечательная таблица "Sentences". В ней есть столбцы ID, Lang и Sentence. По комбинации ID и Lang с помощью запросов можно выделить два списка предложений из Sentences, сохранить их как что-либо "съедобное" для WinAlign - и дело в шляпе.


Direct link Reply with quote
 

Maxim Manzhosin  Identity Verified
Russian Federation
Local time: 11:19
Member (2008)
English to Russian
Что в xml? May 26, 2009

Что содержится в этом xml?
Если заголовок такой —

!DOCTYPE tmx SYSTEM "tmx14.dtd"

tmx version="1.4"

— то это формат TMX. C TMX и TBX замечательно работает ApSic Xbench.


Direct link Reply with quote
 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 10:19
Member (2008)
English to Russian
+ ...
можно и так... May 26, 2009

есть Logoport XLIFF Editor. Им и открываем наши XLZ-файлы. Работает с XLZ-пакетом, как с одним файлом. Автоматически подхватывает все пакеты в папке и выстраивает рабочий список. Если не ошибаюсь, то может работать и с локальной памятью.

[Редактировалось 2009-05-26 08:30 GMT]


Direct link Reply with quote
 

Arkady Vysotsky  Identity Verified
Local time: 10:19
English to Ukrainian
+ ...
Содержимое XLZ May 26, 2009

ТМ, если есть, зашита в заголовке XLF-файла и в редакторе не отображается. Можно достать ее, открыв XLF в текстовом редакторе или через Access, как предлагает Вацлав.
XML-файл - спецификации и ограничения для ТB, языковых данных там нет.
О поддержке TBX заявлено в Across, ApSic Xbench, Swordfish, Heartsome Dictionary Editor и PROMT NET Professional 8.5. Но по крайней мере первые две программы не могут открыть TBX-файл из пакета Idiom. Тогда можно также воспользоваться Access (открыть файл .wstd, таблица Lemmas).


Direct link Reply with quote
 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 11:19
English to Russian
Вызываем "синий экран смерти" сами May 26, 2009

"Синий экран смерти" (Blue Screen of Death/BSOD) — это встроенный механизм перехвата ошибок, которые могут привести к повреждению данных или системы в целом. Такая ситуация возникает, когда появляются неполадки в функционировании встроенных служб или программ пользователя. Внешне это проявляется как внезапная остановка работы среды Windows с выдачей на экран технической информации на синем фоне. После этого остается только перегрузить систему.

Такую ситуацию можно вызвать и вручную, искусственно прервав работу Windows. Такая необходимость может возникнуть, если, например, система не реагирует на нажатие знаменитых [Ctrl]+[Alt]+[Del] (при использовании кнопки Reset завершение работы будет грубым). Сочетание клавиш для вызова BSOD следующее: удерживая правый [Ctrl], два раза нажмите на [Scroll Lock]. Для того чтобы система распознавала данную комбинацию, сделайте следующее:

1. Запустите редактор реестра (regedit.exe);
2. Откройте ветвь [HKEY_LOCAL_ MACHINE\ SYSTEM\ CurrentControlSet\ Services\ i8042prt\ Parameters];
3. В меню "Правка" выберите "Создать" — "Параметр DWORD";
4. Введите имя "CrashOnCtrlScroll", нажмите [Enter];
5. Дважды щелкнув мышкой на созданном ключе, задайте любое ненулевое значение, например "1". Нажмите OK;
6. Закройте редактор реестра и перегрузите систему.


Direct link Reply with quote
 

Eugene Efremov  Identity Verified
Russian Federation
Local time: 11:19
Member (2012)
French to Russian
+ ...
Вопрос по поводу установки параметров Oct 11, 2012


Если же такого пункта в контекстном меню нет, нужно запустить SDLX, открыть модуль Edit, выбрать Fle - New Translation и указать в открывшемся диалоговом окне двуязычный файл Word, установив соответствующие параметры.


Скажите, а какие "соответствующие параметры" устанавливать для двуязычного файла?


Direct link Reply with quote
 

Hna
Local time: 10:19
English to Russian
Сочетание клавиш не работает Nov 17, 2013

Не могу понять особенность.
Предпочитаю использовать клавиши на клавиатуре, а не мышки. Открываю XLIFF Editor - все работает. Например, изменение регистра - Ctrl+U.
На следующий день открываю тот-же файл, уже сочетание клавиш не работает.
Чтобы изменить регистр, надо несколько раз открыть пункт Edit и изменить регистр.
Может кнопка какая есть хитрая?
P.S. Восстанавливается новым запуском программы. Сообщение можно удалить.

[Редактировалось 2013-11-17 11:05 GMT]


Direct link Reply with quote
 

Oleg Delendyk
Ukraine
Local time: 10:19
English to Russian
+ ...
Давайте отличать перегрузку от перезагрузки Nov 18, 2013

Yuriy Vassilenko wrote:

После этого остается только перегрузить систему.

6. Закройте редактор реестра и перегрузите систему.


Не все помнят, как опозорилась Хиллари Клинтон с кнопкой "Перегрузка" перед Сергеем Лавровым?


Direct link Reply with quote
 

Nadezhda & Vatslav Yehurnovy  Identity Verified
Ukraine
Local time: 10:19
Member (2008)
English to Russian
+ ...
И по теме. Dec 3, 2013

Многих переводчиков сейчас начинают совращать всяческими онлайновыми "тулами", которые отличаются определенным неудобством и своеобразностью. Но в некоторых случаях подобные "острые края" можно обойти, особенно если сохранились немалые наработки по тематике, которую загнали в облако.

Пример - работа с файлами MemSource в MemoQ.
1. В веб-интерфейсе сервера выбираем для отдельных файлов, их группы или вообще всех файлов проекта команду "Edit in Desktop Editor".
2. Система задумается, она же облачная, и браузер предложит либо сохранить файл, либо открыть его в MemSource Editor. Сохраняем.
3. В MemoQ, в существующем проекте, импортируем файл. Для этого выбираем "все файлы", чтобы MemoQ увидела файл .mxliff
4. Открывается окошко выбора типа фильтра для файла. И в списочке можно выбрать родимый XLIFF.
5. Файл открыт, но вот незадача: открытым текстом где попало торчат символы типа {1} и т.д.
6. Тем не менее, и эта проблема победима. Не уходя из документа, запускаем Format - Run Regex Tagger...
7. Вводим целых две строчки:
\{\d\} - для тегов {1} - {9}
\{\d\d\} - для тегов {10} - {99}

или по совету друзей-погромистов вводим одну строчку \{\d+\} для любых чисел.

8. В этом же окошечке можно не только просмотреть, а что произойдет, если применить фильтр, а и сохранить его под каким-нибудь названием. Например, MemSource.
И когда файл будет переведен, проверен на орфографию, теги и прочие нюансы богатейшими возможностями MemoQ, вот тогда и можно файлу сделать Save as target.
9. И вот файл открылся в MemSource Editor, здесь можно уже встроенными средствами подтвердить все сегменты, еще раз запустить QA и выгрузить результаты на сервер.

Для всех следующих файлов всё будет еще проще, если вы сохранили Regex-фильтр. То есть пункт 4 будет расширен:
4. Открывается окошко выбора типа фильтра для файла. И в списочке можно выбрать родимый XLIFF. А потом можно сделать Change filter and configuration - Add cascading filter... и выбрать из списка ранее сохраненный фильтр MemSource.

Особенности этого метода:
- сбрасываются заблокированные сегменты. То есть их можно менять без лишних телодвижений. Это очень помогает, когда заблокированные сегменты менять разрешается.
- соответственно учетных слов по статистике MemoQ будет больше, чем в MemSource. Но за возможность работать автономно и с удобством приходится платить.
- нет серверных памятей MemSource и пресловутых мириад вариантов перевода в них. Но если тематика знакома и многолетние наработки имеются, то это и к лучшему.

Ну а самый главный плюс - независимость от технических проблем на сервере и от медленного интернета, отсутствие задержек на блуждание в облаке, ну и результаты работы остаются и у вас. А не уплывают в далекие облака с концами.

PS. Вполне возможно, что и Trados Studio на пару с прочими пожирателями формата XLIFF можно уговорить открыть файл MemSource схожим образом. Но у нас, слава богу, не было столь острой необходимости в подобных экспериментах.

[Edited at 2013-12-04 07:17 GMT]


Direct link Reply with quote
 

Dr. Elena Franzreb  Identity Verified
Germany
Local time: 09:19
German to Russian
+ ...
Технические средства для редактуры Dec 9, 2013

Какие впомогательные средства имеются, когда на редактуру присылают два вордовских файла (исходник и перевод)? Смотреть в два файла очень утомительно.

С большими файлами я бывало даже делала с помощью WinAlign ТМ, потом открывала исходник в Студио и там правила, таким образом и форматирование сохранялось. Но на правку в WinAlign тоже уходит куча времени.


Direct link Reply with quote
 
Pages in topic:   [1 2 3 4] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Полезные советы (Tips and Tricks)

Advanced search


Translation news in Russian Federation





SDL Trados Studio 2017 Freelance
The leading translation software used by over 250,000 translators.

SDL Trados Studio 2017 helps translators increase translation productivity whilst ensuring quality. Combining translation memory, terminology management and machine translation in one simple and easy-to-use environment.

More info »
SDL MultiTerm 2017
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2017 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2017 you can automatically create term lists from your existing documentation to save time.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search