Как сделать TM из двух файлов с "мусором"?
Thread poster: Igor Savenkov

Igor Savenkov  Identity Verified
Russian Federation
Local time: 20:47
Member (2007)
English to Russian
May 31, 2015

Имеется два файла - один с исходным текстом, другой - с переводом. Проблема в том, что тексты "замусорены". Например, в исходном файле есть строчка:
chat_destination_all = "All"
Ей соответствует перевод:
chat_destination_all = "Все"
Соответственно, здесь chat_destination_all = - мусор, которого не должно быть в ТМ. Причем весь "мусор" имеет аналогичную структуру "чего-то_там =".
Я понимаю, что алгоритм для удаления простой: "С начала каждой строчки удалить весь текст до знака = и один пробел после него". Только как и где его реализовать, чтобы сделать это удаление автоматически?


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 20:47
Member (2005)
English to Russian
+ ...
Автозаменой May 31, 2015

Заменить все ненужные комбинации на ничего.
Если комбинации очень разнообразны, то заменить "AnyChraracterAnyChraracterAnyChraracterAnyChraracter = " на ничего.
Количество AnyChraracter после каждой замены уменьшать.

Если в поле "Найти" вводить текст вручную, то, например:
^?^?^?^?^?^?^? =
или
???????? = (при включенном Use Wildcards, Подстановочные знаки).

[Edited at 2015-05-31 11:40 GMT]

[Edited at 2015-05-31 11:41 GMT]

[Edited at 2015-05-31 12:11 GMT]


 

mk_lab  Identity Verified
Ukraine
Local time: 20:47
Member (2004)
English to Russian
+ ...
В Word'е May 31, 2015

Команда "Заменить"
В окне "Найти и заменить" включаем "Подстановочные знаки" и вводим в поле "Найти:" такое "^l*= ", а в поле "Заменить на:" вводим "^l", где ^l - это знак разрыва строки.
"Enter"

Если все строки имеют такую структуру, то получится все, кроме первой строки.
Чтобы получилась и первая строка, нужно добавить перед ней еще одну произвольную строку.

Если в исходном тексте стоит знак переноса строки, а не разрыва строки (как тут это получилось, возможно случайно), то используем его

[Edited at 2015-05-31 11:26 GMT]


 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 20:47
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Михаил! May 31, 2015

Признаюсь, что не знал, что в Word можно использовать подстановочные знаки (стыд и позор).
Сейчас попробовал по-вашему - не получилось: видимо, у меня не "разрыв строки", а "перенос строки", а символа "перенос строки" я не вижу среди символов "Специальный".
Будем думать дальше.


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 20:47
Member (2005)
English to Russian
+ ...
Проблема в том, что May 31, 2015

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, мне такой фокус не удавался в моих вордах.

[Edited at 2015-05-31 15:37 GMT]


 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 20:47
Member (2007)
English to Russian
TOPIC STARTER
Официальное подтверждение May 31, 2015

Alexander Matsyuk wrote:

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, у меня такой фокус не удавался в моих вордах.


Да, действительно, в справке Office так и написано:
^p (не действует в поле Найти, если установлен флажок Подстановочные знаки) или ^13

(https://support.office.com/ru-ru/article/Замена-текста-с-использованием-подстановочных-знаков-5cda8b1b-2feb-45a6-af0e-824173d3d6e4?ui=ru-RU&rs=ru-RU&ad=RU)


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 20:47
Member (2005)
English to Russian
+ ...
Количество ^? нужно сначала задать разумно максимально May 31, 2015

а потом уменьшать.
Я сначала неправильно написал. Исправил.
По идее, не может их быть больше, скажем, двадцати.
Если и останутся какие-то супердлинные, их можно в конце удалить вручную.


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 20:47
Member (2005)
English to Russian
+ ...
"^l" в принципе работает May 31, 2015

но не "отбивает" нужный конец строки.

 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 20:47
Member (2007)
English to Russian
TOPIC STARTER
Да, должно сработать May 31, 2015

Alexander Matsyuk wrote:

Количество ^? нужно сначала задать разумно максимально, а потом уменьшать.


но хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 20:47
Member (2005)
English to Russian
+ ...
Мне тоже ) May 31, 2015

Igor Savenkov wrote:
хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


Хотя я обычно удовлетворяюсь малоизящным.

Поизящнее так:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 20:47
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Александр! May 31, 2015

Alexander Matsyuk wrote:

Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


Работает


 

mk_lab  Identity Verified
Ukraine
Local time: 20:47
Member (2004)
English to Russian
+ ...
А. ну да, действительно, May 31, 2015

^p при включенных подстановочных знаках не работает.

Alexander Matsyuk wrote:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).

Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньшеicon_smile.gif


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 20:47
Member (2005)
English to Russian
+ ...
Да, так хитрее May 31, 2015

mk_lab wrote:
Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньшеicon_smile.gif


но внутренне еще беспокойнееicon_smile.gif


 

boostrer  Identity Verified
United States
Local time: 13:47
Member (2007)
English to Russian
+ ...
Поздно увидел тему, Sep 27, 2015

но для следующих поколений:

нужно было сделать простой макрос: поиск " = " > стрелка вправо > выделение от места курсора до начала строки > удалить > вернуться в начало макроса.

Дальше можно его либо просто запустить и со временем, когда все уже будет удалено, выключить, или добавить в конец макроса выход по достижении конца текста.


 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 20:47
Member (2007)
English to Russian
TOPIC STARTER
Невероятно! Sep 27, 2015

Как раз сейчас мне опять потребовалось провести подобную чистку - и тут пришло последнее сообщение! Спасибо, boostrer, помогло - и так проще всего (заодно и освоил макросы в Wordicon_smile.gif ).

 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Как сделать TM из двух файлов с "мусором"?

Advanced search


Translation news in Russian Federation





SDL Trados Studio 2017 Freelance
The leading translation software used by over 250,000 translators.

SDL Trados Studio 2017 helps translators increase translation productivity whilst ensuring quality. Combining translation memory, terminology management and machine translation in one simple and easy-to-use environment.

More info »
memoQ translator pro
Kilgray's memoQ is the world's fastest developing integrated localization & translation environment rendering you more productive and efficient.

With our advanced file filters, unlimited language and advanced file support, memoQ translator pro has been designed for translators and reviewers who work on their own, with other translators or in team-based translation projects.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search