Как сделать TM из двух файлов с "мусором"?
Thread poster: Igor Savenkov

Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:04
Member (2007)
English to Russian
May 31, 2015

Имеется два файла - один с исходным текстом, другой - с переводом. Проблема в том, что тексты "замусорены". Например, в исходном файле есть строчка:
chat_destination_all = "All"
Ей соответствует перевод:
chat_destination_all = "Все"
Соответственно, здесь chat_destination_all = - мусор, которого не должно быть в ТМ. Причем весь "мусор" имеет аналогичную структуру "чего-то_там =".
Я понимаю, что алгоритм для удаления простой: "С начала каждой строчки удалить весь текст до знака = и один пробел после него". Только как и где его реализовать, чтобы сделать это удаление автоматически?


Direct link Reply with quote
 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:04
Member (2005)
English to Russian
+ ...
Автозаменой May 31, 2015

Заменить все ненужные комбинации на ничего.
Если комбинации очень разнообразны, то заменить "AnyChraracterAnyChraracterAnyChraracterAnyChraracter = " на ничего.
Количество AnyChraracter после каждой замены уменьшать.

Если в поле "Найти" вводить текст вручную, то, например:
^?^?^?^?^?^?^? =
или
???????? = (при включенном Use Wildcards, Подстановочные знаки).

[Edited at 2015-05-31 11:40 GMT]

[Edited at 2015-05-31 11:41 GMT]

[Edited at 2015-05-31 12:11 GMT]


Direct link Reply with quote
 

mk_lab  Identity Verified
Ukraine
Local time: 02:04
Member (2004)
English to Russian
+ ...
В Word'е May 31, 2015

Команда "Заменить"
В окне "Найти и заменить" включаем "Подстановочные знаки" и вводим в поле "Найти:" такое "^l*= ", а в поле "Заменить на:" вводим "^l", где ^l - это знак разрыва строки.
"Enter"

Если все строки имеют такую структуру, то получится все, кроме первой строки.
Чтобы получилась и первая строка, нужно добавить перед ней еще одну произвольную строку.

Если в исходном тексте стоит знак переноса строки, а не разрыва строки (как тут это получилось, возможно случайно), то используем его

[Edited at 2015-05-31 11:26 GMT]


Direct link Reply with quote
 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:04
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Михаил! May 31, 2015

Признаюсь, что не знал, что в Word можно использовать подстановочные знаки (стыд и позор).
Сейчас попробовал по-вашему - не получилось: видимо, у меня не "разрыв строки", а "перенос строки", а символа "перенос строки" я не вижу среди символов "Специальный".
Будем думать дальше.


Direct link Reply with quote
 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:04
Member (2005)
English to Russian
+ ...
Проблема в том, что May 31, 2015

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, мне такой фокус не удавался в моих вордах.

[Edited at 2015-05-31 15:37 GMT]


Direct link Reply with quote
 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:04
Member (2007)
English to Russian
TOPIC STARTER
Официальное подтверждение May 31, 2015

Alexander Matsyuk wrote:

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, у меня такой фокус не удавался в моих вордах.


Да, действительно, в справке Office так и написано:
^p (не действует в поле Найти, если установлен флажок Подстановочные знаки) или ^13

(https://support.office.com/ru-ru/article/Замена-текста-с-использованием-подстановочных-знаков-5cda8b1b-2feb-45a6-af0e-824173d3d6e4?ui=ru-RU&rs=ru-RU&ad=RU)

Direct link Reply with quote
 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:04
Member (2005)
English to Russian
+ ...
Количество ^? нужно сначала задать разумно максимально May 31, 2015

а потом уменьшать.
Я сначала неправильно написал. Исправил.
По идее, не может их быть больше, скажем, двадцати.
Если и останутся какие-то супердлинные, их можно в конце удалить вручную.


Direct link Reply with quote
 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:04
Member (2005)
English to Russian
+ ...
"^l" в принципе работает May 31, 2015

но не "отбивает" нужный конец строки.

Direct link Reply with quote
 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:04
Member (2007)
English to Russian
TOPIC STARTER
Да, должно сработать May 31, 2015

Alexander Matsyuk wrote:

Количество ^? нужно сначала задать разумно максимально, а потом уменьшать.


но хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


Direct link Reply with quote
 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:04
Member (2005)
English to Russian
+ ...
Мне тоже ) May 31, 2015

Igor Savenkov wrote:
хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


Хотя я обычно удовлетворяюсь малоизящным.

Поизящнее так:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


Direct link Reply with quote
 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:04
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Александр! May 31, 2015

Alexander Matsyuk wrote:

Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


Работает


Direct link Reply with quote
 

mk_lab  Identity Verified
Ukraine
Local time: 02:04
Member (2004)
English to Russian
+ ...
А. ну да, действительно, May 31, 2015

^p при включенных подстановочных знаках не работает.

Alexander Matsyuk wrote:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).

Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньше


Direct link Reply with quote
 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 02:04
Member (2005)
English to Russian
+ ...
Да, так хитрее May 31, 2015

mk_lab wrote:
Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньше


но внутренне еще беспокойнее


Direct link Reply with quote
 

boostrer  Identity Verified
United States
Local time: 19:04
Member (2007)
English to Russian
+ ...
Поздно увидел тему, Sep 27, 2015

но для следующих поколений:

нужно было сделать простой макрос: поиск " = " > стрелка вправо > выделение от места курсора до начала строки > удалить > вернуться в начало макроса.

Дальше можно его либо просто запустить и со временем, когда все уже будет удалено, выключить, или добавить в конец макроса выход по достижении конца текста.


Direct link Reply with quote
 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 03:04
Member (2007)
English to Russian
TOPIC STARTER
Невероятно! Sep 27, 2015

Как раз сейчас мне опять потребовалось провести подобную чистку - и тут пришло последнее сообщение! Спасибо, boostrer, помогло - и так проще всего (заодно и освоил макросы в Word ).

Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Как сделать TM из двух файлов с "мусором"?

Advanced search


Translation news in Russian Federation





PerfectIt consistency checker
Faster Checking, Greater Accuracy

PerfectIt helps deliver error-free documents. It improves consistency, ensures quality and helps to enforce style guides. It’s a powerful tool for pro users, and comes with the assurance of a 30-day money back guarantee.

More info »
SDL MultiTerm 2017
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2017 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2017 you can automatically create term lists from your existing documentation to save time.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search