Как сделать TM из двух файлов с "мусором"?
Thread poster: Igor Savenkov

Igor Savenkov  Identity Verified
Russian Federation
Local time: 05:16
Member (2007)
English to Russian
May 31, 2015

Имеется два файла - один с исходным текстом, другой - с переводом. Проблема в том, что тексты "замусорены". Например, в исходном файле есть строчка:
chat_destination_all = "All"
Ей соответствует перевод:
chat_destination_all = "Все"
Соответственно, здесь chat_destination_all = - мусор, которого не должно быть в ТМ. Причем весь "мусор" имеет аналогичную структуру "чего-то_там =".
Я понимаю, что алгоритм для удаления простой: "С начала каждой строчки удалить весь текст до знака = и один пробел после него". Только как и где его реализовать, чтобы сделать это удаление автоматически?


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 05:16
Member (2005)
English to Russian
+ ...
Автозаменой May 31, 2015

Заменить все ненужные комбинации на ничего.
Если комбинации очень разнообразны, то заменить "AnyChraracterAnyChraracterAnyChraracterAnyChraracter = " на ничего.
Количество AnyChraracter после каждой замены уменьшать.

Если в поле "Найти" вводить текст вручную, то, например:
^?^?^?^?^?^?^? =
или
???????? = (при включенном Use Wildcards, Подстановочные знаки).

[Edited at 2015-05-31 11:40 GMT]

[Edited at 2015-05-31 11:41 GMT]

[Edited at 2015-05-31 12:11 GMT]


 

mk_lab  Identity Verified
Ukraine
Local time: 05:16
Member (2004)
English to Russian
+ ...
В Word'е May 31, 2015

Команда "Заменить"
В окне "Найти и заменить" включаем "Подстановочные знаки" и вводим в поле "Найти:" такое "^l*= ", а в поле "Заменить на:" вводим "^l", где ^l - это знак разрыва строки.
"Enter"

Если все строки имеют такую структуру, то получится все, кроме первой строки.
Чтобы получилась и первая строка, нужно добавить перед ней еще одну произвольную строку.

Если в исходном тексте стоит знак переноса строки, а не разрыва строки (как тут это получилось, возможно случайно), то используем его

[Edited at 2015-05-31 11:26 GMT]


 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 05:16
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Михаил! May 31, 2015

Признаюсь, что не знал, что в Word можно использовать подстановочные знаки (стыд и позор).
Сейчас попробовал по-вашему - не получилось: видимо, у меня не "разрыв строки", а "перенос строки", а символа "перенос строки" я не вижу среди символов "Специальный".
Будем думать дальше.


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 05:16
Member (2005)
English to Russian
+ ...
Проблема в том, что May 31, 2015

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, мне такой фокус не удавался в моих вордах.

[Edited at 2015-05-31 15:37 GMT]


 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 05:16
Member (2007)
English to Russian
TOPIC STARTER
Официальное подтверждение May 31, 2015

Alexander Matsyuk wrote:

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, у меня такой фокус не удавался в моих вордах.


Да, действительно, в справке Office так и написано:
^p (не действует в поле Найти, если установлен флажок Подстановочные знаки) или ^13

(https://support.office.com/ru-ru/article/Замена-текста-с-использованием-подстановочных-знаков-5cda8b1b-2feb-45a6-af0e-824173d3d6e4?ui=ru-RU&rs=ru-RU&ad=RU)


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 05:16
Member (2005)
English to Russian
+ ...
Количество ^? нужно сначала задать разумно максимально May 31, 2015

а потом уменьшать.
Я сначала неправильно написал. Исправил.
По идее, не может их быть больше, скажем, двадцати.
Если и останутся какие-то супердлинные, их можно в конце удалить вручную.


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 05:16
Member (2005)
English to Russian
+ ...
"^l" в принципе работает May 31, 2015

но не "отбивает" нужный конец строки.

 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 05:16
Member (2007)
English to Russian
TOPIC STARTER
Да, должно сработать May 31, 2015

Alexander Matsyuk wrote:

Количество ^? нужно сначала задать разумно максимально, а потом уменьшать.


но хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 05:16
Member (2005)
English to Russian
+ ...
Мне тоже ) May 31, 2015

Igor Savenkov wrote:
хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


Хотя я обычно удовлетворяюсь малоизящным.

Поизящнее так:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 05:16
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Александр! May 31, 2015

Alexander Matsyuk wrote:

Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


Работает


 

mk_lab  Identity Verified
Ukraine
Local time: 05:16
Member (2004)
English to Russian
+ ...
А. ну да, действительно, May 31, 2015

^p при включенных подстановочных знаках не работает.

Alexander Matsyuk wrote:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).

Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньшеicon_smile.gif


 

Alexander Matsyuk  Identity Verified
Ukraine
Local time: 05:16
Member (2005)
English to Russian
+ ...
Да, так хитрее May 31, 2015

mk_lab wrote:
Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньшеicon_smile.gif


но внутренне еще беспокойнееicon_smile.gif


 

boostrer  Identity Verified
United States
Local time: 22:16
Member (2007)
English to Russian
+ ...
Поздно увидел тему, Sep 27, 2015

но для следующих поколений:

нужно было сделать простой макрос: поиск " = " > стрелка вправо > выделение от места курсора до начала строки > удалить > вернуться в начало макроса.

Дальше можно его либо просто запустить и со временем, когда все уже будет удалено, выключить, или добавить в конец макроса выход по достижении конца текста.


 

Igor Savenkov  Identity Verified
Russian Federation
Local time: 05:16
Member (2007)
English to Russian
TOPIC STARTER
Невероятно! Sep 27, 2015

Как раз сейчас мне опять потребовалось провести подобную чистку - и тут пришло последнее сообщение! Спасибо, boostrer, помогло - и так проще всего (заодно и освоил макросы в Wordicon_smile.gif ).

 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Как сделать TM из двух файлов с "мусором"?

Advanced search


Translation news in Russian Federation





WordFinder Unlimited
For clarity and excellence

WordFinder is the leading dictionary service that gives you the words you want anywhere, anytime. Access 260+ dictionaries from the world's leading dictionary publishers in virtually any device. Find the right word anywhere, anytime - online or offline.

More info »
BaccS – Business Accounting Software
Modern desktop project management for freelance translators

BaccS makes it easy for translators to manage their projects, schedule tasks, create invoices, and view highly customizable reports. User-friendly, ProZ.com integration, community-driven development – a few reasons BaccS is trusted by translators!

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search