Pages in topic:   [1 2] >
Паразитные символы в Word -- "уголки" и "окошки"
Thread poster: a_grabo

a_grabo  Identity Verified
Ukraine
English to Russian
+ ...
Aug 9, 2014

После распознавания текста и в результате работы программы Trados в документе Word появляются "паразитные" символы "уголки" и "окошки". Они не ищутся и не удаляются по контексту автоматически, удаляются только при помощи клавиш del или backspace. Не подскажете, как их удалить автоматически?


Здесь две разные проблемы. Первая проблема. После распознавания программой ABBYY Fine Reader на местах переносов слов появляются символы-уголки, похожие на повернутую букву Г. Втора проблема. После перевода ТРАДОСОМ 2007 либо 2011, после того, как сгенерирован выходной файл doc (docx), иногда попадаются символы-окошки.

https://cloud.mail.ru/public/a8977840ce63/УГОЛКИ.png

https://cloud.mail.ru/public/5141da138c04/ОКОШКИ.png

Спасибо!

[Редактировалось 2014-08-09 11:39 GMT]

Спасибо, Натали, большое! С уголками ок. Что касается окошек, то они появляются после перевода Традосом не в контексте какого-либо процесса распознавания, а также при переводе готовых doc -- файлов. Смотрите тж. пож-та мои скриншоты. Вот такие мои вопросы.

[Редактировалось 2014-08-09 11:47 GMT]


Direct link Reply with quote
 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 08:21
Member (2008)
English to Russian
+ ...
скриншот Aug 9, 2014

в студию!

Direct link Reply with quote
 
esperantisto  Identity Verified
Local time: 08:21
Member (2006)
English to Russian
+ ...
Больше информации! Aug 9, 2014

a_grabo wrote:

После распознавания текста


Чем распознавали? В какой формат сохранили результат? С какими параметрами?

в результате работы программы Trados


Под общей торговой маркой Trados существуют совершенно разные программы. О какой именно речь?

в документе Word появляются "паразитные" символы "уголки" и "окошки".


Появляются где? В Trados? В Word (опять же, какой версии)? В других программах? А на печать выводятся? Стоит выложить куда-нибудь пример файла (снимок экрана хорошо, но далеко не всегда достаточно).

P. S. А ещё есть смысл научиться задавать вопросы по-умному.


Direct link Reply with quote
 
Enote  Identity Verified
Local time: 08:21
Member (2007)
English to Russian
Распознавание Aug 9, 2014

а не лучше ли распознавать текст в изображении специальной программой, типа Abbyy FR, а не программой CAT, которая вообще-то предназначена для другого?

Direct link Reply with quote
 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 08:21
Member (2008)
English to Russian
+ ...
Без фактического материала Aug 9, 2014

не о чем говорить

Direct link Reply with quote
 

Natalie  Identity Verified
Poland
Local time: 07:21
Member (2002)
English to Russian
+ ...

Moderator of this forum
Уголки-окошки Aug 9, 2014

Уголок (¬) можно заменить, вписав в строку поиска "^-" и заменив на пробел или на "ничто" (т.е. не вписывая в строку замены ничего). И в этом-то как раз и проблема, потому что "уголки" могут возникать вместо пробелов, вместо переносов, вместо еще чего-то, так что глобально устранить их вряд ли удастся (точнее, устранить-то удастся, только что в этом толку).

С окошками (полагаю, это такие пустые квадратики) еще хуже, потому что они обычно возникают при неправильном распознавании каких-то знаков, например, греческих букв, математических знаков и т.п. Все равно все это придется потом проверять вручную, то есть потратить кучу времени совершенно зря. Да и работа в Традосе с таким текстом дает намного худшие результаты.

Одним словом: не забавляйтесь распознаванием текста Традосом. Даже простое копирование текста через клипборд часто дает гораздо лучшие результаты. Распознавать же качественно, как уже сказано выше, лучше с помощью специальных программ, предназначенных именно для этой цели.



[Edited at 2014-08-09 11:31 GMT]


Direct link Reply with quote
 

Sergei Leshchinsky  Identity Verified
Ukraine
Local time: 08:21
Member (2008)
English to Russian
+ ...
Об уголках Aug 9, 2014

Вот бы не догадался... уголок (¬)...
Это мягкий перенос. Это нормально!


Direct link Reply with quote
 

mk_lab  Identity Verified
Ukraine
Local time: 08:21
Member (2004)
English to Russian
+ ...
Могу предположить, Aug 10, 2014

что эти "уголки-окошки" возникли в результате распознавания графических объектов, которые вовсе и не нужно распознавать.

Во-первых, такие объекты лучше предварительно убрать из файла. Объект для распознавания нужно всегда готовить, иначе результат будет плачевный.

Во-вторых, чистить этот "уголочно-окошечный" мусор автоматически (путем поиска) вряд-ли стоит. Я всегда делаю такие вещи вручную (мышкой и клавишей Del)


Direct link Reply with quote
 

a_grabo  Identity Verified
Ukraine
English to Russian
+ ...
TOPIC STARTER
Подготовка файла к распознаванию Aug 10, 2014

mk_lab wrote:

что эти "уголки-окошки" возникли в результате распознавания графических объектов, которые вовсе и не нужно распознавать.

Во-первых, такие объекты лучше предварительно убрать из файла. Объект для распознавания нужно всегда готовить, иначе результат будет плачевный.

Во-вторых, чистить этот "уголочно-окошечный" мусор автоматически (путем поиска) вряд-ли стоит. Я всегда делаю такие вещи вручную (мышкой и клавишей Del)


Напишите пож-та, как Вы готовите скажем пдф-файл к распознаванию? И не легче ли искать пути автоматического удаления, чем удалять вручную (иногда по несколько тысяч?)
С уголками любезно решила Натали. А кто подскажет, как автом-ски искать "окошки"?


Direct link Reply with quote
 

Natalie  Identity Verified
Poland
Local time: 07:21
Member (2002)
English to Russian
+ ...

Moderator of this forum
А вместо чего у вас образовались окошки? Aug 10, 2014

a_grabo wrote:
А кто подскажет, как автом-ски искать "окошки"?


Вряд ли кто-то сможет подсказать в этом случае - "окошки" образовываются вместо отсутствующих знаков. Это может быть связано со шрифтом, к примеру, да мало ли с чем еще.


Direct link Reply with quote
 

a_grabo  Identity Verified
Ukraine
English to Russian
+ ...
TOPIC STARTER
Ответ Натали Aug 10, 2014

Natalie wrote:

a_grabo wrote:
А кто подскажет, как автом-ски искать "окошки"?


Вряд ли кто-то сможет подсказать в этом случае - "окошки" образовываются вместо отсутствующих знаков. Это может быть связано со шрифтом, к примеру, да мало ли с чем еще.


Натали, спасибо Вам за ответ. Но у меня окошки (см. скриншот) добавились к одному пробелу в doc-файле, сгенерированном программой Традос 2011. (они всегда вставляются по два). А в исходном тексте, кроме пробела, ничего не было.


Direct link Reply with quote
 

mk_lab  Identity Verified
Ukraine
Local time: 08:21
Member (2004)
English to Russian
+ ...
Если у вас нет программ от ABBYY Aug 10, 2014

(в них есть специальные средства для выделения рисунков, для указания таблиц и др. особенностей форматирования),
a_grabo wrote:
Напишите пож-та, как Вы готовите скажем пдф-файл к распознаванию? И не легче ли искать пути автоматического удаления, чем удалять вручную (иногда по несколько тысяч?)
С уголками любезно решила Натали. А кто подскажет, как автом-ски искать "окошки"?

то откройте файл Acrobat'ом (или другим средством для редактирования PDF), поудаляйте все рисунки и всю другую "нечисть". Все что нужно, потом повставляете назад в готовый перевод. Желательно, чтобы остался чистый текст (хоть и в графическом виде). Тогда в распознанном тексте "уголков-окошек" будет минимально-разумное количество, а не "все небо в звездах"

Вручную чистить "уголки-окошки" нужно, конечно же, не посимвольно, а выделяя мышью целые области. Удалять их поиском, как мне кажется, просто практически невозможно - вылезет куча проблем (с частью из которых вы уже познакомились), поудаляете массу "не того", а другое просто не найдете.

А вообще-то, лучше бы приобрести ABBYY FineReader или PDF Transformer

[Edited at 2014-08-10 18:59 GMT]


Direct link Reply with quote
 

a_grabo  Identity Verified
Ukraine
English to Russian
+ ...
TOPIC STARTER
Ответ mk_lab Aug 11, 2014

mk_lab wrote:

(в них есть специальные средства для выделения рисунков, для указания таблиц и др. особенностей форматирования),
a_grabo wrote:
Напишите пож-та, как Вы готовите скажем пдф-файл к распознаванию? И не легче ли искать пути автоматического удаления, чем удалять вручную (иногда по несколько тысяч?)
С уголками любезно решила Натали. А кто подскажет, как автом-ски искать "окошки"?

то откройте файл Acrobat'ом (или другим средством для редактирования PDF), поудаляйте все рисунки и всю другую "нечисть". Все что нужно, потом повставляете назад в готовый перевод. Желательно, чтобы остался чистый текст (хоть и в графическом виде). Тогда в распознанном тексте "уголков-окошек" будет минимально-разумное количество, а не "все небо в звездах"

Вручную чистить "уголки-окошки" нужно, конечно же, не посимвольно, а выделяя мышью целые области. Удалять их поиском, как мне кажется, просто практически невозможно - вылезет куча проблем (с частью из которых вы уже познакомились), поудаляете массу "не того", а другое просто не найдете.

А вообще-то, лучше бы приобрести ABBYY FineReader или PDF Transformer

[Edited at 2014-08-10 18:59 GMT]


Уважаемый mk_lab, я имею и активно пользуюсь программой ABBYY FineReader, после которой в местах переносов появляются "уголки". Эта проблема решена полностью с помощью Натали. Остались "окошки" после Традоса. Как их найти при помощи Ctrl+F ? либо Ctrl+H ? -- Спасибо всем!


Direct link Reply with quote
 

mk_lab  Identity Verified
Ukraine
Local time: 08:21
Member (2004)
English to Russian
+ ...
Ok Aug 11, 2014

a_grabo wrote:
Остались "окошки" после Традоса. Как их найти при помощи Ctrl+F ? либо Ctrl+H ? -- Спасибо всем!

Расскажите потом, как получилось. Интересно будет воспользоваться вашим опытом


Direct link Reply with quote
 

Maxim Manzhosin  Identity Verified
Russian Federation
Local time: 08:21
Member (2008)
English to Russian
Поиск методом исключения Aug 11, 2014

a_grabo, в вашем тексте много символов, не являющихся буквами и цифрами?
Откройте документ в Word, нажмите Ctrl+F, нажмите кнопку «Больше», установите флажок «Подстановочные знаки» и в поле «Найти» введите вот это: [!(:,"a-zA-Z0-9^13\-\(\)\?\!\. )]

Такое регулярное выражение найдет все символы, кроме латинских букв, цифр, точек, запятых, двоеточий, пробелов, дефисов, скобок, кавычек, знаков абзаца, вопросительных или восклицательных знаков.


Direct link Reply with quote
 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Паразитные символы в Word -- "уголки" и "окошки"

Advanced search


Translation news in Russian Federation





SDL Trados Studio 2017 Freelance
The leading translation software used by over 250,000 translators.

SDL Trados Studio 2017 helps translators increase translation productivity whilst ensuring quality. Combining translation memory, terminology management and machine translation in one simple and easy-to-use environment.

More info »
Across v6.3
Translation Toolkit and Sales Potential under One Roof

Apart from features that enable you to translate more efficiently, the new Across Translator Edition v6.3 comprises your crossMarket membership. The new online network for Across users assists you in exploring new sales potential and generating revenue.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search