Trados отделяет тегами каждую букву текста
Thread poster: elenochka99

elenochka99
Russian Federation
Local time: 01:52
English to Russian
+ ...
Sep 12, 2011

Здравствуйте! Возникла проблема - при открывании вордовского файла в Традос Студио 2009 получается каждая буква текста заключена в теги. Итого - текст как таковой не видно - сплошные отдельные буквы "в тегах".
Вордовский файл получен после распознания пдф-файла. При просмотре вордовского файла в режиме "Непечатаемые знаки" ничего такого не вижу - только разметку пробелов между словами и метки абзацев или новой страницы.
Что это может быть такое? Как лечить?
Подозрения падают, что это остатки какой-то служебной разбивки после распознания. Файл мне прислали уже распознанным. Попыталась распознать сама - полученный ворд-файл нормально в Традосе отражается.


Direct link
 

Natalie  Identity Verified
Poland
Local time: 00:52
Member (2002)
English to Russian
+ ...

Moderator of this forum
Обработайте исходный ДОК Sep 12, 2011

Выберите весь текст, установите шрифт, уберите все ненужные параметры шрифта (кернинг и все такое прочее). Уберите ненужные знаки ручного конца строки. На 90% это должно помочь.

Если же у исходного ДОКа слишком сложное форматирование или он чересчур велик для обработки вручную, поищите в традосовском форуме ссылку на CodeZapper.


Direct link
 

elenochka99
Russian Federation
Local time: 01:52
English to Russian
+ ...
TOPIC STARTER
CodeZapper Sep 12, 2011

Natalie wrote:

Выберите весь текст, установите шрифт, уберите все ненужные параметры шрифта (кернинг и все такое прочее). Уберите ненужные знаки ручного конца строки. На 90% это должно помочь.

Если же у исходного ДОКа слишком сложное форматирование или он чересчур велик для обработки вручную, поищите в традосовском форуме ссылку на CodeZapper.


Спасибо - попробую


Direct link
 

Nelli Chernitska  Identity Verified
Local time: 01:52
German to Russian
+ ...
Происки Sep 12, 2011

Неоднократно сталкивалась с такой ситуацией, когда открывала в Этиторе тестовые задания на перевод. Видимо, чтобы не попользовалась автоматическим переводчиком. Отошлите им ttx-файл и спросите, что это значит.

Direct link
 

Natalie  Identity Verified
Poland
Local time: 00:52
Member (2002)
English to Russian
+ ...

Moderator of this forum
Ничьего злого умысла здесь нет Sep 12, 2011

Это просто результат плохого форматирования текста, сконвертированного из PDF.

Direct link
 

elenochka99
Russian Federation
Local time: 01:52
English to Russian
+ ...
TOPIC STARTER
это не тест Sep 12, 2011

Nellyusik wrote:

Неоднократно сталкивалась с такой ситуацией, когда открывала в Этиторе тестовые задания на перевод. Видимо, чтобы не попользовалась автоматическим переводчиком. Отошлите им ttx-файл и спросите, что это значит.


Direct link
 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 01:52
English to Russian
// Sep 12, 2011

Сбросьте все форматирование этого файла (в стилях для 2003).

Direct link
 

mk_lab  Identity Verified
Ukraine
Local time: 01:52
Member (2004)
English to Russian
+ ...
Сканированный текст, распознанный OCR Sep 12, 2011

Скорее всего, ваш Word-файл - это плохо отсканированный текст, распознанный OCR
В таком тексте малейшие изменения в параметрах шрифта (кернинга, цвета и т.д.) отмечаются тегами. Далеко не все эти "прибамбасы" можно убрать средствами Ворда.

Неоднократно сталкивался с таким делом и уже поднимал этот вопрос на этом форуме.
Попробуйте открыть этот файл не TagEdotor'ом, а Trados'овским макросом в Ворде. Он игнорирует большинство таких "мелких" тегов, относящихся к параметрам шрифтов, абзацев и др... Коллеги тоже подтверждают этот вариант.


Direct link
 

Leanida
Italy
Local time: 00:52
Italian to Russian
+ ...
работать на своем файле Sep 12, 2011

elenochka99 wrote:
Попыталась распознать сама - полученный ворд-файл нормально в Традосе отражается.


ну значит на этот раз у вас проблема решена.
Как-то уже приводила ссылку на программу, которая удаляет лишние тэги после распознавания http://asap-traduction.com/CodeZapper. Работает хорошо, я довольна. Автор приветливый, программу прислал сразу, по е-мейлу объяснил, как пользоваться.


Direct link
 

elenochka99
Russian Federation
Local time: 01:52
English to Russian
+ ...
TOPIC STARTER
Попробуйте открыть этот файл не TagEdotor'ом, а Trados'овским м Sep 12, 2011

mk_lab wrote:

Скорее всего, ваш Word-файл - это плохо отсканированный текст, распознанный OCR
В таком тексте малейшие изменения в параметрах шрифта (кернинга, цвета и т.д.) отмечаются тегами. Далеко не все эти "прибамбасы" можно убрать средствами Ворда.

Неоднократно сталкивался с таким делом и уже поднимал этот вопрос на этом форуме.
Попробуйте открыть этот файл не TagEdotor'ом, а Trados'овским макросом в Ворде. Он игнорирует большинство таких "мелких" тегов, относящихся к параметрам шрифтов, абзацев и др... Коллеги тоже подтверждают этот вариант.


У мну нет Тег-Эдитора - у меня Традос Студио2009. Соответственно, макроса в Ворде тоже нет...

[Редактировалось 2011-09-12 19:45 GMT]


Direct link
 

Andrej  Identity Verified
Local time: 01:52
Member (2005)
German to Russian
+ ...
Удивительно Sep 12, 2011

elenochka99 wrote:

У мну нет Тег-Эдитора - у меня Традос Студио2009. Соответственно, макроса в Ворде тоже нет...


К Студио на автомате прикладывается Традос 2007 со всеми красотами. У вас не может его не быть.


Direct link
 
Post removed: This post was hidden by a moderator or staff member for the following reason: Нелицензионный софт на этом форуме не обсуждаем.
Post removed: This post was hidden by a moderator or staff member for the following reason: Нелицензионный софт не обсуждаем. Спасибо


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Trados отделяет тегами каждую букву текста

Advanced search


Translation news in Russian Federation





PerfectIt consistency checker
Faster Checking, Greater Accuracy

PerfectIt helps deliver error-free documents. It improves consistency, ensures quality and helps to enforce style guides. It’s a powerful tool for pro users, and comes with the assurance of a 30-day money back guarantee.

More info »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search