Trados отделяет тегами каждую букву текста
Thread poster: Elena Kravtsova

Elena Kravtsova
Russian Federation
Local time: 20:28
English to Russian
+ ...
Sep 12, 2011

Здравствуйте! Возникла проблема - при открывании вордовского файла в Традос Студио 2009 получается каждая буква текста заключена в теги. Итого - текст как таковой не видно - сплошные отдельные буквы "в тегах".
Вордовский файл получен после распознания пдф-файла. При просмотре вордовского файла в режиме "Непечатаемые знаки" ничего такого не вижу - только разметку пробелов между словами и метки абзацев или новой страницы.
Что это может быть такое? Как лечить?
Подозрения падают, что это остатки какой-то служебной разбивки после распознания. Файл мне прислали уже распознанным. Попыталась распознать сама - полученный ворд-файл нормально в Традосе отражается.


 

Natalie  Identity Verified
Poland
Local time: 19:28
Member (2002)
English to Russian
+ ...

Moderator of this forum
Обработайте исходный ДОК Sep 12, 2011

Выберите весь текст, установите шрифт, уберите все ненужные параметры шрифта (кернинг и все такое прочее). Уберите ненужные знаки ручного конца строки. На 90% это должно помочь.

Если же у исходного ДОКа слишком сложное форматирование или он чересчур велик для обработки вручную, поищите в традосовском форуме ссылку на CodeZapper.


 

Elena Kravtsova
Russian Federation
Local time: 20:28
English to Russian
+ ...
TOPIC STARTER
CodeZapper Sep 12, 2011

Natalie wrote:

Выберите весь текст, установите шрифт, уберите все ненужные параметры шрифта (кернинг и все такое прочее). Уберите ненужные знаки ручного конца строки. На 90% это должно помочь.

Если же у исходного ДОКа слишком сложное форматирование или он чересчур велик для обработки вручную, поищите в традосовском форуме ссылку на CodeZapper.


Спасибо - попробую


 

Nelli Chernitska  Identity Verified
Local time: 20:28
German to Russian
+ ...
Происки Sep 12, 2011

Неоднократно сталкивалась с такой ситуацией, когда открывала в Этиторе тестовые задания на перевод. Видимо, чтобы не попользовалась автоматическим переводчиком. Отошлите им ttx-файл и спросите, что это значит.

 

Natalie  Identity Verified
Poland
Local time: 19:28
Member (2002)
English to Russian
+ ...

Moderator of this forum
Ничьего злого умысла здесь нет Sep 12, 2011

Это просто результат плохого форматирования текста, сконвертированного из PDF.

 

Elena Kravtsova
Russian Federation
Local time: 20:28
English to Russian
+ ...
TOPIC STARTER
это не тест Sep 12, 2011

Nellyusik wrote:

Неоднократно сталкивалась с такой ситуацией, когда открывала в Этиторе тестовые задания на перевод. Видимо, чтобы не попользовалась автоматическим переводчиком. Отошлите им ttx-файл и спросите, что это значит.


 

Yuriy Vassilenko  Identity Verified
Russian Federation
Local time: 20:28
English to Russian
// Sep 12, 2011

Сбросьте все форматирование этого файла (в стилях для 2003).

 

mk_lab  Identity Verified
Ukraine
Local time: 20:28
Member (2004)
English to Russian
+ ...
Сканированный текст, распознанный OCR Sep 12, 2011

Скорее всего, ваш Word-файл - это плохо отсканированный текст, распознанный OCR
В таком тексте малейшие изменения в параметрах шрифта (кернинга, цвета и т.д.) отмечаются тегами. Далеко не все эти "прибамбасы" можно убрать средствами Ворда.

Неоднократно сталкивался с таким делом и уже поднимал этот вопрос на этом форуме.
Попробуйте открыть этот файл не TagEdotor'ом, а Trados'овским макросом в Ворде. Он игнорирует большинство таких "мелких" тегов, относящихся к параметрам шрифтов, абзацев и др... Коллеги тоже подтверждают этот вариант.


 

Leanida
Italy
Local time: 19:28
Italian to Russian
+ ...
работать на своем файле Sep 12, 2011

elenochka99 wrote:
Попыталась распознать сама - полученный ворд-файл нормально в Традосе отражается.


ну значит на этот раз у вас проблема решенаicon_smile.gif.
Как-то уже приводила ссылку на программу, которая удаляет лишние тэги после распознавания http://asap-traduction.com/CodeZapper. Работает хорошо, я довольна. Автор приветливый, программу прислал сразу, по е-мейлу объяснил, как пользоваться.


 

Elena Kravtsova
Russian Federation
Local time: 20:28
English to Russian
+ ...
TOPIC STARTER
Попробуйте открыть этот файл не TagEdotor'ом, а Trados'овским м Sep 12, 2011

mk_lab wrote:

Скорее всего, ваш Word-файл - это плохо отсканированный текст, распознанный OCR
В таком тексте малейшие изменения в параметрах шрифта (кернинга, цвета и т.д.) отмечаются тегами. Далеко не все эти "прибамбасы" можно убрать средствами Ворда.

Неоднократно сталкивался с таким делом и уже поднимал этот вопрос на этом форуме.
Попробуйте открыть этот файл не TagEdotor'ом, а Trados'овским макросом в Ворде. Он игнорирует большинство таких "мелких" тегов, относящихся к параметрам шрифтов, абзацев и др... Коллеги тоже подтверждают этот вариант.


У мну нет Тег-Эдитора - у меня Традос Студио2009. Соответственно, макроса в Ворде тоже нет...

[Редактировалось 2011-09-12 19:45 GMT]


 

Andrej  Identity Verified
Local time: 20:28
Member (2005)
German to Russian
+ ...
Удивительно Sep 12, 2011

elenochka99 wrote:

У мну нет Тег-Эдитора - у меня Традос Студио2009. Соответственно, макроса в Ворде тоже нет...


К Студио на автомате прикладывается Традос 2007 со всеми красотами. У вас не может его не быть.


 
Post removed: This post was hidden by a moderator or staff member for the following reason: Нелицензионный софт на этом форуме не обсуждаем.
Post removed: This post was hidden by a moderator or staff member for the following reason: Нелицензионный софт не обсуждаем. Спасибо


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Trados отделяет тегами каждую букву текста

Advanced search


Translation news in Russian Federation





Déjà Vu X3
Try it, Love it

Find out why Déjà Vu is today the most flexible, customizable and user-friendly tool on the market. See the brand new features in action: *Completely redesigned user interface *Live Preview *Inline spell checking *Inline

More info »
memoQ translator pro
Kilgray's memoQ is the world's fastest developing integrated localization & translation environment rendering you more productive and efficient.

With our advanced file filters, unlimited language and advanced file support, memoQ translator pro has been designed for translators and reviewers who work on their own, with other translators or in team-based translation projects.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search