Проблема с символом & в Olifant
Thread poster: Marina Aleyeva

Marina Aleyeva  Identity Verified
Ukraine
Local time: 10:36
English to Russian
+ ...
Dec 22, 2009

Занимаюсь созданием TM из пар текстов с помощью PlusTools. Из одной пары текстов PlusTools создает временную базку - файл Export.txt, который сохраняю в Ворде в кодировке Юникод. Export.txt добавляю в уже существующую TM через меню Wordfast Classic 5.5 (функция Merge another TM with the current one). Потом пополненную TM открываю в Olifant для дальнейшей обработки (удаления дубликатов и т. д.) (аналогичными функциями Вордфаста не пользуюсь, т. к. были случаи порчи базы, к тому же в Olifant для этих целей очень удобное меню).

Столкнулась с такой проблемой. Если в каких-то юнитах в полученном файле Export.txt есть символы &, Olifant ни в какую не хочет читать эти юниты и исключает их из базы. То есть после слияния TM и Export.txt через Вордфаст все добавленные юниты присутствуют в полном составе, но при первом открытии базы в Olifant они пропадают - попросту удаляются. При этом Olifant формирует лог, где честно признается, сколько некачественных, по его мнению, юнитов он удалил, и каких. В логе ошибка прописана так:

Error: Line 622: Missing ';' in string 'XYZ'.

Причина кроется в том, что для Olifant символ & служебный, поэтому в тексте юнита он должен быть не сам по себе, а в виде "& amp ;" (без кавычек и пробелов, конечно). Пробовала перед слиянием баз делать в Export.txt глобальную замену & на "& amp ;" , но Olifant все равно не переваривает и выдает уже другую ошибку:

Error: Line 622: Unknown sequence '622' in string 'amp'.

Единственный пока выход - вставлять удаленные юниты вручную через меню Olifant, ручками заменяя & на "& amp ;" (почему-то в этом случае Olifant все устраивает). Утомительное занятие, т. к. таких юнитов бывает до нескольких десятков.

Еще пробовала через Notepad менять кодировку Export.txt с Юникода на UTF-8. Результат тот же.

Есть ли какой-нибудь выход?

Спасибо за идеи!

[Edited at 2009-12-22 23:54 GMT]


 

Vadim Poguliaev  Identity Verified
Russian Federation
Local time: 10:36
English to Russian
выстрел в небо Dec 22, 2009

попробуйте поставить второй амперсанд (&&)

 

Marina Aleyeva  Identity Verified
Ukraine
Local time: 10:36
English to Russian
+ ...
TOPIC STARTER
Кажется, нашлось решение Dec 23, 2009

Оказывается, после обработки Олифантом амперсанд кодируется так:

 

Marina Aleyeva  Identity Verified
Ukraine
Local time: 10:36
English to Russian
+ ...
TOPIC STARTER
UPD May 22, 2010

Куда-то пропал остаток последнего коммента. Решение заключалось в том, что если ТМ создана с помощью PlusTools, и в ней содержатся амперсанды, то базу нужно открыть в текстовом редакторе и по всему ее тексту заменить символ амперсанда (&) на комбинацию [&'26;] (без квадратных скобок), которую Olifant воспринимает и сохраняет нормально. Похожая проблема обнаружилась с угловыми кавычками. Коды для замены (если не заменять, Olifant преобразует их в ""):

« - [&'AB;]

» - [&'BB;]

Для замены лучше всего воспользоваться подстановочными знаками Word. В строке "Найти": «(*)», в строке "Заменить на": &'AB;\1&'BB; (и включить флажок "Подстановочные знаки").


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Проблема с символом & в Olifant

Advanced search


Translation news in Russian Federation





PerfectIt consistency checker
Faster Checking, Greater Accuracy

PerfectIt helps deliver error-free documents. It improves consistency, ensures quality and helps to enforce style guides. It’s a powerful tool for pro users, and comes with the assurance of a 30-day money back guarantee.

More info »
SDL Trados Studio 2019 Freelance
The leading translation software used by over 250,000 translators.

SDL Trados Studio 2019 has evolved to bring translators a brand new experience. Designed with user experience at its core, Studio 2019 transforms how new users get up and running and helps experienced users make the most of the powerful features.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search