Проблема с символом & в Olifant
Thread poster: Marina Aleyeva

Marina Aleyeva  Identity Verified
Ukraine
Local time: 11:42
English to Russian
+ ...
Dec 22, 2009

Занимаюсь созданием TM из пар текстов с помощью PlusTools. Из одной пары текстов PlusTools создает временную базку - файл Export.txt, который сохраняю в Ворде в кодировке Юникод. Export.txt добавляю в уже существующую TM через меню Wordfast Classic 5.5 (функция Merge another TM with the current one). Потом пополненную TM открываю в Olifant для дальнейшей обработки (удаления дубликатов и т. д.) (аналогичными функциями Вордфаста не пользуюсь, т. к. были случаи порчи базы, к тому же в Olifant для этих целей очень удобное меню).

Столкнулась с такой проблемой. Если в каких-то юнитах в полученном файле Export.txt есть символы &, Olifant ни в какую не хочет читать эти юниты и исключает их из базы. То есть после слияния TM и Export.txt через Вордфаст все добавленные юниты присутствуют в полном составе, но при первом открытии базы в Olifant они пропадают - попросту удаляются. При этом Olifant формирует лог, где честно признается, сколько некачественных, по его мнению, юнитов он удалил, и каких. В логе ошибка прописана так:

Error: Line 622: Missing ';' in string 'XYZ'.

Причина кроется в том, что для Olifant символ & служебный, поэтому в тексте юнита он должен быть не сам по себе, а в виде "& amp ;" (без кавычек и пробелов, конечно). Пробовала перед слиянием баз делать в Export.txt глобальную замену & на "& amp ;" , но Olifant все равно не переваривает и выдает уже другую ошибку:

Error: Line 622: Unknown sequence '622' in string 'amp'.

Единственный пока выход - вставлять удаленные юниты вручную через меню Olifant, ручками заменяя & на "& amp ;" (почему-то в этом случае Olifant все устраивает). Утомительное занятие, т. к. таких юнитов бывает до нескольких десятков.

Еще пробовала через Notepad менять кодировку Export.txt с Юникода на UTF-8. Результат тот же.

Есть ли какой-нибудь выход?

Спасибо за идеи!

[Edited at 2009-12-22 23:54 GMT]


 

Vadim Poguliaev  Identity Verified
Russian Federation
Local time: 12:42
English to Russian
выстрел в небо Dec 22, 2009

попробуйте поставить второй амперсанд (&&)

 

Marina Aleyeva  Identity Verified
Ukraine
Local time: 11:42
English to Russian
+ ...
TOPIC STARTER
Кажется, нашлось решение Dec 23, 2009

Оказывается, после обработки Олифантом амперсанд кодируется так:

 

Marina Aleyeva  Identity Verified
Ukraine
Local time: 11:42
English to Russian
+ ...
TOPIC STARTER
UPD May 22, 2010

Куда-то пропал остаток последнего коммента. Решение заключалось в том, что если ТМ создана с помощью PlusTools, и в ней содержатся амперсанды, то базу нужно открыть в текстовом редакторе и по всему ее тексту заменить символ амперсанда (&) на комбинацию [&'26;] (без квадратных скобок), которую Olifant воспринимает и сохраняет нормально. Похожая проблема обнаружилась с угловыми кавычками. Коды для замены (если не заменять, Olifant преобразует их в ""):

« - [&'AB;]

» - [&'BB;]

Для замены лучше всего воспользоваться подстановочными знаками Word. В строке "Найти": «(*)», в строке "Заменить на": &'AB;\1&'BB; (и включить флажок "Подстановочные знаки").


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Проблема с символом & в Olifant

Advanced search


Translation news in Russian Federation





memoQ translator pro
Kilgray's memoQ is the world's fastest developing integrated localization & translation environment rendering you more productive and efficient.

With our advanced file filters, unlimited language and advanced file support, memoQ translator pro has been designed for translators and reviewers who work on their own, with other translators or in team-based translation projects.

More info »
SDL MultiTerm 2019
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2019 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2019 you can automatically create term lists from your existing documentation to save time.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search