Проблема с символом & в Olifant
Thread poster: Marina Aleyeva

Marina Aleyeva  Identity Verified
Ukraine
Local time: 16:22
English to Russian
+ ...
Dec 22, 2009

Занимаюсь созданием TM из пар текстов с помощью PlusTools. Из одной пары текстов PlusTools создает временную базку - файл Export.txt, который сохраняю в Ворде в кодировке Юникод. Export.txt добавляю в уже существующую TM через меню Wordfast Classic 5.5 (функция Merge another TM with the current one). Потом пополненную TM открываю в Olifant для дальнейшей обработки (удаления дубликатов и т. д.) (аналогичными функциями Вордфаста не пользуюсь, т. к. были случаи порчи базы, к тому же в Olifant для этих целей очень удобное меню).

Столкнулась с такой проблемой. Если в каких-то юнитах в полученном файле Export.txt есть символы &, Olifant ни в какую не хочет читать эти юниты и исключает их из базы. То есть после слияния TM и Export.txt через Вордфаст все добавленные юниты присутствуют в полном составе, но при первом открытии базы в Olifant они пропадают - попросту удаляются. При этом Olifant формирует лог, где честно признается, сколько некачественных, по его мнению, юнитов он удалил, и каких. В логе ошибка прописана так:

Error: Line 622: Missing ';' in string 'XYZ'.

Причина кроется в том, что для Olifant символ & служебный, поэтому в тексте юнита он должен быть не сам по себе, а в виде "& amp ;" (без кавычек и пробелов, конечно). Пробовала перед слиянием баз делать в Export.txt глобальную замену & на "& amp ;" , но Olifant все равно не переваривает и выдает уже другую ошибку:

Error: Line 622: Unknown sequence '622' in string 'amp'.

Единственный пока выход - вставлять удаленные юниты вручную через меню Olifant, ручками заменяя & на "& amp ;" (почему-то в этом случае Olifant все устраивает). Утомительное занятие, т. к. таких юнитов бывает до нескольких десятков.

Еще пробовала через Notepad менять кодировку Export.txt с Юникода на UTF-8. Результат тот же.

Есть ли какой-нибудь выход?

Спасибо за идеи!

[Edited at 2009-12-22 23:54 GMT]


Direct link Reply with quote
 
Vadim Poguliaev  Identity Verified
Russian Federation
Local time: 17:22
English to Russian
выстрел в небо Dec 22, 2009

попробуйте поставить второй амперсанд (&&)

Direct link Reply with quote
 

Marina Aleyeva  Identity Verified
Ukraine
Local time: 16:22
English to Russian
+ ...
TOPIC STARTER
Кажется, нашлось решение Dec 23, 2009

Оказывается, после обработки Олифантом амперсанд кодируется так:

Direct link Reply with quote
 

Marina Aleyeva  Identity Verified
Ukraine
Local time: 16:22
English to Russian
+ ...
TOPIC STARTER
UPD May 22, 2010

Куда-то пропал остаток последнего коммента. Решение заключалось в том, что если ТМ создана с помощью PlusTools, и в ней содержатся амперсанды, то базу нужно открыть в текстовом редакторе и по всему ее тексту заменить символ амперсанда (&) на комбинацию [&'26;] (без квадратных скобок), которую Olifant воспринимает и сохраняет нормально. Похожая проблема обнаружилась с угловыми кавычками. Коды для замены (если не заменять, Olifant преобразует их в ""):

« - [&'AB;]

» - [&'BB;]

Для замены лучше всего воспользоваться подстановочными знаками Word. В строке "Найти": «(*)», в строке "Заменить на": &'AB;\1&'BB; (и включить флажок "Подстановочные знаки").


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Проблема с символом & в Olifant

Advanced search


Translation news in Russian Federation





Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

More info »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search