Проблема с символом & в Olifant
Thread poster: Marina Aleyeva
Marina Aleyeva
Marina Aleyeva  Identity Verified
Israel
Local time: 16:56
Member (2006)
English to Russian
+ ...
Dec 22, 2009

Занимаюсь созданием TM из пар текстов с помощью PlusTools. Из одной пары текстов PlusTools создает временную базку - файл Export.txt, который сохраняю в Ворде в кодировке Юникод. Export.txt добавляю в уже существующую TM через меню Wordfast Classic 5.5 (функция Merge another TM with the current one). Потом пополненную TM о�... See more
Занимаюсь созданием TM из пар текстов с помощью PlusTools. Из одной пары текстов PlusTools создает временную базку - файл Export.txt, который сохраняю в Ворде в кодировке Юникод. Export.txt добавляю в уже существующую TM через меню Wordfast Classic 5.5 (функция Merge another TM with the current one). Потом пополненную TM открываю в Olifant для дальнейшей обработки (удаления дубликатов и т. д.) (аналогичными функциями Вордфаста не пользуюсь, т. к. были случаи порчи базы, к тому же в Olifant для этих целей очень удобное меню).

Столкнулась с такой проблемой. Если в каких-то юнитах в полученном файле Export.txt есть символы &, Olifant ни в какую не хочет читать эти юниты и исключает их из базы. То есть после слияния TM и Export.txt через Вордфаст все добавленные юниты присутствуют в полном составе, но при первом открытии базы в Olifant они пропадают - попросту удаляются. При этом Olifant формирует лог, где честно признается, сколько некачественных, по его мнению, юнитов он удалил, и каких. В логе ошибка прописана так:

Error: Line 622: Missing ';' in string 'XYZ'.

Причина кроется в том, что для Olifant символ & служебный, поэтому в тексте юнита он должен быть не сам по себе, а в виде "& amp ;" (без кавычек и пробелов, конечно). Пробовала перед слиянием баз делать в Export.txt глобальную замену & на "& amp ;" , но Olifant все равно не переваривает и выдает уже другую ошибку:

Error: Line 622: Unknown sequence '622' in string 'amp'.

Единственный пока выход - вставлять удаленные юниты вручную через меню Olifant, ручками заменяя & на "& amp ;" (почему-то в этом случае Olifant все устраивает). Утомительное занятие, т. к. таких юнитов бывает до нескольких десятков.

Еще пробовала через Notepad менять кодировку Export.txt с Юникода на UTF-8. Результат тот же.

Есть ли какой-нибудь выход?

Спасибо за идеи!

[Edited at 2009-12-22 23:54 GMT]
Collapse


 
Vadim Pogulyaev
Vadim Pogulyaev  Identity Verified
Thailand
Local time: 20:56
Member (2007)
English to Russian
выстрел в небо Dec 22, 2009

попробуйте поставить второй амперсанд (&&)

 
Marina Aleyeva
Marina Aleyeva  Identity Verified
Israel
Local time: 16:56
Member (2006)
English to Russian
+ ...
TOPIC STARTER
Кажется, нашлось решение Dec 23, 2009

Оказывается, после обработки Олифантом амперсанд кодируется так:

 
Marina Aleyeva
Marina Aleyeva  Identity Verified
Israel
Local time: 16:56
Member (2006)
English to Russian
+ ...
TOPIC STARTER
UPD May 22, 2010

Куда-то пропал остаток последнего коммента. Решение заключалось в том, что если ТМ создана с помощью PlusTools, и в ней содержатся амперсанды, то базу нужно открыть в текстовом редакторе и по всему ее тексту заменить символ амперсанда (&) на комбинацию [&'26;] (без квадратных скобок)... See more
Куда-то пропал остаток последнего коммента. Решение заключалось в том, что если ТМ создана с помощью PlusTools, и в ней содержатся амперсанды, то базу нужно открыть в текстовом редакторе и по всему ее тексту заменить символ амперсанда (&) на комбинацию [&'26;] (без квадратных скобок), которую Olifant воспринимает и сохраняет нормально. Похожая проблема обнаружилась с угловыми кавычками. Коды для замены (если не заменять, Olifant преобразует их в ""):

« - [&'AB;]

» - [&'BB;]

Для замены лучше всего воспользоваться подстановочными знаками Word. В строке "Найти": «(*)», в строке "Заменить на": &'AB;\1&'BB; (и включить флажок "Подстановочные знаки").
Collapse


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Проблема с символом & в Olifant


Translation news in Russian Federation





Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »
CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »