Mobile menu

Pages in topic:   [1 2] >
Файлы с расширением .mht
Thread poster: NinaShir
NinaShir
Local time: 21:50
German to Russian
+ ...
Apr 18, 2004

Речь идет о переводе веб-сайта. Есть ли у кого-нибудь опыт работы с таким файлами? Я имею в виду - можно ли их как-нибудь перевести в текстовый файл для перевода? Клиент прислал их штук 50, каждый из которых, открываясь, отражает одну из страниц с картинками и текстом. Ни скопировать, ни сохранить как "только текст" не получается. Я зашла на сам сайт в интернете, а он сделан при помощи Macromedia Flash Player 7 - и та же история.
То есть сейчас я работаю в Ворде, каждую минуту переключаясь на переводимый Интернет-сайт, чтобы заглянуть в текст оригинала. Ужасно неудобно. Есть ли какой-нибудь выход?


Direct link Reply with quote
 

Natalie  Identity Verified
Poland
Local time: 19:50
Member (2002)
English to Russian
+ ...
Пара вопросов Apr 18, 2004

А что, клиент не может предоставить для перевода какой-нибудь более "удобоваримый" формат? HTML или DOC?
Но это, видимо, вопрос риторический. Если бы мог, вы бы не спрашивали, верно?

Другой вопрос, более важный: а в принципе эти файлы можно записать? Хотя бы как MHT?

Думаю, что это т.н. веб-архив, т.е. способ записи "содержимого" вебстраницы со всеми "потрохами", т.е. рисунками и прочим.

А какая у вас версия MS Office? Дело в том, что Офисе 2000 и ХР эти файлы должны открываться прямо в Ворде.

[Edited at 2004-04-18 21:07]


Direct link Reply with quote
 
NinaShir
Local time: 21:50
German to Russian
+ ...
TOPIC STARTER
Попытка ответа Apr 18, 2004

Natalie wrote:

Другой вопрос, более важный: а в принципе эти файлы можно записать? Хотя бы как MHT?


Увы, я, можно сказать, только чуть-чуть "продвинутый чайник", так что MHT для меня тоже проблема.

У меня Office2000, так как я работаю с TRADOS Freelance 5, а он под XP не работает. Но при попытке открыть файлы .mht из Ворда появляется длиннющий текст типа:

From:
Subject: …
Date: Fri, 2 Apr 2004 20:03:56 +0300
MIME-Version: 1.0
Content-Type: multipart/related;
boundary="----=_NextPart_000_0138_01C418ED.A10435E0";
type="multipart/alternative"
X-MimeOLE: Produced By Microsoft MimeOLE V5.50.4522.1200

This is a multi-part message in MIME format.

И так далее.
Я приноровилась работать в двух окнах, но всё равно очень нудно, тем более, что файлов этих очень много. Да и жаль, что нельзя использовать CAT.
Но если нельзя ничего сделать с этими файлами - можно ли как-нибудь скопировать текст с самого сайта, если там этот Flash Player "мешает"?


Direct link Reply with quote
 

Natalie  Identity Verified
Poland
Local time: 19:50
Member (2002)
English to Russian
+ ...
- Apr 18, 2004

Нина, я так и не поняла: в формате mht вы можете записать файл у себя на диске? В браузере? То есть, когда в браузере у вас файл на экране, кликните File > Save as и посмотрите, что там можно выбрать (и можно ли вообще).

И если у вас Оффис2К, то в нем должна быть поддержка этого формата - попробуйте в Ворде войти в меню File > Open и выберите в форматах All Word documents или просто All files.

[Edited at 2004-04-18 21:53]


Direct link Reply with quote
 
NinaShir
Local time: 21:50
German to Russian
+ ...
TOPIC STARTER
Значит, я неясно сформулировала. Apr 18, 2004

Natalie wrote:

Нина, я так и не поняла: в формате mht вы можете записать файл у себя на диске? В браузере?

И если у вас Оффис2К, то в нем должна быть поддержка этого формата - попробуйте в Ворде войти в меню File > Open и выберите в форматах All Word documents или просто All files.


Клиент прислал мне файлы с расширением .mht, и все они хранятся у меня на диске. Когда же я любой из этих файлов открываю, у меня загружается полная картинка какой-либо страницы веб-сайта и висит у меня на экране монитора - красивая и мёртвая. И ничего я с ней не могу поделать. Только любоваться.
Если .pdf можно пропустить через FineReader или просто целиком скопировать в Ворд и работать, то эти файлы просто картинка, не поддающаяся ни копированию, ни каким-либо трансформациям.
Далее. После того, как все мои попытки что-то сделать с файлами оказались безуспешными, я бросила файлы и вышла в интернет, найдя сам сайт, который надо переводить. Думаю, скопирую оттуда тексты в Ворд и буду переводить с комфортом. Не тут-то было. Там тоже ничего нельзя скопировать: в Ворде появляется строчка "CONTROL ShockwaveFlash...." и всё. Я так разумею, что это из-за Macromedia Flash Player. А вот нельзя ли как-то этого Player'а нейтрализовать, чтобы перетащить-таки текст в Ворд?


Direct link Reply with quote
 

Juri Istjagin. Ph.D.  Identity Verified
Local time: 19:50
German to Russian
+ ...
Frontpage? Apr 19, 2004

Нина, мне никогда не приходилось работать с такими файлами. Но, может быть, Вам попробовать выйдя на сайт открыть обработку страницы с Frontpage? Оттуда Вы могли бы все скопировать в Ворд...

Direct link Reply with quote
 

Nikolai Muraviev  Identity Verified
Russian Federation
Local time: 20:50
English to Russian
+ ...
TAG EDITOR? Apr 19, 2004

Глупый и наивный вопрос: а TagEditor не берет такие вещи? Или какой другой подобный софт?

Direct link Reply with quote
 

Vitali Chasnovski  Identity Verified
Ukraine
Local time: 20:50
Member (2005)
German to Russian
+ ...
WHAT IS WEB ARCHIVE FORMAT (*.MHT)? Apr 19, 2004

А вот что мне удалось "накопать".

WHAT IS WEB ARCHIVE FORMAT (*.MHT)?

When you save a Web page as "Web archive," the Web page saves this information in Multipurpose Internet Mail Extension HTML (MHTML) format with a .mht file extension. All relative links in the Web page are remapped and the embedded content is included in the .mht file, rather than being saved in a separate folder. The absolute references or hyperlinks on the Web page remain unchanged and the .mht file is viewed using Internet Explorer.
MHTML enables you to send and receive Web pages and other HTML documents using e-mail programs such as Microsoft Exchange, Microsoft Outlook, and Microsoft Outlook Express. MHTML enables you to embed images directly into the body of your e-mail messages rather than attaching

После этого я сохранил веб-страницу с расширением *.MHT и смог открыть ее уже с диска. Сохраненный текст позволяет себя копировать Ворд через буфер обмена. (с рисунками).
Вывод:
Вероятно, Вам прислали не совсем текстовый (веб-страница) файл.
Виталий


Direct link Reply with quote
 

Sergei Tumanov  Identity Verified
Local time: 20:50
English to Russian
+ ...
пройдем дорогой трудной мы в город Изумрудный! Apr 19, 2004

есть способ, он непрямой, но есть.

1. вывести картинку на экран
2. на клавиатуре нажать на клавишу PrintScreen.
3. открыть графический редактор. сгодится и Paint
4. Сделать Paste
5. полученный скриншот распечатать
6. отсканировать и прогнав через OCR (ааббу Reader) получить текстовый файл.

чтобы вместе с полезным изображением в скриншот не шутились ненужные рамки браузера нажимайте на принтскрин + Alt

+++


Direct link Reply with quote
 

mk_lab  Identity Verified
Ukraine
Local time: 20:50
Member (2004)
English to Russian
+ ...
Save As... Apr 19, 2004

А пробовали сохранить в виде текста прямо из Internet Explorer? Если там не слишком сложная разметка, то должно помочь.

Direct link Reply with quote
 

Natalie  Identity Verified
Poland
Local time: 19:50
Member (2002)
English to Russian
+ ...
- Apr 19, 2004

Нина, посмотрите вот эти два документа:

http://support.microsoft.com/default.aspx?scid=kb;en-us;252472

http://support.microsoft.com/default.aspx?scid=kb;EN-US;251336

Скачайте и установите add-in и converter - без них нечего делать.


Direct link Reply with quote
 
NinaShir
Local time: 21:50
German to Russian
+ ...
TOPIC STARTER
Всё испробовала Apr 19, 2004

Natalie wrote:

Нина, посмотрите вот эти два документа:

http://support.microsoft.com/default.aspx?scid=kb;en-us;252472

http://support.microsoft.com/default.aspx?scid=kb;EN-US;251336

Скачайте и установите add-in и converter - без них нечего делать.


Именно с этого я и начала. Установила и Add-on, и Convertor. Однако при попытке открыть файл .mht из Ворда через File-Open-Webarchiv, в документе появляется только строчка {INCLUDEPICTURE \d "http://usm...}.

Чтобы проверить, не допустила ли я ошибок при установке, сделала то, что предлагает Vitali Chasnovski, т.е. вышла на интернет-сайт и сохранила как файл.mht одну из страничек. Всё получилось, но при попытке открыть сохранённый т.о. файл - та же картина с {INCLUDEPICTURE}... А если пробовать через буфер обмена, то появляется строчка {EMBED Package}.

Пробовала открыть через TagEditor: появляется куча всяких тэгов, но текста для перевода среди них нет.

Самый рабочий вариант предложил Сергей Туманов, причем FineReader даже берёт сохраненный файл, но тут мне не повезло в другом: шрифт на сайте очень мелкий, поэтому FineReader легко распознаёт крупные заголовки, а всё остальное просто игнорирует... Распечатывать и сканировать 50 файлов не имеет смысла, т.к. каждая страничка (из тех 50, что я пока видела) это 8 строчек текста, а остальное анимация, картинки, портреты и проч. В любом случае, теперь я знаю эту методу.:-)

2Juri Istjagin: вот это я не поняла: "выйдя на сайт открыть обработку страницы с Frontpage". Потыкалась везде, где могла, но сайт - как неприступная крепость..

Огромное спасибо всем, кто откликнулся и предложил свои варианты. Я узнала много полезного.

А что касается "клиент не может предоставить для перевода какой-нибудь более "удобоваримый" формат?", то клиент мне посочувствовал, дескать, да, работа нудноватая, но хоть по времени не сильно ограничил. И на том спасибо.


Direct link Reply with quote
 

Natalie  Identity Verified
Poland
Local time: 19:50
Member (2002)
English to Russian
+ ...
- Apr 19, 2004

Нина, я попробовала повозиться с конвертером - у меня та же история. Все закончилось глобальным зависанием виндовс в целом

Такое впечатление, что остается только попросить от заказчика файлы в другом формате



[Edited at 2004-04-19 18:11]


Direct link Reply with quote
 

Juri Istjagin. Ph.D.  Identity Verified
Local time: 19:50
German to Russian
+ ...
варианты Apr 19, 2004

NinaShir wrote:

Juri Istjagin: вот это я не поняла: "выйдя на сайт открыть обработку страницы с Frontpage". Потыкалась везде, где могла, но сайт - как неприступная крепость..



Нина, когда открываете страничку и если у Вас установлен Frontpage, то в меню слева в верху, где "файл", есть пунтк "открыть с Frontpage". У меня немецкий язык стоит как Betriebssystemsprache, но я думаю, по-русски примерно так называется. То есть Вы открываете тогда файл в программе обработки вэб-страницы. А оттуда Вы могли бы скопировать текст в Ворд (ибо программы из одного пакета).

Птом я нашел ещё ссылку http://www.thieme.de/notfallmedizin/06_02/medint_01.html Там внизу есть пункт Einzelseiten gekonnt speichern - посмотрите, там тоже речь идёт о mht-файлах. Там нужно загрузить конвертер для Ворда и переименовать расширение файла mht.

Может быть действительно получится.


Direct link Reply with quote
 

Svetlana Touloub  Identity Verified
Local time: 19:50
Dutch to Russian
+ ...
увы... Apr 19, 2004

увы....но это "мертвые" файлы - Вы НИЧЕГО с ними сделать не сможете (вчера мужа мучила, он у меня компутерщик:) - он сказал, что надо просить заказчика прислать тексты в другом формате). Все, что Вы сейчас можете - это только смотреть на них:(......Мне, правда, в таком случае легче - у меня три монитора, поэтому "прыгать" не приходится, места хватает, чтобы как минимум три окна полностью открытыми держать....
Так что обращайтесь к заказчику - у него должны быть те же самы тексты в Ворде....


Direct link Reply with quote
 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Файлы с расширением .mht

Advanced search


Translation news in Russian Federation





PDF Translation - the Easy Way
TransPDF converts your PDFs to XLIFF ready for professional translation.

TransPDF converts your PDFs to XLIFF ready for professional translation. It also puts your translations back into the PDF to make new PDFs. Quicker and more accurate than hand-editing PDF. Includes free use of Infix PDF Editor with your translated PDFs.

More info »
CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use SDL Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

More info »



All of ProZ.com
  • All of ProZ.com
  • Term search
  • Jobs