PDF in Word umwandeln und in TRADOS überestzen ?
Thread poster: doctec

doctec
Local time: 15:05
German to English
Jul 21, 2011

Hallo Zusammen,
Ich habe ein Problem mit PDFs und Trados. Wir bekommen teilweise sehr große PDF-Datein, die wir übersetzen sollen. Diese wandeln wir mit FineReader, OmniPage oder SolidConverter in Word-Dateien um. Mal funktioniert das eine, mal das andere Programm besser, wobei Solid Converter meist die Nase vorn hat. Also wie gesagt, die PDFs werden in Word umgewandelt und sehen dann auch ganz annehmbar aus. Teilweise formatieren wir die vor dem Übersetzen noch mal grob durch. Legen also Formate usw. an, damit Inhaltsverzeichnis automatisch erstellt werden können.
Jetzt zu dem Problem. Wenn wir diese PDF-Dateien in TRADOS laden, es ist egal ob Studio 2007 oder 2009, dann zerpflückt TRADOS die Wörter und haut da überall TAGs zwischen die Buchstaben. In Word ist alles normal. Es sind einzelne Wörter. Da sind keine Leerzeichen zwischen den Buchstaben, überall die gleiche Schriftart und -größe. Die Wörter werden per Doppelklick auch einzeln als ganzes Word markiert und mit recher Maustaste werden auch Korrekturen vorgeschlagen. Die Rechtschreibprüfung funktioniert also auch. Kurz es verhält sich wie ein normales Word-Dokument. Aber eben nicht in TRADOS, da wird es zerhackt. Man kann das natürlich nicht analysieren und auch nicht übersetzen. Ich habe auch schon unter neuem Namen abgespeichert, alle Formate in der Word-Datei komplett gelöscht, und als RTF abgespeichert. Hat alles nix geholfen. Der Effekt tritt auch sowohl bei Word 2010 als auch bei der 2003er Version auf.
Damit ihr besser versteht was ich meine, habe ich mal zwei Screenshots beigefügt. Auf dem ersten sieht man links die erzeugte (in diesem Fall mit Solid Converter) Word-Datei und rechts die Original PDF. Auf dem zweiten Screenshot seht ihr wie es im TagEditor aussieht (In Studio 2009 ist es nciht besser)
Habt Ihr eine Idee, was ich falsch mache?




und




Direct link Reply with quote
 

Andrzej Lejman  Identity Verified
Local time: 15:05
German to Polish
+ ...
CodeZapper Jul 21, 2011

From this forum:

You can use the CodeZapper set of Word macros, if you can find it on Google. It used to be free, but now it doesn't seem to be.

If the visible formatting is the same throughout the text, you can select a little bit of text and use Format Painter in Word to apply the same formatting elsewhere. Another, not mutually exclusive option, is to open a new document, select Insert > File, and point to your document. The content will be inserted, and a lot of useless formatting will be discarded. You can also try saving as RTF/DOCX/DOC and back to the original format.


http://asap-traduction.com/CodeZapper

And another option:

The tags you see represent the formatting in the document.
Do not blame the CAT for existence of tags, but the badly formatted source.
Most probably your sorce is a OCR document or a transformed PDF document.
Open this document in Word.
Press CTRL+A, then CTRL+D, chose Arial and press OK.
Again press CTRL+A and then CTRL+D. Go to the spacing tab.
Set the scale of characters to 100% and the spacin to normal, deselect kerning.
Press OK. Save the document and open in Studio. It will now contain only necessary tags.

HTH

Regards

A.


Direct link Reply with quote
 

doctec
Local time: 15:05
German to English
TOPIC STARTER
THANKS Jul 21, 2011

CTRL+A and CTRL+D helped al lot.

I will try CodeZapper too. 20 € is not so expensive.


THANKS


Direct link Reply with quote
 

Heinrich Pesch  Identity Verified
Finland
Local time: 16:05
Member (2003)
Finnish to German
+ ...
Auf den Original-Dokumenten bestehen! Jul 21, 2011

Kein Dokument entsteht in pdf. Es gibt immer beim Kunden das Original, entweder Word, Excel, Pagemaker oder Indesign etc. Diese Formate eignen sich zum Übersetzen. Pdf ist nur zum Angucken.
Bei pdf Preisaufschlag fordern!

[Bearbeitet am 2011-07-21 12:46 GMT]


Direct link Reply with quote
 

Geneviève von Levetzow  Identity Verified
Local time: 15:05
Member (2002)
French to German
+ ...
Direkt im Studio Jul 23, 2011

Hallo,

Sie können auch PDF (natürlich keine eingescannten) direkt im Studio konvertieren. Meiner Erfahrung nach sind all diese überflüssigen Tags weg. Ein bisschen Handarbeit ist noch beim Layout gefragt, aber die gibt es leider immer.

Geneviève


Direct link Reply with quote
 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


PDF in Word umwandeln und in TRADOS überestzen ?

Advanced search






WordFinder
The words you want Anywhere, Anytime

WordFinder is the market's fastest and easiest way of finding the right word, term, translation or synonym in one or more dictionaries. In our assortment you can choose among more than 120 dictionaries in 15 languages from leading publishers.

More info »
SDL MultiTerm 2017
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2017 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2017 you can automatically create term lists from your existing documentation to save time.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search