Mobile menu

请问如何处理PDF文件中图片上的文字?(How to convert the text in graphics in PDF file to editable text?)
Thread poster: Han Li
Han Li  Identity Verified
China
Local time: 10:49
English to Chinese
+ ...
Jan 21, 2007

这个问题困扰了我很长时间了,以前我用ABBYY Finereader处理,在转换成Word的时候,先把图片作为picture框选,再把图片中的文字作为text框选,然后扫描保存。但这样做的结果是,图片中的文字可以编辑了,但文字区域的背景色彩也丢失了。其实这样的文件完全可以要求客户处理,但我也确实想学习一下。还请有相关经验的朋友指点,谢谢了!
PS:这几天上网可能不太方便,所以可能不能及时回复。

[标题已经过网站人员或版主的修改 2007-01-22 23:58]

[标题已经过网站人员或版主的修改 2007-02-27 10:59]


Direct link Reply with quote
 

Jing Nie
China
Local time: 10:49
Member (2011)
English to Chinese
+ ...
请把问题说清楚一点 Jan 21, 2007

你所说的图片上的文字是字还是与背景的图融合在一起,无法单独复制出来?
如果真的是字,就很方便处理。可以用indesign或是illustrator把字给抠出来。翻译后再把字贴回去。有一个软件,bcl drake 它的转WORD功能很不错的,你也可以试试。

如果是看起来是字,实际上是图,那就比较麻烦,问一下客户有没有原始的制做这个PDF的文件,比如说indesign文件或Quark文件,直接在上面改。不过也必须要求你懂这些排版软件。

如果我的客户想让我翻译PDF,又想做成PDF的话,我总是外包出去。这个没有办法,翻译也不可能是全能的。你这样做也算是替国家的就业问题出了一把力。


Direct link Reply with quote
 
Wenjer Leuschel  Identity Verified
Taiwan
Local time: 10:49
English to Chinese
+ ...
请求提供原图稿 Jan 21, 2007

Han Li wrote:

这个问题困扰了我很长时间了,以前我用ABBYY Finereader处理,在转换成Word的时候,先把图片作为picture框选,再把图片中的文字作为text框选,然后扫描保存。但这样做的结果是,图片中的文字可以编辑了,但文字区域的背景色彩也丢失了。其实这样的文件完全可以要求客户处理,但我也确实想学习一下。还请有相关经验的朋友指点,谢谢了!
PS:这几天上网可能不太方便,所以可能不能及时回复。


小韩:

图片的处理一般不包含在翻译工作上的,通常是另外有预算做 DTP 工作之用,应由客户提供原图稿,文字是后头加入的,不采取图文框嵌入的方式处理,而是直接把文字写到图上。这有特殊的软件可用,排版的专业公司都这样做的。我的做法是交给排版专业人处理,绝不自己做,因为那个预算相当高,翻译者没有必要替翻译公司省这种钱,最终客户反正一定得花这个钱。

有些翻译者只要求翻译费用,却做了额外的工作。那是很划不来的。不应该这样做。如果连 DTP 工作都承接的项目,一定要另计费用。至于给不给专业同仁赚这个钱,那是个人的裁量。我个人偏向于给专业人员赚这个钱,好顺道交一些能解决问题的朋友,自己也多了些时间思考经济原则方面的问题,还有些时间做更加经济实惠的事情。

说明白些,人家吃饭的家伙不太可能随便详尽向别人解说;不如想办法让客户多给预算,你好用来寻找恰当人选与你合作、帮你解决 DTP 的问题。

- Wenjer


[Edited at 2007-01-21 11:46]


Direct link Reply with quote
 

xtang  Identity Verified
Japan
Local time: 11:49
English to Chinese
+ ...
好像客户很少要求同时DTP的 Jan 21, 2007

如果你说的文件是英文的(我觉得应该是。。。),Omnipage可以很好地把各个元素转换出来。但是该软件无法识别中文,这点是个遗憾。

不知道大家有没有受到一份调查的邀请,调查的一部分就是看大家一般的工作包不包括DTP,愿不愿意接受DTP的培训等等。

现在我做的翻译多是side-by-side的,客户不要求排版,好像他们可以把原文件导出为文本格式(如xml),然后再导入翻译文本就可以了,这样可以保留格式,但也需要根据译文进行调整。

DTP这块的利润应该挺大的,所以我在不断学习Indesign,哈哈。


Direct link Reply with quote
 
Wenjer Leuschel  Identity Verified
Taiwan
Local time: 10:49
English to Chinese
+ ...
最好分開兩種不同性質的工作 Jan 21, 2007

Duncan Deng wrote:
好像客户很少要求同时 DTP 的


確實很少客戶會要求翻譯者同時做 DTP 工作的。不過,如果你做的是 freelance project management,那就很可能常常必須安排 DTP 的工作。我能透露的是,DTP 的預算往往佔整個工作費用的相當大比例,給翻譯工作增加相當高的附加價值。因此,有 DTP 本領的翻譯者當然可以獲得較有利的工作條件。

我比較擔心的則是有些翻譯者不知道這行裡的規矩,賤價把翻譯和 DTP 工作結合在一起,那就很容易打壞原本即已不很樂觀的中文翻譯市場。一般情況下,我會把 DTP 工作另外派給專業人士,讓他們獲得工作機會,而不會要求翻譯者順道做 DTP,最主要原因是翻譯者對某些排版細節並不熟悉,容易犯錯,那會造成原本要達到的文宣效果大大降低。

另外,培養專業 DTP 人才也是我們這個行業裡非常重要的一個環節,分工是非常必要的,可以避免浪費翻譯者專業進修的時間,而專業 DTP 人才可以做出更有價值的文件,對終端客戶有利而無弊。因此,我寧可多花一點費用讓 DTP 公司或 freelancers 做這份工作,這也是為我的客戶負責的考量。除非翻譯者本身早已熟悉 DTP 的所有細節,否則我不可能把 DTP 交給翻譯者做。

順道說一下,真正做 DTP 的人大多使用 MacIntosh,而不用 IBM Compatible PC 做他們的工作。從我這裡出去的工作,以 Mac 定稿的比例相當高。InDesign 也是其中一種排版工具,用 Compatible 做的和 Mac 做的到底有差別。利潤確實不小,尤其用 Mac 做出來的。


Direct link Reply with quote
 

Shang
China
Local time: 10:49
English to Chinese
Microsoft Office Document Imaging Jan 22, 2007

如果文本是可编辑的,直接复制即可。

如果文本是不可编辑的图片,一种很简单的办法是将PDF保存成tiff文件,然后用Microsoft Office Document Imaging打开tiff文件,对文字部分进行OCR处理。文本背景应该是图片,在PDF里复制即可;可能要用Photoshop等工具处理,将原文覆盖掉。


Direct link Reply with quote
 
Han Li  Identity Verified
China
Local time: 10:49
English to Chinese
+ ...
TOPIC STARTER
谢谢你,NieJing! Jan 24, 2007

NieJing wrote:

你所说的图片上的文字是字还是与背景的图融合在一起,无法单独复制出来?
如果真的是字,就很方便处理。可以用indesign或是illustrator把字给抠出来。翻译后再把字贴回去。有一个软件,bcl drake 它的转WORD功能很不错的,你也可以试试。

如果是看起来是字,实际上是图,那就比较麻烦,问一下客户有没有原始的制做这个PDF的文件,比如说indesign文件或Quark文件,直接在上面改。不过也必须要求你懂这些排版软件。

如果我的客户想让我翻译PDF,又想做成PDF的话,我总是外包出去。这个没有办法,翻译也不可能是全能的。你这样做也算是替国家的就业问题出了一把力。


不好意思,今天才回到住处,过几天准备申请开通WiFi,这样外出也不会耽误工作了。其实,这是我在外地时一个老客户让翻译的一个材料。我当时就拒绝了,因为我实在无法分身。刚刚试着用Illustrator打开看了一下,似乎属于那种文字和图片融合的情况。但是,我用Indesign却打不开PDF文件。有空试试bcl drake 看看如何,不过看了大家的介绍,如果再碰到类似的情况,我就直接说“不”了,或者照你所说,转包出去。
再次表示感谢!


Direct link Reply with quote
 
Han Li  Identity Verified
China
Local time: 10:49
English to Chinese
+ ...
TOPIC STARTER
谢谢Wenjer先生分享经验! Jan 24, 2007

Wenjer Leuschel wrote:

Duncan Deng wrote:
好像客户很少要求同时 DTP 的


確實很少客戶會要求翻譯者同時做 DTP 工作的。不過,如果你做的是 freelance project management,那就很可能常常必須安排 DTP 的工作。我能透露的是,DTP 的預算往往佔整個工作費用的相當大比例,給翻譯工作增加相當高的附加價值。因此,有 DTP 本領的翻譯者當然可以獲得較有利的工作條件。

我比較擔心的則是有些翻譯者不知道這行裡的規矩,賤價把翻譯和 DTP 工作結合在一起,那就很容易打壞原本即已不很樂觀的中文翻譯市場。一般情況下,我會把 DTP 工作另外派給專業人士,讓他們獲得工作機會,而不會要求翻譯者順道做 DTP,最主要原因是翻譯者對某些排版細節並不熟悉,容易犯錯,那會造成原本要達到的文宣效果大大降低。

另外,培養專業 DTP 人才也是我們這個行業裡非常重要的一個環節,分工是非常必要的,可以避免浪費翻譯者專業進修的時間,而專業 DTP 人才可以做出更有價值的文件,對終端客戶有利而無弊。因此,我寧可多花一點費用讓 DTP 公司或 freelancers 做這份工作,這也是為我的客戶負責的考量。除非翻譯者本身早已熟悉 DTP 的所有細節,否則我不可能把 DTP 交給翻譯者做。

順道說一下,真正做 DTP 的人大多使用 MacIntosh,而不用 IBM Compatible PC 做他們的工作。從我這裡出去的工作,以 Mac 定稿的比例相當高。InDesign 也是其中一種排版工具,用 Compatible 做的和 Mac 做的到底有差別。利潤確實不小,尤其用 Mac 做出來的。

非常感谢你的介绍,我目前确实对这方面的有些规矩不太懂,有时客户给了PDF文件,如果我看着比较好处理,就直接处理后翻译了。而客户其实并不需要我把翻译好的文件做成PDF给他,再弱弱的问一句:客户是否必须把PDF文件转换后再交给译者?如果客户没有转换为PDF文件而交给译者翻译,是否再加收DTP的价格?但我总觉得客户又没有要求交PDF文件,这种情况似乎不能按全部DTP的价格收取,按DTP的多大比例收取比较合适?
再次感谢!


Direct link Reply with quote
 
Han Li  Identity Verified
China
Local time: 10:49
English to Chinese
+ ...
TOPIC STARTER
我也在学Indesign Jan 24, 2007

Duncan Deng wrote:

如果你说的文件是英文的(我觉得应该是。。。),Omnipage可以很好地把各个元素转换出来。但是该软件无法识别中文,这点是个遗憾。

不知道大家有没有受到一份调查的邀请,调查的一部分就是看大家一般的工作包不包括DTP,愿不愿意接受DTP的培训等等。

现在我做的翻译多是side-by-side的,客户不要求排版,好像他们可以把原文件导出为文本格式(如xml),然后再导入翻译文本就可以了,这样可以保留格式,但也需要根据译文进行调整。

DTP这块的利润应该挺大的,所以我在不断学习Indesign,哈哈。

以前学过一点,可是没坚持下来,所以还是什么都不懂,看来三天打鱼,两天晒网还是不行啊。:-)
有时间也试试你的软件。谢谢了!


Direct link Reply with quote
 
Han Li  Identity Verified
China
Local time: 10:49
English to Chinese
+ ...
TOPIC STARTER
一直还没用过Microsoft Office Document Imaging Jan 24, 2007

Shang wrote:

如果文本是可编辑的,直接复制即可。

如果文本是不可编辑的图片,一种很简单的办法是将PDF保存成tiff文件,然后用Microsoft Office Document Imaging打开tiff文件,对文字部分进行OCR处理。文本背景应该是图片,在PDF里复制即可;可能要用Photoshop等工具处理,将原文覆盖掉。

谢谢你的介绍,Office从系统安装过就开始装上了,可一直对这个工具“视而不见”,要不是你提醒,我还一直不知道。不过照大家的意见看来,做这样的项目,如果不熟悉,还是得不偿失的,耽误时间不说,也未必能够做好,开始提问时以为很好解决,只需一个软件就行了,看来我想错了。以后再碰到,就找有经验的朋友做。
Thanks again……


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

请问如何处理PDF文件中图片上的文字?(How to convert the text in graphics in PDF file to editable text?)

Advanced search






Déjà Vu X3
Try it, Love it

Find out why Déjà Vu is today the most flexible, customizable and user-friendly tool on the market. See the brand new features in action: *Completely redesigned user interface *Live Preview *Inline spell checking *Inline

More info »
SDL Trados Studio 2017 Freelance
The leading translation software used by over 250,000 translators.

SDL Trados Studio 2017 helps translators increase translation productivity whilst ensuring quality. Combining translation memory, terminology management and machine translation in one simple and easy-to-use environment.

More info »



All of ProZ.com
  • All of ProZ.com
  • Term search
  • Jobs