SDL Trados - разпознаване на текст в сканирани PDF документи.
Thread poster: etale

etale
Local time: 14:19
Spanish to Bulgarian
+ ...
Mar 12

Напоследък ми изпращат доста сканирани PDF документи. Функцията на SDL Trados 2017 за четене на PDF файли всеки път ми показва грешка.
Как се справяте Вие с този проблем, колеги?


 

Pavel Tsvetkov  Identity Verified
Bulgaria
Local time: 15:19
Member (2008)
English to Bulgarian
+ ...

Moderator of this forum
. Mar 12

Здравейте, etale!

Подходящ софтуер за преработката на сканирани документи в текст е ABBYY Finereader. Има и много други, но този се справя добре със славянски езици вкл. български.

Поздрави,
Павел


 

Ekaterina Kroumova  Identity Verified
Local time: 15:19
French to Bulgarian
+ ...
Не е най-доброто решение Mar 12

Неведнъж съм попадала на мнения на самите служители на SDL, че това не е най-перфектното решение и че служи само за ситуации, в които нямате друг софтуер за оптическо разпознаване. Тоест самите те не препоръчват да разчитате много-много на тази функционалност. Аз използвам ABBYY PDF Transformer+, отлично се справя, но май от известно време предлагането ѝ е спряно.

При всички случаи, ако често Ви изпращат такива файлове, или искайте предварително да Ви ги извлекат в подходящ за текстообработване формат, или си набавете надежден софтуер. Ако нямате притеснения за поверителността, има прилични онлайн варианти.


 

invguy  Identity Verified
Bulgaria
Local time: 15:19
English to Bulgarian
Още един глас за ABBYY Mar 12

Имам някаква стара OEM версия на FineReader, май 7.0. Беше дошла на CD с някой от скенерите. Работила е безотказно под XP, Vista и седмица (на десятката не съм я пробвал). Рядко ми се налага да използвам OCR, но за инцидентно конвертиране на някой и друг (не много голям) документ върши отлична работа.

Вероятно няма някои функции за автоматизация, с които разполагат по-новите версии. Но аз и без това съм малко консерва и не обичам софтуер да решава вместо мен, без да ме пита icon_smile.gif – тъй че ценя въможностите на тази версия за ръчен контрол, макар че това със сигурност прави процеса по-бавен.


 

Georgi Kovachev  Identity Verified
Bulgaria
Local time: 15:19
Member (2010)
English to Bulgarian
+ ...
Купете си софтуер и поискайте повишение на цената Mar 12

Здравейте, etale!

Пиша малко извън конкретния Ви въпрос, но е свързано със сканирани документи/файлове в PDF формат. Напълно съм съгласен с колегите и се присъединявам към техния съвет да си закупите подходящ софтуер за преобразуване на сканирани документи – наистина ще отделяте по-малко време за странична дейност. Аз лично ползвам PDF Transformer Pro 2.0, който е предишната версия на PDF Transformer+.

Бих искал да Ви обърна внимание на цената. Опитът ми от последните месеци показва, че получавам все по-малко документи в текстови формат – както е и при Вас, както и че агенциите не са склонни да отделят време и ресурс, за да се занимават с подготовка на документите за превод – разбирайте преобразуване в текстови формат и сравняване на резултата с оригиналния текст.
Затова преди време поисках от една от агенциите по-висока цена за сканирани документи или за такива в PDF формат, при които преобразуването в текстови формат е по-лошо, най-вече заради необходимото допълнително време за обработка (за друга давам цена за всеки текст, като уговорката ми е, че за сканирани файлове тя е по-висока по подразбиране). Не постигнах по-висока цена с първата агенция, но вече пестя време, като предавам само текст и не се занимавам да копирам и нагласявам изображенията от оригиналния файл – знаете, че техническите ръководства са пълни с такива.

Установявам обаче, че запитванията, свързани със сканирани/PDF файлове, ми отнемат все повече време, а не всички от тях биват потвърждавани. Решението, което ползвам от скоро, е да преобразувам в .txt формат (с PDF Transformer Pro 2.0), съвсем набързо да събера цели изречения, които са на отделни редове, да изтрия излишните интервали и да анализирам текста с преводаческата програма. Това става по-бързо в сравнение с преобразуване в doc(x) формат, тъй като няма колони, таблици, символи за край на реда, параграф или страница – поне такова усещане имам от последната седмица. Вярно е, че няма таблици, но за даване на първоначална информация за срока на изпълнение и стойността на превода върши работа.

Моля, ако някой колега има по-ефективно решение в тази връзка, да го споделиicon_smile.gif

Поздрави!
Георги

П. С. Не се притеснявайте да искате компенсация за повечето отделено време за странична дейност. Ще установите, че колкото по-често казвате „Не“ (на нахални предложения да работите повече за същото възнаграждение), толкова повече ще постигате една от Вашите цели – по-голямо заплащане за повече положен труд или същото заплащане, но без допълнителен трудicon_smile.gif


 

etale
Local time: 14:19
Spanish to Bulgarian
+ ...
TOPIC STARTER
Благодаря Mar 13

Ще опитам пробната версия на ABBYY FineReader и след това вероятно ще го купя.
Документите, които ми изпращат, в повечето случаи съдържат лични данни и затова онлайн конвертирането е изключено.
Поисках да ми ги изпращат в подходящ формат [както казвахме едно време: във вид удобен за логаритмуванеicon_smile.gif], но любезно ми отказаха.
Благодаря за отзивчивостта, колеги.
Желая Ви приятен ден!


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

SDL Trados - разпознаване на текст в сканирани PDF документи.

Advanced search






CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use SDL Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

More info »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search