SDL Trados - разпознаване на текст в сканирани PDF документи.
Thread poster: etale

etale
Local time: 22:43
Spanish to Bulgarian
+ ...
Mar 12

Напоследък ми изпращат доста сканирани PDF документи. Функцията на SDL Trados 2017 за четене на PDF файли всеки път ми показва грешка.
Как се справяте Вие с този проблем, колеги?


Direct link Reply with quote
 

Pavel Tsvetkov  Identity Verified
Bulgaria
Local time: 23:43
Member (2008)
English to Bulgarian
+ ...

Moderator of this forum
. Mar 12

Здравейте, etale!

Подходящ софтуер за преработката на сканирани документи в текст е ABBYY Finereader. Има и много други, но този се справя добре със славянски езици вкл. български.

Поздрави,
Павел


Direct link Reply with quote
 

Ekaterina Kroumova  Identity Verified
Local time: 23:43
French to Bulgarian
+ ...
Не е най-доброто решение Mar 12

Неведнъж съм попадала на мнения на самите служители на SDL, че това не е най-перфектното решение и че служи само за ситуации, в които нямате друг софтуер за оптическо разпознаване. Тоест самите те не препоръчват да разчитате много-много на тази функционалност. Аз използвам ABBYY PDF Transformer+, отлично се справя, но май от известно време предлагането ѝ е спряно.

При всички случаи, ако често Ви изпращат такива файлове, или искайте предварително да Ви ги извлекат в подходящ за текстообработване формат, или си набавете надежден софтуер. Ако нямате притеснения за поверителността, има прилични онлайн варианти.


Direct link Reply with quote
 

invguy  Identity Verified
Bulgaria
Local time: 23:43
English to Bulgarian
Още един глас за ABBYY Mar 12

Имам някаква стара OEM версия на FineReader, май 7.0. Беше дошла на CD с някой от скенерите. Работила е безотказно под XP, Vista и седмица (на десятката не съм я пробвал). Рядко ми се налага да използвам OCR, но за инцидентно конвертиране на някой и друг (не много голям) документ върши отлична работа.

Вероятно няма някои функции за автоматизация, с които разполагат по-новите версии. Но аз и без това съм малко консерва и не обичам софтуер да решава вместо мен, без да ме пита – тъй че ценя въможностите на тази версия за ръчен контрол, макар че това със сигурност прави процеса по-бавен.


Direct link Reply with quote
 

Georgi Kovachev  Identity Verified
Bulgaria
Local time: 23:43
Member (2010)
English to Bulgarian
+ ...
Купете си софтуер и поискайте повишение на цената Mar 12

Здравейте, etale!

Пиша малко извън конкретния Ви въпрос, но е свързано със сканирани документи/файлове в PDF формат. Напълно съм съгласен с колегите и се присъединявам към техния съвет да си закупите подходящ софтуер за преобразуване на сканирани документи – наистина ще отделяте по-малко време за странична дейност. Аз лично ползвам PDF Transformer Pro 2.0, който е предишната версия на PDF Transformer+.

Бих искал да Ви обърна внимание на цената. Опитът ми от последните месеци показва, че получавам все по-малко документи в текстови формат – както е и при Вас, както и че агенциите не са склонни да отделят време и ресурс, за да се занимават с подготовка на документите за превод – разбирайте преобразуване в текстови формат и сравняване на резултата с оригиналния текст.
Затова преди време поисках от една от агенциите по-висока цена за сканирани документи или за такива в PDF формат, при които преобразуването в текстови формат е по-лошо, най-вече заради необходимото допълнително време за обработка (за друга давам цена за всеки текст, като уговорката ми е, че за сканирани файлове тя е по-висока по подразбиране). Не постигнах по-висока цена с първата агенция, но вече пестя време, като предавам само текст и не се занимавам да копирам и нагласявам изображенията от оригиналния файл – знаете, че техническите ръководства са пълни с такива.

Установявам обаче, че запитванията, свързани със сканирани/PDF файлове, ми отнемат все повече време, а не всички от тях биват потвърждавани. Решението, което ползвам от скоро, е да преобразувам в .txt формат (с PDF Transformer Pro 2.0), съвсем набързо да събера цели изречения, които са на отделни редове, да изтрия излишните интервали и да анализирам текста с преводаческата програма. Това става по-бързо в сравнение с преобразуване в doc(x) формат, тъй като няма колони, таблици, символи за край на реда, параграф или страница – поне такова усещане имам от последната седмица. Вярно е, че няма таблици, но за даване на първоначална информация за срока на изпълнение и стойността на превода върши работа.

Моля, ако някой колега има по-ефективно решение в тази връзка, да го сподели

Поздрави!
Георги

П. С. Не се притеснявайте да искате компенсация за повечето отделено време за странична дейност. Ще установите, че колкото по-често казвате „Не“ (на нахални предложения да работите повече за същото възнаграждение), толкова повече ще постигате една от Вашите цели – по-голямо заплащане за повече положен труд или същото заплащане, но без допълнителен труд


Direct link Reply with quote
 

etale
Local time: 22:43
Spanish to Bulgarian
+ ...
TOPIC STARTER
Благодаря Mar 13

Ще опитам пробната версия на ABBYY FineReader и след това вероятно ще го купя.
Документите, които ми изпращат, в повечето случаи съдържат лични данни и затова онлайн конвертирането е изключено.
Поисках да ми ги изпращат в подходящ формат [както казвахме едно време: във вид удобен за логаритмуване], но любезно ми отказаха.
Благодаря за отзивчивостта, колеги.
Желая Ви приятен ден!


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

SDL Trados - разпознаване на текст в сканирани PDF документи.

Advanced search






Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »
SDL MultiTerm 2017
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2017 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2017 you can automatically create term lists from your existing documentation to save time.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search