Beluka örneğinde sözlük veritabanını CAT aracına aktarmak
Thread poster: NecdetB
NecdetB  Identity Verified
Turkey
Local time: 11:56
German to Turkish
+ ...
Aug 28, 2014

Çeviriye yeni başladınız ya da benim gibi CAT araçlarına yeni bulaştınız. Elinizde düz mantık hazırladığınız birkaç bin maddelik birkaç Excel sözlükçesi var ama bunlar CAT aracında kullanıma elverişli yapıda değil. Bunları ve internette sağda-solda bulduğunuz diğer birkaç sözlükçeyi "Sözlükçeler ile ilgili birkaç soru" konu başlığı altında anlattığım yollardan CAT programlarında kullanılır hale getirdiniz ancak farkettiniz ki bu iş herbiri 3-5 bin maddelik 5-10 sözlükçe işi değil. Ona ne şüphe, bundan böyle zamanla uygun formatta sözlükçeler hazırlayacak ve mevcut olanları genişleteceksiniz ancak bu kadar vaktiniz yok. Kullanışlı, iş görür kapsamdaki sözlükçelere hemen ihtiyacınız var. Bu durumda, süreci tersine çevirin: Zamanla oluşturmayın, zamanla silin!

Tüm (neredeyse tüm) sözlük veritabınını CAT aracına aktarın. Arada aktardığınız çer-çöpü zamanla silin. Nasıl mı? Şöyle:

Kullandığınız çevrimiçi ya da çevrimdışı sözlük, kaynak, veritabını, her ne ise o, Almanca-Türkçe çevrimiçi sözlük Beluka (http://www.beluka.de/) örneğinde olduğu gibi, jokerli ("*") aramaya izin veriyorsa, dolayısıyla sonuçları buna göre listeliyorsa, kısa bir süre içinde tüm veritanını CAT programınına aktarabilecek hale getirebilirsiniz. Bunun için yapacağınız birkaç işlemden ilki kopyala-yapıştır. Kopyala yapıştır sayısı, çalıştığınız dilin sözcük türetim eklerinin sayısı kadar (Almanca örneğinde bu sayı yaklaşık 300).

Şimdi yapım eklerini tek tek girerek (İngilizce için birer örnek: semi* ve *able) listelenen (uzun mu uzun) sonuçları kopyalayıp Notepad++ gibi bir metin editörüne yapıştırın.

(Almanca'da Beluka örneğini denemek isteyenler, sözcük türetim eklerinin bir listesini http://hypermedia.ids-mannheim.de/call/public/gramwb.ansicht?v_app=g&v_kat=Affix&v_buchstabe=A adreinde bulabilirler.)

Notepad++'e yapıştırdığınız listenin yapısını inceleyin. Solda, ortalarda veya sonda nelerin tekrarlandığını saptayın. Beluka örneğin de bu sonuçlar:

Almanca Sözcük TAB (sözcük türü) TAB (sözcüğün kullanıldığı alan) Türkçe karşılık


şeklinde. Bu durumda, istemediğiniz alanları/sütunları silmek için, sonuç listesinin yapısına bağlı olarak programın "Bul/Değiştir" özelliğini kullanabilir ya da Excel'den yararlanabilirsiniz. Yukarıdaki örnekte, sonuçlar Excel'e kopyalandığında, Excel'deki görünüm

Sütun A: almanca sözcük
Sütun B: boş
Sütun C: (sözcük türü)
Sütun D: (sözcüğün kullanıldığı alan)
Sütun E: boş
Sütun F: türkçe karşılık


Boş sütunları sildikten sonra diğer ilgili alanları, tutmak isterseniz, sırasını değiştirebilir (örneğin en başa ya da en sona alabilir), tutmak istemezseniz, bunları da silebilirbisiniz. En yalın halinde, Notepad++'e geri kopyaladığınızda, buradaki görünümü:

almanca sözcük TAB türkçe karşılık


şeklinde olacaktır. Bu haliyle CAT aracına aktarılmaya büyük oranda hazır ancak acilen silinmesi gereken dilbilgisi sözcükleri de beraberinde gelmiştir. Bunları silmek için, "Bul/Yapıştır" penceresinde "RegEx" kullanılabilir. Örneğin "on, were, because" gibi yaygın grammatik sözcüklerini silmek için

Find What: " ^on"
Replace with : (Bu kısım boş kalacak")

Bu komutla acilen silinmesi gereken sözcükleri de bulup sildikten sonra tüm listeyi CAT içine txt veya CSV olarak aktarabilirsiniz.

Sonuç listelerini aktarırken aradan kaynamış çer-çöpü (turist-dili-ifadeler-ve-söz-grupları) zamanla silebilirsiniz. Beluka örneğinde girdi sayısı 650,000'i geçiyor. Bunun en az 150,000'i turist almancası/türkçesi. Ben zamanla sileceğim, siz de öyle yapın. Zamanla silin!


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Beluka örneğinde sözlük veritabanını CAT aracına aktarmak

Advanced search







Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »
SDL MultiTerm 2017
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2017 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2017 you can automatically create term lists from your existing documentation to save time.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search