Mobile menu

Ismétlődések eltávolítása
Thread poster: Andras Szivak

Andras Szivak
Local time: 07:38
Member (2004)
English to Hungarian
+ ...
May 3, 2006

Tud-e valaki olyan szoftverről vagy módszerről, amellyel egy szövegből eltávolíthatók a 100%-ban ismétlődő mondatok, úgy, hogy azok csak egy pédányban maradjanak a szövegben?

Direct link Reply with quote
 

Endre Both  Identity Verified
Germany
Local time: 07:38
Member (2002)
English to German
DéjàVu (SDLX?) May 3, 2006

Első ötletként:

A táblázatalapú CAT-szoftverek (DéjàVu biztosan, vsz. SDLX is) lehetővé teszik, hogy import után azonosítsd az ismétlődő szegmenseket. Ha ezeket üresen hagyod, és az összes többi célszegmensbe átmásolod az eredetit, majd exportálod a dokumentumot, minden ismétlődést kitöröltél.

Szépséghiba: nemcsak a 2. előfordulástól arrafelé törlöd így ki az ismétléseket, hanem az „eredetit” is. Ezt megelőzendő DVX-ben ábécésorrendbe állítva az ismétlődéseket, minden egyes „eredetit” kézzel átmásolhatsz a céloszlopba.

Endre


Direct link Reply with quote
 

Katalin Horváth McClure  Identity Verified
United States
Local time: 01:38
Member (2002)
English to Hungarian
+ ...
Tradosban is lehet May 3, 2006

Szia András!
Tradosban is meg lehet csinálni, viszonylag egyszerűen, most próbáltam ki ellneőrzésképpen.
A következőt csináltam:
1. Létrehoztam egy üres TM-et, Hun-Eng párban.
2. Csináltam egy tesztfájlt Word-ben, ez volt benne:
"Ez egy új mondat. Ez ismétlődik. Ez is új mondat. Ez ismétlődik. Ez ismétlődik. Ez a második ismétlődő mondat.
Ez egy teljesen új mondat. Ez ismétlődik. Ez a második ismétlődő mondat. Ez a második ismétlődő mondat. "
3. Analizáltam ezt, és a Trados mondta, hogy van benne 5 szegmens, ami ismétlődik. (A kis okos, kitalálta.)
4. Ezután az Analyse Files képernyő alján az "Export Unknown Segments..." mellé beírtam, hogy 99%, és megnyomtam a gombot.
5. A fájlnév kijelölésnél Word fájl-t (rtf-et) választottam.

Ezután megnyitottam az elkészült export rtf fájlt, és ez volt benne:
"Ez egy új mondat.
Ez ismétlődik.
Ez is új mondat.
Ez a második ismétlődő mondat.
Ez egy teljesen új mondat."

Amint látod, az első előfordulást megtartotta, de az ismétlődéseket kihagyta.
Gondolom, ezzel tudsz valamit kezdeni.
Az egyetlen dolog, amit észrevettem, hogy az exportált fájlban minden szegmens külön sorba került, vagyis a forrásszöveg formázása elveszett.

Ez gondolom, nem olyan nagy gond, hiszen ha az exportált szöveget Tradosban fordítják, akkor akár azt is meg lehet tenni, hogy miután a fordítás/lektorálás befejeződött, és a fájlt megtisztítják, akkor az így előállított TM-et nekieresztik az eredeti, formázott szövegnek. Amúgy is ez lehetett az alapgondolat, ha az ismétlődéseket ki akartad szedni, mert azokat aztán valahogy vissza kell pakolni, nem?

Remélem, ez segít.
Kati


Direct link Reply with quote
 

Eva Blanar  Identity Verified
Hungary
Local time: 07:38
English to Hungarian
+ ...
Két lépésben May 3, 2006

Kati megelőzött: valóban az a megoldás, hogy az eredeti anyagból "pretranslated" verziót kell készíteni (a forrásnyelvi szöveg bemásolásával), aztán ezt az exportált fájlt kell kiadni fordításra és vagy elkérni a TM-et (Trados esetében mind az öt fájlt) vagy az új kétnyelvű fájlt be kell olvasni egy új memóriába, és abból kell az eredetit "lefordítani".
Hátrány: a fordítóirodának egy kicsivel többet kell dolgoznia.
Előny: nem kell fizetni semmit a 100%-os egyezésekért.
Másra nem jó.


Direct link Reply with quote
 

Katalin Horváth McClure  Identity Verified
United States
Local time: 01:38
Member (2002)
English to Hungarian
+ ...
Továbbiak May 3, 2006

Eva Blanar wrote:

Kati megelőzött: valóban az a megoldás, hogy az eredeti anyagból "pretranslated" verziót kell készíteni (a forrásnyelvi szöveg bemásolásával),


Én nem így csináltam, nem feltétlenül kell a pretranslated, szegmentált verzió (az külön fejfájést okozhat a fordításkor, lásd pl. Zsanett gondja a ProZ lokalizáláskor).


aztán ezt az exportált fájlt kell kiadni fordításra és vagy elkérni a TM-et (Trados esetében mind az öt fájlt)


Ha valaki kiadja a fordítást, akkor szerintem a legegyszerűbb, és a legtisztább megoldás a tisztítatlan fájlt elkérni, és akkor az ember a saját (akár üres) TM-jét használva tisztítja le a fájlt. Akkor tutira az utolsó verzió marad a TM-ben.
Ezzel szemben, ha a fordító tisztított fájlt küld, meg a TM-et (akár mind az 5 fájlt, akár exportálva egy fájlként), akkor nincs semmi garancia arra, hogy az esetleges végső simítások, amiket a saját maga által letisztított fájlon végzett a fordító, benne vannak a TM-ben.


Hátrány: a fordítóirodának egy kicsivel többet kell dolgoznia.
Előny: nem kell fizetni semmit a 100%-os egyezésekért.
Másra nem jó.


Igen, a fordító meg tépheti a haját, mert a szövegből hiányzó mondatok miatt elveszik a teljes szövegkörnyezet.
Láttam már olyan anyagot, ahol volt két egymást követő mondat, mindegyikben egy utasítás, hogy nyomja meg ezt-azt, vagy ilyesmi, de a két utasítás szöges ellentétben állt egymással, illetve így teljesen értelmetlen volt a folyamat, amit leírtak. Persze, ez azért volt, mert eredetileg köztük volt egy néhány olyan mondat, amit a korábbi előfordulás miatt kitöröltek...


Direct link Reply with quote
 

Andras Szivak
Local time: 07:38
Member (2004)
English to Hungarian
+ ...
TOPIC STARTER
Köszönöm May 4, 2006

Kedves Kati! Köszönöm, nekem így külön sorba szedve pont jó lenne, csak az a bökkenő, hogy az Export Unknown Segments nálam szürkén jelenik meg és nem tudok rákattintani.

Direct link Reply with quote
 

Katalin Horváth McClure  Identity Verified
United States
Local time: 01:38
Member (2002)
English to Hungarian
+ ...
Analizálni kell először May 4, 2006

Andras Szivak wrote:

Kedves Kati! Köszönöm, nekem így külön sorba szedve pont jó lenne, csak az a bökkenő, hogy az Export Unknown Segments nálam szürkén jelenik meg és nem tudok rákattintani.


Persze, mert nem elemezted a fájlt.
Először kattints az Add gombra, válaszd ki a fájl, ezután Analyse.
Amikor az kész, akkor lehet exportálni, akkor lesz a gomb megnyomható. (Elemzés nélkül honnan tudná, hogy mi az ismétlődés?)

Kati


Direct link Reply with quote
 

Andras Szivak
Local time: 07:38
Member (2004)
English to Hungarian
+ ...
TOPIC STARTER
Sajnos nem May 5, 2006

Az elemzést követően is csak a View Log File gombot lehet megnyomni.

Direct link Reply with quote
 

Katalin Horváth McClure  Identity Verified
United States
Local time: 01:38
Member (2002)
English to Hungarian
+ ...
Valami nem kóser May 5, 2006

Nem értem. Próbáltam mindenfélét, de nem tudtam olyan helyzetet produkálni, hogy az elemzés után ne lehetett volna megnyomni az Export Unknown Segments gombot.
Milyen formátumú fájl ez különben? Másik fájllal kipróbáltad?
Az elemzésnél talál ismétlődéseket, illetve lemegy az elemzés hiba nélkül, és rendesen kimenti a Log fájlt?


Direct link Reply with quote
 

Andras Szivak
Local time: 07:38
Member (2004)
English to Hungarian
+ ...
TOPIC STARTER
Feladom May 6, 2006

Próbáltam mindenféleképpen, nem megy. Ha lesz időm, újratelepítem a Tradost. Kösz az eddigi fáradozásod.

Direct link Reply with quote
 

Eva Blanar  Identity Verified
Hungary
Local time: 07:38
English to Hungarian
+ ...
Hogyan számol a Trados? Jun 2, 2006

Nincs kedvem most új fórumot indítani emiatt, de felhívnám a figyelmét mindazoknak, akik Trados alapon számláznak (amennyiben magyarról idegen nyelvre fordítanak), hogy a Trados a pontokat a szegmens végeként értelmezi, vagyis ha sok "Rt.", "Kft." vagy pl. sorszám van a szövegben, akkor egy-egy mondat több szegmenst is jelenthet.

Azért mondom, mert néhány iroda nem fizet a 100%-os ismétlődésekért, vagy jóval kevesebbet fizet, holott ezek egy-egy mondat szerves részét képezik - na ja, és a darabokra szabdalt mondat nagyobb valószínűséggel jelent magas százalékos arányt képviselő "match"-eket - alacsonyabb díjjal.

Nem lázítok: "érdekképviselek". Tudniillik utálom a burkolt nyerészkedést.


Direct link Reply with quote
 

Katalin Horváth McClure  Identity Verified
United States
Local time: 01:38
Member (2002)
English to Hungarian
+ ...
Segmentation rules? Jun 2, 2006

Eva Blanar wrote:

Nincs kedvem most új fórumot indítani emiatt, de felhívnám a figyelmét mindazoknak, akik Trados alapon számláznak (amennyiben magyarról idegen nyelvre fordítanak), hogy a Trados a pontokat a szegmens végeként értelmezi, vagyis ha sok "Rt.", "Kft." vagy pl. sorszám van a szövegben, akkor egy-egy mondat több szegmenst is jelenthet.

Azért mondom, mert néhány iroda nem fizet a 100%-os ismétlődésekért, vagy jóval kevesebbet fizet, holott ezek egy-egy mondat szerves részét képezik - na ja, és a darabokra szabdalt mondat nagyobb valószínűséggel jelent magas százalékos arányt képviselő "match"-eket - alacsonyabb díjjal.

Nem lázítok: "érdekképviselek". Tudniillik utálom a burkolt nyerészkedést.


Én is utálom, és én mindig ellenőrzöm a szavak számát, nem fogadom el csak úgy az iroda analízisét.
Ugyanis a Penalty és egyéb beállítások miatt egész más eredmény is kijöhet, pl. ami szerintük 100% egyezés, az sokkal kevesebb is lehet.

A mondaton belüli pontok esetét ki lehet szerintem védeni a szegmentálási szabályok megfelelő beállításával.
A File->Setup ablakban ott van a Segmentation Rules fülecske. Ott kell szétnézni. Nem próbáltam még ki (talán majd holnap), de úgy néz ki, hogy be lehet állítani, hogy az olyan pontot, amit kisbetű követ, ne tekintsen szegmens-végnek.

(Skip rules, Stop character: . , Trailing whitespaces :1, Followed by lowercase).
Majd letesztelem, de szerintem van erre megoldás.
Az már más kérdés, hogy ezt el is kell fogadtatni a megbízóval.


Direct link Reply with quote
 
Zoltán Medgyesi
Hungary
Local time: 07:38
English to Hungarian
Másik oldal... Jun 5, 2006

Eva Blanar wrote:

Nincs kedvem most új fórumot indítani emiatt, de felhívnám a figyelmét mindazoknak, akik Trados alapon számláznak (amennyiben magyarról idegen nyelvre fordítanak), hogy a Trados a pontokat a szegmens végeként értelmezi, vagyis ha sok "Rt.", "Kft." vagy pl. sorszám van a szövegben, akkor egy-egy mondat több szegmenst is jelenthet.


Kétélű a dolog, mert ha a megbízó anyagában pl. kettőspont miatt kétfelé szakadnak a mondatok, de te fordítás közben összevonod a szegmenseket, és így egyezést kapsz a memóriával, akkor majdnem nulla munkát teljes áron fizethetnek.

No persze ez a ritkább eset.


Direct link Reply with quote
 

Eva Blanar  Identity Verified
Hungary
Local time: 07:38
English to Hungarian
+ ...
Legyünk bizakodóak! Jun 5, 2006

Persze, nagyon pártolom én is az optimista hozzáállást

A dolog szépségére akkor jöttem rá, amikor egy jogszabályi hivatkozásokkal és vállalatnevekkel zsúfolt anyagot fordítottam, úgyhogy nem győztem bővíteni a szegmenst - tudjátok, vannak ilyen szép, körmönfont, hivatalnoki mondatok, hogy az Sztv. így, meg az Flt. úgy, meg az ilyen-olyan bekezdések felsorolt pontjai, ahol ugye, mindegyik szám után pont van -, és amíg bővítgettem, ráérő időmben rájöttem, hogy no, akkor ezek a kis rövidek már mindjárt csak 30%-ot érnek. (Na de van olyan iroda, amelyik az ismétlődésért semmit nem fizet!)

Jó, belefér, legyünk őszinték, a vállalatneveket többnyire úgyse kell lefordítani, a számokat se, de azért ha egy nyolcsoros mondatban van 18 szegmens ezek miatt, nekem akkor is egy konzisztens, értelmes mondatot kell produkálnom, miközben a Trados elemzése szerint csak egy csomó apró szegmenst kellett lefordítanom, amelyekben úgyis sok volt az ismétlődés.

Főleg azért szóltam, mert bizonyos típusú szövegekben ez jellemző torzítás lehet, vagyis aki sok ilyet csinál, az rosszabbul jár azonos árak mellett, úgyhogy talán jó, ha tud róla. Például ha saját maga szabja meg a vállalási árat, akkor az alapdíjat ennek megfelelően állíthatja be.


Direct link Reply with quote
 

Andras Szivak
Local time: 07:38
Member (2004)
English to Hungarian
+ ...
TOPIC STARTER
Sikerült Jun 6, 2006

Letöltöttem egy javító csomagot a Trados oldaláról és most már működik. Kösz a tanácsokat.

Eva Blanar wrote:

Előny: nem kell fizetni semmit a 100%-os egyezésekért.
Másra nem jó.


Másra tényleg nem jó, csak arra, hogy elfelejtheted a TagEditort és az ábrákkal teletűzdelt Word lassúságát a Trados használatakor. "Csak" kb. 30%-al tudsz gyorsabban dolgozni.


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Ildiko Santana[Call to this topic]

You can also contact site staff by submitting a support request »

Ismétlődések eltávolítása

Advanced search






Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

More info »
Across v6.3
Translation Toolkit and Sales Potential under One Roof

Apart from features that enable you to translate more efficiently, the new Across Translator Edition v6.3 comprises your crossMarket membership. The new online network for Across users assists you in exploring new sales potential and generating revenue.

More info »



All of ProZ.com
  • All of ProZ.com
  • Term search
  • Jobs