Ähnliche Segmente in einem Text zählen
Thread poster: kl64

kl64
Germany
Local time: 05:55
Slovak to German
+ ...
Sep 21, 2010

Hallo,
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Ein Beispiel:

zwei ähnliche Segmente aus einer Objektbeschreibung:
"Haustiere und Rauchen sind in den Zimmern nicht erlaubt"
"Haustiere und Rauchen sind in den Zimmern erlaubt"

Das Programm sollte solche ähnlichen Segmente identifizieren, zählen und anzeigen können. Bisherige Konkordanz-Programme wie auch CAT identifizieren die oben genannten Segmente als zwei verschiedene.

Kennt jemand da ein kostenloses Programm?


Direct link Reply with quote
 

xxxOlaf
Local time: 05:55
English to German
Warum? Sep 21, 2010

kl64 wrote:
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Eine solche Funktinalität ließe sich relativ leicht einbauen ist aber unpraktisch, da die meisten Agenturen Preise gemäß der Ähnlichkeit der Segmente mit einem Translation Memory d.h. über Fuzzy Matches berechnen. Selbst wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.

[Edited at 2010-09-21 20:04 GMT]


Direct link Reply with quote
 

kl64
Germany
Local time: 05:55
Slovak to German
+ ...
TOPIC STARTER
reines Interesse Sep 22, 2010

wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.


Richtig, es ist auch weder für den einen noch den anderen, sondern rein privates Interesse.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.


Vielen Dank für die Links. Der angegebene Quellcode scheint nur für zwei Segmente zu sein. Mal sehen, ob ich jemanden finde, der mir den für eine Vielzahl von Segmenten umschreiben kann (Perl ist nicht so meine Stärke).


Direct link Reply with quote
 

RWSTranslation
Germany
Local time: 05:55
Member (2007)
German to English
+ ...
Moderne TM-Systeme machen das Sep 22, 2010

Hallo,

die modernen TM-Systeme können auch die internen Fuzzy-Matches ermitteln.

Viele Grüße

Hans


Direct link Reply with quote
 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Ähnliche Segmente in einem Text zählen

Advanced search






CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use SDL Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

More info »
Déjà Vu X3
Try it, Love it

Find out why Déjà Vu is today the most flexible, customizable and user-friendly tool on the market. See the brand new features in action: *Completely redesigned user interface *Live Preview *Inline spell checking *Inline

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search