Ähnliche Segmente in einem Text zählen
Thread poster: kl64
kl64
Germany
Local time: 07:51
Slovak to German
+ ...
Sep 21, 2010

Hallo,
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Ein Beispiel:

zwei ähnliche Segmente aus einer Objektbeschreibung:
"Haustiere und Rauchen sind in den Zimmern nicht erlaubt"
"Haustiere und Rauchen sind in den Zimmern erlaubt"

Das Programm sollte solche ähnlichen Segmente identifizieren, zählen und anzeigen können. Bisherige Konkordanz-Programme wie auch CAT identifizieren die oben genannten Segmente als zwei verschiedene.

Kennt jemand da ein kostenloses Programm?


Direct link Reply with quote
 
xxxOlaf
Local time: 07:51
English to German
Warum? Sep 21, 2010

kl64 wrote:
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Eine solche Funktinalität ließe sich relativ leicht einbauen ist aber unpraktisch, da die meisten Agenturen Preise gemäß der Ähnlichkeit der Segmente mit einem Translation Memory d.h. über Fuzzy Matches berechnen. Selbst wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.

[Edited at 2010-09-21 20:04 GMT]


Direct link Reply with quote
 
kl64
Germany
Local time: 07:51
Slovak to German
+ ...
TOPIC STARTER
reines Interesse Sep 22, 2010

wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.


Richtig, es ist auch weder für den einen noch den anderen, sondern rein privates Interesse.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.


Vielen Dank für die Links. Der angegebene Quellcode scheint nur für zwei Segmente zu sein. Mal sehen, ob ich jemanden finde, der mir den für eine Vielzahl von Segmenten umschreiben kann (Perl ist nicht so meine Stärke).


Direct link Reply with quote
 

RWSTranslation
Germany
Local time: 07:51
Member (2007)
German to English
+ ...
Moderne TM-Systeme machen das Sep 22, 2010

Hallo,

die modernen TM-Systeme können auch die internen Fuzzy-Matches ermitteln.

Viele Grüße

Hans


Direct link Reply with quote
 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Ähnliche Segmente in einem Text zählen

Advanced search






BaccS – Business Accounting Software
Modern desktop project management for freelance translators

BaccS makes it easy for translators to manage their projects, schedule tasks, create invoices, and view highly customizable reports. User-friendly, ProZ.com integration, community-driven development – a few reasons BaccS is trusted by translators!

More info »
CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use SDL Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search