Ähnliche Segmente in einem Text zählen
Thread poster: kl64

kl64
Germany
Local time: 15:28
Slovak to German
+ ...
Sep 21, 2010

Hallo,
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Ein Beispiel:

zwei ähnliche Segmente aus einer Objektbeschreibung:
"Haustiere und Rauchen sind in den Zimmern nicht erlaubt"
"Haustiere und Rauchen sind in den Zimmern erlaubt"

Das Programm sollte solche ähnlichen Segmente identifizieren, zählen und anzeigen können. Bisherige Konkordanz-Programme wie auch CAT identifizieren die oben genannten Segmente als zwei verschiedene.

Kennt jemand da ein kostenloses Programm?


 

xxxOlaf
Local time: 15:28
English to German
Warum? Sep 21, 2010

kl64 wrote:
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Eine solche Funktinalität ließe sich relativ leicht einbauen ist aber unpraktisch, da die meisten Agenturen Preise gemäß der Ähnlichkeit der Segmente mit einem Translation Memory d.h. über Fuzzy Matches berechnen. Selbst wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.

[Edited at 2010-09-21 20:04 GMT]


 

kl64
Germany
Local time: 15:28
Slovak to German
+ ...
TOPIC STARTER
reines Interesse Sep 22, 2010

wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.


Richtig, es ist auch weder für den einen noch den anderen, sondern rein privates Interesse.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.


Vielen Dank für die Links. Der angegebene Quellcode scheint nur für zwei Segmente zu sein. Mal sehen, ob ich jemanden finde, der mir den für eine Vielzahl von Segmenten umschreiben kann (Perl ist nicht so meine Stärke).


 

RWSTranslation
Germany
Local time: 15:28
Member (2007)
German to English
+ ...
Moderne TM-Systeme machen das Sep 22, 2010

Hallo,

die modernen TM-Systeme können auch die internen Fuzzy-Matches ermitteln.

Viele Grüße

Hans


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Ähnliche Segmente in einem Text zählen

Advanced search






SDL MultiTerm 2017
Guarantee a unified, consistent and high-quality translation with terminology software by the industry leaders.

SDL MultiTerm 2017 allows translators to create one central location to store and manage multilingual terminology, and with SDL MultiTerm Extract 2017 you can automatically create term lists from your existing documentation to save time.

More info »
WordFinder Unlimited
For clarity and excellence

WordFinder is the leading dictionary service that gives you the words you want anywhere, anytime. Access 260+ dictionaries from the world's leading dictionary publishers in virtually any device. Find the right word anywhere, anytime - online or offline.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search