Ähnliche Segmente in einem Text zählen
Thread poster: kl64

kl64
Germany
Local time: 21:27
Slovak to German
+ ...
Sep 21, 2010

Hallo,
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Ein Beispiel:

zwei ähnliche Segmente aus einer Objektbeschreibung:
"Haustiere und Rauchen sind in den Zimmern nicht erlaubt"
"Haustiere und Rauchen sind in den Zimmern erlaubt"

Das Programm sollte solche ähnlichen Segmente identifizieren, zählen und anzeigen können. Bisherige Konkordanz-Programme wie auch CAT identifizieren die oben genannten Segmente als zwei verschiedene.

Kennt jemand da ein kostenloses Programm?


 

Olaf (X)
Local time: 21:27
English to German
Warum? Sep 21, 2010

kl64 wrote:
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Eine solche Funktinalität ließe sich relativ leicht einbauen ist aber unpraktisch, da die meisten Agenturen Preise gemäß der Ähnlichkeit der Segmente mit einem Translation Memory d.h. über Fuzzy Matches berechnen. Selbst wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.

[Edited at 2010-09-21 20:04 GMT]


 

kl64
Germany
Local time: 21:27
Slovak to German
+ ...
TOPIC STARTER
reines Interesse Sep 22, 2010

wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.


Richtig, es ist auch weder für den einen noch den anderen, sondern rein privates Interesse.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.


Vielen Dank für die Links. Der angegebene Quellcode scheint nur für zwei Segmente zu sein. Mal sehen, ob ich jemanden finde, der mir den für eine Vielzahl von Segmenten umschreiben kann (Perl ist nicht so meine Stärke).


 

RWSTranslation
Germany
Local time: 21:27
Member (2007)
German to English
+ ...
Moderne TM-Systeme machen das Sep 22, 2010

Hallo,

die modernen TM-Systeme können auch die internen Fuzzy-Matches ermitteln.

Viele Grüße

Hans


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Ähnliche Segmente in einem Text zählen

Advanced search






SDL Trados Studio 2019 Freelance
The leading translation software used by over 250,000 translators.

SDL Trados Studio 2019 has evolved to bring translators a brand new experience. Designed with user experience at its core, Studio 2019 transforms how new users get up and running, helps experienced users make the most of the powerful features.

More info »
BaccS – Business Accounting Software
Modern desktop project management for freelance translators

BaccS makes it easy for translators to manage their projects, schedule tasks, create invoices, and view highly customizable reports. User-friendly, ProZ.com integration, community-driven development – a few reasons BaccS is trusted by translators!

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search