Poszukiwane dane na temat najczęstszych zbitek liter w języku polskim
Thread poster: Jaroslaw Michalak

Jaroslaw Michalak  Identity Verified
Poland
Local time: 14:23
Member (2004)
English to Polish
Apr 26, 2010

Do przetłumaczenia pewnej gry językowej potrzebuję listę najczęściej występujących zbiter liter w języku polskim (na początku, w środku i na końcu słowa).

Niestety, zaniedbałem moje lingwistyczne kontakty... Czy ktoś wie może, jak dotrzeć do takich danych?


 

Magdalena Szewciów  Identity Verified
Poland
Local time: 14:23
Member (2008)
English to Polish
+ ...
pomysł Apr 26, 2010

może warto skontaktować się z Polską Federacją Scrabble? pomysł niby od "czapy", ale istnieje OSPS (http://www.pfs.org.pl/osps_aktualizacje.php) - oficjalny słownik polskiego scrabblisty, na podstawie którego statystycznie można by to jakoś ustalić (metoda to już do ustalenia z takimi, co to się na tym znają - ja do nich nie należęicon_wink.gif).

 

Szymon Metkowski  Identity Verified
Poland
Local time: 14:23
Member
German to Polish
+ ...
Korpus Apr 27, 2010

Na konferencji był prezentowany korpus języka polskiego. Twórcy wymyślili bardzo rozbudowany system wyszukiwarek. Może warto pójść w tym kierunku? Niestety nie zajmowałem się tym i „rzucenie tematu“ to jedyna pomoc, jaką Ci mogę zaoferować.

 

Marek Daroszewski (MrMarDar)  Identity Verified
Local time: 14:23
English to Polish
+ ...
na szybko trzy możliwości podejścia Apr 28, 2010

Na szybko trzy możliwości podejścia, przy czym pierwsze dwa są bardziej nastawione na 'audio'.

1. Stenografia. W dobrym podręczniku do stenografii będzie analiza wyrazów i sposób zastępowania kilku dźwięków jednym symbolem. Wadą jest to, że stenografia nie koncentruje się na słowie pisanym, ale słowie mówionym.

2. Nauki pokrewne logopedii. Zbitki literowe stanowią pewien problem w nauce czytania, a rozgryzaniem tych problemów zajmuje się logopedia i nauki pokrewne. W podręcznikach na ten temat opisuje się jednak bardziej sylaby i sposoby analizy wyrazów pod kątem sylabifikacji, stąd nie są to czyste zbitki.

3. Analiza słownikowa. Mając listę polskich słów (z odmianą) i znajomego programistę możesz dokonać analzy według własnych potrzeb. Przy czym, musisz zastanowić się czy waga się też liczy w analizie, a wtedy lepszy jest korpus (jak już powiedział Szymon). Wadą korpusu jednak jest zafałszowanie wyników wpływami pozajęzykowymi - np. analizując korpus dowolnej gazety przed 10 kwietnia i po 10 kwietnia, będą inne wyniki dla zbitki 'tyń' czy 'oleń', ze względu na znacznie wyższą częstość pojawienia się słowa 'Katyń' i 'Smoleńsk'.

HTH
Marek


 

Jaroslaw Michalak  Identity Verified
Poland
Local time: 14:23
Member (2004)
English to Polish
TOPIC STARTER
Dziękuję! Apr 29, 2010

Sprawa już chyba nieaktualna - uświadomiłem klientowi, mam nadzieję, że zabrał się do problemu od niewłaściwej strony.

Za sugestie bardzo dziękuję - widać jednak, że do uzyskania sensownych wyników z podanych źródeł wymagany byłby spory wkład pracy. Większość opracowań wychodzi jednak od analizy morfologicznej lub fonologicznej, ortografia (poniekąd słusznie) traktowana jest raczej jako kwestia wtórna. Traktuje się ją zresztą dość utylitarnie, więc dane są filtrowane pod kątem danego zastosowania (w stenografii istotny jest element mnemotechniczny i szybkość łączenia elementów, w maszynopisaniu układ klawiatury, itp.).

Marek słusznie zauważył, że opracowanie takich danych wymaga przyjęcia pewnych założeń, których nawet ja nie znam (nie mam nawet pewności, że w języku angielskim częstotliwość była podstawą zestawu). Dlatego, jeśli klient w przyszłości zdecyduje się opracować grę na nowo dla języka polskiego, skieruję go do językoznawców...


 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

Poszukiwane dane na temat najczęstszych zbitek liter w języku polskim

Advanced search






SDL Trados Studio 2019 Freelance
The leading translation software used by over 250,000 translators.

SDL Trados Studio 2019 has evolved to bring translators a brand new experience. Designed with user experience at its core, Studio 2019 transforms how new users get up and running and helps experienced users make the most of the powerful features.

More info »
CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use SDL Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search