Poszukiwane dane na temat najczęstszych zbitek liter w języku polskim
Thread poster: Jaroslaw Michalak

Jaroslaw Michalak  Identity Verified
Poland
Local time: 21:10
Member (2004)
English to Polish
Apr 26, 2010

Do przetłumaczenia pewnej gry językowej potrzebuję listę najczęściej występujących zbiter liter w języku polskim (na początku, w środku i na końcu słowa).

Niestety, zaniedbałem moje lingwistyczne kontakty... Czy ktoś wie może, jak dotrzeć do takich danych?


Direct link Reply with quote
 

Magdalena Szewciów  Identity Verified
Poland
Local time: 21:10
Member (2008)
English to Polish
+ ...
pomysł Apr 26, 2010

może warto skontaktować się z Polską Federacją Scrabble? pomysł niby od "czapy", ale istnieje OSPS (http://www.pfs.org.pl/osps_aktualizacje.php) - oficjalny słownik polskiego scrabblisty, na podstawie którego statystycznie można by to jakoś ustalić (metoda to już do ustalenia z takimi, co to się na tym znają - ja do nich nie należęicon_wink.gif).

Direct link Reply with quote
 

Szymon Metkowski  Identity Verified
Poland
Local time: 21:10
Member
German to Polish
+ ...
Korpus Apr 27, 2010

Na konferencji był prezentowany korpus języka polskiego. Twórcy wymyślili bardzo rozbudowany system wyszukiwarek. Może warto pójść w tym kierunku? Niestety nie zajmowałem się tym i „rzucenie tematu“ to jedyna pomoc, jaką Ci mogę zaoferować.

Direct link Reply with quote
 

Marek Daroszewski (MrMarDar)  Identity Verified
Local time: 21:10
English to Polish
+ ...
na szybko trzy możliwości podejścia Apr 28, 2010

Na szybko trzy możliwości podejścia, przy czym pierwsze dwa są bardziej nastawione na 'audio'.

1. Stenografia. W dobrym podręczniku do stenografii będzie analiza wyrazów i sposób zastępowania kilku dźwięków jednym symbolem. Wadą jest to, że stenografia nie koncentruje się na słowie pisanym, ale słowie mówionym.

2. Nauki pokrewne logopedii. Zbitki literowe stanowią pewien problem w nauce czytania, a rozgryzaniem tych problemów zajmuje się logopedia i nauki pokrewne. W podręcznikach na ten temat opisuje się jednak bardziej sylaby i sposoby analizy wyrazów pod kątem sylabifikacji, stąd nie są to czyste zbitki.

3. Analiza słownikowa. Mając listę polskich słów (z odmianą) i znajomego programistę możesz dokonać analzy według własnych potrzeb. Przy czym, musisz zastanowić się czy waga się też liczy w analizie, a wtedy lepszy jest korpus (jak już powiedział Szymon). Wadą korpusu jednak jest zafałszowanie wyników wpływami pozajęzykowymi - np. analizując korpus dowolnej gazety przed 10 kwietnia i po 10 kwietnia, będą inne wyniki dla zbitki 'tyń' czy 'oleń', ze względu na znacznie wyższą częstość pojawienia się słowa 'Katyń' i 'Smoleńsk'.

HTH
Marek


Direct link Reply with quote
 

Jaroslaw Michalak  Identity Verified
Poland
Local time: 21:10
Member (2004)
English to Polish
TOPIC STARTER
Dziękuję! Apr 29, 2010

Sprawa już chyba nieaktualna - uświadomiłem klientowi, mam nadzieję, że zabrał się do problemu od niewłaściwej strony.

Za sugestie bardzo dziękuję - widać jednak, że do uzyskania sensownych wyników z podanych źródeł wymagany byłby spory wkład pracy. Większość opracowań wychodzi jednak od analizy morfologicznej lub fonologicznej, ortografia (poniekąd słusznie) traktowana jest raczej jako kwestia wtórna. Traktuje się ją zresztą dość utylitarnie, więc dane są filtrowane pod kątem danego zastosowania (w stenografii istotny jest element mnemotechniczny i szybkość łączenia elementów, w maszynopisaniu układ klawiatury, itp.).

Marek słusznie zauważył, że opracowanie takich danych wymaga przyjęcia pewnych założeń, których nawet ja nie znam (nie mam nawet pewności, że w języku angielskim częstotliwość była podstawą zestawu). Dlatego, jeśli klient w przyszłości zdecyduje się opracować grę na nowo dla języka polskiego, skieruję go do językoznawców...


Direct link Reply with quote
 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

Poszukiwane dane na temat najczęstszych zbitek liter w języku polskim

Advanced search






Déjà Vu X3
Try it, Love it

Find out why Déjà Vu is today the most flexible, customizable and user-friendly tool on the market. See the brand new features in action: *Completely redesigned user interface *Live Preview *Inline spell checking *Inline

More info »
TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search