Poszukiwane dane na temat najczęstszych zbitek liter w języku polskim
Thread poster: Jaroslaw Michalak

Jaroslaw Michalak  Identity Verified
Poland
Local time: 18:50
Member (2004)
English to Polish
Apr 26, 2010

Do przetłumaczenia pewnej gry językowej potrzebuję listę najczęściej występujących zbiter liter w języku polskim (na początku, w środku i na końcu słowa).

Niestety, zaniedbałem moje lingwistyczne kontakty... Czy ktoś wie może, jak dotrzeć do takich danych?


 

Magdalena Szewciów  Identity Verified
Poland
Local time: 18:50
Member (2008)
English to Polish
+ ...
pomysł Apr 26, 2010

może warto skontaktować się z Polską Federacją Scrabble? pomysł niby od "czapy", ale istnieje OSPS (http://www.pfs.org.pl/osps_aktualizacje.php) - oficjalny słownik polskiego scrabblisty, na podstawie którego statystycznie można by to jakoś ustalić (metoda to już do ustalenia z takimi, co to się na tym znają - ja do nich nie należęicon_wink.gif).

 

Szymon Metkowski  Identity Verified
Poland
Local time: 18:50
Member
German to Polish
+ ...
Korpus Apr 27, 2010

Na konferencji był prezentowany korpus języka polskiego. Twórcy wymyślili bardzo rozbudowany system wyszukiwarek. Może warto pójść w tym kierunku? Niestety nie zajmowałem się tym i „rzucenie tematu“ to jedyna pomoc, jaką Ci mogę zaoferować.

 

Marek Daroszewski (MrMarDar)  Identity Verified
Local time: 18:50
English to Polish
+ ...
na szybko trzy możliwości podejścia Apr 28, 2010

Na szybko trzy możliwości podejścia, przy czym pierwsze dwa są bardziej nastawione na 'audio'.

1. Stenografia. W dobrym podręczniku do stenografii będzie analiza wyrazów i sposób zastępowania kilku dźwięków jednym symbolem. Wadą jest to, że stenografia nie koncentruje się na słowie pisanym, ale słowie mówionym.

2. Nauki pokrewne logopedii. Zbitki literowe stanowią pewien problem w nauce czytania, a rozgryzaniem tych problemów zajmuje się logopedia i nauki pokrewne. W podręcznikach na ten temat opisuje się jednak bardziej sylaby i sposoby analizy wyrazów pod kątem sylabifikacji, stąd nie są to czyste zbitki.

3. Analiza słownikowa. Mając listę polskich słów (z odmianą) i znajomego programistę możesz dokonać analzy według własnych potrzeb. Przy czym, musisz zastanowić się czy waga się też liczy w analizie, a wtedy lepszy jest korpus (jak już powiedział Szymon). Wadą korpusu jednak jest zafałszowanie wyników wpływami pozajęzykowymi - np. analizując korpus dowolnej gazety przed 10 kwietnia i po 10 kwietnia, będą inne wyniki dla zbitki 'tyń' czy 'oleń', ze względu na znacznie wyższą częstość pojawienia się słowa 'Katyń' i 'Smoleńsk'.

HTH
Marek


 

Jaroslaw Michalak  Identity Verified
Poland
Local time: 18:50
Member (2004)
English to Polish
TOPIC STARTER
Dziękuję! Apr 29, 2010

Sprawa już chyba nieaktualna - uświadomiłem klientowi, mam nadzieję, że zabrał się do problemu od niewłaściwej strony.

Za sugestie bardzo dziękuję - widać jednak, że do uzyskania sensownych wyników z podanych źródeł wymagany byłby spory wkład pracy. Większość opracowań wychodzi jednak od analizy morfologicznej lub fonologicznej, ortografia (poniekąd słusznie) traktowana jest raczej jako kwestia wtórna. Traktuje się ją zresztą dość utylitarnie, więc dane są filtrowane pod kątem danego zastosowania (w stenografii istotny jest element mnemotechniczny i szybkość łączenia elementów, w maszynopisaniu układ klawiatury, itp.).

Marek słusznie zauważył, że opracowanie takich danych wymaga przyjęcia pewnych założeń, których nawet ja nie znam (nie mam nawet pewności, że w języku angielskim częstotliwość była podstawą zestawu). Dlatego, jeśli klient w przyszłości zdecyduje się opracować grę na nowo dla języka polskiego, skieruję go do językoznawców...


 


To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Monika Jakacka Márquez[Call to this topic]

You can also contact site staff by submitting a support request »

Poszukiwane dane na temat najczęstszych zbitek liter w języku polskim

Advanced search






BaccS – Business Accounting Software
Modern desktop project management for freelance translators

BaccS makes it easy for translators to manage their projects, schedule tasks, create invoices, and view highly customizable reports. User-friendly, ProZ.com integration, community-driven development – a few reasons BaccS is trusted by translators!

More info »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search