Генеральний регіонально анотований корпус української мови (ГРАК)
Thread poster: Jarema

Jarema  Identity Verified
Ukraine
Local time: 09:37
Member (2003)
German to Russian
+ ...

Moderator of this forum
Aug 24, 2019

Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучен... See more
Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки і одержувати різну статистичну інформацію.

Корпус призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.

Корпус може бути використаний для вивчання мови на високому рівні, також при підготовці навчальних матеріалів, підручників, навчальних словників та вправ з використанням прикладів з реальних текстів, з урахуванням частотної сполучуваності тощо.

Корпус не є взірцем нормативної української мови, в ньому можуть трапитись слова і сполучення, які не відповідають сучасним нормам літературної мови.

Корпус охоплює період з 1816 по 2019 р. і містить понад 40 тисяч текстів різних жанрів, близько 15 тисяч авторів.

Адреса: http://uacorpus.org/

ГРАК у Facebook

https://www.facebook.com/groups/488552241633414/

Генеральний регіонально анотований корпус української мови (ГРАК; англ. General Regionally Annotated Corpus of Ukrainian, GRAC http://uacorpus.org/) — це корпус української мови обсягом понад 290 млн токенів, розмічений за регіонами, призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.

Групу ГРАК створено для публікації

1) новин про ГРАК і про інші корпуси української мови,

2) питань, як користуватися корпусом і що там можна знайти (тут можна просто написати тему дослідження або курсової роботи, найпевніше, що ми знайдемо у корпусі потрібний матеріал, ми просто любимо шукати будь-що у корпусі),

3) власних корпусних розвідок,

4) посилань на дослідження, зроблені на базі ГРАК.
Collapse


Andriy Bublikov
Alexander Matsyuk
 

Jarema  Identity Verified
Ukraine
Local time: 09:37
Member (2003)
German to Russian
+ ...

Moderator of this forum
TOPIC STARTER
Інші корпуси української мови Aug 24, 2019

У розділі "Інші корпуси української мови" наведені адреси інших корпусів української мови.

 

Jarema  Identity Verified
Ukraine
Local time: 09:37
Member (2003)
German to Russian
+ ...

Moderator of this forum
TOPIC STARTER
ГРАК-7 Dec 12, 2019

ГРАК-7 уже на сайті, виріс на 10%, обсяг корпусу тепер - 437 млн токенів.

Додано, з цікавого, романи Б. Грінченка, вичитані за старими виданнями (Dmytro Yesypenko), кілька номерів газети "Молоде життя: часопис українського пласту" 1925-1929 років (Oksana Taran і студенти спеціальності "Прикла
... See more
ГРАК-7 уже на сайті, виріс на 10%, обсяг корпусу тепер - 437 млн токенів.

Додано, з цікавого, романи Б. Грінченка, вичитані за старими виданнями (Dmytro Yesypenko), кілька номерів газети "Молоде життя: часопис українського пласту" 1925-1929 років (Oksana Taran і студенти спеціальності "Прикладна лінгвістика" НУ ЛП), твори Михайла Жука (Alena Yavorskaya), колекцію радянських газетних матеріалів 1986-1991 років про Чорнобиль (Микола Жарких), колекцію сучасної драматургії (Ольга Сахарова), газету "Україна молода" 2010-2019 рр. (Vasyl Starko). І майже сто номерів журналу "Всесвіт" (1958-1983), які підготували студенти спеціальності "Прикладна лінгвістика" НУ Львівська "Політехніка" (дякуємо Olena Levchenko, Oksana Taran) і ЛНУ імені Івана Франка (дякуємо Solomija Buk). Другу частину готових журналів ще не встигла додати, чекають. Корпус родинних листів силами студентів збільшився вдвічі, тепер там близько 600 текстів, є і зображення листів, які поки що не доступні онлайн. Додали рукописні щоденники. Всі студенти, які готували матеріали для корпусу, можуть пошукати себе на сайті на сторінці "Розробники".

https://www.facebook.com/groups/488552241633414/
Collapse


Oksana Weiss
 

Jarema  Identity Verified
Ukraine
Local time: 09:37
Member (2003)
German to Russian
+ ...

Moderator of this forum
TOPIC STARTER
Пошук Feb 18, 2020

На сайтах https://r2u.org.ua/ та https://e2u.org.ua/ зреалізовано перехід від українських слів у словниках до корпусу: виділіть слово в результатах пошуку, натисніть комбінацію клавіш Ctrl+Shift+4 і побачите ... See more
На сайтах https://r2u.org.ua/ та https://e2u.org.ua/ зреалізовано перехід від українських слів у словниках до корпусу: виділіть слово в результатах пошуку, натисніть комбінацію клавіш Ctrl+Shift+4 і побачите результати (простого) пошуку цього слова в корпусі ГРАК (http://uacorpus.org/).
NB: якщо ви раніше заходили на наші сайти, варто жорстко оновити сторінку (Ctrl+F5 для "Хрому"). Інакше браузер підтягне стару версію сторінки з кешу й ця нова комбінація клавіш не працюватиме.
Collapse


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Генеральний регіонально анотований корпус української мови (ГРАК)

Advanced search







Trados Business Manager Lite
Create customer quotes and invoices from within Trados Studio

Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.

More info »
MultiTerm
One central location to store and manage multilingual terminology.

By providing access to all those involved in applying terminology (such as engineers, marketers, translators, and terminologists), our terminology management solution ensures consistent and high-quality content from source through to translation.

More info »