Браунський корпус української мови

Завдання

Створити відкритий, збалансований за жанрами та в майбутньому проанотований корпус сучасної української мови (БрУК) обсягом 1 млн слововживань. Корпус побудований на засадах, що були покладені в основу відомого корпусу англійської мови Brown.

Структура репозиторію

misc - допоміжні файли
data - фрагменти текстів, зібрані для корпусу
- good - перевірені фрагменти, написані літературною українською мовою
- so-so - перевірені фрагменти, що містять помилки
- bad - перевірені фрагменти, що зовсім не відповідають вимогам (наприклад, усне мовлення)
- unprocessed - фрагменти, що чекають на перевірку
doc - документація: вимоги до фрагментів та рішення щодо мовних питань
scripts - допоміжні скрипти: обчислення статистики та список доданих творів

Команда

Василь Старко
Андрій Рисін
Ольга Гавура
Наталія Чейлитко
Мар’яна Романишин
Настасія Осідач
Катерина Альошкіна
Катерина Бобровник
Христина Кулак
Оксана Кунікевич
Тетяна Матвєєва
Ірина Возна
Ян Бутельський

Ліцензія

Дані корпусу доступні для використання згідно з умовами ліцензії "Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License" (http://creativecommons.org/licenses/by-nc-sa/4.0/)

Інші проекти

ВЕСУМ - Великий електронний словник української мови
LanguageTool - вільний програмний засіб для перевірки граматики та стилю для української мови
lang-uk - проект, метою якого є покращення комп'ютерної обробки україномовних текстів

Name		Name	Last commit message	Last commit date
Latest commit History 797 Commits
data		data
doc		doc
meta		meta
misc		misc
scripts		scripts
.gitignore		.gitignore
README.md		README.md
build.gradle		build.gradle
find.sh		find.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Браунський корпус української мови

Завдання

Структура репозиторію

Команда

Ліцензія

Інші проекти

About

Releases

Packages

Contributors 9

Languages

brown-uk/corpus

Folders and files

Latest commit

History

Repository files navigation

Браунський корпус української мови

Завдання

Структура репозиторію

Команда

Ліцензія

Інші проекти

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 9

Languages

Packages