Цифрові лексикографічні системи української мови +

Нові коментарі

Нова тема   Відповісти
Автор Повідомлення
USofTrod 
Новенький


З нами з: 08.06.17
Востаннє: 17.10.17
Повідомлень: 2

2017-06-09 09:35  
Шановні друзі!
Пів року тому ми започаткували роботу над серією цифрових лінгвістичних продуктів, старт якої ознаменував вихід цифрової версії граматичного словника української мови.
Проект розміщено на GitHub (https://github.com/LinguisticAndInformationSystems/mphdict/wiki) під MIT ліцензією.

Чому наша система, що є у нас і чого немає в жодному іншому українському словнику - три головні речі + 1:

    Ми описали внутрішню структуру бази даних словника і перші відкрили алгоритми роботи з даними.
    Ми створили і надали вільний доступ до словника словозмінної класифікації. Хочемо зауважити, що жоден ресурс не надає словозмінної та акцентуаційної класифікації. Відповідно це є основним бар'єром у використанні цих ресурсів в основі систем аналізу тексту. І саме це спонукало розробку відкритого словника.
    Реєстр нашого словника складає 261499 слів (на вересень 2016 року). І на цей час, наскільки нам відомо, це найбільший словник такого типу.
    Ми надаємо доступ до даних та алгоритмів а не до сервісів.

Система може бути розгорнута як у Windows середовищі, так і в Linux. Будь-хто, системний адміністратор у школі або університеті, може розгорнути нашу систему у внутрішній мережі закладу.
Для зацікавлених в розгортанні системи в Інтернеті ми рекомендуємо конвертувати БД з SQLite до однієї з клієнт-серверних СУБД (PostgreSQL, MS Sql Server ...).
Ваш часовий пояс: GMT + 2 Години

Нова тема   Відповісти