Семантико-синтаксический парсер паттернов текстов XVIII века


В начале было Слово, и Слово было у Бога, и Слово было Бог.
— Евангелие от Иоанна, 1:1
О проекте
Это - сервис, позволяющий анализировать тексты на трёх уровнях: морфологическом, синтаксическом и семантическом. Ориентирован на тексты, написанные на русском языке XVIII столетия.

Проблема

Сейчас, к сожалению, не существует подобного рода анализаторов, ориентированных на старые или малораспространённые языки. Однако они необходимы для облегчения работы учёным-лексикографам.

Актуальность

Академическая лексикография является одной из важных частей науки о языке.
Кроме того, в будущем подобные модели, с помощью которых осуществляется обработка контекста и именованных сущностей, помогут языковым моделям лучше ориентироваться в различных сферах деятельности человека.
Исследовательские задачи
Помимо практических целей, наш проект призван также ответить на эти вопросы. На них существует несколько возможных ответов-гипотез. По умолчанию принимается нулевая гипотеза H0.
1
Связь семантики с синтаксисом
H0: Семантика слова не связана с его синтаксической позицией.
H1: Связь семантики слова и его синтаксической позицией существует
2
Расхождение синонимов со временем
H0: Значения синонимов со временем не расходятся.
H1: Значения синонимов со временем начинают различаться.
H2: Значения синонимов со временем сближаются.
Наше решение

Пакет программ, производящих необходимую работу:

  • Поиск словоформ
  • Анализ и поиск предложений
  • Поиск когнат и N-грамм, сравнение значений слов
Дальнейшее развитие

Уточнение синтаксической и семантической модели языка

Создание смысловых пространств и тематического поиска

Масштабирование для работы с крупными корпусами текстов

Наша команда
  • Сараев Андрей
    Backend
    Telegram: @JonyJonAPS
  • Василевский Марк
    Frontend
    Telegram: @JustAStarWarsFan
  • Кругликов Андрей
    Fullstack
    Telegram: @KruASe
  • Яриков Михаил
    Теоретик
    Telegram: @MichYar
Руководитель
  • Евгений Соколов
    Магистр лингвистики, внешний консультант компании "Яндекс", младший научный сотрудник Института линвгистических исследований Российской академии наук, преподаватель базовой кафедры ИЛИ РАН в НИУ ВШЭ СПб
    Telegram: @chymotheras
Партнёры