НИВЦ МГУ
имени М. В. Ломоносова
  • Research
    Computing Center
    Lomonosov Moscow
    State University

    Laboratory for Computational Lexicography

  • Руководитель лаборатории 
    ГРАЩЕНКОВ ПАВЕЛ ВАЛЕРЬЕВИЧ, д.ф.н.
    О лаборатории

    Сотрудники лаборатории занимаются проведением исследований и разработкой методов моделирования в компьютерной, экспериментальной и типологической лингвистике. Основной фокус нашей работы – изучение грамматической структуры языка через призму современных формальных теорий и строгих экспериментальных методов.

    Ключевые направления теоретических исследований включают проблемы согласования, структуры простой предикации, организации составляющих и аргументной структуры. Особое внимание уделяется типологическому изучению грамматики языков России, среди которых алтайские языки (проблемы порядка слов), дагестанские языки (падежные системы), малые языки России (грамматические категории). Важной прикладной задачей является разработка и создание корпусов текстов для малоресурсных языков.

    Основные направления работы 

    I. Экспериментальные подходы к грамматике:
    Традиционные подходы к оценке приемлемости грамматических конструкций долгое время опирались на бинарную логику («приемлемо/неприемлемо») и методы интроспекции и элицитации, что нередко приводило к построению сомнительных теоретических моделей. В Лаборатории принят экспериментально-синтаксический подход, в последние годы получивший широкое распространение в мировой лингвистике. Для проверки гипотез об устройстве грамматики мы проводим контролируемые опросы репрезентативных групп носителей (десятки человек) с последующей строгой статистической обработкой результатов. Это позволяет выстраивать лингвистическую теорию на более надежных основаниях и отсеивать мнимые языковые явления.

    II. Компьютерное моделирование языковых процессов:
    Развитие формальной лингвистики с середины XX века происходило под влиянием «компьютерного вызова». Быстро выяснилось, что сложность естественного языка несопоставима с простыми алгоритмами типа «словарь + набор операций». Сегодня перед сотрудниками лаборатории стоит амбициозная задача: проводя эксперименты по автоматическому анализу и порождению текстов, понять, какие вычислительные алгоритмы (от конечных автоматов до нейросетей и методов корпусной лингвистики) адекватны различным областям грамматики, и попытаться преодолеть разрыв между академической и компьютерной лингвистикой.

    Наши проекты:
    РНФ 25-28-00552 «Цифровизация данных исчезающего языка: нивхский», рук. П.В. Гращенков, 2025-2026 гг.
    РНФ 22-18-00037(-П) «Параметрическая модель согласования в свете экспериментальных данных», рук. Е.А. Лютикова, 2021-2026 гг.
    РНФ 25-78-00071 «Адаптация суждений о приемлемости к языковому материалу: экспериментальное исследование», рук. А.А. Герасимова, 2025-2027 гг.

    Основные результаты 

    В рамках исследовательской работы лаборатории ведется изучение грамматической вариативности в русском языке. С использованием методов экспериментального синтаксиса и корпусного анализа выявляются синтаксические и коммуникативные факторы, влияющие на выбор того или иного варианта.

    Разработана параметрическая модель согласования в русском языке. С применением методов экспериментального синтаксиса изучен широкий спектр контекстов с согласовательной вариативностью: конструкции с квантификаторами, количественными существительными и числительными, сочиненные подлежащие с различными типами конъюнктов, биноминативные предложения, относительные клаузы с вершиной-местоимением. Установлено влияние порядка слов, одушевленности, исчисляемости, типа союза и личной иерархии на выбор стратегии согласования.

    Выделены грамматические профили носителей языка. Предложены количественные метрики, характеризующие согласованность респондентов в контексте синтаксического эксперимента. На материале нескольких экспериментов оценены два аспекта согласованности: единодушие респондентов в языковой общности и индивидуальная последовательность отдельных носителей языка. Показано, что доступность в грамматике языка одного или нескольких вариантов определенной конструкции не коррелирует с параметрами согласованности.

    Создан Параметрический корпус русского языка RuParam. Корпус содержит ~14  тыс. минимальных пар предложений, различающихся по грамматичности, где каждому верному предложению соответствует минимально отличающееся от него ошибочное. Источник неграмматичности в каждой паре сопровождается экспертной лингвистической разметкой. Корпус включает лексико-грамматические тесты по русскому языку как иностранному и модифицированные корпусные примеры.

    Создана База согласовательной вариативности. В базе исчисляются ситуации варьирования в согласовании в русском языке. Выделены основные параметры вариативности и разработан единый шаблон описания экспериментальных исследований варьирования при согласовании.

    Создан Корпус нивхского языка. Корпус текстов на нивхском языке (малый язык, на котором говоря на о. Сахалин и Приамурье) используется для документации языка, а также для исследований в области морфологии и синтаксиса.

    Лаборатория организует Конференцию «Экспериментальные исследования языка». Цель конференции – объединить исследователей, которые используют экспериментальный метод для изучения самых разных аспектов структуры и использования языка.

    Научные семинары 

    Ежегодно лаборатория проводит Практикум по экспериментальному синтаксису — специальный курс, на котором студенты проходят полный исследовательский цикл: от обзора литературы и постановки задачи до презентации результатов в формате доклада. Участники знакомятся с возможностями и ограничениями экспериментального метода, учатся формулировать цели эксперимента, выбирать дизайн, готовить стимульный материал, проводить техническую реализацию, обрабатывать и анализировать данные.

    Учебная работа 

    Сотрудники лаборатории активно участвуют в преподавании на филологическом факультете и руководят научной работой студентов и аспирантов.

    Читаемые курсы:

    П.В. Гращенков: «Введение в прикладную лингвистику»; «Проектные исследования»; «Языки России»; «Введение в теорию грамматических изменений»; «Исторический синтаксис»; «Теория синтаксических категорий»; «Морфология нивхских текстов» (с/к); «Синтаксис нивхских текстов» (с/к).

    Е.А. Лютикова: «Общий синтаксис», «Русский синтаксис», «Модели и методы в синтаксических исследованиях», «Теоретический синтаксис», «Практикум по синтаксическому анализу»

    А.А. Герасимова: «Практикум по экспериментальному синтаксису» (совм. с Е.А. Лютиковой)

    Л.И. Паско: «Грамматика цезских языков», «Синтаксис цезских языков» (совм. с Е.А. Лютиковой)

    Интернет-ресурсы лаборатории 

    Параметрический корпус русского языка RuParam: github.com/grapaul/RuParam

    Корпус с синтаксической разметкой RuConst: github.com/grapaul/Ru_Const

    База анкет феноменов с согласовательной вариативностью: expsynt.com/table.html

    Конференция «Экспериментальные исследования языка»: expsynt.com/expling

    Корпус нивхского языка: github.com/grapaul/NivkhKurng

    Сайт лаборатории 
    Contacts