XLVIII Международная филологическая научная конференция

Разработка базы данных по семантике русских предлогов

Екатерина Владимировна Еникеева
Докладчик
аспирант
Санкт-Петербургский государственный университет
Анна Денисовна Москвина
Докладчик
аспирант
Санкт-Петербургский государственный университет

193
2019-03-21
16:50 - 17:10

Ключевые слова, аннотация

Русские предлоги, предложные конструкции, значение предлогов, корпусная лингвистика, база данных.

Тезисы

База данных — удобная форма представления систематизированной информации, ее обработки и оценки. Наш проект направлен на корпусно-ориентированное квантитативное описание системы русских предлогов. Отбор предложных конструкций начинается с составления и оптимизации запросов к корпусам с последующим ручным анализом и разметкой полученных конструкций, списки которых хранятся в виде таблиц. Запросы учитывают управление предлога определенным падежом, разрывность конструкций, частеречную принадлежность главных и зависимых слов. Каждой конструкции приписывается ее частота, реализованное в ней значение предлога, данные об их частотности, семантические классы главных и зависимых слов. Работа ведется параллельно на нескольких корпусах с целью получить усредненные параметры для всего языка и изучить «поведение» предлогов применительно к разным функциональным стилям. Мы используем и храним такую информацию, как все допустимые в русском языке значения конкретного предлога; падежи, которыми он управляет; отношения синонимии; расширенные списки контекстов в качестве примеров употребления. Формат базы данных позволяет автоматизировать часть задач, связанных с подсчетом количественных показателей (частота, проценты, ipm), упростить установление связей между семантическими и структурными свойствами конструкций, а также обеспечивает прямой доступ к отдельным интересующим нас данным, как, например, все случаи употребления предлога «в» в значении локатива. С точки зрения пользователя, разрабатываемая база данных позволит посмотреть примеры употребления и статистику, связанные с любым конкретным предлогом, где в качестве ключа поиска могут выступать падеж, тип, значение, корпус, семантический класс хозяев и слуг, а также любые их комбинации.