XXIV Open Conference for Philology Students at St. Petersburg State University

Случаи конституентной неоднозначности в современных русских юридических документах (по корпусным данным)

Анастасия Александровна Воронкова
Докладчик
студент 4 курса
Национальный исследовательский университет «Высшая школа экономики»

Ключевые слова, аннотация

Доклад посвящён анализу выделенных из юридического корпуса примеров, содержащих подвид синтаксической неоднозначности — конституентную. Это тип неоднозначности, при котором определённое зависимое (модификатор) можно отнести либо ко всей сочинённой группе, либо к выражению внутри группы, находящемуся линейно ближе к модификатору. Материалом исследования является корпус юридических текстов Corcodex.

Тезисы

Существуют различные виды неоднозначности: выделяют в том числе лексическую (лексико-семантическую), структурную и референциальную неоднозначность. Настоящий доклад посвящён одному из типов синтаксической (структурной) неоднозначности, а именно конституентной неоднозначности.
Материалом исследования является корпус юридических текстов Corcodex объемом 2 млн 700 тыс. слов (или 3 млн 223 тыс. токенов), состоящий из 279 документов и включающий тексты кодексов РФ, Федеральных и др. законов. Корпус размечен с использованием парсера UDPipe и морфологического анализатора pymorphy2.
Основной целью исследования является ручное выделение из корпуса и последующий анализ предложений, содержащих конституентную неоднозначность, ср. пример (1):
(1) Арбитражный суд первой инстанции в составе судьи и двух арбитражных заседателей рассматривает экономические споры и иные дела, возникающие из гражданских и иных правоотношений, если какая-либо из сторон заявит ходатайство о рассмотрении дела с участием арбитражных заседателей.
В этом предложении причастный оборот «возникающие из гражданских и иных правоотношений» может относиться как к именной группе «иные дела», так и сочинённой группе «экономические споры и иные дела» целиком. Таким образом, предложению (1) соответствуют две верные синтаксические интерпретации.
В ходе исследования выполнена сплошная выборка примеров из текстов корпуса Corcodex. В докладе предлагается подробный анализ этих примеров.
Исследование выполнено в рамках НИР «Научно-исследовательский институт проблем государственного языка» по реализации в СПбГУ комплекса мер, направленных на совершенствование государственной политики в области развития, защиты и поддержки русского языка на 2020—2021 гг.