XLVIII Международная филологическая научная конференция

Аннотация русской спонтанной речи и индивидуальность эксперта

Антон Анатольевич Степихов
Докладчик
старший научный сотрудник
Российский государственный педагогический университет им. А. И. Герцена

184
2019-03-21
16:10 - 16:40

Ключевые слова, аннотация

Спонтанная речь, сегментация, межфразовая граница, экспертное аннотирование, объем рабочей памяти, пятифакторный опросник личности.

Тезисы

Проблема сегментации спонтанной речи сегодня является одной из самых актуальных в области обработки естественных языков, так как эффективность многих автоматических алгоритмов обработки текста напрямую связана с наличием сведений о межфразовых границах.
Золотым стандартом аннотации спонтанной речи, то есть ее членения на предложения, обычно считается ручная разметка, осуществляемая экспертами. Тем не менее, даже ей свойствена высокая вариативность. Ранее нами было установлено, что на степень межэкспертного согласия при членении спонтанной речи влияют такие факторы, как тип текста, особенности грамматики русского языка, пол и профессия говорящего, а также психологические особенности эксперта, выявляемые с помощью пятифакторного личностного опросника. 
Поскольку пятифакторная модель личности не является универсальной и всеобъемлющей, можно предполагать существование иных индивидуальных характеристик, которые оказывают влияние на характер экспертной сегментации, например, объема рабочей памяти. Гипотеза проведенного исследования состояла в том, что эксперты, имеющие больший объём рабочей памяти, склонны членить спонтанную речь на более длинные предложения. С целью верификации данного предположения был проведен психолингвистический эксперимент (n>80), направленный на выявление возможной взаимосвязи между характером членения русской спонтанной речи на предложения и индивидуальными особенностями эксперта, осуществляющего это членение. 
Комплект стимульного материала состоял из текстовой части, подлежащей экспертной сегментации, и тестовой части, включающей пятифакторный опросник личности, тесты на скорость обработки информации и два теста объема рабочей памяти. Сегментация осуществлялась на основе только текстовой информации, без опоры на звучание. Время на выполнение задания не ограничивалось.
Вопреки гипотезе исследования, объем рабочей памяти оказался не связан со средней длиной предложения, как и скорость обработки информации. Ранее те же данные были получены нами на материале немецкого языка. Тем не менее, было установлено, что при аннотации русской спонтанной речи значимое влияние на длину предложения оказывает черта «самоконтроль — импульсивность»: эксперты, в большей степени склонные к волевой саморегуляции своего поведения, проявляют тенденцию к членению текста на более длинные предложения.
Анализ длины предложения выявил статистически значимые корреляции средней длины предложения в текстах разных типов при разметке одним и тем же экспертом. Это явление наблюдалось как на материале немецкого, так и на материале русского языка. Данный факт свидетельствует о том, что длина предложения является индивидуальной характеристикой эксперта, которая остается стабильной вне зависимости от внешних факторов, таких как язык или тип текста.