XXVI Открытая конференция студентов-филологов в СПбГУ

Компьютерные методы анализа коллокаций в лингвистическом анализе художественного произведения

Александра Валерьевна Трошина
Докладчик
магистрант 1 курса
Санкт-Петербургский государственный университет

Ключевые слова, аннотация

Настоящий доклад посвящен исследованию возможности использовать коллокации для лингвистического анализа художественного произведения. Выделение коллокаций осуществляется компьютерными методами с помощью метрики t-критерий Стьюдента.

Тезисы

Ключевые слова: коллокации; лингвистический анализ; художественная проза.

В современной лингвистике одним из важных направлений является исследование коллокаций. Традиционно многие исследователи говорят о коллокациях в связи с «лексико-фразеологически обусловленной сочетаемостью слов в речи для реализации их полисемии» [Ахманова, 1966]. В данной докладе коллокации будут рассматриваться в русле корпусной лингвистики как «комбинация двух или более слов, имеющих тенденцию к совместной встречаемости» [Захаров и др., 2010]. Подход к выделению коллокаций — статистический, а сами коллокации «могут быть как фразеологизированными, так и свободными». Это обуславливает множество приложений результатов коллокационного анализа в корпусных исследованиях, в лексикографии, лингводидактике, дискурс-анализе и т. д. В данной работе мы сделали попытку показать возможность исследовать коллокации в рамках лингвистического  анализа художественного произведения.
В качестве материала исследования был выбран рассказ А. И. Солженицына «Один день Ивана Денисовича», посвященный описанию одного дня из лагерной жизни заключенного. С помощью метрики t-критерий Стьюдента было выделено 200 коллокаций. Основной особенностью полученных результатов является большая доля коллокаций с числительными (количественными и порядковыми). Количественные числительные часто относятся к обозначению времени, веса (пайка), порядковые числительные относятся к номерам зеков, бригад, бараков. Доля коллокаций, в составе которых наблюдается хотя бы одно числительное, составляет 45% от выделенных (44 из 200). Такое количество числительных может говорить о детальности описания быта Ивана Денисовича. Его жизнь в лагере очень однообразна и бедна, и для него значение имеют не сами события, повторяющиеся изо дня в день из года в год, а их мера (время отдыха, количество порции). Анализ коллокаций ясно показывает, что числительные являются одной из важнейших стилистических характеристик данного произведения.
В коллокациях можно выделить несколько тематических групп. Самые многочисленные три группы: персонажи, локации и коллокации, связанные с работой, которую выполняли зэки. Помимо этих больших групп также можно выделить тематические группы — обозначения частей тела, одежды, отдельные коллокации — обозначения предметов мебели. Данные коллокации говорят о скудности быта заключенных. Еще одна тематическая группа, которую можно выделить, относится к погоде, это то немногое, что менялось в жизни заключенных.
Важным наблюдением является то, что нами не были найдены коллокации с абстрактными существительными (за исключением существительных, обозначающих время). Можно сделать вывод, что жизнь заключенных состояла из конкретных действий и вещей и у них не было времени и желания думать об абстрактных предметах.
Таким образом, мы видим, что анализ коллокаций дает нам богатый материал для анализа исследования стилистических и сюжетных особенностей литературного произведения.  

Литература:
Ахманова О. С. Словарь лингвистических терминов, М., 1966.
Захаров В. П., Хохлова М. В. Анализ эффективности статистических методов выявления коллокаций в текстах на русском языке // Компьютерная лингвистика и интеллектуальные технологии. Вып. 9 (16). М., 2010. С. 137—142.