50-я Международная научная филологическая конференция имени Людмилы Алексеевны Вербицкой

Лингвостатистический анализ глаголов мышления на корпусе публицистических текстов о правах женщин в Афганистане

Екатерина Михайловна Белавина
Докладчик
доцент
Московский государственный университет им. М. В. Ломоносова
Полина Сергеевна Уварова
Докладчик
аспирант
Санкт-Петербургский государственный университет

193
2022-03-16
16:00 - 16:20

Ключевые слова, аннотация

Корпусная статистика; глаголы мышления; теория семантического поля; textométrie (TXM); лингвостатистический анализ

Тезисы

В настоящий момент в мире выходит большое количество статей, посвященных положению женщин в Афганистане и несоблюдении их прав и свобод. Эта тема широко освещается средствами массовой информации по всему миру, что позволяет обработать значительное количество текстовых данных и провести их анализ. Для исследования были отобраны тексты на английском и русском языках, в результате их обработки был составлен репрезентативный двуязычный корпус. Было принято решение не делать корпус параллельным для полноценного анализа особенностей использования глаголов мышления в каждом из языков, так как перевод не всегда отражает актуальную языковую ситуацию.
Тексты данной тематики были выбраны не только в связи с актуальностью темы, а еще и из-за большого количества глаголов мышления, используемых при выражении мнения автора. Это позволяет оценить разнообразие глаголов мыслительной сферы в публицистических текстах. Отдельно хотелось бы выделить, что глаголы мыслительной деятельности в настоящей работе чаще всего имеют значение предиката мнения, а не знания, что и обуславливает важность эмоциональной окраски в выбранных текстах, так как это напрямую влияет на количество оценочных комментариев автора.
Выбор списка глаголов для анализа не является очевидным. Глаголы были отобраны и классифицированы, в результате чего был составлен список тех, которые можно отнести к мыслительной сфере. Для осуществления этой задачи был проведен анализ семантического своеобразия языков (английского и русского) в рамках публицистических текстов и дальнейшая классификация глаголов согласно теории семантического поля, учитывая самые современные работы на эту тему.
Для составления доклада был подготовлен двуязычный корпус текстов с использованием средств SketchEngine, дальнейшая работа осуществлялась средствами платформы Textométrie (TXM), имплементирующей основные методы текстометрии. В докладе приводится краткий разбор функционала данных инструментов и обосновывается их выбор в рамках работы с текстами данной тематики.
Во время работы над докладом были проанализированы и обоснованы критерии выбора источников для составления двуязычного корпуса текстов, проведен обзор средств для составления корпуса и проведения морфосинтаксической разметки готового корпуса, обоснован выбора (SketchEngine, Universal Dependencies). Дальнейший анализ данных показал, что получившийся список лексем в английском языке значительно меньше чем в русском.