XXIX Открытая конференция студентов-филологов в СПбГУ

Динамика лексико-семантических характеристик русскоязычной поп-лирики (2015—2025): корпусное исследование

Анастасия Егоровна Кочкурова
Докладчик
студент 4 курса
Национальный исследовательский университет «Высшая школа экономики»

Ключевые слова, аннотация

Доклад посвящен количественному анализу русскоязычной популярной песенной лирики 2015—2025 гг. На корпусе из 1100 текстов применены методы тематического моделирования (BERTopic), извлечение ключевых слов через TF-IDF и автоматического анализа тональности (с использованием ruBERT). Исследуется динамика тематической структуры, эмоциональной окраски и доли англоязычной лексики. Результаты показывают выраженную годовую вариативность лексических профилей и продуктивность инструментов компьютерной лингвистики для изучения песенного дискурса.

Тезисы

Ключевые слова: компьютерная лингвистика; песенный дискурс; тематическое моделирование; сентимент-анализ

Исследование песенного дискурса активно развивается в междисциплинарном поле цифровых гуманитарных исследований. Так, в фокусе оказываются связь популярности и жанровой распознаваемости [Corbara, Molinari, 2021], динамика эмоциональной тональности текстов [Napier, Shamir, 2018], а также лексические и тематические особенности песенных текстов (напр., в [Bansal et al. 2025] на примере корпуса из 3814 хип-хоп-композиций фиксируется рост синтаксической сложности и лексического разнообразия, а также смещение тематики от социальной к интроспективной).
В настоящем докладе анализируется динамика лексико-семантических и прагматических характеристик русскоязычных популярных песен за 2015—2025 гг. Новизна исследования заключается в комплексном применении методов компьютерной лингвистики к корпусу песенных текстов для выявления тематических, эмоциональных и языковых сдвигов во времени. Цель работы — установить, меняются ли тематическая структура, тональность и процент англоязычной лексики в русской поп-музыке в течение указанного периода.
В процессе исследования выдвигаются следующие гипотезы: (1) тематическая структура популярной лирики демонстрирует смещение от романтической проблематики к социально-рефлексивной; (2) наблюдается рост доли негативной тональности в поздние годы периода; (3) доля англоязычной лексики снижается к концу рассматриваемого временного интервала.
Материалом исследования послужил корпус текстов популярных песен (общий объем корпуса составил 1100 текстов) за 2015—2025 гг. Источником данных выступили опубликованные тексты песен. Предварительная обработка включала нормализацию регистра, удаление нерелевантных символов, морфологическую лемматизацию с использованием pymorphy3 и исключение русскоязычных стоп-слов. Дополнительно рассчитывалась доля англоязычной лексики.
Для выявления тематической структуры корпуса применялось тематическое моделирование на основе BERTopic, сочетающее трансформерные эмбеддинги, алгоритм понижения размерности UMAP и плотностную кластеризацию HDBSCAN. Эмоциональная динамика анализировалась с использованием предобученной модели тонального анализа для русского языка (ruBERT). Для каждого текста определялась метка тональности (позитивная, негативная, нейтральная), после чего рассчитывалось распределение сентимента по годам.
Полученные данные свидетельствуют о наличии статистически различимых лексических профилей для разных годов рассматриваемого периода. Выявленные различия подтверждают чувствительность методов тематического моделирования и TF-IDF к временной динамике корпуса. Совмещение тематического анализа, оценки тональности и измерения доли англоязычной лексики позволяет комплексно описать изменения в структуре современного песенного дискурса. Таким образом, применение методов компьютерной лингвистики позволяет количественно зафиксировать эволюцию песенного дискурса и выявить закономерности, неочевидные при традиционном качественном анализе.

Литература:
Bansal A., Agarwal R., Jain K. Linguistic Complexity and Socio-cultural Patterns in Hip-Hop Lyrics //arXiv preprint arXiv:2505.00035. 2025.
Corbara S., Molinari A. Reading songs: A Computational Analysis of Popular Songs Lyrics // Italian Information Retrieval Workshop. 2021
Napier K., Shamir L. Quantitative Sentiment Analysis of Lyrics in Popular Music // Journal of Popular Music Studies. 2018. P. 161—176.