XLVIII Международная филологическая научная конференция

Частотные характеристики естественной устной и письменной речи в социолекте и идиолекте: корпусное исследование

Татьяна Александровна Литвинова
Докладчик
ведущий научный сотрудник
Воронежский государственный педагогический университет

4-У
2019-03-22
15:00 - 15:30

Ключевые слова, аннотация

Корпус текстов, социолект, идиолект, устная речь, естественная письменная речь, наиболее употребительные слова корпуса, частотные характеристики речи.

Тезисы

Современная лингвистика активно исследует естественную (в противоположность профессионально подготовленной) речь — как устную (ЕУР), так и письменную (ЕПР), в том числе ее частотные характеристики, однако вплоть до последнего времени лингвисты не располагали «статистически представительными данными о частоте слов в наиболее важном для человека языковом жанре — живой спонтанной речи» [3, р. 616], в том числе с учетом характеристик говорящих. Высказанное положение о неизученности частотных характеристик «словаря» ЕУР справедливо и для ЕПР. Появление корпуса «Один речевой день» и глубоких социолингвистических исследований на его основе [1, 3] внесло значительный вклад в решение указанных проблем, однако ЕПР до настоящего времени оставалась на периферии подобных исследований. В докладе приводятся результаты сопоставительного исследования наиболее употребительных слов ЕУР (по данным, полученным авторами корпуса «Один речевой день») и ЕПР (по данным, полученным нами на основе созданного корпуса ЕПР RusPersonality, содержащего разнообразную информацию об авторах текстов [2]) с учетом характеристик говорящих/пишущих.
Вторым важным аспектом исследования ЕУР и ЕПР является анализ характеристик (в том числе частотных) этих типов речи в идиолекте как индивидуальном варианте языка. Появление благодаря развитию интернета большого числа «естественных» текстов не только привело к возможности изучения феномена идиолекта с использованием технологий корпусной лингвистики, но и поставило перед исследованиями ряд теоретических и прикладных задач. Исследования идиолекта (в указанном понимании термина) целесообразно проводить в рамках развиваемого нами направления — корпусной идиолектологии. В докладе излагаются результаты сравнительных исследований частотных характеристик устных и письменных текстов в идиолектах авторов, а также описывается структура создаваемого нами в настоящее время корпуса RusIdiostyle, специально предназначенного для исследования стабильности/вариативности характеристик идиолекта носителя русского языка.

Литература
 Богданова-Бегларян Н. В. и др. Корпус «Один речевой день» в исследованиях социолингвистической вариативности русской разговорной речи // Анализ разговорной русской речи (АР3-2017): Труды седьмого междисциплинарного семинара. — СПб.: Политехника-принт. — 2017. — С. 14–20.
 Litvinova T., et al. «Ruspersonality»: A Russian corpus for authorship profiling and deception detection // 2016 International FRUCT Conference on Intelligence, Social Media and Web (ISMW FRUCT), St. Petersburg, 2016, pp. 1–7.
Sherstinova T. Y. The most frequent words in everyday spoken Russian (in the gender dimension and depending on communication settings) // Komp'juternaja Lingvistika i Intellektual'nye Tehnologii. — 2016. — С. 616–631.