XIX Открытая конференция студентов-филологов в СПбГУ

Процедура тематической атрибуции в текстах заданной тематики

Дина Гильмановна Шакурова
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет

193
2016-04-20
12:40 - 13:00

Ключевые слова, аннотация

В докладе представлена процедура автоматического присвоения темы тексту. При этом выбирается подход, основанный на частотности появления некоторых номинативных единиц в текстах заданной тематики — тематически релевантных слов. На данном этапе рассматриваются первичные результаты по отбору тематических слов или словосочетаний и их сопоставлению с результатами, которые дают известные существующие инструменты.

Тезисы

В настоящее время существует потребность в обработке большого количества текстов различного содержания (новостных статей, документов и т. д.) с тем, чтобы определять их тематическую принадлежность, поскольку это позволяет решать задачи тематического поиска, классификации, суммаризации и аннотации. Для решения данной задачи имеется ряд инструментов, которые, однако, имеют ограничения. В докладе представлена процедура автоматического присвоения темы тексту. При этом выбирается подход, основанный на частотности появления некоторых номинативных единиц в текстах заданной тематики — тематически релевантных слов. Целью исследования является получение наглядного представления тематического содержания документов из собранного корпуса. На данном этапе рассматриваются первичные результаты по отбору тематических слов или словосочетаний и их сопоставлению с результатами, которые дают известные существующие инструменты.