Процедура тематической атрибуции в текстах заданной тематики
Дина Гильмановна Шакурова
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
193
2016-04-20
12:40 -
13:00
Ключевые слова, аннотация
В
докладе представлена процедура автоматического присвоения темы тексту. При этом
выбирается подход, основанный на частотности появления некоторых номинативных
единиц в текстах заданной тематики — тематически релевантных слов.
На
данном этапе рассматриваются первичные результаты по отбору тематических слов
или словосочетаний и их сопоставлению с результатами, которые дают известные существующие
инструменты.
Тезисы
В
настоящее время существует потребность в обработке большого количества текстов
различного содержания (новостных статей, документов и т. д.) с тем, чтобы
определять их тематическую принадлежность, поскольку это позволяет решать
задачи тематического поиска, классификации, суммаризации и аннотации. Для
решения данной задачи имеется ряд инструментов, которые, однако, имеют
ограничения.
В
докладе представлена процедура автоматического присвоения темы тексту. При этом
выбирается подход, основанный на частотности появления некоторых номинативных
единиц в текстах заданной тематики — тематически релевантных слов.
Целью
исследования является получение наглядного представления тематического
содержания документов из собранного корпуса. На данном этапе рассматриваются
первичные результаты по отбору тематических слов или словосочетаний и их
сопоставлению с результатами, которые дают известные существующие инструменты.