XXIX Открытая конференция студентов-филологов в СПбГУ

Создание нейросетевого консультанта по учебным программам филологического направления

Варвара Андреевна Азина
Докладчик
студент 2 курса
Санкт-Петербургский государственный университет

Ключевые слова, аннотация

Рассматривается создание нейросетевого консультанта для абитуриентов СПбГУ на основе технологии Retrieval Augmented Generation (RAG). Материалом исследования послужили учебные планы и описания программ бакалавриата СПбГУ по направлениям «Филология» и «Лингвистика». Данные были обработаны и интегрированы в программный код на языке Python. В результате был разработан бот-помощник, способный отвечать на вопросы о содержании учебных планов и давать рекомендации по выбору специальности. Консультант создан для повышения качества коммуникации с абитуриентами, в дальнейшем возможна его доработка.

Тезисы

Ключевые слова: Retrieval Augmented Generation; нейросетевой консультант; большие языковые модели

В настоящее время большие языковые модели (LLM) активно применяются в различных областях деятельности для решения прикладных задач. Среди прочего, на их основе создаются генеративные нейросети и вопросно-ответные системы, используемые в качестве интеллектуальных помощников. Одним из методов работы с большими языковыми моделями является технология Retrieval Augmented Generation (RAG), которая особенно полезна при решении узкоспециализированных задач. Метод RAG позволяет улучшить ответы LLM путем поиска информации во внешних источниках. Он обеспечивает генерацию более точных и информативных ответов, а также способствует уменьшению риска возникновения галлюцинаций. 
Использование методов RAG открывает новые перспективы при решении задач компьютерной лингвистики. Целью работы является разработка с помощью RAG нейросетевого консультанта для помощи абитуриентам, поступающим на образовательные программы бакалавриата СПбГУ. В качестве специальности были рассмотрены образовательные программы направлений «Филология» и «Лингвистика».
Работа над проектом состояла из нескольких этапов. Для создания базы данных были использованы актуальные учебные планы и описания программ по выбранным направлениям. Эти данные были предварительно обработаны: очищены от избыточной информации и приведены к формату, удобному для использования. На языке Python был разработан программный код нейросетевого консультанта, к которому была подключена собранная база данных. На последующих этапах проводилось тестирование системы, включавшее проверку точности и качества ответов.
Данные методы позволили создать бота-помощника, способного свободно отвечать пользователям на вопросы, касающиеся содержания учебных планов интересующих специальностей. Кроме того, консультант может давать абитуриентам рекомендации относительно выбора предпочтительной сферы деятельности, помогая разобраться в широком диапазоне специальностей. Таким образом, результатом работы является создание инструмента, который может быть использован для повышения качества коммуникации с абитуриентами СПбГУ. В дальнейшем работа может быть направлена на расширение возможностей данного бота, в первую очередь на расширение списка факультетов и специальностей, включенных в базу данных.