Генеративный ИИ как инструмент создания персонализированных учебных материалов по английскому языку
София Михайловна Мокроусова
Докладчик
студент 2 курса
НИУ ВШЭ — Санкт-Петербург
НИУ ВШЭ — Санкт-Петербург
Ключевые слова, аннотация
Исследование оценивает
способность генеративного искусственного интеллекта формировать качественные учебные
материалы для изучения английского языка на уровнях A1—A2. В корпусном эксперименте на основе
принципов дистрибутивной семантики сравниваются две лексические подборки: составленная
на основе существующих учебных пособий и сгенерированная большими языковыми
моделями с учетом индивидуальных особенностей ученика (возраст, уровень CEFR,
интересы). Результаты работы показывают, что ИИ-модели способны превзойти
учебные пособия по таким параметрам как аутентичность и персонализация.
Тезисы
Ключевые слова:
генеративный ИИ; LLM; учебные материалы; английский
язык; персонализация
Генеративный искусственный интеллект (ИИ) в последнее десятилетие стал значимой частью образовательного процесса и открыл новые возможности для персонализации обучения. Особый интерес в области преподавания иностранных языков представляют большие языковые модели (Large Language Model, LLM).
Настоящее исследование сфокусировано на оценке способности LLM формировать качественный языковой контент при создании лексических материалов по английскому языку (для уровней A1—A2 по шкале CEFR). Рассматривается вопрос, действительно ли LLM могут адаптировать учебные материалы под индивидуальные потребности ученика (возраст, уровень языка, интересы). В работе впервые проводится системный анализ соответствия созданных ИИ лексических подборок реальным закономерностям употребления слов. Исследование основано на корпусном эксперименте. Формируются два сопоставимых корпуса по лексической теме «Занятия в свободное время» («Free-time activities») для уровней A1—A2. Корпус A (традиционный) включает тексты и лексические подборки из учебных пособий, Корпус B (экспериментальный) содержит материалы, сгенерированные моделями DeepSeek-V3.2, Perplexity, Qwen3.5 на основе специально разработанных промптов с заданными параметрами персонализации (уровень CEFR, возраст, интересы ученика). Далее проводится сравнительный анализ по предложенным критериям:
1) Репрезентативность коллокаций: анализ разнообразия сочетаний слов, предлагаемых ИИ-моделями, в сравнении с представленными в учебниках;
2) Релевантность: оценка того, насколько сгенерированные списки слов и фраз отражают ядро и периферию семантического поля и соответствуют уровню A1—A2;
3) Контекстуальная аутентичность: анализ примеров употребления слов в сгенерированных ИИ микродиалогах и текстах на предмет естественности и частотности дистрибутивных паттернов.
В результате предварительного анализа выявлено, что сгенерированные LLM материалы демонстрируют более широкое разнообразие коллокационных структур и включают речевые закономерности и контексты, соответствующие современным языковым тенденциям (напр., употребление фразовых глаголов, а также сокращений и эллипсиса в диалогах), что не всегда отражено в текстах учебных пособий по английскому языку. Однако, как предполагалось, отдельные сгенерированные примеры требуют перепроверки и исправлений, так как созданные лексические конструкции не проходят проверку по критерию контекстуальной аутентичности и смотрятся недостаточно естественно в созданном контексте. Кроме того, ряд сгенерированных лексических подборок оказался трудным для восприятия учениками на начальных уровнях английского языка. На основе полученных данных создаются методические рекомендации для преподавателей, представляющие собой пошаговый план по созданию урока и подготовке персонализированных учебных материалов с помощью рассматриваемых LLM. Они также включают советы по написанию эффективных промптов для наиболее качественной выдачи LLM. Предварительные результаты выявляют, что LLM действительно способны создавать лексические подборки, обладающие высокой степенью дистрибутивной вариативности и приближенные к реальному узусу. Учитывая особенности выдачи LLM, можно повысить качество персонализированного обучения иностранным языкам, сэкономив временные ресурсы преподавателя без потери эффективности учебного процесса.
Генеративный искусственный интеллект (ИИ) в последнее десятилетие стал значимой частью образовательного процесса и открыл новые возможности для персонализации обучения. Особый интерес в области преподавания иностранных языков представляют большие языковые модели (Large Language Model, LLM).
Настоящее исследование сфокусировано на оценке способности LLM формировать качественный языковой контент при создании лексических материалов по английскому языку (для уровней A1—A2 по шкале CEFR). Рассматривается вопрос, действительно ли LLM могут адаптировать учебные материалы под индивидуальные потребности ученика (возраст, уровень языка, интересы). В работе впервые проводится системный анализ соответствия созданных ИИ лексических подборок реальным закономерностям употребления слов. Исследование основано на корпусном эксперименте. Формируются два сопоставимых корпуса по лексической теме «Занятия в свободное время» («Free-time activities») для уровней A1—A2. Корпус A (традиционный) включает тексты и лексические подборки из учебных пособий, Корпус B (экспериментальный) содержит материалы, сгенерированные моделями DeepSeek-V3.2, Perplexity, Qwen3.5 на основе специально разработанных промптов с заданными параметрами персонализации (уровень CEFR, возраст, интересы ученика). Далее проводится сравнительный анализ по предложенным критериям:
1) Репрезентативность коллокаций: анализ разнообразия сочетаний слов, предлагаемых ИИ-моделями, в сравнении с представленными в учебниках;
2) Релевантность: оценка того, насколько сгенерированные списки слов и фраз отражают ядро и периферию семантического поля и соответствуют уровню A1—A2;
3) Контекстуальная аутентичность: анализ примеров употребления слов в сгенерированных ИИ микродиалогах и текстах на предмет естественности и частотности дистрибутивных паттернов.
В результате предварительного анализа выявлено, что сгенерированные LLM материалы демонстрируют более широкое разнообразие коллокационных структур и включают речевые закономерности и контексты, соответствующие современным языковым тенденциям (напр., употребление фразовых глаголов, а также сокращений и эллипсиса в диалогах), что не всегда отражено в текстах учебных пособий по английскому языку. Однако, как предполагалось, отдельные сгенерированные примеры требуют перепроверки и исправлений, так как созданные лексические конструкции не проходят проверку по критерию контекстуальной аутентичности и смотрятся недостаточно естественно в созданном контексте. Кроме того, ряд сгенерированных лексических подборок оказался трудным для восприятия учениками на начальных уровнях английского языка. На основе полученных данных создаются методические рекомендации для преподавателей, представляющие собой пошаговый план по созданию урока и подготовке персонализированных учебных материалов с помощью рассматриваемых LLM. Они также включают советы по написанию эффективных промптов для наиболее качественной выдачи LLM. Предварительные результаты выявляют, что LLM действительно способны создавать лексические подборки, обладающие высокой степенью дистрибутивной вариативности и приближенные к реальному узусу. Учитывая особенности выдачи LLM, можно повысить качество персонализированного обучения иностранным языкам, сэкономив временные ресурсы преподавателя без потери эффективности учебного процесса.