XXIV Открытая конференция студентов-филологов в СПбГУ

Построение отраслевого тезауруса по металлургии (на материале английского языка)

Юлия Павловна Комарова
Докладчик
студент 4 курса
Южно-Уральский государственный университет

Ключевые слова, аннотация

Цель работы — построение отраслевого тезауруса предметной области «Металлургия». Методология исследования включала отбор частотной терминологической лексики из корпуса научных текстов на английском языке, определение структуры лексико-семантических отношений между терминами, определение микроструктуры тезауруса и описание частотных терминов в соответствии с построенной микроструктурой. Микроструктура тезауруса задана схемой описания тезаурусной статьи, включающей общие лексико-семантические отношения и предметно-ориентированные отношения, предопределенные гиперонимическими связями вхождения.

Тезисы

Целью данного исследования является построение отраслевого тезауруса предметной области «Металлургия», что включает в себя определение структуры парадигматических отношений между единицами тезауруса, определение микроструктуры словарной статьи на основе выделенных лексико-семантических отношений и в соответствии с заданной микроструктурой описание конкретных лексических единиц, отобранных из корпуса научных текстов по металлургии.
Были выделены такие общие для лексической системы языка отношения как синонимия, антонимия, гипонимия, гиперонимия, а также частные отношения, предписанные предметной областью — наследуемые признаки, предопределяемые гиперонимом. Например, единица Fe гипонимически подчинена компонентам «химический элемент» и «физический объект». Как элемент термин имеет следующие наследуемые признаки: распространение в природе, место нахождения, атомный номер, (физическое) свойство. В качестве физического объекта наследуются следующие признаки: внешний вид, цвет, температура плавления, точка кипения, состояние при нормальных условиях. Такие специфические отношения были выделены на основе дефиниционного анализа по тезаурусам, отраслевым энциклопедиям, а также поисковым выдачам в Google и Yandex.
В соответствии с определенной структурой отношений, релевантной для разрабатываемого отраслевого тезауруса, нами было описано 20 терминов предметной области «Металлургия», которые были отобраны по частотности использования в корпусе научных статей по металлургии на английском языке объемом 100 тыс. словоупотреблений. Непосредственными гиперонимами для описанных терминов являются химический элемент — 4, физический объект — 5, процесс — 2 и т. д. Для каждого типа гиперонимов определен набор частных признаков, задающих семантические отношения между единицами тезауруса. Так, например, единица Fe оказывается связана с такими элементами тезауруса как metal-like form (внешний вид), powder form (внешний вид), silver (цвет), solid (фаза), coercivity (свойство), magnetic permeability (свойство) и др.
При определении парадигматических отношений между единицами тезауруса допустимо множественное связывание посредством одноименных отношений, что можно видеть в приведенном примере для отношений «внешний вид» и «свойство». Таким образом, структура тезауруса образует сеть, узлы которой содержат термины предметной области, связанные типизированными общими и частными (предопределяемыми гиперонимической связью данного узла) лексико-семантическими отношениями.
Выделенный перечень отношений микроструктуры тезауруса не полный и по мере работы будет расширяться.