Классификация научных текстов по специальностям методами машинного обучения

Иномов Бехруз Бурхонович
1. Политехнический институт Таджикского технического университета им. акад. М. С. Осими
behruzinomov@gmail.com
Mарина Тропманн-Фрик
1. Гамбургский университет прикладных наук
marina.tropmann-frick@haw-hamburg.de
Материал поступил в редколлегию 30.05.2022
Данная статья исследует экспериментальную задачу проблемы классификации научных текстовых материалов на основе методов машинного и глубокого обучения (Machine Learning & Deep Learning). Для решения задачи предложен метод классификации текстов, учитывающий предобработку и специфику научных текстовых материалов, позволяющий при использовании алгоритмов ML, повысить точность и быстродействие классификации текстов. Проведено исследование методов индексации и классификации по специальностям для базы научных текстовых материалов. Рассмотрены оценки качества алгоритмов ML и получены результаты сравнений классификации диссертационных работ по специальностям методами машинного обучения в рамках существующей обучающей выборки научных материалов.

Выходные данные: Б.Б. Иномов, М. Тропман-Фрик Классификация научных текстов по специальностям методами машинного обучения. Вестник НГУ. Серия: Информационные технологии. 2022 Т.20, №2. C. 27–36. DOI: 10.25205/1818-7900-2022-20-2-27-36