10.25205/1818-7900-2023-21-1-32-45

Радеев Никита Андреевич
1. Новосибирский государственный университет
n.radeev@g.nsu.ru
Материал поступил в редколлегию 29.03.2023
Существуют предметные области, где все преобразования данных должны быть прозрачными и объяснимыми (например, медицина и финансы). Уменьшение размерности данных является важной частью предварительной обработки данных, но алгоритмы для него в настоящее время не являются прозрачными. В данной работе мы предлагаем генетический алгоритм для прозрачного уменьшения размерности числовых табличных данных. Алгоритм строит признаки в виде деревьев выражений на основе подмножества числовых признаков из исходных данных и обычных арифметических операций. Он спроектирован так, чтобы стремиться к достижению
максимального качества в задачах бинарной классификации и генерировать признаки, объяснимые человеком, что достигается за счет использования в построении признаков операций, понятных человеку. Кроме того, преобразованные алгоритмом данные могут быть использованы в визуальном анализе, если уменьшить размерность до двух. В алгоритме используется многокритериальная динамическая фитнес-функция, предназначенная для построения признаков с высоким разнообразием.

Выходные данные: Н.А. Радеев 10.25205/1818-7900-2023-21-1-32-45. Вестник НГУ. Серия: Информационные технологии. 2023 Т.21, №1. C. 46–61. DOI: 10.25205/1818-7900-2023-21-1-46-61