Применение кластеризации данных для решения задачи группировки графических образов. Построение схемы последовательной кластеризации сложной графической информации. Обзор вопроса выбора меры различия, учитывающей степень визуального сходства изображений.
Аннотация к работе
ФОРМИРОВАНИЕ ИНТЕЛЛЕКТУАЛЬНЫХ КРИТЕРИЕВ В ЗАДАЧАХ КЛАСТЕРИЗАЦИИ СЛОЖНОЙ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ
М.И. БояркинНа примере схемы последовательной кластеризации сложной графической информации рассматривается вопрос выбора меры различия, учитывающей степень визуального сходства изображений. Рассматриваемая в данной статье модифицированная модель кластеризации графических данных, учитывающая специфику обрабатываемых, в данном случае, изображений лиц людей, позволяет группировать изображения по признаку их визуального сходства [1]. Специфика данных упомянута неслучайно, так как структура данных и принцип их поступления в систему (как и в прочих случаях практического использования моделей кластеризации) накладывают существенные ограничения на выбор алгоритмических схем кластеризации. Наиболее сложным и интересным для рассмотрения является случай реализации работы данной модели в режиме «реального времени», т.е. данные поступают в модель последовательно и постоянно, и в каждый момент времени должна существовать готовая структура сгруппированных графических образов, уже имеющихся на данный момент в системе. В таких случаях в основном используется мера различия между образом и «представителем» кластера C (в рассматриваемой модели представителем кластера является некоторая группа образов, называемая «ядром» кластера [1]).