Кластерный анализ как инструмент группировки объектов. Коэффициенты оценки подобия на практике. Задача кластерного анализа. Иерархические методы его применения. Проверка качества кластеризации. Методика применения основных методов кластерного анализа.
Аннотация к работе
Задача кластерного анализа заключается в том, чтобы разбить множество, состоящее из k объектов на m кластеров (m - целое число, меньшее чем k) так, чтобы каждый объект принадлежал только одному кластеру с однородными признаками и чтобы объекты, принадлежащие разным кластерам, были с разнородными признаками. В формулах (5.8) - (5.11) приняты следующие обозначения: - расстояние между q-ым кластером, к которому подсоединен еще один объект, и g-ым объектом или кластером; Объекты, которые по значениям х1 и х2 "похожи" друг на друга, принадлежат к одному кластеру; объекты из разных кластеров не похожи друг на друга. Объект относится к кластеру, если расстояние от объекта до центра кластера меньше радиуса кластера. выбор первых двух объектов в качестве центров двух первых кластеров по максимальному расстоянию между ними (по k-средним); в качестве центра третьего кластера выбирается объект суммарное расстояние которого от объектов, ранее выбранных в качестве центров кластеров, максимально.