Кластерный анализ как инструмент группировки объектов. Коэффициенты оценки подобия на практике. Задача кластерного анализа. Иерархические методы его применения. Проверка качества кластеризации. Методика применения основных методов кластерного анализа.
Задача кластерного анализа заключается в том, чтобы разбить множество, состоящее из k объектов на m кластеров (m - целое число, меньшее чем k) так, чтобы каждый объект принадлежал только одному кластеру с однородными признаками и чтобы объекты, принадлежащие разным кластерам, были с разнородными признаками. В формулах (5.8) - (5.11) приняты следующие обозначения: - расстояние между q-ым кластером, к которому подсоединен еще один объект, и g-ым объектом или кластером; Объекты, которые по значениям х1 и х2 "похожи" друг на друга, принадлежат к одному кластеру; объекты из разных кластеров не похожи друг на друга. Объект относится к кластеру, если расстояние от объекта до центра кластера меньше радиуса кластера. выбор первых двух объектов в качестве центров двух первых кластеров по максимальному расстоянию между ними (по k-средним); в качестве центра третьего кластера выбирается объект суммарное расстояние которого от объектов, ранее выбранных в качестве центров кластеров, максимально.
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы