Измерение геометрических свойств зерен пшеницы. Агломеративный алгоритм иерархической классификации. Процедура создания кластеров. Градиентный алгоритм кластеризации, основанный на классической Ньютоновской процедуре. Величина стандартного отклонения.
Аннотация к работе
На основе измерения геометрических свойств зерен пшеницы необходимо классифицировать зерна по их принадлежности к сортам. Рассматриваемая группа содержала зерна, принадлежащие к различным сортам пшеницы. Высокое качество визуализации внутренней структуры зерен было получено при помощи рентгеновской техники. Исследования проводились с использованием объединенного рассмотрения собранных зерен пшеницы, произрастающих на опытных полях в Институте Агрофизики Польской академии наук в Люблине. Характеристики (атрибуты): Для формирования данных были измерены 7 геометрических параметров зерен пшена: 1) область расположения зерен;Разбиение k-го уровня имеет вид S(k) = (S1(k), S2(k), …, Sn-k(k)) и строится из разбиения S(k-1), k 1, путем объединения пары классов (S1, S2), где (S1, S2) = (S1, S2). В алгоритме k-средних единственным управляющим параметром является число классов, на которые производится разбиение S = (S1, S2, …, Sk) выборки Х. Введем расстояние d(X, e) от точки X Rp до множества e = (e1, …, ek), где ej Rp по формуле: Тогда можно рассмотреть статистический выброс выборки X относительно множества e = (e1, …, ek): F(X,e) = . Определим статистический выброс F(S) разбиения S = (S1, …, Sk) выборки X как разброс этой выборки относительно множества e(S) = (e1(S), …, ek(S)), где ej(S) - средний вектор класса Sj, т.е. полагается, что F(S) = F(X, e(S)). Так как на последовательности разбиений S0, S1, …, Sm, …, которая строится в алгоритме k-средних, функционал F(S) не возрастает, то для любого начального разбиения алгоритм через конечное число шагов заканчивает работу.