Изучение возможностей среды статистических вычислений R для классификации многомерных неоднородных ассиметричных данных с помощью Expectation-Maximization (EM) алгоритмов. Использование R для анализа модели смеси вероятностных распределений (FMM).
Аннотация к работе
Глава 1. Обзор литературы 1.1 EM алгоритмы для FMM 1.2 Использование R для анализа FMM Глава 2. Методика исследования 2.1 Описание EM алгоритма 2.2 Примеры ассиметричных распределений Глава 3. Результаты численных экспериментов 3.1 Модельные данные 3.2 Реальные данные Заключение Библиографический список Приложения Введение При статистическом анализе многомерных данных из различных областей человеческой деятельности часто возникает проблема неоднородности данных, которая может быть переформулирована как задача классификации. В качестве базовой модели используется модель смеси нормальных распределений, поскольку она наиболее полно изучена теоретически. В условиях указанной модели для одновременной оценки параметров и классификации наблюдений традиционно используется итерационный алгоритм расщепления смесей распределений, который в англоязычной литературе имеет название Expectation-Maximization (EM). Существует множество подходов к оцениванию параметров модели FMM, включая метод максимального правдоподобия (Maximum Likelihood-based Inference - ML), байесовский метод на основе метода Монте-Карло c использованием цепи Маркова (Bayesian approach based on Markov chain Monte Carlo), онлайн EM алгоритм (Online EM).