Статистический анализ многомерных неоднородных данных в программной среде R - Реферат

бесплатно 0
4.5 141
Знакомство с возможностями среды статистических вычислений R для классификации многомерных неоднородных ассиметричных данных. EM алгоритм как общий метод для нахождения оценок максимального правдоподобия параметров моделей по данным с пропусками.


Аннотация к работе
При статистическом анализе многомерных данных из различных областей человеческой деятельности часто возникает проблема неоднородности данных, которая может быть переформулирована как задача классификации [1]. С точки зрения теории вероятности, при решении данной задачи наиболее адекватным является параметрический подход, при котором для описания данных используется модель смеси вероятностных распределений (Finite Mixture Model - FMM) [2]. В качестве базовой модели используется модель смеси нормальных распределений [3], поскольку она наиболее полно изучена теоретически. В условиях указанной модели для одновременной оценки параметров и классификации наблюдений традиционно используется итерационный алгоритм расщепления смесей распределений [1], который в англоязычной литературе имеет название Expectation-Maximization (EM) [5]. Существует множество реализаций EM алгоритма для некоторых из перечисленных выше задач, но для научных исследований представляется наиболее удобным использование реализаций данного алгоритма из специализированных библиотек среды статистического программирования R [6]. Основными задачами являются: подготовка обзора по соответствующим реализациям EM алгоритмов в R, проверка работоспособности данных алгоритмов на модельных данных, а также адаптация указанных алгоритмов для задачи оценивания кредитных рейтингов предприятий. 1. Обзор литературы 1.1 EM алгоритмы для FMM статистический вычисление неоднородный ассиметричный EM алгоритм является общим методом для нахождения оценок максимального правдоподобия параметров моделей по данным с пропусками [7]. Существует множество подходов к оцениванию параметров модели FMM, включая метод максимального правдоподобия (Maximum Likelihood-based Inference - ML), байесовский метод на основе метода Монте-Карло c использованием цепи Маркова (Bayesian approach based on Markov chain Monte Carlo), онлайн EM алгоритм (Online EM)[2].
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?