Разработка и построение прогностических моделей на основе нейронной сети в аналитической платформе Deductor - Курсовая работа

бесплатно 0
4.5 194
"Наивная" модель прогнозирования. Прогнозирование методом среднего и скользящего среднего. Метод опорных векторов, деревьев решений, ассоциативных правил, системы рассуждений на основе аналогичных случаев, декомпозиции временного ряда и кластеризации.

Скачать работу Скачать уникальную работу

Чтобы скачать работу, Вы должны пройти проверку:


Аннотация к работе
Прогнозирование - одна из самых востребованных, но при этом и самых сложных, задач анализа. Период прогнозирования - это основная единица времени, на которую делается прогноз. Горизонт прогнозирования - это число периодов в будущем, которые покрывает прогноз. Выбор периода и горизонта прогнозирования обычно диктуется условиями принятия решений в области, для которой производится прогноз. Для того чтобы прогнозирование имело смысл, горизонт прогнозирования должен быть не меньше, чем время, необходимое для реализации решения, принятого на основе прогноза.Экстраполяция представляет собой попытку распространить закономерность поведения некоторой функции из интервала, в котором известны ее значения, за его пределы. Если это требование не выполняется, скорее всего, поведением функции в различных интервалах будет подчиняться разным закономерностям.В формуле прогноза на основе среднего предполагается, что ряд усредняется по достаточно длительному интервалу времени (в пределе - по всем наблюдениям). С точки зрения прогноза это не вполне корректно, так как старые значения временного ряда могли сформироваться на основе иных закономерностей и утратить актуальность. Поэтому свежие наблюдения из недалекого прошлого лучше описывают прогноз, чем более старые значения того же ряда. Смысл данного метода заключается в том, что модель «видит» только ближайшее прошлое на T отсчетов по времени и прогноз строится только на этих наблюдениях. Чем меньшее количество наблюдений используется для вычисления скользящего среднего, тем точнее будут отражены изменения показателей, на основе которых строится прогноз.К числу наиболее мощных, развитых и универсальных моделей прогнозирования относятся регрессионные модели. Регрессия - это технология статистического анализа, целью которой является определение лучшей модели, устанавливающей взаимосвязь между выходной (зависимой) переменной и набором входных (независимых) переменных. Применение регрессионных моделей оказывается особенно полезным в следующих случаях: · входные переменные задачи известны или легко поддаются изменению, а выходные - нет;Одним из методов прогнозирования временных рядов является определение факторов, которые влияют на каждое значение временного ряда. Для этого выделяется каждая компонента временного ряда, вычисляется ее вклад в общую составляющую, а затем на его основе прогнозируются будущие значения временного ряда. Данный метод получил название декомпозиции временного ряда. При декомпозиции при помощи линейного тренда, что типично для многих реальных временных рядов, он представляет собой прямую линию, описываемую уравнением: y=a b•x, где y - значение ряда, a, b-коэффициенты, определяющие расположение и наклон линии тренда, t - время. При использовании сезонности для прогнозирования методом декомпозиции сначала из временного ряда убирается тренд и сглаживается возможная циклическая компонента.Если зависимая переменная принимает непрерывные значения, то дерево решений устанавливает зависимость этой переменной от независимых переменных, т.е. решает задачу численного прогнозирования. 4, т.е. принять решение, играть ли в гольф, следует отнести текущую ситуацию к одному из известных классов (в данном случае - «играть» или «не играть»).По сути дела такой подход является комбинацией двух различных моделей временных рядов - первая модель определяет кластер, вторая прогнозирует внутри кластера. Вся цель подобного нагромождения моделей состоит в повышении точности прогнозирования временных рядов. Однако нужно четко понимать, что создание комбинированных моделей весьма трудоемко, потому как нужно создать не только модель для кластеризации, но множество моделей прогнозирования внутри каждого кластера. Хотя все прогностические методы имеют свои сильные и слабые стороны, точность модели в значительной мере зависит от исходных данных и функций, используемых для обучения прогностической модели. Метод окон (метод windowing) позволяет выявить закономерности во временном ряде на основе сведения анализа временного ряда к задаче распознавания образов и последующего ее решения на нейросети.

План
Содержание

Введение

Практическая и математическая постановка задачи

Анализ существующих алгоритмов и методов решения задачи

1. «Наивная» модель прогнозирования.

2. Экстраполяция.

3. Прогнозирование методом среднего и скользящего среднего.

4. Регрессионные модели.

5. Метод декомпозиции временного ряда.

6. Метод «ближайшего соседа» (NN - “nearest neighbor”) или системы рассуждений на основе аналогичных случаев

7. Метод опорных векторов (SVM - Support Vector Machine).

8. Метод деревьев решений.

9. Кластеризация

10. Метод ассоциативных правил

Описание разрабатываемого алгоритма, его укрупненная схема

Решение контрольного примера

Оценка точности решения

Заключение и выводы

Список литературы

Введение
Прогнозирование - одна из самых востребованных, но при этом и самых сложных, задач анализа. Проблемы при ее решении обусловлены многими причинами - недостаточное качество и количество исходных данных, изменения среды, в которой протекает процесс, воздействие субъективных факторов. [1]

Качественный прогноз является ключом к решению таких актуальных бизнес-задач, как оптимизация складских запасов и финансовых потоков, бюджетирование, оценка инвестиционной привлекательности и многих других. [1]

Нейронные сети - это очень мощный и гибкий механизм прогнозирования. При определении того, что нужно прогнозировать, необходимо указывать переменные, которые анализируются и предсказываются. Второй важный этап при построении нейросетевой прогнозирующей системы - это определение следующих трех параметров: периода прогнозирования, горизонта прогнозирования и интервала прогнозирования. Период прогнозирования - это основная единица времени, на которую делается прогноз. Горизонт прогнозирования - это число периодов в будущем, которые покрывает прогноз. То есть, может понадобиться прогноз на 10 дней вперед, с данными на каждый день. В этом случае период - сутки, а горизонт - 10 суток. Наконец, интервал прогнозирования - частота, с которой делается новый прогноз. Часто интервал прогнозирования совпадает с периодом прогнозирования. Выбор периода и горизонта прогнозирования обычно диктуется условиями принятия решений в области, для которой производится прогноз. Выбор этих двух параметров - едва не самое трудное в нейросетевом прогнозировании. Для того чтобы прогнозирование имело смысл, горизонт прогнозирования должен быть не меньше, чем время, необходимое для реализации решения, принятого на основе прогноза. [2]

В некоторых случаях не так важно предсказание конкретных значений прогнозируемой переменной, как предсказание значительных изменений в ее поведении. Такая задача возникает, например, при предсказании момента, когда текущее направление движения рынка (тренд) изменит свое направление на противоположное. [2]

Точность прогноза, требуемая для конкретной проблемы, оказывает огромное влияние на прогнозирующую систему. Также огромное влияние на прогноз оказывает обучающая выборка. [2]

Практическая и математическая постановка задачи

Структура прогностической модели похожа на структуры моделей, используемых для решения других задач анализа, например распознавания, идентификации и т.п. Модель прогноза отличается только характером используемых данных и алгоритмами их обработки. Обобщенная структура прогностической модели представлена на Ошибка! Источник ссылки не найден.. [3 стр. 533]

Рисунок 1. - Обобщенная модель прогноза

Здесь набор входных переменных xi (i=1..n), образующих вектор X, - исходные данные для прогноза. Набор выходных переменных yi (j=1..m), образующих вектор результата Y, есть набор прогнозируемых величин. [3 стр. 533]

Когда решается задача прогнозирования значений временного ряда, описывающего динамику изменения некоторого бизнес-процесса, входные значения - наблюдения за развитием процесса в прошлом, в выходные - прогнозные значения процесса в будущем. При этом временные интервалы прошлых наблюдений и временные интервалы, по которым требуется получить прогноз, должны соответствовать друг другу. Например, если требуется получить прогноз по продажам за будущую неделю, наблюдения, на основе которых будет строиться прогноз, также должны быть за неделю. Обучающая выборка стоится путем преобразования временного рядас помощью скользящего окна. [3 стр. 533]

Кроме того, количество прогнозируемых наблюдений за историей развития процесса в прошлом, на основе которого строится прогноз, должно быть больше, чем число прогнозируемых интервалов, то есть n<m. Иначе говоря, если мы хотим получить прогноз на неделю, то для этого должны взять наблюдения за несколько прошедших недель. [3 стр. 533]

Анализ существующих алгоритмов и методов решения задачи

1. «Наивная» модель прогнозирования модель прогнозирование кластеризация вектор

«Наивная» модель прогнозирования предполагает, что последний период прогнозируемого временного ряда лучше всего описывает будущее этого ряда. В таких моделях прогноз, как правило, является довольно простой функцией от наблюдений прогнозируемой величины в недалеком прошлом. [3 стр. 533]

Простейшая модель описывается выражением: y(t 1)=y(t), где y(t) - последнее наблюдаемое значение, y(t 1) - прогноз. [3 стр. 533]

Данная модель не только не учитывает закономерности прогнозируемого процесса (что в той или мной степени свойственно многим статистическим методам прогнозирования), но и не защищена от случайных изменений в данных, а также не отражает сезонные колебания частоты и тренды. [3 стр. 533-534]

Список литературы
1. Deductor 4 - прогнозирование. BIGROUP Labs. [В Интернете] [Цитировано: 20 10 2014 r.] http://www.bi-grouplabs.ru/RESOURCEANALITIC/Forcast2/DEDFORCAST.html.

2. Прогнозирование с помощью нейронных сетей. [В Интернете] [Цитировано: 20 10 2014 r.] http://apsheronsk.bozo.ru/Neural/Lec9.htm.

3. Паклин, Н. и Орешков, В. Бизнес-аналитика: от данных к знаниям. СПБ. : Питер, 2013.

4. Паклин, Н. Логистическая регрессия и ROC-анализ - математический аппарат. BASEGROUP Labs. [В Интернете] [Цитировано: 03 11 2014 r.] http://www.basegroup.ru/library/analysis/regression/logistic/.

5. Чубукова, И. А. Data Mining. Интуит - национальный открытый университет. [В Интернете] [Цитировано: 03 11 2014 r.] http://lnfm1.sai.msu.ru/~rastor/Books/Chubukova-Data_Mining.pdf.

6. Гуаццелли, Алекс. Прогнозирование будущего: Часть 2. Методы прогностического моделирования. DEVELOPERWORKS Россия. [В Интернете] IBM, 01 10 2012 r. [Цитировано: 03 11 2014 r.] http://www.ibm.com/developerworks/ru/library/ba-predictive-analytics2/.

7. Чучуева, И. Два способа повысить точность прогноза. Математическое бюро. [В Интернете] 30 01 2012 r. [Цитировано: 03 11 2014 r.] http://www.mbureau.ru/blog/dva-sposoba-povysit-tochnost-prognoza.

8. Пешнина, М. А. Материалы Международного молодежного научного форума «ЛОМОНОСОВ-2014». [1 электрон. опт. диск (DVD-ROM)] М. : МАКС Пресс, 2014 r.

9. Пауков, Д. ПРОГНОЗИРОВАНИЕ С ПОМОЩЬЮ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ. ДНТУ. [В Интернете] [Цитировано: 20 10 2014 r.] http://masters.donntu.edu.ua/2006/kita/kiryan/library/art06.htm.

10. Чубукова, И. А. Лекция 9: Методы классификации и прогнозирования. Деревья решений. Интуит - национальный открытый университет. [В Интернете] [Цитировано: 03 11 2014 r.] http://www.intuit.ru/studies/courses/6/6/lecture/174.

Размещено на

Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность
своей работы


Новые загруженные работы

Дисциплины научных работ





Хотите, перезвоним вам?