Прогнозирование объема кредита - Курсовая работа

бесплатно 0
4.5 58
Общее понятие о прогнозировании, методы. Абсолютные, сравнительные и качественные показатели оценки качества прогноза. Метод наименьших квадратов. Модели линейного роста. Новшества программы Excel 5.0. Пример решения задачи по прогнозу объема кредита.


Аннотация к работе
Качество прогнозирования, прежде всего, характеризуется ошибкой прогноза, (математическое определение качества прогноза): предполагается, что чем меньше ошибка прогноза, тем выше его качество. Абсолютные показатели оценки качества прогноза позволяют количественно определить величину ошибки прогноза в единицах измерения прогнозируемого объекта или в процентах. Все рассмотренные выше показатели точности прогноза используются при проверке точности прогноза, полученного в виде точечных оценок. Прогнозирование с помощью временных рядов относится к классу адаптивных методов прогнозирования, которые имеют следующие особенности: 1) в основе всех адаптивных моделей лежит идея экспоненциального сглаживания; Time Series/Forecasting - Анализ временных рядов и прогнозирование: общее назначение модуля - построить простую модель, описывающую ряд, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых до данного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье - анализ ряда;В данной курсовой работе рассматривались данные с января 2005 года по май 2007 года и осуществлялся прогноз на июнь 2007 года. Были построены четыре модели прогнозирования объема кредитов: - с использованием Метода наименьших квадратов (расчеты производились в таких программных продуктах, как Statistica и Excel), - линейная модель (Excel) Выбранные модели дают довольно различные результаты, и лучшие результаты были получены при использовании Метода наименьших квадратов.

Введение
В экономике основой практически любой деятельности является прогноз. Уже на основе прогноза составляется план действий и мероприятий. Таким образом, можно сказать, что прогноз макроэкономических переменных является основополагающей составляющей планов всех субъектов экономической деятельности.

Прогнозирование - это способ научного предвидения, в котором используется как накопленный в прошлом опыт, так и текущие допущения насчет будущего с целью его определения. Основная функция прогноза - обоснование возможного состояния объекта в будущем или определение альтернативных путей.

В настоящее время ни одна сфера жизни общества не может обойтись без прогнозов как средства познания будущего. Особо важное значение имеют прогнозы социально-экономического развития общества, обоснование основных направлений экономической политики, предвидение последствий принимаемых решений.

Актуальность данной темы как в условиях развитой рыночной экономики, так и переходной экономики определяется тем, что уровень прогнозирования процессов общественного развития обуславливает эффективность планирования и управления экономикой и другими сферами.

Целью данной курсовой работы является рассмотрение наиболее эффективных методов социально экономических прогнозов и осуществление прогнозирования кредитов в РФ в 2007 году.

Организация финансово-кредитного обслуживания предприятий, организаций и населения, функционирование кредитной системы играют исключительно важную роль в развитии хозяйственных структур. От эффективности и бесперебойности функционирования кредитно-финансового механизма зависят не только своевременное получение средств отдельными хозяйственными единицами, но и темпы экономического развития страны в целом.

Кредитные операции - это отношения между кредитором и заемщиком (дебитором) по представлению первым последнему определенной суммы денежных средств на условиях платности, срочности, возвратности. Банковские кредитные операции подразделяются на две большие группы: активные, когда банк выступает в лице кредитора, выдавая ссуды;

пассивные, когда банк выступает в роли заемщика (дебитора), привлекая деньги от клиентов и других банков в банк на условиях платности срочности, возвратности

1. Описание предметной области и постановка задачи исследования

Задачей данного исследования является осуществление точечного краткосрочного прогноза по выдачи кредита.

Прогнозирование - разработка прогноза, т.е. специальное научное исследование перспектив (прошлых тенденций) развития каких-либо явлений (технических, социально-экономических).

При прогнозировании используются три группы методов: Экстраполяция (интерполяция);

Моделирование;

Опрос экспертов.

Экстраполяция изучает явление и переносит тенденции этого изученного явления на другую часть этого явления или переносит прошлые тенденции явления на будущие периоды. В научном плане примером экстраполяции является математическая статистика.

Интерполяция имеет сходную с экстраполяцией методологию - ищет промежуточные значения величины (параметра) по некоторым известным ее значениям.

В данной работе будут использованы следующие аналитические методы прогнозной экстраполяции: метод наименьших квадратов, адаптивные методы.

Качество прогнозирования, прежде всего, характеризуется ошибкой прогноза, (математическое определение качества прогноза): предполагается, что чем меньше ошибка прогноза, тем выше его качество.

Все существующие методики оценки качества прогнозирования можно условно разделить на три группы показателей: Абсолютные;

Сравнительные;

Качественные.

Абсолютные показатели оценки качества прогноза позволяют количественно определить величину ошибки прогноза в единицах измерения прогнозируемого объекта или в процентах. Это среднеквадратическая ошибка ( ), абсолютная ошибка ( ), средняя абсолютная ошибка ( ), относительная ошибка ( ) и средняя относительная ошибка ( ).

Абсолютная ошибка прогноза может быть определена как разность между фактическим значением ( ) и прогнозом ( ), значит, ;

среднее абсолютное значение ошибки

.

Среднее абсолютное значение всегда неотрицательно. Среднеквадратическая ошибка прогноза рассчитывается по формуле: , где n - период упреждения.

Недостатком рассматриваемых показателей является то, что значение этих характеристик существенно зависит от масштаба измерения уровней исследуемых явлений.

Поэтому абсолютная ошибка прогноза может быть выражена в процентах относительно фактических изменений показателя следующим образом:

, а средняя относительная ошибка рассчитывается как .

Данный показатель используется, как правило, при сравнении точности прогнозов разнородных объектов прогнозирования.

Сравнительные показатели оценки качества прогноза основаны на сравнении ошибки рассматриваемого прогноза с эталонными прогнозами определенного вида.

Один из типов таких показателей может быть представлен следующим образом: , где - прогнозируемое значение величины эталонного прогноза. В качестве эталонного прогноза может быть выбрана простая экстраполяция, постоянный темп прироста и т.д.

Качественные показатели позволяют повести некоторый анализ видов ошибок прогнозов, разложить их на какие-либо составляющие. Особенно такой анализ важен для циклически меняющихся переменных, когда необходимо прогнозировать не только общее направление развития, но и поворотные точки цикла, в которых меняются коэффициенты адаптации прогнозной модели.

Все рассмотренные выше показатели точности прогноза используются при проверке точности прогноза, полученного в виде точечных оценок.

Выбор показателей точности зависит от задач, которые ставит перед собой исследователь при анализе точности прогноза.

Важным критерием правильности применения прогнозной модели является проверка на адекватность. Адекватными моделями считаются такие, для которых остаточная компонента имеет свойства независимости, случайности и нормальности распределения.

В данной работе использовались абсолютные показатели оценки качества прогноза.

2. Описание используемого математического аппарата при проведении расчетов

Как уже отмечалось выше, в данной курсовой работе использовались аналитические методы прогнозной экстраполяции: метод наименьших квадратов, адаптивные методы. Расчеты проводились на их основе. Остановимся поподробнее на каждом из них.

Метод наименьших квадратов (МНК)

Метод наименьших квадратов позволяет относительно просто определить аналитическую зависимость одного показателя от другого: y=?(x).

Имея такую функциональную зависимость, легко определить значение Y при любом значении x, т.е. получить прогнозное значение Y при заданном значении х. Вывод формул метода наименьших квадратов. Пусть имеем статистические данные о параметре y в зависимости от х. Эти данные представим в виде табл.1.

х х1 х2 ….. хі ….. xn y* y1* y2* ...... yi* ….. yn*

Метод наименьших квадратов позволяет при заданном типе зависимости y=?(x) так выбрать ее числовые параметры, чтобы кривая y=?(x) наилучшим образом отображала экспериментальные данные по заданному критерию. Рассмотрим обоснование с точки зрения теории вероятностей для математического определения параметров, входящих в ?(x).

Предположим, что истинная зависимость y от х в точности выражается формулой y=?(x). Экспериментальные точки, представленные в табл.2, отклоняются от этой зависимости следствие ошибок измерения. Ошибки измерения подчиняются по теореме Ляпунова нормальному закону. Рассмотрим какое-нибудь значение аргумента хі. Результат опыта есть случайная величина yi,распределенная по нормальному закону с математическим ожиданием ?(xi) и со средним квадратическим отклонением ?i, характеризующим ошибку измерения. Пусть точность измерения во всех точках х=(х1, х2, …, xn) одинакова, т.е. ?1=?2=…=?n=?. Тогда нормальный закон распределения Yi имеет вид: (1)

В результате ряда измерений произошло следующее событие: случайные величины (y1*, y2*, …, yn*). Поставим следующую задачу.

Задача МНК. Подобрать математические ожидания ?(x1), ?(x2), …, ?(xn) так, чтобы вероятность этого события была максимальной. Так как величины Yi непрерывны, то говорят не о вероятностях событий Yi=yi*, а о вероятностях того, что Yi примут значения из интервала (yi*,yi* dyi*), т.е.

Вероятность P того, что система случайных величин (y1, y2, …, yn) примет совокупность значений, лежащих в пределах (yi*,yi* dyi*), i=1, 2, …, n, с учетом того, что измерения проводятся независимо друг от друга, равна произведению вероятностей Fi(yi)*dyi* для всех значений i: (2)

Где k - коэффициент, не зависящий от ?(xi).

Требуется выбрать математические ожидания ?(x1), ?(x2), …, ?(xn) так, чтобы выражение (2) достигало максимума. Это возможно, когда выполнено условие

. (3)

Отсюда получаем требование метода наименьших квадратов: для того чтобы данная совокупность наблюдаемых значений (y1*, y2*, …, yn*) была наивероятнейшей, нужно выбрать функцию ?(x) так, чтобы сумма квадратов отклонений наблюдаемых значений yi* от ?(xi) была наименьшей.

При решении практических задач зависимость y=?(x) задается в виде y=?(x,a1, a2, …, am), где a1, a2, …, am - числовые параметры, которые необходимо определить. Учитывая соотношение (3), получим

(4)

Продифференцируем выражение (4) по a1, a2, …, am и прировняем полученные производные нулю. Получим следующую систему уравнений: , , … … … … … … … … … … ; (5)

, где - значения частной производной функции ? по ак в точке хі.

Отметим, что в общем случае систему (5) решить нельзя, так как неизвестен вид функции ?(x,a1, a2, …, am). При решении практических задач зависимость y от x ищут в виде линейной комбинации известных функций с коэффициентами a1, a2, …, am, а именно: . Подставив значение ?k(х) в (5), решаем эту систему и находим a1, a2, …, am.

Рассмотрим один из частных случаев МНК: пусть зависимость y от х выражается линейной функцией y=a1 a2x. Тогда значения коэффициентов a1 и a2 находятся по следующим формулам: ; (6)

Адаптивные методы прогнозирования

Временным рядом называется множество наблюдений, получаемых последовательно во времени.

Прогнозирование с помощью временных рядов относится к классу адаптивных методов прогнозирования, которые имеют следующие особенности: 1) в основе всех адаптивных моделей лежит идея экспоненциального сглаживания;

2) адаптивные модели отражают только текущие свойства исследуемого временного ряда;

3) на каждой итерации адаптивные модели непрерывно учитывают текущие изменения характеристик ряда;

4) некоторые адаптивные модели обладают свойством самонастраивания, т.е. свойством учитывать прошлые изменения характеристик ряда;

5) критерием качества использования адаптивной прогнозной модели, как правило, является средний квадрат ошибки прогнозирования. В редких случаях за качество модели принимается отсутствие автокорреляции между членами временного ряда.

Согласно классическому подходу, в общем случае временной ряд рассматривается как состоящий из четырех компонент: тренда, сезонных колебаний, нерегулярных колебаний и случайной компоненты.

Для описания временных рядов используется следующая модель: хт=?t ?t, (7) где хт - текущий член временного ряда в момент времени t;

?t - случайная величина, которая генерируется детерминированной функцией или стохастическим процессом;

?t - случайная величина, которая генерируется случайным неавтокоррелированным процессом с математическим ожиданием М=0 и постоянной дисперсией.

Значение прогнозируемого показателя определяется по формуле (7) только случайной величиной ?t, так как в силу концепции модели (7) только через нее может быть реализовано взаимодействие членов ряда. Величина ?t называется уровнем ряда хт и может быть представлена различными законами, т.е. трендами.

Случайная величина ?t влияет на один или несколько соответствующих членов временного ряда, причем долевое влияние ?t на прогноз значительно меньше, чем влияние ?t.

Простейшие адаптивные модели используют идею экспоненциального сглаживания, т.е. вычисление экспоненциальной средней. Рассмотрим экспоненциальное сглаживание.

Экспоненциальное сглаживание

При исследовании временного ряда xt экспоненциальное сглаживание проводится по формуле: (8)

Где хт - текущий член временного ряда в момент времени t;

St - значение экспоненциальной средней в момент времени t;

? - параметр адаптации (параметр сглаживания), 0< ?<1, ?=1-?.

В качестве начальных условий для применения экспоненциального сглаживания рекомендуется выбирать следующие значения: среднее арифметическое всех имеющихся значений (или части значений) временного ряда;

среднее геометрическое всех имеющихся значений временного ряда;

значения, выбранные из статистики, полученной при наблюдении за аналогами изучаемого явления.

Модели линейного роста

Если временной ряд имеет тенденцию линейного роста, то применение экспоненциальной средней ведет к смещенным прогнозам. Поэтому были сконструированы специальные адаптивные модели, учитывающие тенденции роста и опирающиеся на идею экспоненциального сглаживания.

Эти модели позволяют статистически данным, близким к периоду прогнозирования, придать в некотором смысле больший вес, а наблюдениям, относящимся к далекому прошлому, - меньший, тогда как при использовании критерия наименьших квадратов все наблюдения имеют равный вес.

При исследовании численности населения была использована двухпараметричная модель Хольта.

Простейшая модификация двухпараметрической модели Хольта выглядит следующим образом:

где: - временной ряд;

- прогнозное значение временного ряда в точке t на шагов вперед;

- шаг прогноза;

- коэффициенты;

- параметры адаптации, и ;

- ошибка прогноза.

3. Описание выбранных программных продуктов

Для расчетов будет использоваться СПП STATISTICA и MS Excel.

Программа MS Excel, являясь лидером на рынке программ обработки электронных таблиц, определяет тенденции развития в этой области. Вплоть до версии 4.0 программа Excel представляла собой фактический стандарт с точки зрения функциональных возможностей и удобства работы. Теперь на рынке появилась версия 5.0, которая содержит много улучшений и приятных неожиданностей.

К значительным достижениям в новой версии программы Excel можно отнести появление трехмерных документов (блокнотов). Установление связей между файлами и таблицами значительно упростилось по сравнению с прежними версиями. Контекстные меню значительно расширены, а дополнительные программные инструменты облегчают решение сложных прикладных задач.

Следует также упомянуть о различных помощниках (Ассистентах), которые помогают пользователю задавать функции и выдают рекомендации, если существует более простой метод решения текущей задачи. В программу Excel встроена удобная подсистема помощи, которая в любой момент готова выдать необходимую справку.

Описанные до сих пор новшества касаются в основном комфорта в работе и быстрого освоения программы. Одним из важнейших функциональных расширений программы, предназначенным для профессионалов, является встроенная в Excel Среда программирования Visual Basic (VBA) для решения прикладных задач. Благодаря VBA фирме Microsoft удалось не только расширить возможности языка макрокоманд Excel 4.0, но и ввести новый уровень прикладного программирования, поскольку VBA позволяет создавать полноценные прикладные пакеты, которые по своим функциям выходят далеко за рамки обработки электронных таблиц. Кроме этого, следует назвать следующие важные новшества программы Excel 5.0: - менеджер файлов, который выдает подробную информацию о всех файлах;

- диалоговые окна-регистры;

- отдельная пиктограмма для форматирования;

- появление механизма Drag & Plot, предназначенного для быстрой активизации диаграмм.

MS Excel - средство для работы с электронными таблицами, намного превышающее по своим возможностям существующие редакторы таблиц. MS Excel - это простое и удобное средство, позволяющее проанализировать данные и, при необходимости, проинформировать о результате заинтересованную аудиторию, используя Internet.

Ключевые преимущества: эффективный анализ данных;

богатые средства форматирования и отображения данных;

совместное использование данных и работа над документами;

обмен данными и информацией через Internet и внутренние Intranet-сети.

Достоинства Microsoft Excel

Эффективность анализа данных

Быстрый и эффективный анализ, удобные средства для работы с данными (мастер сводных таблиц позволяет быстро обрабатывать большие массивы данных и получать итоговые результаты в удобном виде);

Механизм автокоррекции формул автоматически распознает и исправляет ошибки при введении формул;

Использование естественного языка при написании формул.

Богатство средств форматирования и отображения данных

Новые средства форматирования делают оформление таблиц более ярким и понятным (возможности слияния ячеек в электронной таблице, поворот текста в ячейке на любой угол);

Новый и дополненный Мастер создания диаграмм позволяет сделать представление данных в таблицах более наглядным (более удобный и мощный мастер создания диаграмм, новые типы диаграмм - диаграммы в виде круглых столбиков, тетраэдров, в виде «бубликов» и др.).

Совместное использование данных и работа над документами

Microsoft Excel обеспечивает возможность одновременной работы нескольких пользователей над одним документом.

Обмен данными и работа в Internet

Теперь возможно использовать самые свежие данные путем получения их в виде электронных таблиц прямо с Web-серверов в Internet;

Возможность использовать встроенный Internet Assistant для преобразования таблицы в формат HTML и публикации на Web-сервере.

Пакет STATISTICA был создан в начале 1990-х годов сразу для среды Windows. В пакете нашли отражение многие последние достижения теоретической и прикладной статистики.

У пакета есть специальная версия для обучения основам статистических методов - Student Edition of STATISTICA. Эта версия позволяет анализировать файлы данных, включающих не более 400 наблюдений, и представляет собой урезанный вариант пакета.

Основная версия пакета может дополнительно комплектоваться специализированными модулями: Power Analysis (планирование статистических исследовании), Neural Networks (нейросетевой анализ) и др.

С помощью реализованных в системе STATISTICA мощных языков программирования, снабженных специальными средствами поддержки, легко создаются законченные пользовательские решения и встраиваются в различные другие приложения или вычислительные среды. Очень трудно представить себе, что кому-то могут понадобиться абсолютно все статистические процедуры и методы визуализации, имеющиеся в системе STATISTICA, однако опыт многих людей, успешно работающих с пакетом, свидетельствует о том, что возможность доступа к новым, нетрадиционным методам анализа данных помогает находить новые способы проверки рабочих гипотез и исследования данных.

STATISTICA является наиболее динамично развивающимся статистическим пакетом и по многочисленным рейтингам является мировым лидером на рынке статистического программного обеспечения. СПП STATISTICA является универсальной системой, предназначенной для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских приложений, содержащей широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе.

Она состоит из следующих основных компонент, объединенных в рамках одной системы: электронных таблиц для ввода и задания исходных данных;

специальных таблиц для вывода численных результатов анализа;

графической системы для визуализации данных и результатов статистического анализа;

набора специализированных статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;

специального инструментария для подготовки отчетов.

Статистический анализ данных в системе STATISTICA может быть разбит на следующие основные этапы: ввод данных в электронную таблицу с исходными данными и их предварительное преобразование перед анализом;

визуализация данных при помощи того или иного типа графиков;

применение конкретной процедуры статистической обработки;

вывод результатов анализа в виде графиков и электронных таблиц с численной и текстовой информацией;

Пакет содержит следующие модули: Basic Statistic/Tables - Основные статистики и таблицы: позволяет провести предварительную обработку данных, осуществить разведочный анализ, определить зависимости между переменными, разбить их различными способами на группы;

Nonparametrics/Distrib. - Модуль Непараметрическая статистика/Распределеня: дает возможность проверить гипотезы о характере распределения ваших данных;

ANOVA/MANOVA - Модуль дисперсионного анализа: представляет собой набор процедур общего одномерного и многомерного дисперсионного и ковариационного анализа;

Multiple Regression - Модуль Множественная регрессия: помогает построить зависимости между многомерными переменными, подобрать простую линейную модель и оценить ее адекватность;

Nonlinear Estimation - Модуль Нелинейное оценивание: предоставляет возможность определения нелинейной зависимости в данных и подгонки к ним функциональных кривых;

Time Series/Forecasting - Анализ временных рядов и прогнозирование: общее назначение модуля - построить простую модель, описывающую ряд, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых до данного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье - анализ ряда;

Claster Analysis - Модуль Кластерный анализ: позволяет произвести сложную иерархическую классификацию данных или выделить в них кластеры;

Data Management/MFM - Управление данными: специализированный модуль, который содержит большое количество вспомогательных процедур по работе с данными (иерархическая сортировка, проверка, категоризация и ранжирование и др.);

Factor Analysis - Модуль Факторный анализ: дает возможность сжать данные или выделить основные общие факторы, влияющие на наблюдаемые характеристики сложного объекта и объясняющие связи между ними;

Canonical Analysis - Модуль Канонический анализ: включает в себя широкий набор процедур для выполнения канонического корреляционного анализа, исследования связи между двумя множествами переменных;

Multidimensional Scaling - Модуль Многомерное шкалирование: помогает представить данные о близости объектов какой-либо простой пространственной моделью, в которой объекты интерпретируются, например, как города на обычной карте, а различия между ними есть просто расстояния, в частности данные о странах, политических партиях и т.д., и всесторонне диагностировать модель;

SEPATH - Модуль Моделирование структурными уравнениями: позволяет строить и тестировать различные модели, объясняющие структуру связей между наблюдаемыми переменными;

Reliability/Item Analysis - Модуль Анализ надежности: включает широкий набор процедур для разработки и вычислений надежности сложных объектов на основе результатов обследований и диагностики отдельных узлов;

Discriminant Analysis - Модуль Дискриминантный анализ: позволяет построить на основе ряда предположений классификационное правило отнесения объекта к одному из нескольких классов, минимизируя некоторый разумный критерий;

Log-linear Analysis - Модуль Лог-линейный анализ: проводит анализ сложных многоуровневых таблиц;

Survival Analysis - Модуль Анализ длительностей жизни: предлагает обширный набор методов анализа данных из социологии, биологии, медицины, так же, как процедуры, используемые в инженерии и маркетинге;

Commmand Language (SCL) - Командный язык STATISTICA: позволяет автоматизировать рутинные процессы обработки данных в системе;

STATISTICA File Server - позволяет быстро открыть для просмотра/редактирования как графики и таблицы, так и отчеты.

Выбор системы STATISTICA в качестве инструмента для обработки данных может быть обусловлен возможностью проведения наиболее полного анализа, т.к. система содержит все необходимые нам статистические процедуры.

Основные преимущества системы STATISTICA: содержит полный набор классических методов анализа данных: от основных классических методов статистики, до самых современных, что позволяет гибко организовывать анализ;

является средством построения приложений в конкретных областях;

отвечает всем стандартам Windows, что позволяет сделать анализ высокоинтерактивным;

система может быть интегрирована в Интернет;

поддерживает web-форматы:HTML, JPEG, PNG;

данные системы STATISTICA легко конвертировать в различные базы данных и электронные таблицы;

поддерживает высококачественную графику, позволяющую эффективно визуализировать данные и проводить графический анализ;

является открытой системой: содержит языки программирования, которые позволяют расширить систему, запускать ее из других Windows-приложений, например из Excel;

используются разнообразные методы, позволяющие провести всесторонне исследование ретроспективных данных (в виде временных рядов);

доступны различные возможности преобразования временных рядов;

позволяют построить объективный прогноз данных, который включает в себя вычисление верхних и нижних границ, в которых, можно утверждать, что с определенной вероятностью лежат значения прогнозируемых показателей.

4. Практическая часть прогнозирование кредит объем

Полное исследование проблем, связанных с прогнозированием конкретного показателя, сводится к выполнению следующих этапов: 1. постановка задачи исследования и сбор исходной информации;

2. предпрогнозный анализ данных;

3. выбор моделей прогнозирования;

4. численное оценивание параметров моделей;

5. проверка моделей на точность и адекватность;

6. выбор лучшей модели или построение обобщенной модели;

7. получение точечного интервального прогнозов;

8. анализ и интерпретация полученных прогнозных значений.

Задача исследования

Задачей данного исследование является прогнозирование объема кредита. Исходная информация представляет из себя временной ряд размерностью 27 - с января 2005 г. по май 2007 г.

Таблица 1 t y

1 137,4

2 142,8

3 142,6

4 142,9

5 143,7

6 145,2

7 144,6

8 144,0

9 145,9

10 146,3

11 147,0

12 147,7

13 146,9

14 146,6

15 147,8

16 147,2

17 147,5

18 147,3

19 147,0

20 147,8

21 147,5

22 146,9

23 146,3

24 145,6

25 145,0

26 144,2

27 145,5

Исходные данные

Примем январь 2005 года за единицу. Обозначим за X (независимую переменную) определенный момент времени, а за Y - выдачу кредита в каждый из рассматриваемых моментов. Рассмотрим диаграмму рассеяния зависимой переменной (рисунок 1.).

Рис. 1 - Диаграмма рассеивания выдачи кредита (Y)

Глядя на этот график можно предположить, что, близкими к такому виду зависимости являются линейная, степенная функции и полином второго порядка. Их параметры возможно определить, используя метод наименьших квадратов. Кроме того, исходные данные представляют из себя временной ряд с тенденцией линейного роста, значит, к нему возможно применить адаптивные модели, а именно экспоненциальное сглаживание и модели линейного роста.

Таким образом, конечный выбор моделей для построения следующий: 1) Линейная зависимость вида (МНК);

2) Полином второго порядка (МНК);

3) Степенная функция (МНК);

4) Экспоненциальное сглаживание;

5) Модель Хольта;

Оценка параметров моделей.

Параметры линейной зависимости определяются в пакете MSEXCEL. Получили следующую зависимость Y=201507 153,94*t. Коэффициент детерминации ( ) = 0,5199. Это значит, что предложенное уравнение на 51% объясняет дисперсию результативного признака.

Рис. 2 - Линейный тренд

Рассчитаем абсолютные показатели качества прогноза по рассматриваемой модели. Это будут средняя абсолютная и среднеквадратическая ошибки. а1=153,94;

а2=201507.

Таблица 2 - Расчет средней абсолютной и среднеквадратической ошибок в линейной модели t y t2 t*y МНК ?пр ?пр2

1 202486 1 202486 201741,1 744,9 554950,1

2 205654 4 411308 201895 3759,0 14130139

3 200899 9 602697 202048,9 -1149,9 1322349

4 201785 16 807140 202202,9 -417,9 174620,6

5 202321 25 1011605 202356,8 -35,8 1282,949

6 202698 36 1216188 202510,8 187,2 35058,71

7 201999 49 1413993 202664,7 -665,7 443159,5

8 202856 64 1622848 202818,6 37,4 1395,45

9 201897 81 1817073 202972,6 -1075,6 1156886

10 202655 100 2026550 203126,5 -471,5 222338,9

11 203968 121 2243648 203280,5 687,5 472697,1

12 202789 144 2433468 203434,4 -645,4 416557

13 202899 169 2637687 203588,4 -689,4 475209,3

14 203122 196 2843708 203742,3 -620,3 384767,5

15 203320 225 3049800 203896,2 -576,2 332050,6

16 205166 256 3282656 204050,2 1115,8 1245054

17 203100 289 3452700 204204,1 -1104,1 1219086

18 202963 324 3653334 204358,1 -1395,1 1946204

19 203689 361 3870091 204512 -823,0 677339,4

20 203954 400 4079080 204665,9 -711,9 506870,4

21 206211 441 4330431 204819,9 1391,1 1935186

22 204569 484 4500518 204973,8 -404,8 163889,2

23 204998 529 4714954 205127,8 -129,8 16841,37

24 204568 576 4909632 205281,7 -713,7 509391

25 207123 625 5178075 205435,7 1687,3 2847122

26 205456 676 5341856 205589,6 -133,6 17849,05

27 207897 729 5613219 205743,5 2153,5 4637380 сумма 378 5501042,0 6930 7,7E 07 35845674 средняя 1327617,56 а1= 201587,1 а2= 153,942 прогноз 28 207998 205897,5

= 132761736; =1152,2;

Степенная функция

Рис. 3 - Степенная зависимость Y от X

Получили, что . Коэффициент детерминации невысок и равен 28%. Расчет оценок качества прогноза приведен ниже в Таблице 4.

Таблица 3 - Расчет средней абсолютной и среднеквадратической ошибок в линейной модели t y t2 t*y МНК ?пр ?пр2

1 202486 1 202486 201167 1319,0 1739761

2 205654 4 411308 203297,7 2356,3 5552304,16

3 200899 9 602697 204554,5 -3655,5 13362488,8

4 201785 16 807140 205450,9 -3665,9 13438833,7

5 202321 25 1011605 206148,9 -3827,9 14653042,4

6 202698 36 1216188 206721 -4023,0 16184686,6

7 201999 49 1413993 207206 -5207,0 27112364,9

8 202856 64 1622848 207626,9 -4770,9 22761885,6

9 201897 81 1817073 207999 -6102,0 37234278,2

10 202655 100 2026550 208332,4 -5677,4 32232447,9

11 203968 121 2243648 208634,4 -4666,4 21775248,3

12 202789 144 2433468 208910,5 -6121,5 37472914,1

13 202899 169 2637687 209164,8 -6265,8 39260724,4

14 203122 196 2843708 209400,6 -6278,6 39420598,4

15 203320 225 3049800 209620,3 -6300,3 39693708,8

16 205166 256 3282656 209826 -4660,0 21715876,9

17 203100 289 3452700 210019,5 -6919,5 47879097

18 202963 324 3653334 210202 -7239,0 52403384,1

19 203689 361 3870091 210374,8 -6685,8 44700426,7

20 203954 400 4079080 210538,9 -6584,9 43361199,9

21 206211 441 4330431 210695,1 -4484,1 20107313,8

22 204569 484 4500518 210844,2 -6275,2 39377558,3

23 204998 529 4714954 210986,7 -5988,7 35864079,5

24 204568 576 4909632 211123,2 -6555,2 42970585,5

25 207123 625 5178075 211254,2 -4131,2 17067116,6

26 205456 676 5341856 211380,2 -5924,2 35096317,2

27 207897 729 5613219 211501,5 -3604,5 12992479,1 сумма 378 5501042,0 6930 77266745 775430722 средняя 28719656 прогноз 28 207998 211618,5 а1= 201167;

= 28719656; =5359,07;

Произошло снижение средней абсолютной ошибки с 132761736 до 28719656 единиц и среднеквадратической ошибки с 1152,2 до 5359,07.

Полином второго порядка

Воспользовавшись средствами MSEXCEL, получили уравнение Y=10,954x2 152,76x 203070.

Рис. 4 - Зависимость Y от X в виде полинома второго прядка

Коэффициент детерминации достаточно высокий 64,7%. Рассчитаем оценки качества прогноза (Таблица 5.).

Таблица 4 - Расчет средней абсолютной и среднеквадратической ошибок в модели полинома t y t2 t*y МНК ?пр ?пр2

1 202486 1 202486 202928,2 -442,2 195535,5336

2 205654 4 411308 202808,3 2845,7 8098031,256

3 200899 9 602697 202710,3 -1811,3 3280829,426

4 201785 16 807140 202634,2 -849,2 721181,4022

5 202321 25 1011605 202580,1 -259,0 67106,9025

6 202698 36 1216188 202547,8 150,2 22564,84666

7 201999 49 1413993 202537,4 -538,4 289902,5575

8 202856 64 1622848 202549 307,0 94263,73658

9 201897 81 1817073 202582,4 -685,4 469819,7684

10 202655 100 2026550 202637,8 17,2 295,84

11 203968 121 2243648 202715,1 1252,9 1569823,561

12 202789 144 2433468 202814,3 -25,3 637,865536

13 202899 169 2637687 202935,3 -36,3 1321,031716

14 203122 196 2843708 203078,3 43,7 1905,846336

15 203320 225 3049800 203243,3 76,8 5890,5625

16 205166 256 3282656 203430,1 1735,9 3013473,796

17 203100 289 3452700 203638,8 -538,8 290290,3538

18 202963 324 3653334 203869,4 -906,4 821589,9651

19 203689 361 3870091 204122 -433,0 187449,1661

20 203954 400 4079080 204396,4 -442,4 195717,76

21 206211 441 4330431 204692,8 1518,2 2305070,917

22 204569 484 4500518 205011 -442,0 195378,1443

23 204998 529 4714954 205351,2 -353,2 124740,3506

24 204568 576 4909632 205713,3 -1145,3 1311629,63

25 207123 625 5178075 206097,3 1025,8 1052163,063

26 205456 676 5341856 206503,1 -1047,1 1096510,557

27 207897 729 5613219 206930,9 966,1 933260,3309 сумма 378 5501042,0 6930 77266745 26346384,17 средняя 975792,0062 а1= 203070 а2= -152,76 а3= 10,954 прогноз 28 207998 207380,7

= 975792,006; =987,8;

Средняя абсолютная ошибка равна 975792,006, а среднеквадратическая = 987,8.

Экспоненциальное сглаживание

Применим к рассматриваемому временному ряду экспоненциальное сглаживание, используя формулу: .

Для этого сначала определим начальное значение S0 как первый член прогнозного ряда, полученного методом наименьших квадратов для полиномиальной модели третьего порядка. Т.е. S0=203742,3 штук. Шаг прогноза в нашем случае равен 1. Следующее значение прогноза равно . Повторяем проделанные шаги несколько раз и формируем таким образом прогнозный ряд на основе экспоненциального сглаживания для адаптивной полиномиальной модели 0-го порядка. Большое влияние на точность прогноза влияет параметр адаптации.

Таблица 5 t y у сгл а=0,1 прогноз ?пр |?пр|

1 202486,0 81371,3 140,074 81231,22 81231,22

2 205654,0 20565,4 141,006 20424,42 20424,42

3 200899,0 20090 141,876 19948,11 19948,11

4 201785,0 20178,5 142,685 20035,81 20035,81

5 202321,0 20232,1 143,433 20088,67 20088,67

6 202698,0 20269,8 144,118 20125,68 20125,68

7 201999,0 20199,9 144,742 20055,16 20055,16

8 202856,0 20285,6 145,305 20140,30 20140,30

9 201897,0 20189,7 145,806 20043,89 20043,89

10 202655,0 20265,5 146,245 20119,26 20119,26

11 203968,0 20396,8 146,623 20250,18 20250,18

12 202789,0 20278,9 146,939 20131,96 20131,96

13 202899,0 20289,9 147,193 20142,71 20142,71

14 203122,0 20312,2 147,386 20164,81 20164,81

15 203320,0 20332 147,518 20184,48 20184,48

16 205166,0 20516,6 147,587 20369,01 20369,01

17 203100,0 20310 147,595 20162,40 20162,40

18 202963,0 20296,3 147,542 20148,76 20148,76

19 203689,0 20368,9 147,427 20221,47 20221,47

20 203954,0 20395,4 147,25 20248,15 20248,15

21 206211,0 20621,1 147,012 20474,09 20474,09

22 204569,0 20456,9 146,712 20310,19 20310,19

23 204998,0 20499,8 146,35 20353,45 20353,45

24 204568,0 20456,8 145,927 20310,87 20310,87

25 207123,0 20712,3 145,443 20566,86 20566,86

26 205456,0 20545,6 144,896 20400,70 20400,70

27 207897,0 20789,7 144,288 20645,41 20645,41 сумма 607298,03

= 31724,58; =33319,08;

Таблица 6 t y у сгл а=0,5 прогноз ?пр |?пр|

1 202486,0 162366 140,074 162225,62 162225,62

2 205654,0 102827 141,006 102686,14 102686,14

3 200899,0 100450 141,876 100307,71 100307,71

4 201785,0 100893 142,685 100749,81 100749,81

5 202321,0 101161 143,433 101017,07 101017,07

6 202698,0 101349 144,118 101204,88 101204,88

7 201999,0 101000 144,742 100854,76 100854,76

8 202856,0 101428 145,305 101282,70 101282,70

9 201897,0 100949 145,806 100802,69 100802,69

10 202655,0 101328 146,245 101181,26 101181,26

11 203968,0 101984 146,623 101837,38 101837,38

12 202789,0 101395 146,939 101247,56 101247,56

13 202899,0 101450 147,193 101302,31 101302,31

14 203122,0 101561 147,386 101413,61 101413,61

15 203320,0 101660 147,518 101512,48 101512,48

16 205166,0 102583 147,587 102435,41 102435,41

17 203100,0 101550 147,595 101402,40 101402,40

18 202963,0 101482 147,542 101333,96 101333,96

19 203689,0 101845 147,427 101697,07 101697,07

20 203954,0 101977 147,25 101829,75 101829,75

21 206211,0 103106 147,012 102958,49 102958,49

22 204569,0 102285 146,712 102137,79 102137,79

23 204998,0 102499 146,35 102352,65 102352,65

24 204568,0 102284 145,927 102138,07 102138,07

25 207123,0 103562 145,443 103416,06 103416,06

26 205456,0 102728 144,896 102583,10 102583,10

27 207897,0 103949 144,288 103804,21 103804,21 сумма 2807714,95

= 146268,9; =146309,7;

Таблица 7 t y у сгл а=0,7 прогноз ?пр |?пр|

1 202486,0 202863 140,074 202722,82 202722,82

2 205654,0 204817 141,006 204675,66 204675,66

3 200899,0 202074 141,876 201932,42 201932,42

4 201785,0 201872 142,685 201729,10 201729,10

5 202321,0 202186 143,433 202042,80 202042,80

6 202698,0 202544 144,118 202400,35 202400,35

7 201999,0 202163 144,742 202017,90 202017,90

8 202856,0 202648 145,305 202502,69 202502,69

9 201897,0 202122 145,806 201976,49 201976,49

10 202655,0 202495 146,245 202348,94 202348,94

11 203968,0 203526 146,623 203379,53 203379,53

12 202789,0 203010 146,939 202863,21 202863,21

13 202899,0 202932 147,193 202785,15 202785,15

14 203122,0 203065 147,386 202917,72 202917,72

15 203320,0 203244 147,518 203096,01 203096,01

16 205166,0 204589 147,587 204441,67 204441,67

17 203100,0 203547 147,595 203399,18 203399,18

18 202963,0 203138 147,542 202990,59 202990,59

19 203689,0 203524 147,427 203376,31 203376,31

20 203954,0 203825 147,25 203677,67 203677,67

21 206211,0 205495 147,012 205348,16 205348,16

22 204569,0 204847 146,712 204700,14 204700,14

23 204998,0 204953 146,35 204806,31 204806,31

24 204568,0 204683 145,927 204537,47 204537,47

25 207123,0 206391 145,443 206245,68 206245,68

26 205456,0 205737 144,896 205591,64 205591,64

27 207897,0 207249 144,288 207104,57 207104,57 сумма 5495610,21

= 203541,1; =2003545,9;

Очевидно, что с ростом параметра адаптации увеличиваются ошибки прогноза.

Двухпараметрическая модель Хольта

Простейшая модификация двухпараметрической модели Хольта выглядит следующим образом:

где: - временной ряд;

- прогнозное значение временного ряда в точке t на шагов вперед;

- шаг прогноза;

- коэффициенты;

- параметры адаптации, и ;

- ошибка прогноза.

В нашем случае воспользуемся моделями Хольта с шагом прогноза =1, начальные значения и определим с помощью линейной модели, полученной методом наименьших квадратов.

Модель Хольта с шагом прогноза = 1. а1= 201587,0 а2= 153,94 альфа1= 0,5 альфа2= 0,5

На их основе можно определить прогнозные значения независимой переменной по формуле . Рассмотрим случай, когда параметры адаптации равны 0,5. Были получены следующие значения коэффициентов (Таблица 8.): Таблица 8 мод хольт а1 а2 t y 201587,0 153,9 ?пр |?пр|

1 202486,0 201740,9 202113,47 340,2065 745,06 745,06

2 205654,0 202453,7 204053,84 1140,287 3200,32 3200,32

3 200899,0 205194,1 203046,56 66,50566 -4295,13 4295,13

4 201785,0 203113,1 202449,03 -265,511 -1328,07 1328,07

5 202321,0 202183,5 202252,26 -231,142 137,48 137,48

6 202698,0 202021,1 202359,56 -61,922 676,88 676,88

7 201999,0 202297,6 202148,32 -136,581 -298,64 298,64

8 202856,0 202011,7 202433,87 74,48425 844,26 844,26

9 201897,0 202508,4 202202,68 -78,354 -611,35 611,35

10 202655,0 202124,3 202389,66 54,31539 530,68 530,68

11 203968,0 202444,0 203205,99 435,3212 1524,02 1524,02

12 202789,0 203641,3 203215,15 222,2438 -852,31 852,31

13 202899,0 203437,4 203168,2 87,64419 -538,40 538,40

14 203122,0 203255,8 203188,92 54,18331 -133,84 133,84

15 203320,0 203243,1 203281,55 73,40705 76,89 76,89

16 205166,0 203355,0 204260,48 526,1672 1811,04 1811,04

17 203100,0 204786,6 203943,32 104,5054 -1686,65 1686,65

18 202963,0 204047,8 203505,41 -166,702 -1084,83 1084,83

19 203689,0 203338,7 203513,86 -79,13 350,29 350,29

20 203954,0 203434,7 203694,36 50,68845 519,27 519,27

21 206211,0 203745,1 204978,03 667,1755 2465,95 2465,95

22 204569,0 205645,2 205107,1 398,1252 -1076,20 1076,20

23 204998,0 205505,2 205251,61 271,3187 -507,23 507,23

24 204568,0 205522,9 205045,47 32,58581 -954,93 954,93

25 207123,0 205078,1 206100,53 543,8229 2044,95 2044,95

26 205456,0 206644,3 206050,17 246,7357 -1188,35 1188,35

27 207897,0 206296,9 207096,96 646,7582 1600,09 1600,09 прогноз28 207743,7 сраб ош 1151,23

сигма 1497,685

Просчитаем оценки качества модели Хольта для различных комбинаций значений коэффициентов адаптации.

Таблица 9 а1= 201587,0 а2= 153,94 альфа1= 0,3 альфа2= 0,7

мод хольт а1 а2 t y 201587,0 153,9 ?пр |?пр|

1 202486,0 201740,9 201964,46 220,9972 745,06 745,06

2 205654,0 202185,5 203226,02 533,1661 3468,54 3468,54

3 200899,0 203759,2 202901,13 275,7494 -2860,19 2860,19

4 20178

Вывод
В данной курсовой работе рассматривались данные с января 2005 года по май 2007 года и осуществлялся прогноз на июнь 2007 года. Были построены четыре модели прогнозирования объема кредитов: - с использованием Метода наименьших квадратов (расчеты производились в таких программных продуктах, как Statistica и Excel), - линейная модель (Excel)

- полином 2-го порядка (Excel)

- экспонециальное сглаживание (Excel)

- модель Хольта (Excel)

Выбранные модели дают довольно различные результаты, и лучшие результаты были получены при использовании Метода наименьших квадратов. Результаты вычислений представлены в таблицах. Рассчитана абсолютная ошибка прогноза и средняя относительная ошибка прогноза, статистика Дарбина-Уотсона. Именно эти показатели рассматривались в качестве критерия для выбора модели, дающей наилучшее прогнозное значение интересующей нас переменной, т.е. объема кредита. Итак, прогнозное значение объема кредитов на июнь 2007 года составляет 207998 млн. рублей.

Список литературы
1. Бабкова Е.В. Статистическое моделирование и прогнозирование показателей развития социально-экономических систем. Учеб. пособие / Уфимск. гос. авиац. техн. ун-т. Уфа, 2005.- 128 с.

2. Боровиков В. 8ТАТ18Т1СА: искусство анализа данных на компьютере: для профессионалов.- СПБ.: Питер, 2001.- 656 с.

3. Бююль А., Цефель П. ЗР55: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей.- СПБ.: ООО "ДИАСОФТЮП", 2001.- 608 с.

4. Пвахненко А.Г. Непрерывность и дискретность. Переборные методы прогнозирования и кластеризации.- Киев: Наук.Думка, 1990.-123 с.

5. Конюховский П.В. Математические методы исследования операций в экономике. - СПБ.: Питер, 2000.- 208 с.

6. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования. - М.: Статистика, 1975.-254 с.

7. Мухачева А.С. Развитие генетических алгоритмов для решения задач прямоугольной упаковки // Принятие решений в условиях неопределенности: Межвуз. науч. сб.-Уфа: УГАТУ, 2001.- С.87-94.

8. Народное хозяйство Российской Федерации. Статистический сборник. - М.: Финансы и статистика, 2000.- 500 с.

9. Нейлор Т. Машинные имитационные эксперименты с моделями экономических систем,- М.: Мир, 1975.- 496 с.

10. Николаева М.А., Муфтахова Е.Е., Биглова А.Ф. Принятие решений в сигнальной системе стоимостных и объемных индикаторов // Принятие решений в условиях неопределенности: Межвуз. науч. сб.-Уфа: УГАТУ, 2001,-С. 149-157.

Размещено на
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?