Экономико-математическая модель зависимости цены М2 жилья на первичном рынке от полной себестоимости М2 строительства домов массового спроса в Приволжском федеральном округе - Курсовая работа
Расчет параметров уравнений линейной и нелинейной парной регрессии, порядок проведения дисперсионного анализа. Оценка тесноты связи между ценами первичного рынка и себестоимостью с помощью показателей корреляции и детерминации, ошибки аппроксимации.
Аннотация к работе
В работе на основе полученных функций регрессии выполнен выбор математической модели, позволяющей прогнозировать цену жилья на первичном рынке. Самые высокие показатели цены в среднем за метр на первичном рынке - в Нижегородской области, где кв. метр стоит 52 300 рублей, в Удмуртской Республике (38 900 рублей) и в Республике Башкортостан (35 900 рублей). В качестве позитивных тенденций, которые в обозримом будущем должны повлиять на цену кв. метра, на обеспеченность людей жильем, можно назвать проекты комплексной застройки, которые сегодня взяли старт и уже реализуются в Пензенской, Кировской, Нижегородской, Саратовской, Самарской, Ульяновской областях, в Республике Татарстан и Чувашской Республике, а также проекты возведения новых, мощных современных производств в строительной индустрии. 5 представлены опытные значения стоимости квадратного метра жилья на первичном рынке и его себестоимости, а также теоретические значения стоимости квадратного метра жилья на первичном рынке в Приволжском федеральном округе. 7 представлены опытные значения стоимости квадратного метра жилья на первичном рынке и его себестоимости, а также теоретические значения стоимости квадратного метра жилья на первичном рынке в Приволжском федеральном округе.В настоящей курсовой работе решена задача разработки математической модели цен жилья на первичном рынке в зависимости от себестоимости строительства. Исходными данными для ее расчета явились реальные значения цен жилья на первичном рынке и себестоимости в 12 областях (республиках), расположенных на территории Приволжского федерального округа РФ. Выполнена оценка тесноты связи цены жилья и себестоимости строительства с помощью показателей корреляции и детерминации. Сравнение показателей степени связи между ценами жилья и себестоимостями показывают, что для практических целей целесообразно использовать линейную модель, поскольку она обладает высоким коэффициентом детерминации и простотой.
Введение
Анализ рынка жилья в Приволжском федеральном округе
В настоящее время для решения большого числа практических задач разработаны и широко применяются экономико-математические модели, в основу которых положены уравнения регрессии.
В настоящей курсовой работе стоит задача обосновать математическую модель цены жилья на первичном рынке в зависимости от полной себестоимости строительства домов массового спроса в Приволжском федеральном округе. Исходными данными для ее расчета являются реальные значения цен на первичном рынке в общих ценах и себестоимости строительства (всего 12 областей и республик). Для обоснования модели в курсовой работе рассматриваются линейные и нелинейные парные функции регрессии. В работе на основе полученных функций регрессии выполнен выбор математической модели, позволяющей прогнозировать цену жилья на первичном рынке.
В 2008 г. в Приволжском федеральном округе введено в эксплуатацию жилья общей площадью 13,55 млн. кв. метров, что составило 110,2% к предыдущему году (в 2007 г. было введено 12,29 млн. кв. метров, 122,7% к 2006 г.). На рис. 1 - рис. 4 приведены основные сведения по строительству жилья в Приволжском федеральном округе.
Рис. 1
Рис. 2
Рис. 3
Рис. 4
На первичном рынке в ПФО в среднем цена на метр держится на уровне 33 500 рублей. Самые высокие показатели цены в среднем за метр на первичном рынке - в Нижегородской области, где кв. метр стоит 52 300 рублей, в Удмуртской Республике (38 900 рублей) и в Республике Башкортостан (35 900 рублей). Самые низкие показатели на сегодняшний день в пяти регионах: Республике Мордовия, Оренбургской, Пензенской и Саратовской областях. Здесь цены в среднем за квадратный метр балансируют на уровне между 20 тыс. и 24 тыс. рублей за квадратный метр. На вторичном рынке самая высокая цена в Удмуртской Республике - 47 000 рублей, в республике Башкортостан (46 100 рублей), в Пермском крае и Нижегородской области (по 39 000 тыс. рублей).
В качестве информации для анализа причин образования таких трендов в регионах можно привести цифры прошедшего года. В Приволжье в прошлом году эти показатели были следующими: в числе лидеров - Республика Башкортостан (0,42 кв. м на душу населения), Республика Татарстан (0,47), Чувашская Республика (0,6). В числе отстающих - Кировская область (0,2), Самарская область (также 0,2), Нижегородская область (0,24). За первое полугодие текущего года было введено в общей сложности 3,9 млн. кв. метров. Это, по сравнению с предыдущим годом, больше на 48%. Наибольшие объемы ввода жилья были продемонстрированы в Республике Татарстан (почти 1 млн.), в Республике Башкортостан (700 тыс.), Нижегородской области (400 тыс.). Наименьший объем ввода жилья был зафиксирован в Республике Мордовия, в Республике Марий Эл и в Кировской области - менее 10 тыс. кв. метров. Нужно отметить, что из 3,9 млн. построенных кв. метров 2,3 млн. построено индивидуальными застройщиками. Этот показатель на 44% больше, чем за аналогичный период прошлого года.
В среднем стоимость 1 кв. метра жилья по итогом второго квартала на первичном рынке увеличилась на 3%, на вторичном снизилась на 3%. В среднем на первичном рынке она составляет 32 тыс. рублей, на вторичном - 32 300 рублей. Основными показателями и факторами, которые влияют на рост стоимости жилья, оказались, помимо названных, увеличение стоимости строительных материалов и монтажных работ на 10%, а также спрос на жилье, рост доходов населения и увеличение объема выданных ипотечных кредитов на 40%. На сегодняшний день плановый показатель по предоставлению ипотечного кредита в среднем по регионам Приволжья выполнен на 60%, т.е. идет с опережением графика.
В качестве позитивных тенденций, которые в обозримом будущем должны повлиять на цену кв. метра, на обеспеченность людей жильем, можно назвать проекты комплексной застройки, которые сегодня взяли старт и уже реализуются в Пензенской, Кировской, Нижегородской, Саратовской, Самарской, Ульяновской областях, в Республике Татарстан и Чувашской Республике, а также проекты возведения новых, мощных современных производств в строительной индустрии. В частности, такие строительства начаты в Республике Мордовия, Чувашской Республике, Кировской, Оренбургской, Саратовской, Ульяновской областях, Удмуртской Республике и Республике Башкортостан. Главная составляющая - это обеспечение строительной деятельности нормативным материалом, и здесь можно сказать о том, что в целом ряде субъектов Приволжья проводится серьезная работа по разработке региональных планов градостроительного развития, схем территориального планирования муниципальных районов, городских округов. Тем не менее, приходится озвучивать такую цифру: субъектам России, входящим в Приволжский округ, необходимо утвердить 7 776 планов поселений, однако на 1 июля текущего года принято всего 1364, что составляет 18% от общего количества. Наиболее благополучная ситуация в Республике Башкортостан, Республике Татарстан, Чувашской Республике, Кировской и Нижегородской областях. Поэтому работа предстоит весьма большая.
1. Расчет параметров уравнений линейной и нелинейной парной регрессии
Парная линейная регрессия имеет вид: yx = a b · x, где yx - результативный признак, характеризующий теоретические цены жилья на первичном рынке; x - фактор (себестоимость строительства);
a, b - параметры, подлежащие определению.
Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессии используется метод наименьших квадратов. Он позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака (цены жилья на первичном рынке) y от теоретических yx будет минимальной. В этом случае для определения параметров a и b линейной регрессии необходимо решить следующую систему уравнений:
На основании исходных данных выполнены расчеты, которые при = 12 представлены в табл. 2.1
Среднее значение 31,318 43,978 988,390 2005,725 1397,3291 - - -
С учетом обозначений при n = 12
= (y1 y2 … y12)/12; = (x1 x2 … x12)/12;
= (y1x1 y2x2 … y12 x12)/12;
= (x12 x22 … x12)/12; Sx2 = 2.
Значения параметров линейной регрессии вычисляются по формулам: b = ( )/( 2) = (1397,291 - 43,978 ? 31,318) / (988,390 - 31,318 ? 31,318) = 2,643;
a = - b = 43,978 - 2,643 ? 31,318 = - 38,795.
Тогда уравнение регрессии, являющееся линейной моделью цен жилья на первичном рынке в зависимости от себестоимости строительства, примет вид: yx = 2,643 · x - 38,795.
На Рис. 5 представлены опытные значения стоимости квадратного метра жилья на первичном рынке и его себестоимости, а также теоретические значения стоимости квадратного метра жилья на первичном рынке в Приволжском федеральном округе. На Рис. 6 выполнено построение линейной функции регрессии.
Рис. 5
Рис. 6
1.2 Расчет параметров степенной парной регрессии
Степенная парная регрессия относится к нелинейным регрессиям по оцениваемым параметрам. Однако она считается внутренне линейной, так как логарифмирование ее приводит к линейному виду. Таким образом, построению степенной модели предшествует процедура линеаризации переменных. Линеаризация позволяет использовать для определения параметров функции регрессии метод наименьших квадратов. При этом оценки параметров будут вычислены по алгоритму, изложенному в 2.1.1. для этой цели проведем логарифмирование обеих частей уравнения: lg y = lg a b lg x.
Обозначим через Y = lg y; X = lg x; A = lg a. Тогда уравнение примет вид: Y = A b X.
Как отмечалось, для расчета параметров А и b используются соотношения метода наименьших квадратов, поскольку в новых переменных Y и X соотношение стало линейным, а следовательно, оценки параметров будут состоятельными, несмещенными и эффективными.
Весь предварительный расчет параметров степенной функции регрессии аналогично линейной сведен в табл. 2.2.
Среднее значение 3,440 3,767 11,843 14,220 12,972 - - -
Тогда b = ( - )/Sx2 = (12,972 - 3,44·3,767)/(11,843 - 3,44·3,44) = 1,729;
A = - b · = 3,766 - 1,729 ·3,440 = -2,184.
Таким образом, степенное уравнение регрессии с учетом логарифмических переменных будет иметь вид: Y = -2,184 1,729·X.
Выполнив его потенцирование, получим: y x = 0,113 x 1,729
Подставляя в последнее уравнение фактические значения x, получаем теоретическое значение yx. Эти значения приведены в табл. 2.2.
На Рис. 7 представлены опытные значения стоимости квадратного метра жилья на первичном рынке и его себестоимости, а также теоретические значения стоимости квадратного метра жилья на первичном рынке в Приволжском федеральном округе. На Рис. 8 выполнено построение степенной функции регрессии.
Поскольку показательная функция относится к классу нелинейных по оцениваемым параметрам, то построению функции парной показательной регрессии yx = a·bx предшествует, как и в случае степенной функции регрессии, процедура линеаризации переменных с помощью логарифмирования обеих частей функции регрессии. После логарифмирования получим следующее выражение: lg yx =lg a x lg b.
Введя обозначения переменных и констант
Y = lg yx, A = lg a, B = lg b, получим линейное уравнение регрессии в новых переменных: Y = A B x.
Для определения параметров все вычисления сведены в табл. 2.3.
Среднее значение 31,318 3,767 118,400 988,390 14,220 - - -
C учетом табличных данных значения параметров линейной регрессии составят: B = / Sx2 = (118,400 - 3,767?31,318)/(988,390 - 980,817) = 0,056;
A = - B = 3,767 - 0,056?31,318 = 2,013.
Таким образом, получено уравнение
Y = 2,013 0,056x, или после потенцирования yx = 7,486 (1,058) x.
На Рис. 9 представлены опытные значения стоимости квадратного метра жилья на первичном рынке и его себестоимости, а также теоретические значения стоимости квадратного метра жилья на первичном рынке в Приволжском федеральном округе. На Рис. 10 выполнено построение показательной функции регрессии.
Рис. 9
Рис. 10
На Рис. 11 и Рис. 12 представлены все построенные функции регрессии
Рис. 11
Рис. 12
2. Дисперсионный анализ линейной функции регрессии
Центральное место в дисперсионном анализе занимает разложение общей суммы квадратов отклонения результирующего показателя y от его среднего значения на две части, а именно на объясненную (факторную) и остаточную: , (*) где - общая сумма квадратов отклонений;
- объясненная (факторная) сумма квадратов;
- остаточная сумма квадратов.
Результаты расчетов сведены в табл. 2.4.
Таблица 2.4
Номер п/п yi | yi - |(yi - )2yxi| yxi - |(yxi - )2| yi - yxi |(yi - yxi)2
Среднее значение 43,978 6,565 71,682 43,978 - 52,668 - 18,861
На основании выполненных расчетов имеем: 860,189 = 632,013 226,333. Погрешность равенства 0,2% следует отнести к вычислительной, а следовательно, равенство (*) выполняется.
Если коэффициент b изменить в 1,1 раза, то измененное уравнение линейной регрессии будет иметь вид: yx = -46,938 2,903·x и приведенное выше соотношение (*) выполняться не будет, что следует из расчетов (табл. 2.5).
Таблица 2.5
Номер п/п yi | yi - |(yi - )2yxi| yxi - |(yxi - )2| yi - yxi |(yi - yxi)2
На Рис. 13 результаты дисперсионного анализа для линейной функции регрессии представлены графически.
Рис. 13
3. Оценка тесноты связи цен на жилье на первичном рынке и себестоимости строительства с помощью показателей корреляции и детерминации
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существуют различные формы записи линейного коэффициента корреляции. Наиболее часто встречаются следующие: rxy = b (Sx / Sy) = Mxy /(Sx / Sy) = ( - )/ SXSY.
Как известно, линейный коэффициент корреляции находится в пределах -1 ? rxy ? 1. Если коэффициент регрессии b > 0, то 0 ? rxy ? 1, и наоборот, при b < 0 -1 ? rxy ? 0.
Используя первое выражение для rxy, рассчитаем линейный коэффициент парной корреляции: rxy = b (Sx/Sy) = 2,639 (2,752/8,465) = 0,858.
Значение коэффициента корреляции показывает, что связь прямая, то есть с увеличением себестоимости строительства цены жилья на первичном рынке в общих ценах увеличиваются.
Для оценки качества подбора линейной функции необходимо определить квадрат линейного коэффициента rxy2, который называется коэффициентом детерминации линейной функции регрессии. Он характеризует долю дисперсии (разброса) цен на жилье на первичном рынке yx, объясняемую зависимостью от себестоимости строительства x, в общей дисперсии, возникающей за счет влияния множества факторов, не учтенных функцией регрессии.
Соответственно величина 1 - rxy2 характеризует долю дисперсии цен на жилье на первичном рынке y, вызванную влиянием остальных не учтенных в математической модели факторов.
Из графиков и приведенных в таблицах расчетных данных следует, что фактическое значение цен на жилье на первичном рынке y отличается от теоретического значения yx, рассчитанных по одному из уравнений регрессии. Очевидно, чем меньше это отличие, тем ближе опытные данные к теоретическим значениям и тем лучше качество модели.
Величина, представляющая собой разность опытного и теоретического результативного признака (y - yx) для каждого опыта представляет собой ошибку аппроксимации функции, связывающей цены на жилье на первичном рынке и себестоимость строительства. В данном случае число таких опытов равно двенадцати. Для оценки каждого опыта используются не сами разности, а абсолютные значения разностей опытного и теоретического результативных признаков, отнесенные к опытному признаку и выраженные в процентах, то есть: Аі = | (yi - yxi) / yi |100%.
Оценка качества всей функции регрессии может быть осуществлена как средняя ошибка аппроксимации - средняя арифметическая Аі: А = (А1 А2 … А12) / 12.
Найдем величину средней ошибки аппроксимации линейной функции связи между ценами на жилье на первичном рынке и себестоимостью строительства: А = 100,529· 100% / 12 = 8,377%.
Аналогично получим среднюю ошибку аппроксимации для степенной: А = 100,209/12 = 8,351% и для показательной функции: А = 88,077/12 = 7,340%.
Их анализ показывает, что ошибка аппроксимации находится в допустимых для практического использования пределах, однако с теоретической точки зрения может быть продолжен поиск более качественной функции регрессии. Ниже приводятся графики ошибки аппроксимации линейной, степенной и показательной регрессий.
Рис. 14
Рис. 15
Рис. 16
5. Сравнительная оценка силы связи себестоимости строительства с ценой на жилье на первичном рынке с помощью среднего коэффициента эластичности
Средний коэффициент эластичности Э показывает, на сколько процентов в среднем изменится цена на жилье на первичном рынке жилья yx от своей величины при изменении себестоимости строительства x на 1% от своего значения. Для произвольной величины x он может быть вычислен по следующей формуле: Э = yx" (x)· / yx.
С учетом приведенной формулы коэффициент эластичности Э для линейной функции регрессии yx = -38,670 2,639 ? x примет следующий вид: Э = yx" (x) · / yx= b · / (a b ).
В таблице 2.7 вычислены коэффициент эластичности для линейной функции регрессии.
Таблица 2.7
№ п/п x y y A y’ Эу(x)
1 30,3 42,97 41,292 3,905 2,639 1,937
2 32,425 43,408 46,900 8,045 2,639 1,971
3 31,182 35,742 43,619 22,039 2,639 2,302
4 32,646 43,806 47,483 8,394 2,639 1,975
5 34,409 51,474 52,135 0,013 2,639 1,742
6 29,098 39,044 38,120 2,367 2,639 2,014
7 29,289 39,3 38,624 1,720 2,639 2,001
8 34,857 58,653 53,318 9,096 2,639 1,726
9 35,108 61,194 53,980 11,789 2,639 1,716
10 29,305 35,39 38,666 9,257 2,639 2,000
11 25,254 33,887 27,975 17,446 2,639 2,382
12 31,945 42,865 45,633 6,458 2,639 1,847
Среднее значение 31,318 43,978 43,979 8,377 2,639 1,968
Аналогичные расчеты коэффициентов эластичности выполнены для степенной и для показательной функций. На Рис. 17 приведены их значения. Анализ разработанных математических моделей показывает, что изменение на 1% себестоимости строительства жилья, например, себестоимость строительства в Самаре, приводит к увеличению на 1,879 … 1,766% стоимости жилья на первичном рынке.
Рис. 17
При этом по линейной модели это увеличение составляет 1,879%, по степенной функции регрессии - 1,778%, по показательной функции регрессии - 1,766%.
6. Оценка статистической надежности результатов линейного регрессионного моделирования
Оценку статистической надежности уравнения регрессии в целом будем производить с помощью F-критерия Фишера. При этом примем нулевую гипотезу H0, что коэффициент регрессии b равен нулю. В таком случае фактор x не оказывает влияния на результат y, то есть себестоимость строительства не оказывает влияния на цены на жилья на первичном рынке. Альтернативная гипотеза H1 будет состоять в статистической надежности линейного регрессионного моделирования. Для установления истинной значимости линейной модели необходимо выполнить сравнение факторного Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Факторный F-критерий Фишера вычисляется по формуле: Fфакт = Sфакт2 / Soct2, где Sфакт2 - факторная выборочная дисперсия, вычисленная на одну степень свободы по соотношению: Sфакт2 = ((yx1 - )2 (yx2 - )2 … (yx12 - )2) / 1;
Soct2 - остаточная выборочная дисперсия, вычисленная на одну степень свободы по соотношению: Soct2 = ((y1 - yx1)2 (y2 - yx2)2 … (y17 - yx12)2)/ n - 2.
Если нулевая гипотеза справедлива, то факторная и остаточная выборочные дисперсии не отличаются друг от друга. Для опровержения нулевой гипотезы H0 необходимо, чтобы факторная дисперсия превышала остаточную дисперсию в несколько раз. Табличное Fтабл значение F-критерия Фишера - это максимальная величина критерия (отношения дисперсий) под влиянием случайных факторов при данных степенях свободы и уровне значимости б, который примем равным 0,05.
Если Fтабл Fфакт, то нулевая гипотеза не отклоняется и признается статическая незначимость и ненадежность уравнения регрессии.
По таблице значений F-критерия Фишера при уровне значимости б = 0,05 и степенях свободы к1 = 1, к2 = 10 получаем Fтабл = 4,97. Выполнив расчет, получим Fфакт = 632,013/22,633 = 27,924.
Полученные значения F-критерия Фишера указывают, что Fтабл < Fфакт, поэтому необходимо отвергнуть нулевую гипотезу о случайной природе коэффициента регрессии, а следовательно, и оцениваемой модели и принять альтернативную гипотезу.
7. Расчет прогнозного значения цены на жилье на первичном рынке по линейной модели при увеличении себестоимости строительства
Полученное уравнение линейной регрессии позволяет использовать его для прогноза. Согласно заданию на курсовую работу, следует рассчитать прогнозное значение цен жилья на первичном рынке, если прогнозное значение себестоимости строительства увеличится на 10% от среднего значения всей себестоимости. При этом установить доверительный интервал прогноза для уровня значимости, равного 0,05.
Если прогнозное значение себестоимости строительства составит xp = 1,1 · = 1,1 · 31,318 = 34,450, то прогнозное точечное значение цен на жилье на первичном рынке можно вычислить по соотношению: yxp = -38,670 2,639 · xp = -38,670 2,639 · 34,450= 52,244.
Для определения доверительного интервала прогноза цен необходимо вычислить ошибку прогноза по формуле: myp = Soct·(1 1 / 12 (xp - )2/((x1 - )2 (x2 - )2 … (x7 -
Предельная ошибка прогноза, которая с вероятностью 0,95 не будет превышена, составит:
?yp = ттабл · myp = 2,228· 5,190 = 11,563.
Здесь ттабл - табличное значение t-статистки Стьюдента для числа степеней свободы n - 2 = 10 и уровне значимости 0,05.
Тогда предельные значения доверительного интервала прогноза цены на жилье на первичном рынке при прогнозируемом увеличении себестоимости строительства на 10% можно вычислить по формулам: yxp min = yxp - ?yp = 52,244 - 11,563 = 40,681;
yxp max = yxp ?yp = 52,244 11,563 = 63,807.
Выполненный прогнозный расчет по линейной регрессионной модели показал, что при достаточной надежности (вероятность 0,95) прогнозируемое значение yxp = 52,244 будет накрыто диапазоном (40,681 - 63,807).
8. Реализация решенных задач на компьютере
Определение линейной функции регрессии выполним с помощью ППП Excel.
8.1 Реализация процедуры «ЛИНЕЙН»
Статистическая функция ЛИНЕЙН позволяет вычислить параметры линейной регрессии: yx = a b · x.
Вся регрессионная статистика будет выводиться по схеме: Значение коэффициента b значение коэффициента а Среднеквадратическое отклонение b среднеквадратическое отклонение а коэффициент детерминации среднеквадратическое отклонение y
F-статистика число степеней свободы регрессионная сумма квадратов остаточная сумма квадратов
Алгоритм вычисления регрессионной статистики включает следующие этапы: 1) подготовку исходных данных;
2) выделение области пустых ячеек 5 ? 2 для вывода результатов регрессионной статистики;
3) активизацию Мастера функций одним из способов: а) в главном меню выбрать ВСТАВКА/ФУНКЦИЯ;
в) на панели СТАНДАРТНАЯ щелкнуть по кнопке ВСТАВКА ФУНКЦИИ;
4) в окне КАТЕГОРИЯ выбрать СТАТИСТИЧЕСКИЕ, в окне ФУНКЦИЯ - ЛИНЕЙН; затем щелкнуть по кнопке ОК;
5) заполнить аргументы функции;
6) в левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Для раскрытия всей таблицы необходимо нажать на клавишу F2, затем нажать комбинацию клавишей CTRL SHIFT ENTER.
Ниже приводятся результаты регрессионной линейной математической модели цен жилья на первичном рынке в зависимости от себестоимости строительства в 12 областях (республиках) по статистическим данным РФ.
Значение коэффициента b 2,643182 Значение коэффициента a -38,8019
Среднеквадратическое отклонение b 0,499229 Среднеквадратическое отклонение а 15,69511
Коэффициент детерминации 0,737064 Среднеквадратическое отклонение y 4,755782
Для активизации надстройки «Пакет анализа» необходимо открыть меню «Сервис» и щелкнуть по строке «Надстройки…». В открывшемся меню следует отметить строку «Пакет анализа» и подтвердить выбор кнопкой «ОК».
Использование пакета анализа осуществляется выбором строки «Анализ данных…» в строке «Сервис» после выделения любой ячейки рабочего листа. Построение парной линейной регрессии выполняется с помощью инструмента «Регрессия» пакета анализа.
Инструмент анализа «Регрессия» пакета анализа данных Excel позволяет по введенным статистическим данным получить значения выборочных коэффициентов корреляции и детерминации, стандартного отклонения; разложения общей суммы квадратов на объясненную и остаточную, расчетное значение -статистики и уровень значимости на котором расчетная -статистика равняется соответствующей табличной величине; значения регрессионных параметров, их стандартные ошибки, и -статистики; таблицу теоретических значений и величины их отклонений от опытных данных; график статистических данных с линией регрессии и график остатков; и другие статистические оценки.
Вызов опции «Регрессия» осуществляется через надстройку «Анализ данных…» меню «Сервис».
Вызов надстройки «Анализ данных…» приведет к появлению списка инструментов анализа. В этом списке необходимо выбрать «Регрессия» и подтвердить выбор нажатием кнопки «ОК».
Интерфейс инструмента анализа «Регрессия» представляет собой диалоговое окно, в верхней части которого следует ввести статистические данные результирующей переменной в поле «Входной интервал Y» и данные фактора в поле «Входной интервал X». При необходимости построения уравнения регрессии вида нужно задать параметр «Константа-ноль». Параметр «Уровень надежности» в процентах определяет величину доверительной вероятности . В качестве выходного интервала удобно задать адрес ячейки непосредственно рядом с таблицей исходных данных. Рекомендует активизировать параметры «Остатки» (таблица теоретических значений результирующего показателя и соответствующие значения остатков), «График остатков» (график отклонений теоретических значений результирующего показателя от его опытных значений) и «График подбора» (график статистических данных с соответствующими теоретическими величинами, вычисленными по уравнению регрессии).
После подтверждения настроек нажатием кнопки «ОК» итоги регрессионного анализа высветятся в заданной области.
Ниже приведены пояснения к итогам расчетов инструмента анализа «Регрессия».
1. Регрессионная статистика: Множественный R - выборочный коэффициент корреляции;
R-квадрат - выборочный коэффициент детерминации;
Нормированный R-квадрат - выборочный скорректированный на объем выборки коэффициент детерминации;
Итого - строка таблицы, соответствующая общей сумме квадратов отклонений;
df - столбец значений числа степеней свободы;
SS - столбец значений сумм квадратов отклонений;
MS - столбец значений сумм квадратов отклонений отнесенных к числу степеней свободы;
F - расчетное значение -статистики;
Значимость F - значение уровня статистической значимости, при котором табличное значение -статистики с числом степеней свободы 1 и будет равно расчетной -статистике (если это значение меньше заданного уровня значимости, то есть основание отвергнуть гипотезу о статистической ненадежности уравнения регрессии).
3. Вывод остатков: Наблюдения - номера наблюдений по порядку;
Предсказанное Y - теоретические значения результирующего показателя, соответствующие опытным величинам;
Остатки - отклонения (разность) теоретических значений результирующего показателя и соответствующих опытных значений.
8.3 Реализация процедуры «ТРЕНД»
Построению линий регрессии и получению регрессионных зависимостей в Excel с помощью процедуры «ТРЕНД» предшествует создание точечных графиков исходных данных. Построение точечных графиков начинается с вызова мастера диаграммы, в окне которого на вкладке «Стандартные» выбирается тип «Точечная» и вид позволяющий сравнивать пары значений.
Построение графика заключается в добавлении нового ряда статистических данных. Для этого на вкладке «Ряд» «Мастера диаграммы» необходимо нажать кнопку «Добавить». Добавление нового ряда данных требует ввода его имени и значений фактора и результирующего показателя соответственно в поля «Значения X» и «Значения Y».
На построенном графике следует щелкнуть правой кнопкой «мыши» по одной из точек графика и в появившемся меню выбрать «Добавить линию тренда». На вкладке «Тип» окна «Линия тренда» выбирается вид построения линии тренда «Линейная». Изменить название и использовать возможность отображения уравнения на диаграмме можно на вкладке «Параметры».
Вывод
1. В настоящей курсовой работе решена задача разработки математической модели цен жилья на первичном рынке в зависимости от себестоимости строительства. Исходными данными для ее расчета явились реальные значения цен жилья на первичном рынке и себестоимости в 12 областях (республиках), расположенных на территории Приволжского федерального округа РФ. Для выбора и обоснования модели в курсовой работе рассмотрены линейная, степенная и показательная математические модели.
2. Выполнена оценка тесноты связи цены жилья и себестоимости строительства с помощью показателей корреляции и детерминации. Сравнение показателей степени связи между ценами жилья и себестоимостями показывают, что для практических целей целесообразно использовать линейную модель, поскольку она обладает высоким коэффициентом детерминации и простотой.
3. Анализ ошибки аппроксимации функций регрессии позволяет заключить, что она находится в допустимых для практического использования пределах и средняя ее величина равна: - для линейной функции: А = 100,529· 100% / 12 = 8,377%;
- для степенной функции: А = 100,209/12 = 8,351%;
- для показательной функции: А = 88,077/12 = 7,340%.
4. Осуществлена сравнительная оценка силы связи фактора (себестоимость строительства) с результатом (цены жилья на первичном рынке) с помощью среднего коэффициента эластичности. Из анализа разработанных математических моделей следует, что изменение на 1% себестоимости приводит к увеличению на 1,766 …1,879% стоимости жилья на первичном рынке. При этом по линейной модели это увеличение составляет 1,879%, по степенной функции регрессии - 1,778%, по показательной функции регрессии - 1,766%.
5. Полученные значения F-критерия Фишера при анализе качества линейного уравнения регрессии указывают, что Fтабл < Fфакт (4,97 < 27,924), что позволяет заключить о значимости выбранного для практического использования значит линейной функции регрессии.
6. Выполненный прогнозный расчет по линейной регрессионной модели показал, что при достаточной надежности (вероятность 0,95) линейная модель имеет приемлемую точность, так как отношение значений верхней и нижней границ доверительного интервала составляет 1,569. yxp min = 40,681; yxp max = 63,807.
7. Сравнение результатов расчетов, выполненных на основе пакетов прикладных программ Excel и согласно разработанным в курсовой работе алгоритмам (в соответствии с изученными методами в дисциплине «Экономико-математические модели»), показало высокую степень их совпадения.