Изучение классической модели линейной регрессии, анализ ее нарушений. Рассмотрение особенностей регрессионных моделей с переменной структурой, нелинейной регрессии. Моделирование одномерных временных рядов. Системы линейных одновременных уравнений.
Современная ситуация в России предъявляет высокие требования к содержанию и качеству подготовки экономистов, в том числе и в области статистики.
Современный экономист должен уметь использовать в своей ежедневной практике статистические подходы к исследованию социально-экономических явлений и процессов: - методы статистического наблюдения за явлениями социальной и экономической жизни, сбора и измерения статистической информации;
- методы обработки статистической информации, такие как метод сводки и группировки, ряды распределения, табличный и графический методы;
- методы анализа с помощью обобщающих показателей: абсолютных, относительных, средних величин и индексных систем;
- статистические методы изучения динамики процессов, выявления взаимосвязей явлений посредством реализации корреляционно-регрессионного анализа.
Именно для овладения студентами необходимыми основами статистических знаний разработано данное учебное пособие по выполнению лабораторных работ по дисциплине "Теория статистики".
Учебное пособие составлено в соответствии с учебной программой курса и предназначено для студентов специальностей 080601 "Статистика", 080105 "Финансы и кредит". Дисциплина "Теория статистики" базируется на предшествующем ей курсе "Информатика", в связи с этим при составлении учебного пособия предполагалось, что студенты владеют необходимыми навыками работы в ППП Microsoft Word и ППП Microsoft Excel.
В данном учебном пособии изложен теоретический материал к лабораторным работам, приведены задания к лабораторному практикуму, вопросы к защите лабораторных работ, а также указания о порядке их выполнения с использованием ППП Microsoft Excel.
Задания к лабораторным работам составлены по основным темам курса: "Статистическое наблюдение", "Сводка и группировка статистических данных", "Абсолютные и относительные величины", "Средние величины", "Показатели вариации", "Статистическое изучение динамики социально-экономических явлений и процессов", "Индексы", "Статистическое изучение взаимосвязи социально - экономических явлений".
При составлении задач к лабораторным работам были использованы статистические материалы Росстата и Территориального органа Федеральной службы государственной статистики по Оренбургской области. Использование реальных статистических данных при выполнении заданий лабораторных работ позволит студентам овладеть основами статистической науки, развить навыки применения статистических методов, научиться анализировать и интерпретировать полученные результаты, а также понять, что они считали и для чего.
Применение современных пакетов прикладных программ при изучении дисциплины "Статистика", таких как ППП Microsoft Excel, дает возможность студентам повысить темп решения задач, и сосредоточить их внимание на понимании экономического смысла исчисленных показателей, на объяснении полученных результатов и формулировании выводов.
При изучении данной дисциплины студенты приобретают не только умения и навыки применения статистических методов, которые могут пригодиться в любом направлении деятельности экономиста, но также у них закладываются элементы статистического мышления.
Лабораторная работа №1. Классическая модель линейной регрессии
Задания: 1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2012 г.
2. Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
3. Постройте модель с информативными факторами.
4. Оцените с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
5. Оцените статистическую значимость коэффициентов регрессии с помощью t- критерия Стьюдента.
6. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
7. Оцените качество уравнения через среднюю ошибку аппроксимации.
8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.
9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.
10. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .
11. По полученным результатам сделайте экономический вывод.
Реализация типовых заданий: 1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2012 г.
Имеются данные о деятельности 25 крупнейших компаний США
Таблица 1.
План
Содержание
Введение
Лабораторная работа №1. Классическая модель линейной регрессии
Лабораторная работа №2. Регрессионные модели с переменной структурой
Лабораторная работа №3. Нарушения допущений классической модели линейной регрессии
Лабораторная работа №4. Нелинейная регрессия
Лабораторная работа №5. Моделирование одномерных временных рядов
Лабораторная работа №6. Системы линейных одновременных уравнений
Список использованной литературы
Приложения
Введение
Современная ситуация в России предъявляет высокие требования к содержанию и качеству подготовки экономистов, в том числе и в области статистики.
Современный экономист должен уметь использовать в своей ежедневной практике статистические подходы к исследованию социально-экономических явлений и процессов: - методы статистического наблюдения за явлениями социальной и экономической жизни, сбора и измерения статистической информации;
- методы обработки статистической информации, такие как метод сводки и группировки, ряды распределения, табличный и графический методы;
- методы анализа с помощью обобщающих показателей: абсолютных, относительных, средних величин и индексных систем;
- статистические методы изучения динамики процессов, выявления взаимосвязей явлений посредством реализации корреляционно-регрессионного анализа.
Именно для овладения студентами необходимыми основами статистических знаний разработано данное учебное пособие по выполнению лабораторных работ по дисциплине "Теория статистики".
Учебное пособие составлено в соответствии с учебной программой курса и предназначено для студентов специальностей 080601 "Статистика", 080105 "Финансы и кредит". Дисциплина "Теория статистики" базируется на предшествующем ей курсе "Информатика", в связи с этим при составлении учебного пособия предполагалось, что студенты владеют необходимыми навыками работы в ППП Microsoft Word и ППП Microsoft Excel.
В данном учебном пособии изложен теоретический материал к лабораторным работам, приведены задания к лабораторному практикуму, вопросы к защите лабораторных работ, а также указания о порядке их выполнения с использованием ППП Microsoft Excel.
Задания к лабораторным работам составлены по основным темам курса: "Статистическое наблюдение", "Сводка и группировка статистических данных", "Абсолютные и относительные величины", "Средние величины", "Показатели вариации", "Статистическое изучение динамики социально-экономических явлений и процессов", "Индексы", "Статистическое изучение взаимосвязи социально - экономических явлений".
При составлении задач к лабораторным работам были использованы статистические материалы Росстата и Территориального органа Федеральной службы государственной статистики по Оренбургской области. Использование реальных статистических данных при выполнении заданий лабораторных работ позволит студентам овладеть основами статистической науки, развить навыки применения статистических методов, научиться анализировать и интерпретировать полученные результаты, а также понять, что они считали и для чего.
Применение современных пакетов прикладных программ при изучении дисциплины "Статистика", таких как ППП Microsoft Excel, дает возможность студентам повысить темп решения задач, и сосредоточить их внимание на понимании экономического смысла исчисленных показателей, на объяснении полученных результатов и формулировании выводов.
При изучении данной дисциплины студенты приобретают не только умения и навыки применения статистических методов, которые могут пригодиться в любом направлении деятельности экономиста, но также у них закладываются элементы статистического мышления.
Лабораторная работа №1. Классическая модель линейной регрессии
Задания: 1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2012 г.
2. Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
3. Постройте модель с информативными факторами.
4. Оцените с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
5. Оцените статистическую значимость коэффициентов регрессии с помощью t- критерия Стьюдента.
6. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
7. Оцените качество уравнения через среднюю ошибку аппроксимации.
8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.
9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.
10. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .
11. По полученным результатам сделайте экономический вывод.
Реализация типовых заданий: 1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2012 г.
Имеются данные о деятельности 25 крупнейших компаний США
Таблица 1.1 - Исходные данные
№ компании y x1 x2 x3 x4 x5
1 2,5 38,2 5,3 16,5 29,4 1,2
2 3,3 20,3 3,8 24,9 29 2
3 2,3 11,4 5,1 9,2 27,4 0,9
4 3,3 16,9 1,3 19,3 27 1,3
5 4,2 26,9 6,1 40,8 25,8 1,6
6 2,9 21,9 1,6 37,2 15 0,3
7 5,7 144 27,5 133,5 25,5 2,6
8 3,2 24,8 5,6 32,9 25,3 1,3
9 8,5 172,3 16,8 286,5 24,8 2,3
10 2 8,9 0,4 1,6 23,8 1
11 2,9 13,7 2,2 10,3 23,8 1,5
12 3,5 34 5,3 16,4 23,5 1,8
13 3,5 20,3 3,7 23,8 14,7 1,9
14 3 16,7 3,5 81,5 21,6 1,3
15 2 26,4 3,4 40,4 21,2 1,5
16 2,4 13,7 0,9 12,9 20,6 0,2
17 3,4 33,9 3,6 54,6 19 1,1
18 2,5 19,3 1,9 36,9 18,3 1,7
19 2,7 24,6 4,2 53,8 13,9 2,1
20 3,5 19,6 3,3 22,8 17,8 2,1
21 0,7 28,3 0,4 50,4 17,7 1,4
22 2,9 20,4 2,4 27,2 17,7 1,8
23 3,6 20,3 3,2 25,2 17,6 2
24 2,2 11,1 0,5 8,9 16,4 1,3
25 2,3 22,4 1,6 31,1 15,7 2 где y - чистый доход, млрд. долл. x1 - оборот капитала, млрд. долл. x2 - использованный капитал, млрд. долл. x3 - численность служащих, тыс. чел. x4 - рыночная капитализация компаний, млрд. долл. x5 - заработная плата служащих, тыс. долл.
Построим уравнение множественной линейной регрессии следующего вида: .
Для этого проведем регрессионный анализ данных факторов с помощью ППП МС Excel.
Для построения модели можно воспользоваться инструментом анализа данных Регрессия. Порядок действий следующий: а) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК;
б) заполните диалоговое окно ввода данных и параметров ввода (рисунок 1): Входной интервал Y - диапазон, содержащий данные результативного признака;
Входной интервал Х - диапазон, содержащий данные всех пяти факторов;
Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет;
Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист - можно задать произвольное имя нового листа.
Результаты регрессионного анализа представлены на рисунке 1.2.
Рисунок 1.2 - Результат применения инструмента Регрессия для факторов
Составим уравнение множественной регрессии: .
Коэффициенты регрессии показывают среднее изменение результативного признака с изменением на 1 единицу своего измерения данного фактора при условии постоянства всех остальных.
Таким образом, коэффициент регрессии при показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится на 0,0039 млрд. долл., при фиксированном значении остальных факторов. Аналогичным образом делаются выводы по остальным коэффициентам регрессии.
Параметр a экономической интерпретации не имеет.
2. Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.
Парные коэффициенты корреляции рассчитываются по формулам: ; .
Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого: 1) в главном меню последовательно выберите пункты Сервис / Анализ данных / Корреляция. Щелкните по кнопке ОК;
2) заполнит диалоговое окно ввода данных и параметров вывода (рисунок 3);
3) результаты вычислений - матрица коэффициентов парной корреляции - представлены на рисунке 4.
Из матрицы можно заметить, что факторы и , и мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,75. Таким образом, можно сказать, что они дублируют друг друга.
При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: и .
Построим новое уравнение множественной регрессии с информативными факторами.
3. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.
Построим уравнение множественной линейной регрессии следующего вида: .
Параметры вычисляем аналогично пункту 1 (рисунок 5).
Рисунок 1.5 - Результат применения инструмента Регрессия
Получаем уравнение следующего вида: .
Выводы по коэффициентам регрессии делаются аналогично пункту 1.
4. Оцените с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F-критерий Фишера: .
Для проверки значимости уравнения выдвигаем две гипотезы: Н0: уравнение регрессии статистически не значимо;
Н1: уравнение регрессии статистически значимо.
По данным таблиц дисперсионного анализа, представленным на рисунке 5, =32,8. Вероятность случайно получить такое значение F-критерия составляет 0,0000, что не превышает допустимый уровень значимости 5%; об этом свидетельствует величина P - значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
5. Оцените статистическую значимость коэффициентов регрессии с помощью t- критерия Стьюдента.
Выдвигаем две гипотезы: Н0: коэффициенты регрессии статистически не значим, т.е. равны о;
Н1: коэффициенты регрессии статистически значимы, т.е. отличны от нуля.
Значения случайных ошибок параметров с учетом округления равны (рисунок 5): Они показывают, какое значение данной характеристики сформировались под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента (рисунок 5): Если значения t-критерия больше 2,07, можно сделать вывод о существенности параметра, который формируется под воздействием неслучайных причин. Здесь все параметры являются статистически значимыми.
На это же указывает показатель вероятности случайных значений параметров регрессии: если ? меньше принятого нами уровня (обычно 0,1; 0,05 или 0,01), делают вывод о неслучайной природе данного значения параметра, т.е. о том, что он статистически значим и надежен. В противном случае принимается гипотеза о случайной природе значения коэффициентов уравнения.
6. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
Средние коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении фактора на 1% от своей средней и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости
, где - коэффициент регрессии при в уравнении множественной регрессии.
Средние значения признаков могут быть получены с помощью инструмента анализа данных Описательная статистика.
Для этого выполните следующие шаги: 1) введите исходные данные или откройте существующий файл, содержащий анализируемые данные;
2) в главном меню выберите последовательно пункты Сервис / Анализ данных / Описательная статистика, после чего щелкните по кнопке ОК;
3) заполните диалоговое окно ввода данных и параметров вывода (рисунке 6).
Результаты вычисления соответствующих показателей для каждого признака представлены на рисунке 1.7.
Рисунок 1.7 - Результат применения инструмента Описательная статистика
Здесь , .
Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением использованного капитала на 1%, чистый доход увеличивается в среднем на 0,06 %, при условии, что другие факторы остаются постоянными. Аналогично делаются выводы по другим коэффициентам.
7. Оцените качество уравнения через среднюю ошибку аппроксимации.
Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:
Таблица 1.2
Данные для расчета средней ошибки аппроксимации
№ п/п y
1 2,50 2,8 0,13
2 3,30 2,8 0,15
3 2,30 2,7 0,18
4 3,30 2,5 0,24
5 4,20 3,3 0,23
6 2,90 2,8 0,03
7 5,70 6,5 0,13
8 3,20 3,1 0,03
9 8,50 7,8 0,09
10 2,00 2,2 0,09
11 2,90 2,5 0,15
12 3,50 2,8 0,19
13 3,50 2,8 0,20
14 3,00 3,6 0,20
15 2,00 3,0 0,50
16 2,40 2,4 0,00
17 3,40 3,2 0,05
18 2,50 2,8 0,13
19 2,70 3,3 0,21
20 3,50 2,7 0,22
21 0,70 2,9 3,13
22 2,90 2,7 0,06
23 3,60 2,8 0,23
24 2,20 2,3 0,04
25 2,30 2,7 0,18
Итого 79,00 79 6,81
Таким образом, фактические значения результативного признака отличаются от теоретических значений на 27,23%. Следовательно, построенная модель имеет удовлетворительную точность.
8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.
Уравнение в стандартизованном масштабе имеет вид: .
Расчет ? - коэффициентов выполним по формулам: ; .
Парные коэффициенты корреляции берутся из матрицы (рисунок 4):
Получим уравнение
.
Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на 1 сигму при неизменном среднем уровне других факторов.
В нашем случае, при увеличении использованного капитала на 1 сигму чистый доход увеличится на 0,34 сигм, при условии, что численность служащих остаются на прежнем уровне. Аналогично вывод для .
9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.
Рассчитаем ожидаемое прогнозное значение чистого дохода как точечный прогноз путем подстановки в уравнение регрессии прогнозные значения факторов: 1) найдем максимальное значение для фактора (рисунок 7): 2) найдем максимальное значение для фактора (рисунок 7): 3) найдем прогнозные значения факторов: для фактора : для фактора : 4) подставим прогнозные значения факторов в уравнение . В результате получим: .
Таким образом, при прогнозных значениях использованного капитала 22 млдр. долл. и численности служащих 229,2 тыс. чел. чистый доход крупнейших компаний США составит 7,47 млрд. долл.
10. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .
Доверительный интервал прогноза имеет следующий вид: , где - средняя ошибка прогнозируемого значения ;
- вектор-столбец прогнозных значений факторов;
- стандартная ошибка .
1) составим вектор-столбец ;
2) найдем транспонируемый вектор-столбец ;
3) из рисунка 4 ;
4) найдем стандартную ошибку ;
5) составим матрицу X - 25 наблюдаемых значений независимых переменных и , размер которой 25 3 (добавлен единичный столбец для определения a0);
6) найдем произведение ;
7) найдем ;
8) найдем выражение ;
9) вычислим среднюю ошибку прогнозируемого значения
;
10) по таблицам распределения Стьюдента находим табличное значение при уровне значимости 0,05 и числе степеней свободы 22
;
11) составляем доверительный интервал: .
Значит, с вероятность 95% можно сказать, что чистый доход будет колебаться от 6,33 до 8,61 млрд. долл. при использованном капитале в 22 млрд. долл. и численности служащих 229,2 тыс. чел.
11. По полученным результатам сделайте экономический вывод.
Делается общий вывод по проделанной работе.
Лабораторная работа №2. Регрессионные модели с переменной структурой
Задания
По данным лабораторной работы №1: 1) оцените линейную регрессию, включив в модель фиктивную переменную
;
2) проверти данные на наличие структурного сдвига при помощи теста Чоу.
Реализация типовых заданий
1 Оцените линейную регрессию, включив в модель фиктивную переменную.
По исходным данным из лабораторной работы №1, включив фиктивную переменную (таблица 2.1), построим матрицу парных коэффициентов корреляции (таблица 2.2).
Таблица 2.1 - Исходные данные для построения объединенной модели с фиктивными переменными
№ предприятия y x1 x2 x3 x4 x5 Пол руководителя компании D
По матрице коэффициентов корреляции видно, что фиктивная переменная не коллинеарна с отобранными в лабораторной работе №1 факторными переменными х2 и х3 (соответствующие коэффициенты составили 0,36 и 0,18). Следовательно, можно построить модель множественной регрессии, включив эти факторы. Результаты регрессионного анализа представлены в таблице 8.5.
Модель примет вид: .
Уравнение регрессии значимо по F - критерию на 5% уровне значимости. Оно показывает, что при одном и том же объеме использованного капитала и численности служащих, у предприятий руководителями которых являются мужчины, чистый доход больше в среднем на 0,522 млрд. долл., чем у остальных компаний. Однако, коэффициент при D статистически незначим (уровень значимости составил 0,118 > 0,05). Следовательно, влияние фактора "пол" оказалось несущественно, и есть основание считать, что модель одна и та же для компаний с руководителями мужчинами и женщинами.
2. Проверти данные на наличие структурного сдвига при помощи теста Чоу.
Используя критерий Г. Чоу, выясним, можно ли считать одной и той же линейную регрессию для компаний с руководителями мужчинами и женщинами.
По 15 наблюдениям для компаний, руководителями которых являются мужчины, построим уравнение регрессии от факторов х2 и х3. Исходные данные представлены в таблице 2.4.
Таблица 2.4 - Исходные данные для построения модели по первой подвыборке (руководитель компании - мужчина)
№ предприятия y x2 x3
1 2 3 4 5 6
1 2,5 5,3 16,5 3,0 0,219
2 3,3 3,8 24,9 3,0 0,084
3 2,3 5,1 9,2 2,8 0,288
4 3,3 1,3 19,3 2,8 0,289
5 4,2 6,1 40,8 3,4 0,620
7 5,7 27,5 133,5 6,3 0,314
8 3,2 5,6 32,9 3,3 0,003
9 8,5 16,8 286,5 8,1 0,183
12 3,5 5,3 16,4 3,0 0,285
13 3,5 3,7 23,8 3,0 0,264
17 3,4 3,6 54,6 3,5 0,006
20 3,5 3,3 22,8 2,9 0,308
21 0,7 0,4 50,4 3,2 6,304
22 2,9 2,4 27,2 3,0 0,004
23 3,6 3,2 25,2 3,0 0,388
Итого 54,1 - - 54,1 9,559
Результаты регрессионного анализа представлены в таблице 8.7.
Уравнение примет вид: .
Расчетные значения по нему представлены в таблице 8.6, графа 5.
Построим модель регрессии по 10 предприятиям руководителями, которых являются женщины (исходные данные представлены в таблице 2.6).
Таблица 2.5 - Вывод итогов регрессионного анализа по первой подвыборке
- сумма квадратов отклонений фактических значений результативного признака от теоретических для объединенной выборки (таблица 8.10, итог графы 6);
- сумма квадратов отклонений фактических значений результативного признака от расчетных для первой подвыборки (таблица 8.6, итог графы 6);
- сумма квадратов отклонений фактических значений результативного признака от расчетных для второй подвыборки (таблица 8.8, итог графы 6).
Табличное значение критерия Фишера составило 3,127. Так как расчетное значение критерия меньше табличного, то влияние фактора "пол" несущественно, и в качестве оценки регрессионной модели можно рассматривать уравнение регрессии, полученное по объединенной выборке.
Лабораторная работа №3. Нарушения допущений классической модели линейной регрессии
Задания
1 Проведите графический анализ остатков. Проверьте остатки на гетероскедастичность с помощью: - графического анализа, - теста Голдфелда-Квандта, - теста ранговой корреляции Спирмена, - теста Уайта (White test).
2 Если будет обнаружена гетероскедастичность остатков, примените для исходных данных ОМНК, предполагая, что .
3 Проверить остатки на наличие автокорреляции первого порядка, используя метод рядов, критерий Дарбина - Уотсона и Q- статистику Льюинга - Бокса. Если гипотеза об отсутствии автокорреляции первого порядка не будет отвергнута, то применить ОМНК для оценивания параметров уравнения регрессии.
Реализация типовых заданий
1 Провести графический анализ остатков
В лабораторной работе №1 выявили, что на чистый доход (y) предприятий оказывают влияния такие факторы, как использованный капитал (x2) и численность служащих (x3).
Для нахождения остатков можно воспользоваться инструментом анализа данных Регрессия. Порядок действий следующий: а) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК;
б) заполните диалоговое окно ввода данных и параметров ввода как показано на рисунке 8.8: Входной интервал Y - диапазон, содержащий данные результативного признака;
Входной интервал Х - диапазон, содержащий данные всех пяти факторов;
Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет;
Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист - можно задать произвольное имя нового листа;
Остаток - флажок, указывает вывод остатков и теоретические значения результативного признака.
Рисунок 3.1 - Регрессия с остатками
Результаты регрессионного и корреляционного анализа, а также вспомогательные характеристики представлены на рисунке 3.2.
Рисунок 3.2 - Вывод остатков
Проверим остатки полученного уравнения регрессии на гетероскедастичность.
Графический анализ остатков
Построим графики остатков для каждого уравнения (рисунок 3.3 и 3.4)
Рисунок 3.3 - График остатков для фактора х2
Рисунок 3.4 - График остатков для фактора х3
Как видно на рисунке отклонения не лежат внутри полуполосы постоянной ширины, это говорит, о зависимости дисперсионных остатков от величины х3 и о их непостоянстве, т.е. о наличии гетероскедастичности.
Тест Голфелда-Квандта
Выдвигаются гипотезы: Но: - гомоскедастичность
Н1: - гетероскедастичность
Порядок проведения теста следующий: 1 Все n наблюдений упорядочиваются по величине X2 и X3 (таблица 3.5 и 3.6).
Таблица 3.5 - Упорядоченные значения по фактору х2
№ предприятия
1 2 0,4
2 0,7 0,4
3 2,2 0,5
4 2,4 0,9
5 3,3 1,3
6 2,9 1,6
7 2,3 1,6
8 2,5 1,9
9 2,9 2,2
10 2,9 2,4
11 3,6 3,2
12 3,5 3,3
13 2 3,4
14 3 3,5
15 3,4 3,6
16 3,5 3,7
17 3,3 3,8
18 2,7 4,2
19 2,3 5,1
20 3,5 5,3
21 2,5 5,3
22 3,2 5,6
23 4,2 6,1
24 8,5 16,8
25 5,7 27,5
2 Исключим С центральных наблюдений, разобьем совокупность на две части: а) со значениями x ниже центральных; б) со значениями x выше центральных.
Пусть С=5, это наблюдения с порядковыми номерами 11-15.
3 Оцениваются отдельные регрессии для первой подвыборки (10 первых наблюдений) и для третьей подвыборки (10 последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям X верно, то дисперсия регрессии по первой подвыборке (сумма квадратов отклонений ) будет существенно меньше дисперсии регрессии по третьей подвыборке (суммы квадратов отклонений ).
Таблица 3.6 - Упорядоченные значения по фактору х3
№ предприятия
1 1,6 2
2 8,9 2,2
3 9,2 2,3
4 10,3 2,9
5 12,9 2,4
6 16,4 3,5
7 16,5 2,5
8 19,3 3,3
9 22,8 3,5
10 23,8 3,5
11 24,9 3,3
12 25,2 3,6
13 27,2 2,9
14 31,1 2,3
15 32,9 3,2
16 36,9 2,5
17 37,2 2,9
18 40,4 2
19 40,8 4,2
20 50,4 0,7
21 53,8 2,7
22 54,6 3,4
23 81,5 3
24 133,5 5,7
25 286,5 8,5
4 По каждой части находим уравнение регрессии (рисунок 8.12)
Рисунок 3.5 - Вывод итогов для подвыборок для фактора х2
5 Для сравнения соответствующих дисперсий строится следующая F-статистика:
, .
При сделанных предположениях относительно случайных отклонений построенная F-статистика имеет распределение Фишера с числами степеней свободы v1=v2=(n-C-2m)/2.
6 Если , то гипотеза об отсутствии гетероскедастичности отклоняется ( - выбранный уровень значимости).
По проведенным расчетам мы получили, что следовательно в ряду остатков обнаружена гетероскедастичность.
Значения хі и абсолютные величины ui ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции: ,
где di - разность между рангами хі и ui, i = 1, 2, ..., n;
n - число наблюдений.
Рассчитаем теоретические значения по уравнению регрессии и найдем остатки. Ранжируем совокупность по возрастанию (рисунок 3.6).
Рисунок 3.6 - Расчетная таблица для проведения теста Спирмена
Тогда .
Если коэффициент корреляции для генеральной совокупности равен нулю, то статистика имеет распределение Стьюдента с числом степеней свободы v=n-2. Следовательно, если наблюдаемое значение t-статистики превышает табличное, то необходимо отклонить гипотезу о равенстве нулю коэффициента корреляции , а следовательно, и об отсутствии гетероскедастичности.
В нашем примере статистика Стьюдента равна:
.
Табличное значение статистики Стьюдента составит t(0,05; 23)=2,0687.
Таким образом, мы получили, что расчетное значение меньше табличного, следовательно, гипотеза об отсутствии гетероскедастичности принимается на уровне значимости 5%.
Тест Уайта позволяет оценить количественно зависимость дисперсии ошибок регрессии от значений фактора x, используя квадратичную функцию: , где - нормально распределенная ошибка.
Проводится этот тест следующим образом: 1) получаем регрессионные остатки ui;
2) оцениваем вспомогательную регрессию;
Гипотеза об отсутствии гетероскедастичности принимается в случае незначимости регрессии в целом.
3) в нашем примере вспомогательная регрессия принимает вид: .
Уравнение статистически незначимо на уровне значимости . Следовательно, гипотеза об отсутствии гетероскедастичности принимается.
2 Если будет обнаружена гетероскедастичность остатков, примените для исходных данных ОМНК, предполагая, что .
По всем проведенным тестам можно сделать вывод о гомоскедастичности регрессионных остатков. В противном случае для устранения гетероскедастичности необходимо применить к исходным данным обобщенный метод наименьших квадратов в предположении, что .
Исходное уравнение преобразуем делением правой и левой частей на x2: .
К нему применим МНК. Полученное уравнение имеет вид: .
Получены новые оценки параметров линейного уравнения, в котором смягчена гетероскедастичность.
Рисунок 3.8 - Вывод итога ОМНК
3 Проверить остатки на наличие автокорреляции первого порядка, используя метод рядов, критерий Дарбина - Уотсона и Q- статистику Льюинга - Бокса. Если гипотеза об отсутствии автокорреляции первого порядка не будет отвергнута, то применить ОМНК для оценивания параметров уравнения регрессии.
Метод рядов
Последовательно определяются знаки остатков .
Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда.
Пусть n - объем выборки;
n1 - общее количество знаков " " при n наблюдениях;
n2 - общее количество знаков "-" при n наблюдениях;
k - количество рядов.
Если при достаточно большом количестве наблюдений (n1>10, n2>10) количество рядов k лежит в пределах от k1 до k2: , регрессия линейный уравнение то гипотеза об отсутствии автокорреляции не отклоняется.
Рисунок 3.9 - Расчет характеристик метода рядов
Найдя знаки отклонений теоретических уровней от фактических, мы получили, что в анализируемой выборке содержится 15 рядов, т.е. k=15 (рисунок 8.16). Общее количество знаков " " n1=14, количество знаков "-" n2=11.
Подставим найденные значения в формулу, получим, что k1=7,5, k2=19,13. Следовательно, гипотеза об отсутствии автокорреляции не отклоняется.
Критерий Дарбина - Уотсона
Для проверки автокорреляции первого порядка необходимо рассчитать критерий Дарбина-Уотсона. Он определяется так:
.
Выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. При сравнении расчетного значения статистики (DW<2) с dl и du возможны следующие варианты.
1 Если DW< dl , то гипотеза Н0 отвергается.
2 Если DW > du, то гипотеза Н0 не отвергается.
3 Если dl< DW< du, то нельзя сделать определенного вывода по имеющимся исходным данным (зона неопределенности).
При DW > 2, то с табличными значениями сравнивается величина (4-DW).
Рисунок 3.10 - Расчет критерия Дарбина - Уотсона
В результате проведенных расчетов получено значение критерия Дарбина - Уотсона DW=2,2032.
Так как оно больше 2, то с критическими значением сравниваем величину 4-DW=1,7967. Оно больше du следовательно мы не можем отвергнуть гипотезу Н0 - в ряду остатков отсутствует автокорреляция первого порядка.
Q-тест Льюинга - Бокса
Использование данного теста предполагает использование Q- статистики, значение которой определяется по формуле: , где - выборочные значения автокорреляционной функции;
- величина лага;
n - число наблюдений.
Q- статистика имеет - распределение с степенями свободы. Если Q - статистика меньше табличного , то гипотеза об отсутствии автокорреляции принимается.
Список литературы
1. Айвазян С.А. Прикладная статистика. Основы эконометрики: в 2 т. учеб. для вузов / С.А. Айвазян, В.С. Мхитарян. - М.: ЮНИТИ-ДАНА, 2001. - ISBN 5-238-00304-8
2. Афанасьев В.Н. Анализ временных рядов и прогнозирование: учебник / В.Н. Афанасьев, М.М. Юзбашев. - 2-е изд., перераб. и доп. - М.: Финансы и статистика; ИНФРА-М, 2010. - 320 с.: ил. ISBN 978-5-279-03400-0 (Финансы и статистика); 978-5-16-004248-0 (ИНФРА-М)
3. Афанасьев В.Н. Эконометрика: учеб. для вузов / В.Н. Афанасьев, М.М. Юзбашев, Т.И. Гуляева; под ред. В.Н. Афанасьева. - М.: Финансы и статистика, 2005. - 256 с- ISBN 5-279-02738-3.
4. Бабешко Л.О. Основы эконометрического моделирования: учебное пособие / Л.О. Бабешко. - Изд. 2-е, испр. М.: КОМКНИГА, 2006. - 432 с. -ISBN 978 - 5- 484-00757-8
5. Еремеева Н.С., Лебедева Т.В. Эконометрика: учебное пособие для вузов. - Оренбург: ОАО "ИПК "Южный Урал", 2010. - 296 с.- ISBN 978 -5-94162-074-6
6. Кремер Н.Ш. Эконометрика: учеб. для вузов / Н.Ш. Кремер, Б.А. Путко. - М.: ЮНИТИ-ДАНА, 2003. - 311 с. - ISBN5-238-00333-1.
7. Официальный сайт "Высшей школы экономики" http://www.hse.ru
8. Официальный сайт Федеральной службы государственной статистики http://www.gks.ru
9. Практикум по эконометрике: учеб. пособие для экон. вузов / под ред. И.И. Елисеевой.- 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2008. - 344 с.: ил 1 электрон. опт. диск (CD-ROM - 2007). - Прилагается компакт-диск к каждому экз. - Прил.: с. 332-342. - ISBN 978-5-279-02785-9.
10. Тихомиров Н.П., Дорохина Е.Ю. Эконометрика: Учебник / Н.П. Тихомиров, Е.Ю. Дорохина - М.: Издательство "Экзамен", 2003. - 512 с. - ISBN 5-94692-438-9
11. Эконометрика для бакалавров: учебник для студентов, обучающихся по программам высшего профессионального образования по направлению подготовки 080100 Экономика / под ред. В.Н. Афанасьева; М-во образования и науки Рос. Федерации, Федер. гос. бюджет. образоват. учреждение высш. проф. образования "Оренбург. гос. ун-т".- 2-е изд., перераб. и доп. - Оренбург: Университет, 2014. - 422 с.: ил. - Библиогр.: с. 393-399. - Прил.: с. 400-421. - ISBN 978-5-4417-0345-1.
12. Эконометрика: учеб. / под ред. д-ра экон. наук, проф. В.С. Мхитаряна. - М.: Проспект, 2009. - 384 с. - ISBN 978-5-392-00188-0
13. Эконометрика: учеб. / Под ред. И.И. Елисеевой. - М.: Проспект, 2008. - 288 с. - ISBN 978-5-392-00186-6
14. Эконометрика: учебник / И.И. Елисеева [и др.]. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2007. - 576 с. - ISBN 5-279-02786-3
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы