Определение коэффициента детерминации. Исследование сущности оценки значимости параметров модели по критерию Стьюдента. Ознакомление с результатами проверки статистических гипотез. Анализ направлений совершенствования линейной регрессионной модели.
Аннотация к работе
Проверка общего качества эконометрической моделиКоэффициент корреляции служит основой для другой статистической характеристики - коэффициента детерминации. Этот коэффициент позволяет ответить на вопрос о том, каково качество описания зависимости с помощью уравнения регрессии. Очевидно, чем теснее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает соответствующую зависимость переменных и с большей надежностью может быть примечена для практических расчетов - оценивая значения у для заданных значений х. Первая из них характеризует систематическую вариацию, т.е. изменение у в соответствии с уравнением регрессии (такую вариацию иногда называют объясненной, так как она объясняется уравнением регрессии), вторая - случайную вариацию (отклонение от линии регрессии). Найдем теперь отношение суммы квадратов отклонений, обусловленных линией регрессии, к общей сумме квадратов: Напомним, что Следовательно, Величина r получила название выборочного коэффициента детерминации.В этом случае предполагается, что зависимая переменная Y является функцией m объясняющих факторов X1,…,Xm и оцениваются параметры функции Y=a0 a1X1 … AMXM e, где aj-коэффициенты регрессии, e - случайная ошибка. Для обеспечения статистической надежности оценок требуется, чтобы число наблюдений (объем выборок) как минимум в три раза превосходило число оцениваемых параметров. Приравнивая к нулю частные производные функции S по всем aj, мы получаем так называемую систему нормальных уравнений, состоящую из (m 1) линейных уравнений с (m 1) неизвестными. Для определения статистической значимости коэффициента детерминации проверяется нулевая гипотеза для F-статистики, вычисляемой по формуле: . Смысл проверяемой гипотезы заключается в равенстве нулю всех коэффициентов регрессии за исключением свободного члена.Оценки параметров a и b, полученные методом МНК, при условии, что сделанные выше предположения относительно возмущений e справедливы, обладают свойствами: Оценки параметров являются несмещенными, то есть математическое ожидание параметра равно истинному его значению: M(a)=a; M(b)=b. Оценки состоятельны, то есть дисперсия оценки параметра стремится к нулю с возрастанием объема выборки n: . Оценки являются эффективными, то есть они имеют минимальную дисперсию по сравнению с любыми другими линейными и несмещенными оценками параметров a и b. Формулы для дисперсий оценок следующие: , где - мера разброса значений зависимой переменной Y около линии регрессии (необъясненная дисперсия); ei=yi-a-bxi - отклонения наблюдаемых значений случайной величины Y от линии регрессии; sa и sb - стандартные отклонения оценок коэффициентов a и b. При проверке нулевой гипотезы отдельно для каждого коэффициента aj рассчитываются t-статистики: , где - стандартная ошибка для коэффициента aj.Если эти отклонения не являются взаимно независимыми и дисперсия их непостоянна, то такое нарушение исходных предпосылок, сделанных выше, свидетельствует о неточной спецификации (определения вида зависимости) уравнения регрессии, а также свидетельствуют о неточности полученных оценок коэффициентов регрессии и их стандартных ошибок. Поэтому при оценке качества уравнения регрессии существенна проверка его некоторых важных свойств, которые предполагались при оценке параметров этого уравнения. Если, например, реальная связь между экономическим показателем Y и объясняющими переменными X1,X2,,...,Xm нелинейна, то анализ статистической значимости коэффициентов регрессии неточен и оценки этих коэффициентов не обладают желательными для исследователя свойствами, как несмещенность, состоятельность и эффективность. Закономерность в поведении остатков ei=yi-a0-a1xi1-a2xi2-...-amxim, i=1,...,n, - отклонений выборочных значений показателя Y от линии регрессии выражается, как правило, в знаке каждых соседствующих отклонений, что может являться следствием нелинейного характера связи переменных или воздействием какого-то фактора, не включенного в уравнение регрессии. Это может быть причиной того, что существует возможность улучшить уравнение регрессии путем оценивания другой нелинейной формулы уравнения или путем включения нового объясняющего экономического фактора.При эконометрическом исследовании мы встречаемся с тремя противоречиями: 1. Не всегда измерения (количественных, статистически наблюдаемых величин) относятся к реальной структуре, на основе которой строится экономический объект. Какими бы точными и правильными ни были данные наблюдения, они могут отражать лишь внешние свойства, столь далекие от сущности исследуемого явления, что связь, которую мы устанавливаем между ними, не будет иметь ничего общего со структурной связью, от которой они происходят. Наши дедуктивные модели часто вступают в противоречие с результатами эмпирического исследования.
План
План
1. Коэффициент детерминации. Остаточная и общая дисперсия
2. Оценка адекватности модели. Критерий Фишера
3. Оценка значимости параметров модели по критерию Стьюдента. Проверка статистических гипотез