Функциональная и статистическая зависимости. Положения корреляционного анализа, двумерная модель. Проверка значимости и интервальная оценка параметров связи. Понятие о многомерном корреляционном анализе, множественный и частный коэффициенты корреляции.
Аннотация к работе
Любой закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследований относится к задачам статистического исследования зависимостей, которые включают в себя корреляционный, регрессионный, дисперсионный, ковариационный анализ и анализ таблиц сопряженности.Диалектический подход к изучению природы и общества требует рассмотрения явлений в их взаимосвязи и непрестанном изменении. Понятия корреляции и регрессии появились в середине XIX в. благодаря работам английских статистиков Ф.В естественных науках часто речь идет о функциональной зависимости (связи), когда каждому значению одной переменной соответствует вполне определенное значение другой. В экономике в большинстве случаев между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. В силу неоднозначности статистической зависимости между Y и X для исследователя, в частности, представляет интерес усредненная по х схема зависимости, т.е. закономерность в изменении среднего значения - условного математического ожидания MX(Y) (математического ожидания случайной переменной Y, найденного при условии, что переменная X приняла значение х) в зависимости от х. Определение: Статистическая зависимость между двумя переменными, при которой каждому значению одной переменной соответствует определенное среднее значение, т.е. условное математическое ожидание другой, называется корреляционной. Иначе, корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.Вели-Середи-Всего Группо-чина ны ин-Суточная выработка продукции, т (Y) n вая сред- Рассмотрим в качестве примера зависимость между суточной выработкой продукции Y (т) и величиной основных производственных фондов X (млн руб.) для совокупности 50 однотипных предприятий (табл. Вычисленные групповые средние поместим в последнем столбце корреляционной таблицы и изобразим графически в виде ломаной, называемой эмпирической линией регрессии Y по X (см. рис. (1.6) вычислим групповые средние (см. нижнюю строку корреляционной таблицы), где , l - число интервалов по переменной X. С этой целью применим метод наименьших квадратов, согласно которому неизвестные параметры и выбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних , вычисленных по формуле (1.5), от значений , найденных по уравнению регрессии (1.8), была минимальной: (1.9) на основании необходимого условия экстремума функции двух переменных S = S( , ) приравниваем к нулю ее частные производные, т.е. откуда после преобразований получим систему нормальных уравнений для определения параметров линейной регрессии: (1.10)На первый взгляд подходящим измерителем тесноты связи Y от X является коэффициент регрессии byx, ибо, как уже отмечено, он показывает, на сколько единиц в среднем изменяется Y, когда X увеличивается на одну единицу. Например, в полученной ранее зависимости он увеличится в 1000 раз, если величину основных производственных фондов X выразить не в млн руб., а в тыс. руб. Очевидно, что для «исправления» byx как показателя тесноты связи нужна такая стандартная система единиц измерения, в которой данные по различным характеристикам оказались бы сравнимы между собой. (1.29) показывает, на сколько величин sy изменится в среднем Y, когда X увеличится на одно sx Очевидно, что в случае а) зависимость между переменными менее тесная и коэффициент корреляции должен быть меньше, чем в случае б), так как точки корреляционного поля а) дальше отстоят от линии регрессии, чем точки поля б).Корреляционный анализ (корреляционная модель) - метод, применяемый тогда, когда данные наблюдений или эксперимента можно считать случайными и выбранными из совокупности, распределенной по многомерному нормальному закону. Основная задача корреляционного анализа, как отмечено выше, состоит в выявлении связи между случайными переменными путем точечной и интервальной оценок различных (парных, множественных, частных) коэффициентов корреляции. Дополнительная задача корреляционного анализа (являющаяся основной в регрессионном анализе) заключается в оценке уравнений регрессии одной переменной по другой. Рассмотрим простейшую модель корреляционного анализа - двумерную. Из свойств коэффициента корреляции следует, что является показателем тесноты связи лишь в случае линейной зависимости (линейной регрессии) между двумя переменными, получаемой, в частности, в соответствии с равенствами (1.41), (1.42) при их совместном нормальном распределении.В практических исследованиях о тесноте корреляционной зависимости между рассматриваемыми переменными судят фактически не по величине генерального коэффициента корреляции (который обычно неизвестен), а по величине его выборочного аналога r. Та
План
СОДЕРЖАНИЕ
Введение
Глава 1. Корреляционный анализ
1.1 Функциональная, статистическая и корреляционная зависимости
1.2 Линейная парная регрессия
1.3 Коэффициент корреляции
1.4 Основные положения корреляционного анализа. Двумерная модель
1.5 Проверка значимости и интервальная оценка параметров связи
1.6 Корреляционное отношение и индекс корреляции
1.7 Понятие о многомерном корреляционном анализе. Множественный и частный коэффициенты корреляции