Задачи которые решает корреляционный анализ. Определение формы связи - установление математической формы, в которой выражается связь. Измерение тесноты, т.е. меры связи между признаками с целью установления степени влияния данного фактора на результат.
Аннотация к работе
Корреляционный анализ решает две основные задачи: Первая задача заключается в определении формы связи, т.е. в установлении математической формы, в которой выражается данная связь.Определяющая роль в выборе формы связи между явлениями принадлежит теоретическому анализу. Так, например, чем больше размер основного капитала предприятия (факторный признак), тем больше при прочих равных условиях оно выпускает продукции (результативный признак). Параметр b называется коэффициентом регрессии и показывает, насколько в среднем отклоняется величина результативного признака у при отклонении величины факторного признаках на одну единицу.Применение методов корреляционного анализа дает возможность выражать связь между признаками аналитически - в виде уравнения - и придавать ей количественное выражение. Необходимо найти параметры a и b, что позволит определить теоретические значения Y для разных значений x. Математически доказано, что условие минимума обеспечивается, если параметры a и b, определяются при помощи системы двух нормальных уравнений, отвечающих требованию метода наименьших квадратов: Первое уравнение есть сумма всех первоначальных уравнений. Для определения параметров степенной функции вначале ее приводят к линейному виду путем логарифмирования: lg y=lg a blg x, а затем строят систему нормальных уравнений: Решив систему двух нормальных уравнений, находят логарифмы параметров логарифмической функции a и b, а затем и сами параметры a и b. Для определения параметров показательной функции ее также вначале приводят к линейному виду путем логарифмирования: lg y=lg a xlg b, а затем строят систему нормальных уравнений: Вычислив соответствующие данные и решив систему двух нормальных уравнений, находят параметры показательной функции a и b.Так как при корреляционной связи имеют дело не с приращением функции в связи с изменением аргумента, а с сопряженной вариацией результативных и факторных признаков, то определение тесноты связи, по существу, сводится к изучению этой сопряженности, т.е. того, в какой мере отклонение от среднего уровня одного признака сопряжено с отклонением другого. Это значит, что при наличии полной прямой связи все значения (х-X) и (у-Y) должны иметь одинаковые знаки, при полной обратной - разные, при частичной связи знаки в преобладающем числе случаев будут совпадать, а при отсутствии связи - совпадать примерно в равном числе случаев. Показатель остаточной, случайной дисперсии определяется по формуле: Она характеризует размер отклонений эмпирических значений результативного признака у от теоретических Y, т.е. случайную вариацию. Отношение случайной дисперсии к общей характеризует долю случайной вариации в общей вариации, а есть не что иное, как доля факторной вариации в общей, потому что по правилу сложения дисперсий общая дисперсия равна сумме факторной и случайной дисперсий: ?2=?2Y ?20. Подставим в формулу индекса корреляции соответствующие обозначения случайной, общей и факторной дисперсий и получим: Таким образом, индекс корреляции характеризует долю факторной вариации в общей: однако с той лишь разницей, что вместо групповых средних берутся теоретические значения Y.Например, выпуск продукции зависит не только от размера основного капитала, но и от уровня квалификации рабочих, состояния оборудования, обеспеченности и качества сырья и материалов, организации труда и т.д. В связи с этим возникает необходимость в изучении, измерении связи между результативным признаком, двумя и более факторными. Определение формы связи сводится обычно к отысканию уравнения связно с факторами x,z,w,...v. При определении тесноты связи для множественной зависимости пользуются коэффициентом множественной (совокупной) корреляции, предварительно исчислив коэффициенты парной корреляции. Так, при изучении связи между результативным признаком y и двумя факторными признаками - х и z, нужно предварительно определить тесноту связи между у и х, между у и z, т.е. вычислить коэффициенты парной корреляции, а затем для определения тесноты связи результативного признака от двух факторных исчислить коэффициент множественной корреляции по следующей формуле: где rxy, rzy, rzx - парные коэффициенты корреляции.Измерение тесноты связи при помощи дисперсионного и корреляционного анализа связано с определенными сложностями и требует громоздких вычислений. К ним относятся: коэффициент корреляции знаков Фехнера, коэффициент корреляции рангов, коэффициент ассоциации и коэффициент взаимной сопряженности. Коэффициент корреляции знаков основан на сопоставлении знаков отклонений от средней и подсчете числа случаев совпадения и несовпадения знаков, а не на сопоставлении попарно размеров отклонений индивидуальных значений факторного и результативного признаков от средней Коэффициент корреляции рангов исчисляется не по первичным данным, а по рангам (порядковым номерам), которые присваиваются всем значениям изучаемых признаков, расположенным в порядке их возрастания.