Вычисление корреляционного отношения - Курсовая работа

бесплатно 0
4.5 70
Особенности методики построения корреляционной таблицы, вычисление с ее помощью параметров уравнения. Определение параболической регрессии по формуле Крамера. Оценка надежности корреляционного отношения, вариация факторного и результативного признака.


Аннотация к работе
Например, с повышением количества занимающихся в каком-либо виде спорта повышаются результаты в этом виде; осложнения во взаимоотношениях между игроками одной команды ухудшает ее результативность; с повышением интенсивности нагрузки у спортсмена повышается пульс; увеличивается скорость кровообращения ; регулярность тренировок, оптимально подобранные нагрузки по их виду, объему и интенсивности улучшают результаты спортсмена и т.д. Она направлен на то, чтобы на основе статистического материала выявить факт влияния одного признака на другой, установить полезность или вред этого влияния и оценить уверенность в полученных выводах. Корреляция - статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). Корреляция считается простой, когда речь идет об отношениях между двумя величинами или переменными (например, между потреблением и доходами), и множеством, если в ней участвуют три и более переменных (например, потребление, доходы, цены). Частичная К. определяет отношения между двумя переменными когда для третьей переменной берется определенная постоянная величина (например, корреляция между потреблением и доходами для данного возрастного класса участников).Управление корреляционной связи измеряет зависимость между вариацией результативного признака и вариации факторного признака.

Введение
В природе многие явления и процессы взаимосвязаны между собой. В физической культуре и спорте, в спортивной команде и в организме спортсмена тоже существует много взаимосвязей между различными признаками. Например, с повышением количества занимающихся в каком-либо виде спорта повышаются результаты в этом виде; осложнения во взаимоотношениях между игроками одной команды ухудшает ее результативность; с повышением интенсивности нагрузки у спортсмена повышается пульс; увеличивается скорость кровообращения ; регулярность тренировок, оптимально подобранные нагрузки по их виду, объему и интенсивности улучшают результаты спортсмена и т.д.

Влияние одних признаков на другие может быть положительным и отрицательным. Грамотный специалист должен хорошо разбираться в таких взаимосвязях в своей области, устранять или уменьшать негативное влияние и уметь своевременно и в достаточной мере использовать полезные взаимосвязи.

Некоторые методы математической статистики могут помочь любому специалисту выявить взаимосвязи, раскрыть их особенности. Одним из таких методов и является метод корреляционного анализа. Она направлен на то, чтобы на основе статистического материала выявить факт влияния одного признака на другой, установить полезность или вред этого влияния и оценить уверенность в полученных выводах. При этом различают два вида зависимости - функциональную и статистическую (корреляционную).

Корреляция - статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения значений одного или нескольких из этих величин приводят в систематическому изменению значений другой или других величин.

Корреляция считается простой, когда речь идет об отношениях между двумя величинами или переменными ( например, между потреблением и доходами), и множеством, если в ней участвуют три и более переменных (например, потребление, доходы, цены). Частичная К. определяет отношения между двумя переменными когда для третьей переменной берется определенная постоянная величина (например, корреляция между потреблением и доходами для данного возрастного класса участников). Математической мерой корреляции двух случайных величин служит коэффициент корреляции в теории вероятности и статистике - это показатель характера изменения двух случайных величин.

1. Построение корреляционной таблицы

Таблица 1. Исходные данные

X Y X Y X Y X Y X Y

0 185 24 85 53 2 85 40 121 180

2 180 24 90 55 4 87 45 123 174

3 175 27 75 57 0 89 35 125 185

5 170 28 82 59 2 90 64 127 196

7 160 29 64 63 5 92 60 129 200

8 155 30 70 64 2 95 83 130 196

10 140 33 58 67 8 98 94 132 210

12 140 34 50 69 10 100 100 134 220

12 145 36 40 70 4 103 112

14 125 38 30 72 6 105 120

14 118 38 25 75 10 108 125

15 124 40 23 77 15 110 140

17 120 42 25 77 20 112 146

19 100 45 14 79 25 114 135

20 95 46 12 81 30 115 154

Параболическая зависимость имеет вид: у=а bx cx2.

Для получения такого вида строят корреляционную таблицу.

Для того чтобы построить корреляционную таблицу , необходимо представить вариационный ряд (табл.1) в виде интервального ряда (табл.2). Для этого воспользуемся формулой величины интервала. h = (Xmax-Xmin)/ (1 3,2lg(n)) h = (Ymax- Ymin)/(1 3,2lg(n)) где Xmax, Ymax - максимальное значение изучаемого признака

Xmin, Ymin - минимальное значение изучаемого признака n = 72 - количество проб

В нашем случае: Xmax=134, Xmin=0

Ymax=220, Ymin=0

Таблица 2.

Границы интервалов для x: Границы интервалов для y: 0-20 0-32

20-40 32-64

40-60 64-96

60-80 96-128

80-100 128-160

100-120 160-192

120-140 192-224

В корреляционной таблице факторный признак X, располагают в строках, а результативный признак Y - в столбцах таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного значения X и Y.

Корреляционная таблица, а также расчет дополнительных величин представлен в таблице 2.

Таблица 3.

? -4 -3 -2 -1 0 1 2 my my ? my? 2

? 0-20 20-40 40-60 60-80 80-100 100-120 120-140

-4 0-32 3 8 10 1 22 -88 352

-3 32-64 4 6 10 -30 90

-2 64-96 1 5 2 8 -16 32

-1 96-128 5 1 1 3 10 -10 10

0 128-160 5 4 9 0 0

1 160-192 4 1 3 8 8 8

2 192-224 5 5 10 20

? 15 13 8 10 10 8 8 72 -126 512

?мх -60 -39 -16 -10 0 8 16 -101

?2mx 240 117 32 10 0 8 32 439

?3mx -960 -351 -64 -10 0 8 64 -1313

?4mx 3840 1053 128 10 0 8 128 5167

?m? -3 -35 -32 -40 -27 -2 13 -126

??2 m 13 105 128 160 79 4 23 512

??M? 12 105 64 40 0 -2 26 245

?2?m? -48 -315 -128 -40 0 -2 52 -481

??MY= ?my/?m 2064 751,998 128 160 576 1088 1568 6335,998

137,6 57,846 16 16 57,6 136 196 617,046

2. Вычисления параметров уравнения

2.1 С помощью корреляционной решетки

Уравнение регрессии в форме параболы второго порядка имеет вид (в координатах ? и ?) : ?= а’ b’ ? с’ ?2 (1)

2)Параметры этого уравнения определяют по способу наименьших квадратов, решая систему уравнений(2): ?m? = a’n b’? ? m c’? ? 2m

? ?m? = a’ ? ? m b’? ? 2m c’? ? 3m (2)

? 2?m? = a’? ? 2m b’? ? 3m c’?(? 2 )2m

Из таблицы 2 находим необходимые данные

N=72 ,? ? m = -101, ? ? 2m= 439, ? ? 3m= -1313, ?(? 2 )2m= 5167

Подставляем данные в систему уравнений(2), и получаем систему уравнений (А): -126= a’72-b’101 c’439

245= -a’ 101 b’439 -c’1313

-481= a’ 439 - b’ 1313 c’ 5167

Решая эту систему уравнений найдем a’,b’,c’: a’= -2,896 , b’=1,456 , c’= 0,523

Уравнение параболы имеет вид: ?= -2,896 1,456? 0,523?2

Произведя в уравнении параболы замену переменных и найдем уравнение параболической регрессии : Y=(y-144)/32;

X=(x-90)/20;

Подставив в уравнение вместо ?, ?, получим уравнение параболической регрессии: (y-144)/32= -2,896 1,456(x-90)/20 0,523((x-90)/20)2

Упростив, мы получим: У=0,042x2-5,202x-497,24

2.2 С помощью матриц по формуле Крамера

Определим параметры параболической регрессии по формуле Крамера

?m? = a’n b’? ? m c’? ? 2m

? ?m? = a’ ? ? m b’? ? 2m c’? ? 3m (2)

? 2?m? = a’? ? 2m b’? ? 3m c’?(? 2 )2m

Для нашей системы уравнений определитель будет иметь вид: А=

D=18313896

Дополнительные определители a,b,c: D1:= -53037696

D2:= 26656518

D3:= 9575106

Корни уравнения равны: a’ = D1 / D = -53037696/18313896=-2,896 b’ = D2 / D = 26656518/18313896=1,456 c’ = D3 / D = 9575106/18313896=0,523

Подставив, получим уравнение: Y=0,042x2-5,202x-497,24

3. Вычисление корреляционного отношения

Такая задача как измерение тесноты зависимости, для всех форм связи, в том числе и параболы, может быть решена при помощи вычисления эмпирического корреляционного отношения :

дисперсия в ряду выровненных значений результативного показателя;

средняя внутригрупповая дисперсия у.

Проведем дополнительные расчеты.

Определим средние значения у для каждой группы по х (по данным таблицы 2): У(10)=137,6

У(30)=57,846

У(50)=16

У(70)=16

У(90)=57.6

У(110)=136

Для значения у вычисляют дисперсия по группам по формуле: ? = ?(yi-yi)2*mi/?*mi ?10=(80-137,6)2*1 (112-137,6)2*5 (144-137,6)2*5 (176-137,6)2*4/15=846,507 ?30=(16-57,846)2*3 (48-57,846)2*4 (80-56,846)2*5 (112-57,846)2*1/13=848,284 ?50=(16-16)2*8/8=0 ?70=(16-16)2*10/10=0 ?90=(16-57,6)2*1 (48-57,6)2*6 (80-57,6)2*2 (112-57,6)2*1/10=624,64 ?110=(112-136)2*3 (144-136)2*4 (176-136)2*1/8=448 ?130=(176-196)2*3 (208-196)2*5/8=240

Средневзвешенное значение дисперсии показывает рассеяние содержания уза счет прочих факторов, кроме х. Оно вычисляется по формуле: ?2 = ?(? i)2*mi/?*mi ?2 = (846,507 848,284 624,64 448 240)/72 =41,77

Влияние содержания х на содержание у отражает межгрупповая дисперсия: ?2=?(yi-yi)2*mi/?*n, где у среднее вычисляется по формуле: у=?yi*mi/n ?2=(846,507*15) (848,284*13) (0*8) (0*10) (624,64*10) (448*8) (240*8)/72=492,77

Среднее значение у в целом по совокупности данных: Тогда: =3653,062

Общую дисперсию находим по правилу сложения дисперсий

Тогда корреляционное отношение равно: Корреляционное отношение измеряет близость эмпирической линии связи к теоретической. Значение корреляционного отношения, которое мы получили равно 0.88 ближе к 1, свидетельствует о том, что связь является тесной.

4. Оценка надежности корреляционного отношения

Значимость корреляционного отношения определим с использованием критерия Стьюдента. Расчет t-критерия проводится по формуле:

Расчет: Табличное значение t-критерия при уровне значимости 0,88 и степенях свободы 72-2=70 равно 1,989. Расчетное значение выше критического, следовательно, корреляционное отношение значимо.

5. Построение линии регрессии

Найдем теоретические значения Ут. Для этого воспользуемся уравнением параболической регрессии: У=0,042x2-5.202x-497.24

Составим таблицу: Таблица 4.

Х 10 30 50 70 90 110 130

Уп. 137,6 57,846 16 16 57,6 136 196

Ут. 135,424 62,048 23,04 18,4 48,128 112,224 210,688

Вывод
Управление корреляционной связи измеряет зависимость между вариацией результативного признака и вариации факторного признака. Меры тесноты связи измеряют долю вариации результативного признака, которая связана корреляционно с вариацией факторного признака. Интерпретировать корреляционные показатели следует строго в терминах вариации ( различий в пространстве) отклонения от средней величины.

Корреляционное отношение измеряет близость эмпирической линии связи к теоретической. В моем случае значение корреляционного отношения ?=0,88 - по шкале Чеддока - это весьма высокая связь.

Список литературы
корреляционный параболический регрессия крамер

1. Статистика: учебник. Под ред. И.И. Елисеевой. - М.: Высшее образование, 2008. - 566 с.

2. Бочаров П.П., Печинкин А.В. Теория вероятностей. Математическая статистика. - М.: Гардарика, 1998. - 328 с.

3. Лекции по теории вероятностей. Елисеев В.М.

4. Лекции по статистике. Елисеев В.М.

5. Яковлева Н.В., Венсковская В.И. теория вероятностей и математическая статистика. - М.: РУДН, 2009 - 130 с.

Размещено на .ru
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?