Особенности методики построения корреляционной таблицы, вычисление с ее помощью параметров уравнения. Определение параболической регрессии по формуле Крамера. Оценка надежности корреляционного отношения, вариация факторного и результативного признака.
Аннотация к работе
Например, с повышением количества занимающихся в каком-либо виде спорта повышаются результаты в этом виде; осложнения во взаимоотношениях между игроками одной команды ухудшает ее результативность; с повышением интенсивности нагрузки у спортсмена повышается пульс; увеличивается скорость кровообращения ; регулярность тренировок, оптимально подобранные нагрузки по их виду, объему и интенсивности улучшают результаты спортсмена и т.д. Она направлен на то, чтобы на основе статистического материала выявить факт влияния одного признака на другой, установить полезность или вред этого влияния и оценить уверенность в полученных выводах. Корреляция - статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). Корреляция считается простой, когда речь идет об отношениях между двумя величинами или переменными (например, между потреблением и доходами), и множеством, если в ней участвуют три и более переменных (например, потребление, доходы, цены). Частичная К. определяет отношения между двумя переменными когда для третьей переменной берется определенная постоянная величина (например, корреляция между потреблением и доходами для данного возрастного класса участников).Управление корреляционной связи измеряет зависимость между вариацией результативного признака и вариации факторного признака.
Введение
В природе многие явления и процессы взаимосвязаны между собой. В физической культуре и спорте, в спортивной команде и в организме спортсмена тоже существует много взаимосвязей между различными признаками. Например, с повышением количества занимающихся в каком-либо виде спорта повышаются результаты в этом виде; осложнения во взаимоотношениях между игроками одной команды ухудшает ее результативность; с повышением интенсивности нагрузки у спортсмена повышается пульс; увеличивается скорость кровообращения ; регулярность тренировок, оптимально подобранные нагрузки по их виду, объему и интенсивности улучшают результаты спортсмена и т.д.
Влияние одних признаков на другие может быть положительным и отрицательным. Грамотный специалист должен хорошо разбираться в таких взаимосвязях в своей области, устранять или уменьшать негативное влияние и уметь своевременно и в достаточной мере использовать полезные взаимосвязи.
Некоторые методы математической статистики могут помочь любому специалисту выявить взаимосвязи, раскрыть их особенности. Одним из таких методов и является метод корреляционного анализа. Она направлен на то, чтобы на основе статистического материала выявить факт влияния одного признака на другой, установить полезность или вред этого влияния и оценить уверенность в полученных выводах. При этом различают два вида зависимости - функциональную и статистическую (корреляционную).
Корреляция - статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом, изменения значений одного или нескольких из этих величин приводят в систематическому изменению значений другой или других величин.
Корреляция считается простой, когда речь идет об отношениях между двумя величинами или переменными ( например, между потреблением и доходами), и множеством, если в ней участвуют три и более переменных (например, потребление, доходы, цены). Частичная К. определяет отношения между двумя переменными когда для третьей переменной берется определенная постоянная величина (например, корреляция между потреблением и доходами для данного возрастного класса участников). Математической мерой корреляции двух случайных величин служит коэффициент корреляции в теории вероятности и статистике - это показатель характера изменения двух случайных величин.
1. Построение корреляционной таблицы
Таблица 1. Исходные данные
X Y X Y X Y X Y X Y
0 185 24 85 53 2 85 40 121 180
2 180 24 90 55 4 87 45 123 174
3 175 27 75 57 0 89 35 125 185
5 170 28 82 59 2 90 64 127 196
7 160 29 64 63 5 92 60 129 200
8 155 30 70 64 2 95 83 130 196
10 140 33 58 67 8 98 94 132 210
12 140 34 50 69 10 100 100 134 220
12 145 36 40 70 4 103 112
14 125 38 30 72 6 105 120
14 118 38 25 75 10 108 125
15 124 40 23 77 15 110 140
17 120 42 25 77 20 112 146
19 100 45 14 79 25 114 135
20 95 46 12 81 30 115 154
Параболическая зависимость имеет вид: у=а bx cx2.
Для получения такого вида строят корреляционную таблицу.
Для того чтобы построить корреляционную таблицу , необходимо представить вариационный ряд (табл.1) в виде интервального ряда (табл.2). Для этого воспользуемся формулой величины интервала. h = (Xmax-Xmin)/ (1 3,2lg(n)) h = (Ymax- Ymin)/(1 3,2lg(n)) где Xmax, Ymax - максимальное значение изучаемого признака
Xmin, Ymin - минимальное значение изучаемого признака n = 72 - количество проб
В нашем случае: Xmax=134, Xmin=0
Ymax=220, Ymin=0
Таблица 2.
Границы интервалов для x: Границы интервалов для y: 0-20 0-32
20-40 32-64
40-60 64-96
60-80 96-128
80-100 128-160
100-120 160-192
120-140 192-224
В корреляционной таблице факторный признак X, располагают в строках, а результативный признак Y - в столбцах таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного значения X и Y.
Корреляционная таблица, а также расчет дополнительных величин представлен в таблице 2.
Такая задача как измерение тесноты зависимости, для всех форм связи, в том числе и параболы, может быть решена при помощи вычисления эмпирического корреляционного отношения :
дисперсия в ряду выровненных значений результативного показателя;
средняя внутригрупповая дисперсия у.
Проведем дополнительные расчеты.
Определим средние значения у для каждой группы по х (по данным таблицы 2): У(10)=137,6
У(30)=57,846
У(50)=16
У(70)=16
У(90)=57.6
У(110)=136
Для значения у вычисляют дисперсия по группам по формуле: ? = ?(yi-yi)2*mi/?*mi ?10=(80-137,6)2*1 (112-137,6)2*5 (144-137,6)2*5 (176-137,6)2*4/15=846,507 ?30=(16-57,846)2*3 (48-57,846)2*4 (80-56,846)2*5 (112-57,846)2*1/13=848,284 ?50=(16-16)2*8/8=0 ?70=(16-16)2*10/10=0 ?90=(16-57,6)2*1 (48-57,6)2*6 (80-57,6)2*2 (112-57,6)2*1/10=624,64 ?110=(112-136)2*3 (144-136)2*4 (176-136)2*1/8=448 ?130=(176-196)2*3 (208-196)2*5/8=240
Средневзвешенное значение дисперсии показывает рассеяние содержания уза счет прочих факторов, кроме х. Оно вычисляется по формуле: ?2 = ?(? i)2*mi/?*mi ?2 = (846,507 848,284 624,64 448 240)/72 =41,77
Влияние содержания х на содержание у отражает межгрупповая дисперсия: ?2=?(yi-yi)2*mi/?*n, где у среднее вычисляется по формуле: у=?yi*mi/n ?2=(846,507*15) (848,284*13) (0*8) (0*10) (624,64*10) (448*8) (240*8)/72=492,77
Среднее значение у в целом по совокупности данных: Тогда: =3653,062
Общую дисперсию находим по правилу сложения дисперсий
Тогда корреляционное отношение равно: Корреляционное отношение измеряет близость эмпирической линии связи к теоретической. Значение корреляционного отношения, которое мы получили равно 0.88 ближе к 1, свидетельствует о том, что связь является тесной.
4. Оценка надежности корреляционного отношения
Значимость корреляционного отношения определим с использованием критерия Стьюдента. Расчет t-критерия проводится по формуле:
Расчет: Табличное значение t-критерия при уровне значимости 0,88 и степенях свободы 72-2=70 равно 1,989. Расчетное значение выше критического, следовательно, корреляционное отношение значимо.
5. Построение линии регрессии
Найдем теоретические значения Ут. Для этого воспользуемся уравнением параболической регрессии: У=0,042x2-5.202x-497.24
Управление корреляционной связи измеряет зависимость между вариацией результативного признака и вариации факторного признака. Меры тесноты связи измеряют долю вариации результативного признака, которая связана корреляционно с вариацией факторного признака. Интерпретировать корреляционные показатели следует строго в терминах вариации ( различий в пространстве) отклонения от средней величины.
Корреляционное отношение измеряет близость эмпирической линии связи к теоретической. В моем случае значение корреляционного отношения ?=0,88 - по шкале Чеддока - это весьма высокая связь.
Список литературы
корреляционный параболический регрессия крамер
1. Статистика: учебник. Под ред. И.И. Елисеевой. - М.: Высшее образование, 2008. - 566 с.
2. Бочаров П.П., Печинкин А.В. Теория вероятностей. Математическая статистика. - М.: Гардарика, 1998. - 328 с.
3. Лекции по теории вероятностей. Елисеев В.М.
4. Лекции по статистике. Елисеев В.М.
5. Яковлева Н.В., Венсковская В.И. теория вероятностей и математическая статистика. - М.: РУДН, 2009 - 130 с.