Описание параметрических и непараметрических методов, их применения и основных критериев: сравнение двух независимых и К-независимых выборок. Критерии знаков, Вилкоксона, серий, биномиальный, Колмогорова-Смирнова. Выполнение контрольных заданий.
· подсчет числа значений одного распределения, которые превышают значения другого распределения; Разница заключается в том, что t-критерии ориентированы на нормальные и близкие к ним распределения, а критерий Манна-Уитни - на распределения, отличные от нормальных. Меню Analyze (Анализ) ®Nonparametric Tests ® Independent Samples (Непараметрические методы ®Две независимые выборки)® окно Two-Independent Samples Tests (Критерии для двух независимых выборок) В поле Group 1 (Группа 1) введите значение 1, в поле Croup 2 (Группа 2) - значение 2 ® Continue ®окно Two-Independent Samples Test (Критерий для двух независимыхвыборок)® ОК®окно вывода.
План
Содержание
Введение
Введение
параметрический биномиальный вилкоксон
Параметрический критерий - это метод статистического вывода, который применяется в отношении параметров генеральной совокупности.
Самым главным условием для параметрических методов является нормальность распределения переменных и, как следствие, правомерность применения таких статистик, как среднее значение и стандартное отклонение. Несмотря на то, что некоторые параметрические методы позволяют анализировать данные, распределенные по другим законам (например, биномиальному или Пуассона), непараметрические методы в этом смысле гораздо функциональнее, т.к. вообще не связывают анализ с каким-либо законом распределения.
Таким образом, непараметрические методы позволяют исследовать данные без каких-либо допущений о характере распределения переменных, в том числе - при нарушении требования нормальности распределения.
Так как эти методы предназначены для номинативных и ранговых переменных, в отношении которых недопустимо применение арифметических операций, они основаны на различных дополнительных вычислениях, среди которых можно отметить: · ранжирование переменных;
· подсчет числа значений одного распределения, которые превышают значения другого распределения;
· применение весовых сравнений;
· определение степени отклонения распределения от случайного или биноминального распределения;
· сравнение групп путем вычисления частот значений, лежащих выше или ниже главной медианы.
Наиболее часто применяемые непараметрические методы: · Сравнение двух независимых выборок (критерий Манна-Уитни), проводится по двум критериям: § Критерий знаков
Процедуры непараметрических методов имеют дополнительную возможность расчета точного значения р-уровня значимости, если диалоговое окно метода содержит кнопку Exact... (Точный...). При ее нажатии появляется окно Exact Tests (Точные методы).
По умолчанию переключатель в этом окне установлен в положении Asymptotic only (Только приближенный), что соответствует определению приблизительной значимости по традиционным критериям.
Иногда данные не соответствуют требованиям со стороны того или иного критерия, например, численность одной из сравниваемых выборок может быть слишком мала. Тогда при помощи соответствующего переключателя можно воспользоваться одним из двух точных методов расчета значимости: метод статистических испытаний «Монте-Карло» (Monte-Carlo) точный метод (Exact). Метод Exact (Точный) по определению, дает более точные результаты.
Однако в некоторых случаях его расчет слишком трудоемок даже для компьютера, тогда используется метод Monte-Carlo (Монте-Карло).
Сравнение двух независимых выборок
Критерий Манна-Уитни (Mann-Whitney), или U-критерий - устанавливает различия между двумя независимыми выборками по уровню выраженности порядковой переменной. По назначению аналогичен t-критерию для независимых выборок.
Разница заключается в том, что t-критерии ориентированы на нормальные и близкие к ним распределения, а критерий Манна-Уитни - на распределения, отличные от нормальных.
В частном случае критерий Манна-Уитни можно применять и для нормально распределенных данных, однако он менее чувствителен к различиям (является менее мощным), чем t-критерий.
Задание 1. Выполнить сравнение успеваемости юношей и девушек в выпускном классе
Пол учащихся определяется значением переменной Пол, а успеваемость - переменной Отметка2. При реализации метода программа сначала ранжирует все объекты без учета принадлежности к сравниваемым группам, а затем вычисляет средние ранги для каждой из двух групп. Чем выше средний ранг группы, тем выше ее успеваемость. После нахождения средних рангов определяется р-уровень.
1. Загрузите файл ex01.sav
2. Меню Analyze (Анализ) ®Nonparametric Tests ® Independent Samples (Непараметрические методы ®Две независимые выборки)® окно Two-Independent Samples Tests (Критерии для двух независимых выборок)
3. Переместите переменную Отметка2 в список Test Variable List (Список тестируемых переменных)
4. Переместите переменную Пол в поле Grouping Variable (Группирующая переменная)
5. Щелкните на кнопке Define Croups (Определение групп) ®окно определения групп
6. В поле Group 1 (Группа 1) введите значение 1, в поле Croup 2 (Группа 2) - значение 2 ® Continue ®окно Two-Independent Samples Test (Критерий для двух независимыхвыборок)® ОК®окно вывода.
Анализ результатов
Результаты работы программы будут представлены в таблицах Ранги и Статистики критерия
Средний ранг (Mean Rank) для девушек равен 56,21, а для юношей - 41,56. Это значит, что у девушек успеваемость выше, чем у юношей.
Величина U-критерия (Mann-Whitney U) равна 841.
Значение Z является нормализованным, связанным с уровнем значимости р = 0,014.
Величина уровня значимости Sig.(2-tailed))<0,05, то вывод о том, что успеваемость девушек выше успеваемости юношей достоверен.
Сравнение двух зависимых выборок
Основные методы, которые используются для сравнения двух зависимых выборок: · критерий знаков (sign test)
· критерий Вилкоксона (Wilcoxon test).
Критерий знаков
Критерий знаков основан на подсчете числа отрицательных и положительных разностей между повторными измерениями, позволяет сравнить два измерения переменной на одной выборке.
Например, «до» и «после», по уровню ее выраженности путем сопоставления количества положительных и отрицательных разностей (сдвигов) значений. Подсчитывается число положительных, отрицательных и нулевых разностей и затем вычисляется нормализованное z-значение и р-уровень значимости.
Задание 2. Сравнить результаты учащихся по второму и четвертому тестам с помощью критерия знаков
Для того чтобы продемонстрировать применение критерия, сравним результаты учащихся по второму (Тест2) и четвертому (Тест4) тестам.
Для каждого объекта сначала определяется знак разности значений.
Для первого объекта значение Тест2 равно 7, а значение Тест4 - 10. Сравнение этих значений даст отрицательный знак (7 - 10 = 3 < 0).
Для четвертого объекта значения переменных Тест2 и Тест4 составляют 9 и 6 соответственно - знак разности будет положительным (9 - 6 > 0).
1. Загрузите файл ex01.sav
2. Меню Analyze (Анализ) ®Nonparametric Tests ® Related Samples (Непараметрические методы ®Две зависимые выборки)® окно Two Related Samples Tests (Критерии для двух зависимых выборок)
3. Для применения критерия знаков выполните следующую последовательность действий: · В группе Test Type (Тип критерия) установите флажок Sign (Знаков) и сбросьте флажок Wilcoxon (Вилкоксона)
· Щелкните на переменной Тест2. Ее имя окажется возле метки Variable 1 (Переменная 1) в области Current Selections (Текущий выбор).
· Нажмите клавишу Ctrl и щелкните на переменной Тест4. Ее имя окажется возле метки Variable 2 (Переменная 2) в области Current Selections (Текущий выбор)
· Переместите переменные Отметка2 в список Test Pair(s) List (Список тестируемых пар)®ОК®окно определения групп
Анализ результатов
Результаты работы программы будут представлены в таблицах Частоты и Статистики критерия.
Полученные результаты говорят о том, что в 39 случаях значения переменной Тест2 оказались меньшими, чем значения переменной Тест4, в 57 случаях значения переменной Тест2 превысили значения переменной Тест4, и 4 раза было установлено равенство значений обеих переменных.
Стандартизованное значение с составляет -1,735, а уровень значимости р = 0,083, т.е. различи между результатами тестов Тест4 и Тест2 статистически недостоверны. Переменные Тест1 и тест2 - метрические, поэтому лучше к ним применить t-критерий для зависимых выборок, т.к. он показал бы, что средние значения Тест4 и Тест2 различаются с уровнем значимости р = 0 01.
Вывод: статистические возможности t-критерия в отношении переменных значительно выше, чем возможности критерия знаков.
Недостаток критерия знаков - не учитывает величину разности двух значений (для него нет разницы между результатами сравнения пар (10; 0) и (6; 5); в обоих случаях знак разности будет положительным), а ведь абсолютное значение разности также характеризует соотношение распределений.
Для того чтобы учесть это, применяется критерий Вилкоксона.
Критерий Вилкоксона
Критерий Вилкоксона - в дополнении к знакам разности учитывает их величину, основан на подсчете абсолютных разностей между парами значений с последующим их ранжированием, затем вычисляются средние значения рангов для положительных и отрицательных разностей (сдвигов). Уровень значимости подсчитывается на основе стандартизованного значения.
Задание 3: Сравнить результаты учащихся по второму и четвертому тестам с помощью критерия Вилкоксона
1. Загрузите файл ex01.sav
2. Меню Analyze (Анализ) ®Nonparametric Tests ® Related Samples (Непараметрические методы ®Две зависимые выборки)® окно Two Related Samples Tests (Критерии для двух зависимых выборок)®очистите окно (Reset)
3. Для применения критерия Вилкоксона выполните следующую последовательность действий (флажок Wilcoxon установлен по умолчанию): · Щелкните на переменной Тест2. Ее имя окажется возле метки Variable 1 (Переменная 1) в области Current Selections (Текущий выбор).
· Нажмите клавишу Ctrl и щелкните на переменной Тест4. Ее имя окажется возле метки Variable 2 (Переменная 2) в области Current Selections (Текущий выбор)
· Переместите переменные Отметка2 в список Test Pair(s) List (Список тестируемых пар)®ОК®окно определения групп
Анализ результатов
Результаты работы программы будут представлены в таблицах Ранги и Статистики критерия.
Результаты применения критерия Вилкоксона и критерия знаков очень похожи.
Частота каждого из трех исходов N осталась неизменной. Информация о каждом из исходов (кроме равенства) теперь включает также среднее и суммарное значения для соответствующих рангов.
Визуальный анализ исходных данных показывает, что значения теста 4 (осведомленность) в целом несколько превышают значения теста 2 (числовые ряды). Это показывает и величина Z = -2,493, которая значительно превосходит по модулю соответствующее значение, полученное ранее для критерия знаков и уровень значимости р = 0,013 (статистическая достоверность различий).
Вывод: критерий Вилкоксона является более чувствительным к различиям (более мощным), чем критерий знаков. Тем не менее он оказывается несколько хуже t-критерия (уровень значимости 0,01), это подтверждает предпочтительность последнего для анализа метрических данных.
Критерий серий применяется для анализа последовательности объектов (явлений, событий), упорядоченных во времени или порядке возрастания (убывания) значений измеренного признака, критерий требует представления последовательности в виде бинарной переменной, т.е. чередования событий 0 и 1. Серия - последовательность однотипных событий, непосредственно перед и после которой произошли события другого типа.
Математическая идея критерия основа на подсчете числа серий в упорядоченной последовательности событий двух
Гипотеза о случайном распределении событий случайном распределении событий 1 среди событий 0 может быть отклонена, если количество серий либо слишком мало (однотипные события имеют тенденцию к группированию), либо слишком велико (события 0 и 1 имеют тенденцию к чередованию).
Задание 4. Выполните проверку гипотезы о неслучайном чередовании юношей и девушек (переменная Пол) в списке испытуемых в файле ex0l.sav
Для задания точки раздела значений переменной на 2 категории предназначены флажок и поле Custom (Настройка). В данном задании в одну группу надо включить значения переменной Пол, равные 1, а в другую группу - значения, равные 2.
3. Выделите переменную Пол и переместите ее в поле Test Variable List (Список тестируемых переменных)
4. В группе Cut Point (Точка деления) установите флажок Custom (Настройка), введите в расположенное рядом поле значение 2 и сбросьте флажок Median (Медиана)®ОК® окно вывода.
Анализ результатов
Результаты работы программы будут представлены в таблице Критерий серий
Количество серий равно 49. В результаты включено значение точки деления, введенное в поле Custom (Настройка).
Величина Z и соответствующая значимость зависят от числа серий. Число серий преобразуется к z-значению, для которого определяется р-уровень. Большое значение р-уровня (0,929) свидетельствует о том, что чередование юношей и девушек в файле ex01.sav является случайным.
Статистически значимый результат свидетельствовал бы о том, что чередование юношей и девушек в файле является неслучайным.
Если при этом число серий было бы слишком велико, это свидетельствовало бы о том, что после юноши с высокой долей вероятности следует девушка (и наоборот).
При малом значении числа серий можно было бы сделать вывод о том, что более вероятно группирование испытуемых в списке по половому признаку (после юноши чаще следует юноша, а после девушки - девушка).
Биномиальный критерий
Назначение биномиального критерия - определение вероятности того, что наблюдаемое распределение не отличается от ожидаемого (заданного) биномиального распределения.
Свойством биномиального распределения является заранее заданное соотношение вероятностей двух взаимоисключающих событий (обычно - равновероятное).
Например, при многократном подбрасывании «правильной» монеты вероятности выпадения «орлов» и «решек» подчиняется биномиальному распределению.
Задание 5. Определите, является ли распределение проверку юношей и девушек в выборке биномиальным
1. Загрузите файл ex01.sav
В файле собраны данные о 61 ученице и 39 учениках, проверить отличается ли статистически достоверно это распределение (наблюдаемое) от ожидаемого (теоретически равновероятного соотношения.
3. Выделите переменную Пол и переместите ее в поле Test Variable List (значение Test Proportion по умолчанию равно 0,5).
4. В группе Cut Point (Точка деления) установите флажок Custom (Настройка), введите в расположенное рядом поле значение 2 и сбросьте флажок Median (Медиана)®ОК® окно вывода.
Анализ результатов
Результаты работы программы будут представлены в таблице Биномиальный критерий
Ожидаемая пропорция для биномиального теста равна 0,5 для обеих групп. Наблюдаемая пропорция для каждой из групп определяется как отношение размера группы (N) к размеру выборки (100).
Наблюдаемые пропорции отличаются от 0,5: 0,39 для мужчин и 0,61 для женщин.
Уровень значимости 0,035, показывает статистически достоверное отличие исследуемого распределения от биномиального (равновероятного).
Проверить отличие наблюдаемого распределения от любого другого биномиального распределения, можно задав нужные ожидаемые пропорции в поле Test Proportion (Ожидаемое соотношение).
Критерий Колмогорова-Смирнова для одной выборки позволяет определить, отличается ли заданное распределение от нормального (эксцесс и асимметрия распределения равны 0), равномерного (значения распределены с одинаковой плотностью, например, как у целых чисел от 1 до 1000), Пуассона (среднее значение и дисперсия равны l; при больших значениях l. распределение Пуассона приближается к нормальному) или экспоненциального.
Суть метода - сравнение эмпирического (наблюдаемого) распределения накопленных частот выборки с теоретическим (ожидаемым) распределением накопленных частот (нормальным, Пуассона и т.д.).
2. Меню Analyze (Анализ) ®Nonparametric Tests ® 1-Simple K-S (Непараметрические критерии® Критерий К-С для одной выборки) ®окно One Simple Kolmogorov-Smirnov Test (Критерий Колмогорова-Смирнова для одной выборки)
Выделите переменную Отметка1 и переместите ее в поле Test Variable List ®ОК® окно вывода.
Анализ результатов
Результаты работы программы будут представлены в таблице Одновыборочный критерий Колмогорова-Смирнова
В первой строке таблицы приведен объем выборки (N); далее следуют Среднее (Меап) и Стд. отклонение (Std. Dev).
В строке Разности экстремумов (Most Extreme Difference) приведены Модуль (Absolute), а также Положительные (Positive) и Отрицательные (Negative) отклонения исследуемого распределения от теоретического (в данном случае, нормального).
Строка Kolmogorov-Smirnov Z (Статистика Z Колмогорова-Смирнова) содержит Z-значение, уровень значимости которого равен 0,685 (последняя строка), что означает, что распределение значений переменной Отметка1 статистически не отличается от нормального.
Критерий хи-квадрат для одной выборки
Критерий c2 для одной выборки немного отличается от рассмотренного ранее критерия c2 для таблиц сопряженности. В данном случае в качестве ожидаемого (теоретического) распределения обычно выступает равномерное распределение объектов по градациям переменной, в отношении которой применяется критерий.
Далее будет приведен пример применения критерия c2 к переменной Вуз.
Число объектов (N) в файле ех01.sav - 100, переменная Вуз имеет 4 градации, ожидаемые частоты для каждой градации равны 100/4=25.
Применение данного критерия допускает задание не только равномерного ожидаемого распределения, но и любого другого.
Например, можно проверить гипотезу о том, что соотношение учащихся, предпочитающих 4 категории специализаций, соотносятся как 20:20:30:30. Для этого в группе Expected Values (Ожидаемые значения) следует установить переключатель Values (Значения), а затем при помощи поля и кнопки Add последовательно ввести в список значения 20, 20, 30, 30. После этих действий ожидаемые частоты изменятся в соответствии с заданными пропорциями.
3. Выделите переменную Вуз и переместите ее в поле Test Variable List ®ОК® окно вывода.
Анализ результатов
Результаты работы программы будут представлены в таблице Вуз и Статистики критерия.
Таблица Вуз показывает заметные различия наблюдаемых и ожидаемых частот. Разность между наблюдаемыми и ожидаемыми частотами называется остатком (Residual).
Число степеней свободы (df) определяется как число градаций переменной, уменьшенное на 1.
Уровень значимости (р = 0,002) свидетельствует о статистически достоверном отличии наблюдаемого распределения предпочтений от равномерного распределения.
Сравнение К-независимых выборок и критерий Краскала-Уоллеса
Для сравнения более двух независимых выборок по уровню выраженности переменной применяется несколько критериев: 1. Н-критерий Краскала-Уоллеса (Kruskal-Wallis H), 2. Критерий медианы (Median)
Из них наибольшей чувствительностью к различиям обладает H-критерий Краскала-Уоллеса, который является непараметрическим аналогом однофакторного дисперсионного анализа, отличаясь от него в двух отношениях: 1. Сравнение средних рангов (а не на сравнении средних значений и дисперсий переменных). Вместо вычисления F-критерия на основе сравнения средних рангов с ожидаемыми значениями вычисляется критерий хи-квадрат. Для нормальных распределений однофакторный дисперсионный анализ обеспечивает более точные результаты, чем критерий Краскала-Уоллеса, который рекомендуется применять для распределений, отличающихся от нормального.
Н-критерий Краскала-Уоллеса сходен с U-критерием Манна-Уитни. Он оценивает степень пересечения (совпадения) нескольких рядов значений измеренного признака. Чем меньше совпадений, тем больше различаются ряды, соответствующие сравниваемым выборкам.
Критерия Краскала-Уоллеса представляет все значения сравниваемых выборок в виде одной общей последовательности упорядоченных (ранжированных) значений с последующим вычислением среднего ранга для каждой из выборок.
Если выполняется статистическая гипотеза об отсутствии различий, то можно ожидать, что все средние ранги примерно равны и близки к общему среднему рангу.
Задание 8: Сравнить три группы учащихся, отличающихся внешкольными увлечениями (переменная Хобби) и успеваемостью в выпускном классе (переменная Отметка2).
Загрузите файл ex01.sav
1. Меню Analyze (Анализ)®Nonparametric Tests®К Independent Samples (Непараметрические критерии® К независимых выборок)®окно Tests for Several Independent Samples (Критерии для нескольких независимых выборок)
2. Выделите переменную Отметка2 и переместите ее в поле Test Variable List (Список тестируемых переменных)®ОК® окно вывода.
3. Выделите переменную Хобби и переместите ее в поле Grouping Variable (Группирующая переменная).
4. Щелкните на кнопке Define Range (Определение диапазона)® окно Define Range.
5. В поле Minimum (Минимум) введите значение 1, в поле Maximum (Максимум), введите значение 3 ®Continue ®окно Tests for Several Independent Samples (Критерии для нескольких независимых выборок) ® ОК®окно вывода.
Флажок Kruskal-Wallis Н (Н-критерий Краскала-Уоллеса) установлен по умолчанию, поэтому ничего не нужно менять для выбора критерия.
Анализ результатов
Результаты работы программы будут представлены в таблицах Ранги и Статистики критерия
В таблице Ранги для каждой группы представлена ее численность и средний ранг. В таблице Статистики критерия указано значение критерия c2 , число степеней свободы и уровень статистической значимости.
Результаты обработки показывают статистически достоверную связь внешкольных увлечений учащихся с успеваемостью в выпускном классе.
Сравнение К зависимых выборок и критерий Фридмана
Критерий Фридмана - непараметрический аналог однофакторного дисперсионного анализа для повторных измерений. Он позволяет проверять гипотезы о различии более двух зависимых выборок (повторных измерений) по уровню выраженности изучаемой переменной.
В случаях повторных измерений изучаемого признака на небольших выборках и при отличии распределения от нормального, применять критерий Фридмана более эффективно, однофакторный дисперсионный анализ
Критерий Фридмана сходен с критерием Краскала-Уоллеса: 1. ранжирование ряда повторных измерений для каждого объекта выборки
2. вычисление суммы рангов для каждого из условий (повторных измерений).
Если выполняется статистическая гипотеза об отсутствии различий между повторными измерениями, то можно ожидать примерного равенства сумм рангов для этих условий. Чем больше различаются зависимые выборки по изучаемому признаку, тем больше эмпирическое значение вычисляемого значения критерия c2., по которому определяется р-уровень значимости.
Задание 9. Сравнить результаты тестов Тест1, Тест2, Тест3, Тест4, Тест5 для всех учащихся
3. Выделите переменную Тест1 и переместите ее в поле Test Variable List (Список тестируемых переменных)
4. Повторите предыдущее действие для переменных Тест2, Тест3, Тест4, Тест5 ®ОК® окно вывода.
Анализ результатов
Результаты работы программы будут представлены в таблицах Ранги и Статистики критерия
Средние ранги (Mean rank)определяются так: 1. Для каждого объекта значения сравниваемых переменных ранжируются.
2. Для каждой из сравниваемых переменных вычисляется средний ранг по всем объектам
Определяемый по критерию c2 уровень значимости Асимпт.знч. (Asymp.Sig) равен 0,000, который свидетельствует о статистически значимой разнице между пятью результатами тестирования.
Различаться может любая пара переменных, и без попарного сравнения невозможно выяснить, какие именно пары вносят значимый вклад в факт статистической достоверности результата.
Размещено на .ru
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы