Определение понятия дисперсионного анализа. Создания выборок и проверка нормальности распределения результативного признака. Описание методов однофакторного дисперсионного анализа для несвязанных и связанных выборок, их графическое представление.
В зарубежной литературе дисперсионный анализ часто обозначается как ANOVA, что переводится как анализ вариативности (Analysis of Variance). Вариативность, обусловленная действием исследуемых переменных и их взаимодействием, соотносится со случайной вариативностью. В дисперсионном анализе возможны два принципиальных пути разделения всех исследуемых переменных на независимые переменные (факторы) и зависимые переменные (результативные признаки). Первый путь состоит в том, что мы совершаем какие-либо воздействия на испытуемых или учитываем какие-либо не зависящие от нас воздействия на них, и именно эти воздействия считаем независимыми переменными, или факторами, а исследуемые признаки рассматриваем как зависимые переменные, или результативные признаки. По тем или иным причинам мы решаем, что одни признаки могут рассматриваться скорее как факторы, а другие - как результат действия этих факторов.Лучше всего для каждого испытуемого создать отдельную карточку, куда были бы занесены данные по всем исследованным признакам. Потребуется создавать, быть может, не один, а множество дисперсионных комплексов, различающихся как по факторам, так и по результативным признакам.Комплекс, в котором каждая ячейка представлена одинаковым количеством наблюдений, называется равномерным. Равномерность комплекса позволяет нам обойти требование равенства дисперсий в каждой из ячеек комплекса (Шеффе Г., 1980). Равномерные комплексы позволяют также избежать значительных трудностей, которые неизбежно возникают при обсчете неравномерных, или неортогональных, комплексов.Строго говоря, перед тем, как применять дисперсионный анализ, мы должны убедиться в нормальности распределения результативного признака. Нормальность распределения результативного признака можно проверить путем расчета показателей асимметрии и эксцесса и сопоставления их с критическими значениями (Пустыльник Е. И., 1968* Плохинский Н. А., 1970 и др.). Действовать будем по следующему алгоритму: а) определим показатели асимметрии и эксцесса по формулам Н.А. б) рассчитаем критические значения показателей асимметрии и эксцесса по формулам Е.И. Показатели асимметрии и эксцесса свидетельствуют о достоверном отличии эмпирических распределений от нормального в том случае, если они превышают по абсолютной величине свою ошибку репрезентативности в 3 и более раз: В данном случае: Мы видим, что оба показателя не превышают в три раза свою ошибку репрезентативности, из чего мы можем заключить, что распределение данного признака не отличается от нормального.Плохинский указывает на возможность следующих преобразований: 1) все наблюдаемые значения можно разделить на одно и то же число k, например перевести показатели из миллиметров в сантиметры и т.п.; 4) можно сделать двойное преобразование: из каждого значения вычесть число А, а полученный результат разделить на другое число k. Средние величины изменяются, но их можно восстановить, умножая среднюю величину на число k или деля ее на k (варианты 1 и 2), или прибавляя к средней число А (вариант 3) и т. п.Метод однофакторного дисперсионного анализа применяется в тех случаях, когда исследуются изменения результативного признака под влиянием изменяющихся условий или градаций какого-либо фактора.Работу начинаем с того, что представляем полученные данные в виде столбцов индивидуальных значений.H0: Различия между градациями фактора (разными условиями) являются не более выраженными, чем случайные различия внутри каждой группы.2 показана кривая изменения объема воспроизведения слов при разной скорости их предъявления (см.Условие равенства дисперсий выполняется при использовании предлагаемой схемы расчета за счет выравнивания количества наблюдений в каждом из условий (градаций). Характерно, что зарубежные руководства, в общем ссылаясь на необходимость нормального распределения данных для дисперсионного анализа, при рассмотрении конкретных схем и примеров к этому вопросу уже не возвращаются и никаких данных о распределении признака в выборке в целом или в той ее части, которая составляет дисперсионный комплекс, не приводят (см. Первой группе слова предъявлялись с низкой скоростью - 1 слово в 5 секунд, второй группе со средней скоростью - 1 слово в 2 секунды, и третьей группе с большой скоростью - 1 слово в секунду. Однако всякие различия между испытуемыми внутри каждой группы объясняются какими-то другими, не относящимися к делу переменными, будь то индивидуальные различия между отдельными испытуемыми или неконтролируемые факторы, заставляющие их реагировать различным образом Критерий F позволяет проверить гипотезы: H0: Различия в объеме воспроизведения слов между группами являются не более выраженными, чем случайные различия внутри каждой группы. Н1: Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы.Метод дисперсионного анализа для связанных выборок применяется в тех случаях, когда исследуется влияние разных градаций фактора или разных условий на одну и ту же выборку испытуемы