Введение в регрессионный анализ и планирование эксперимента. Типовые задачи практики статистического изучения зависимостей. Проведение исследования нелинейной, непараметрической и пошаговой регрессии. Анализ оценки степени тесноты связи переменных.
Аннотация к работе
Министерство образования республики Беларусь «Гомельский государственный университет имени Франциска Скорины»Современный уровень развития компьютерных и информационных технологий характеризуется возрастающей сложностью не только отдельных физических и программных компонентов, но и лежащих в основе этих технологий концепций и идей. Главная задача лекций состоит в выработке необходимых навыков логического мышления для взаимодействия с компьютерным интерфейсом, приобретении теоретических и практических базовых знаний в области пакетов анализа и обработки данных.Случайной величиной называется переменная величина, которая в зависимости от случая принимает различные значения с некоторой вероятностью. Закон распределения случайной величины показывает частоту ее тех или иных значений в общей их совокупности. Раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами называется корреляционным анализом. Теснота связи определяется с помощью коэффициента корреляции, который рассчитывается специальным образом и лежит в интервалах от минус единицы до плюс единицы. В случае, если значение коэффициента корреляции лежит в интервале от 0,9 до 0,6, то говорят, что имеет место слабая корреляционная зависимость.Для того, чтобы найти уравнение регрессии, прежде всего нужно исследовать тесноту связи между случайными величинами X и Y, т.е. корреляционную зависимость. Для нахождения уравнения регрессии вычисляются следующие величины: Средние значения Величины дисперсии и среднего квадратичного отклонения характеризуют разброс наблюдаемых значений вокруг среднего значения. Коэффициент корреляции вычисляется по формуле: Доказано, что коэффициент корреляции находится в интервале от минус единицы до плюс единицы (). Коэффициент b находится по формуле: После чего можно легко найти параметр a: Коэффициенты a и b находятся методом наименьших квадратов, основная идея которого состоит в том, что за меру суммарной погрешности принимается сумма квадратов разности (остатков) между фактическими значениями результативного признака и его расчетными значениями , полученными при помощи уравнения регрессииОбозначим разность между фактическим значением результативного признака и его расчетным значением как : , где фактическое значение y; Поскольку (среднее значение остатков) равно нулю, то суммарная погрешность равна остаточной дисперсии: Остаточная дисперсия находится по формуле: Для нашего примера . Относительная погрешность уравнения регрессии вычисляется как: , где стандартная ошибка; - среднее значение результативного признака. Стандартные ошибки коэффициентов используются также для оценки статистической значимости коэффициентов при помощи t - критерия Стьюдента. Далее находятся максимальные и минимальные значения параметров () по формулам: Таблица 1.3 Некоторые значения t - критерия СтьюдентаУравнение степенной агрессии имеет вид: , где a, b - параметры, которые определяются по данным таблицы наблюдений. Таблица наблюдений составлена и имеет вид: Таблица 2.1. Прологарифмируем исходное уравнение и в результате получим: ln y = ln a b?ln x . В результате подстановки получим: Данное уравнение есть ничто иное, как уравнение линейной регрессии, параметры которого мы умеем находить.Линейное двухфакторное уравнение регрессии имеет вид: , где - параметры; Для установления статистической зависимости (уравнения регрессии) между изучаемым экономическим показателем (объясняемой переменной) и влияющими на нее факторами (объясняющими переменными) проводится регрессионный анализ. Такой анализ предполагает идентификацию объясняющих переменных, спецификацию формы искомой связи между переменными, определение и оценку конкретных числовых значений параметров уравнения регрессии. Цель планирования эксперимента - нахождение таких условий и правил проведения опытов при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда, а также представить эту информацию в компактной и удобной форме с количественной оценкой точности. Для построения эффективной математической модели целесообразно провести предварительный анализ значимости факторов (степени влияния на функцию), их ранжирование и исключить малозначащие факторы.Если учесть, что в матрице Х элементы , то матрицу Х можно записать Транспонированная матрица - это матрица, у которой по отношению к исходной столбцы и строки поменяны местами. строка, N столбцов матрица, получившаяся в результате произведения транспонированной матрицы на исходную. Для того чтобы получить в общем виде матрицу-столбец коэффициентов В необходимо домножить обе части последнего матричного уравнения слева на матрицу С-1 - матрицу обратную матрице С. Задача планирования заключается в том как нужно строить матрицу Х, чтобы матрица С легко обращалась и коэффициенты B определялись независимо друг от друга.
План
Содержание
Введение
Раздел 1. Введение в регрессионный анализ и планирование эксперимента
Тема 1. Основы регрессионного анализа
1.1 Понятие корреляционного и регрессионного анализа
1.2 Определение параметров линейного однофакторного уравнения регрессии
1.4 Проблема автокорреляции остатков. Критерий Дарбина-Уотсона
Тема 2. Введение в регрессионный анализ
2.1 Построение уравнения степенной регрессии
2.2 Двухфакторные и многофакторные уравнения регрессии
2.3 Применения уравнения регрессии. Эконометрика
Тема 3. Основные понятия и определения планирования эксперимента
3.1 Основные понятия и определения планирования эксперимента
Тема 4. Преобразования при обработке результатов эксперимента
4.1 Матричные преобразования при обработке результатов эксперимента
Раздел 2. Статистическое исследование зависимостей
Тема 5. Типовые задачи практики статистического исследования зависимостей
5.1 Схема взаимодействия переменных при статистическом исследовании зависимостей
5.2 Конечные прикладные цели статистического исследования зависимостей
5.3 Типовые задачи практики статистического исследования зависимостей
5.4 Основные типы зависимостей между количественными переменными
Тема 6. Корреляционный анализ
6.1 Корреляционный анализ
6.2 Оценка степени тесноты связи переменных
6.3 Особенности корреляционного анализа для количественных переменных
Тема 7. Регрессионный анализ
7.1 Примеры использования регрессионного анализа
7.2 Классическое определение регрессии
7.3 Оптимизационный подход в регрессионном анализе
7.4 Рекомендации по выбору вида регрессии
Тема 8. Линейный регрессионный анализ
8.1 Простая линейная регрессия
8.2 Доверительные интервалы и проверка гипотез
8.3 Множественная линейная регрессия
Тема 9. Нелинейная, непараметрическая и пошаговая регрессия
9.1 Итерационные методы поиска оценок наименьших квадратов для параметров регрессии
9.2 Поиск начального приближения для итерационных процедур
9.3 Непараметрический подход в регрессионном анализе
9.4 Пошаговая регрессия
Литература
Введение
Современный уровень развития компьютерных и информационных технологий характеризуется возрастающей сложностью не только отдельных физических и программных компонентов, но и лежащих в основе этих технологий концепций и идей. Целью текстов лекций является обучение базовым навыкам в области анализа и обработки экспериментальных данных, в частности погружения в новые программные среды статистической обработки. В тексты лекции включены как общеобразовательные, так и технологические аспекты изучения анализа и обработки экспериментальных данных. Главная задача лекций состоит в выработке необходимых навыков логического мышления для взаимодействия с компьютерным интерфейсом, приобретении теоретических и практических базовых знаний в области пакетов анализа и обработки данных. В ходе изучения текстов лекций необходимо познакомиться с приемами работы в среде специальных компьютерных математических программных систем (Maple, Mathematica, Statistica, Matlab, Excel, Mathcad и других пакетов) освоить основы работы с ними в процессе анализа и обработки данных, осознать их достоинства и недостатки, а также ориентированность.
Тексты лекций предназначены для студентов специальности 1-31 03 01 - 02 - «Математика (научно-педагогическая деятельность» математического факультета. Тексты лекций ставят своей целью оказание помощи студентам в усвоении основ анализа и обработки данных, а также технологии применения методов прикладной статистики и навыков работы с соответствующими прикладными пакетами.