Применение регрессионного анализа для моделирования и изучения данных в математической статистике. Оценивание коэффициентов регрессии с помощью метода наименьших квадратов. Составление алгоритма регрессионного анализа линейного уравнения в Mathcad.
Государственное образовательное учреждение высшего профессионального образования "национальный исследовательский Томский политехнический университет" Кафедра геологии и разработки нефтяных месторожденийТермин "регрессия" был введен Фрэнсисом Гальтоном в конце 19-го века. Гальтон обнаружил, что дети родителей с высоким или низким ростом обычно не наследуют выдающийся рост и назвал этот феномен "регрессия к посредственности". В статистической литературе различают регрессию с участием одной свободной переменной и с несколькими свободными переменными - одномерную и многомерную регрессию. Если регрессионнуя модель не является линейной комбинацией функций от параметров, то говорят о нелинейной регрессии. Параметры функции должны доставлять минимум некоторому функционалу, например, Термин аппроксимация - синоним термина "приближение функций".Для характеристики зависимости у от х рассчитать параметры функции равносторонней гиперболы. Исходные данные: По семи территориям Уральского района За 199Х г. известны значения двух признаков. Район Расходы на покупку продовольственных товаров в общих расходах, %, у Среднедневная заработная плата одного работающего, руб., хПолагается, что переменная отклика - это сумма значений некоторой модели, а также СВ. Что касается характера распределения этой величины, то делаются предположения, которые называются гипотезой порождения данных. В основном, регрессионный анализ применяется для прогноза, тестирования гипотез, разбора временных рядов и обнаружения скрытых взаимосвязей в данных. В силу этого и - тоже случайная величина с распределением того же вида, что и что непосредственно вытекает из равенства , и вместо случайного возмущения используется , для которого предположение 2 выполняется.Эти модели представляют собой определенные математические соотношения между показателями работы объекта или характеристиками наблюдаемого явления и обусловливающими их величинами . Модель всегда отражает данное явление с некоторым приближением. Часть из них имеет систематический характер и в силу этого может с течением времени вызвать изменения коэффициентов модели. Модель не может точно учесть влияние случайных возмущений в каждом отдельном измерении, она показывает лишь некоторые усредненные характеристики. В зависимости от того, как эти коэффициенты входят в уравнение регрессии, модели делятся на линейные и нелинейные по параметрам.Поскольку результаты наблюдений суть случайные величины, получить "истинные" значения коэффициентов из модели (2.1) нельзя.В силу предположения П.6 на возможные значения оценок не наложены никакие ограничения, поэтому минимум получим, приравняв к нулю производные по неизвестным оценкам . После дифференцирования этого выражения по искомым оценкам и приравнивания нулю первых производных получаем систему уравнений: Константы-2, входящие во все уравнения, не играют роли, ибо для равенства нулю произведения достаточно, чтобы равными нулю оказались соответствующие суммы. Поэтому полученная система сводится к виду: Полученная система линейна относительно искомых оценок , а число уравнений в ней равно числу неизвестных коэффициентов k модели. В новых обозначениях система нормальных уравнений примет такой вид: В дальнейшем мы воспользуемся матричной записью. Обозначим - матрицу величин буквой G, - вектор оценок искомых коэффициентов буквой b, - вектор правой части системы буквой Z.Пакет Mathcad создан разработчиками как инструмент для работы расчетчиков-инженеров. Пакет Mathcad создавался как мощный микрокалькулятор, позволяющий справляться с рутинными задачами инженерной практики, ежедневно встречающимися в работе. Сюда можно отнести решение алгебраических и дифференциальных уравнений с постоянными и переменными параметрами, анализ функций, поиск их экстремумов, численное и аналитическое дифференцирование и интегрирование, вывод таблиц и графиков при анализе найденных решений. • запись сложных математических выражений в том виде, в котором они обычно записываются инженерами на листе бумаги (то есть отсутствие специального языка программирования); Настоящим украшением MATHCAD, доступным уже в первых версиях, была поддержка дискретных переменных, позволяющих одновременно вычислять функции для целого ряда значений аргумента, что обеспечивало возможность построения таблиц и графиков без применения операторов программирования.При решении многих инженерных задач возникает необходимость в установлении связи между k независимыми переменными x1, х2,…, xk и зависящей от них величиной у. Стохастическая связь проявляется в том, что одна из случайных величин реагирует на изменения другой изменениями своего закона распределения. Корреляционная связь между двумя случайными величинами выражается в том, что на изменения одной случайной величины другая случайная величина реагирует изменениями своего математического ожидания или среднего значения.
План
Оглавление
Введение
1. Описание задачи
2. Регрессионный анализ
3. Регрессионные модели
4. Метод наименьших квадратов
5. Оценивание коэффициентов регрессии с помощью МНК
6. Регрессионный анализ в Mathcad
7. Программная реализация алгоритма решения задачи
Список используемой литературы
Приложение. Список обозначений
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы