Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.
Аннотация к работе
2.3 Метод максимального правдоподобия3.1 Критерий согласияИсходные данные к курсовой работе взяты на сайте: http://www.gks.ru/Официальная статистика\Рынок труда, занятость и заработная плата\Трудовые ресурсы. Для построения статистического ряда необходимо найти долю населения. Воспользуемся формулой: где - численность занятого населения; - численность экономически активного населения. Мы получили выборку значений непрерывной случайной величины, где отдельные значения случайной величины как угодно мало отличаться друг от друга и поэтому в совокупности наблюдаемых данных одинаковые значения величины встречаться редко, а частоты вариантов мало отличаются друг от друга, следовательно, построим интервальный статистический ряд. Теперь построим интервальный статистический ряд.Гистограмма - служит только для представления интервальных статистических рядов и представляет собой столбчатую диаграмму, состоящую из прямоугольников, основания которых - частичные интервалы длины h, а высоты - абсолютные или относительные частоты . На рабочем листе получили таблицу частот (рисунок 4) и гистограмму (рисунок 5).Эмпирической функцией распределения (функцией распределения выборки) называют функцию, определяющую для каждого значения х относительную частоту события , т.е. Для построения графика эмпирической функции найдем накопительную частость. Введем формулы в ячейки рабочего листа согласно рисунку 6.Найдем числовые характеристики: Средним арифметическим наблюдаемых значений случайной величины Х (выборочным средним) называется частное от деления суммы всех этих значений на их число, т.е. где - значение признака у i-го объекта, n - число объектов в совокупности. Если индивидуальные значения признака (варианты), уменьшить (увеличить) в n раз, то среднее значение нового признака соответственно уменьшится или увеличится во столько же. Если все варианты усредняемого признака уменьшить (увеличить) на число А, то средняя арифметическая соответственно изменится на это же число. Его суть заключается в том, что сумма абсолютных отклонений значений х, от медианы представляет собой минимальную величину по сравнению с отклонением X от любой другой величины Выборочной дисперсией значений случайной величины X называется среднее арифметическое квадратов отклонений наблюдаемых значений этой величины от их среднего арифметического (обозначение ): Основные свойства выборочной дисперсии: 1.Основная гипотеза: - исследуемая случайная величина Х подчиняется нормальному закону распределения. Выполним следующие шаги: · Записываем границы интервалов; · Находим интегральную функцию распределения на концах интервалов; Критической областью называется множество возможных значений статистического критерия, при которых основная гипотеза отвергается. Областью принятия гипотезы или областью допустимых значений называется множество возможных значений статистического критерия, при которых основная гипотеза принимается.Все задачи математической статистики касаются вопросов обработки наблюдений над массовыми случайными явлениями, но в зависимости от характера решаемого практического вопроса и от объема имеющегося экспериментального материала эти задачи могут принимать ту или иную форму. Математическая (или теоретическая) статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи. Если мы наблюдаем одновременно проявление двух (или более) признаков, т.е.
План
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1. ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ
1.1 Построение статистического ряда
1.2 Графическое представление данных
1.3 Эмпирическая функция распределения
2. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ СТАТИСТИЧЕСКИХ ДАННЫХ. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
Вывод
Все задачи математической статистики касаются вопросов обработки наблюдений над массовыми случайными явлениями, но в зависимости от характера решаемого практического вопроса и от объема имеющегося экспериментального материала эти задачи могут принимать ту или иную форму.
Математическая (или теоретическая) статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи.
Если мы наблюдаем одновременно проявление двух (или более) признаков, т.е. имеем набор значений нескольких случайных величин - что можно сказать об их зависимости? Есть она или нет? А если есть, то какова эта зависимость? Часто бывает возможно высказать некие предположения о распределении, спрятанном в "черном ящике", или о его свойствах. В этом случае по опытным данным требуется подтвердить или опровергнуть эти предположения ("гипотезы"). При этом надо помнить, что ответ "да" или "нет" может быть дан лишь с определенной степенью достоверности, и чем дольше мы можем продолжать эксперимент, тем точнее могут быть выводы. Наиболее благоприятной для исследования оказывается ситуация, когда можно уверенно утверждать о некоторых свойствах наблюдаемого эксперимента - например, о наличии функциональной зависимости между наблюдаемыми величинами, о нормальности распределения, о его симметричности, о наличии у распределения плотности или о его дискретном характере, и т.д.
· Итак, о (математической) статистике имеет смысл вспоминать, если имеется случайный эксперимент, свойства которого частично или полностью неизвестны, · мы умеем воспроизводить этот эксперимент в одних и тех же условиях некоторое (а лучше - какое угодно) число раз.
Математическая статистика - раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей.
Целью данной курсовой работы является детальный анализ исследование доли занятого населения в общей численности экономически активного населения по Северо-Кавказскому федеральному округу РФ. Для достижения выше поставленной цели предполагается решить следующие задачи: · Построить интервальный или дискретный статистический ряд.
· Построить полигон или гистограмму, в зависимости от того, дискретна или непрерывна изучаемая случайная величина.
· Найти эмпирическую функцию распределения и построить ее график.
· Вычислить основные характеристики выборочных данных. Указать какими свойствами обладают полученные оценки.
· На основе полигона или гистограммы, полученных выборочных характеристик сделать предварительный выбор закона распределения.
· Найти точечные оценки параметров закона распределения случайной величины методом максимального правдоподобия.
· Используя точечные оценки параметров, записать плотность вероятности и функцию распределения.
· В случае нормальности распределения построить доверительные интервалы с надежностью 0,95: а) для математического ожидания, считая известным, равным ;
б) для математического ожидания, считая дисперсию неизвестной;
в) для среднего квадратического отклонения.
· Проверить с помощью критерия согласия , согласуется ли гипотеза о виде распределения с опытными данными, уровень значимости .
· Для непрерывной случайной величины построить график функции плотности вероятности и сравнить его с гистограммой, для дискретной случайной величины построить многоугольник распределения и сравнить его с полигоном.
Объектом данной курсовой работы является статистика доли занятого населения и численности экономически активного населения.
Предметом выступают статистические показатели численности занятого населения и численности экономически активного населения за 2000-2011 гг. по Северо-Кавказскому федеральному округу РФ.
Структура курсовой работы. Курсовая работа состоит из введения, трех глав, заключения и списка использованной литературы.1. Граничина О.А. Математико-статистические методы психолого-педагогических исследований. - 2012.- С. 115
2. Вентцель Е.С. "Теория вероятности и математическая статистика" - 2003
3. Методические указание по математической статистики. - 2010. - С. 75