Основы статистики - Контрольная работа

бесплатно 0
4.5 33
Построение статистического ряда, группирование выборки. Построение гистограммы, кумуляты. Проверка гипотезы о нормальном законе распределения случайной величины X по критерию Пирсона. Выборочное среднее, коэффициент линейной вариации, асимметрия, эксцесс.


Аннотация к работе
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИИ федеральное государственное бюджетное образовательное учреждение высшего профессионального образования САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕХНОЛОГИИ И ДИЗАЙНА СЕВЕРО-ЗАПАДНЫЙ ИНСТИТУТ ПЕЧАТИ Выполнил студент 1 курса, группы 1-ТИЗ-1Записать исходную выборку в виде таблицы Записать сгруппированную выборку в виде таблицы.

План
Оглавление

Список литературы
Задание кумулята асимметрия распределение

Каждому студенту в соответствии со своим номером варианта требуется: 1) записать исходную выборку в виде таблицы;

2) построить статистический ряд;

3) записать сгруппированную выборку в виде таблицы;

4) построить гистограмму и кумуляту;

5) проверить гипотезу о нормальном законе распределения случайной величины Х по критерию Пирсона и записать вычисления в таблицу;

6) исследовать вариацию признака Х, найдя для этого числовые характеристики (выборочное среднее, среднее квадратическое отклонение, коэффициент линейной вариации, асимметрию и эксцесс).

При проверке гипотезы о нормальном распределении принять уровень значимости a = 0,05. Варианты индивидуальных заданий приведены в таблице. Номер варианта определяется по номеру фамилии студента в списке его группы.

Варианту номер к соответствуют элементы выборки, расположенные в 15-ти следующих строчках таблицы, начиная со строки номер к (объем выборки при этом n = 150).

Записать исходную выборку в виде таблицы

Таблица 1

Номер варианта Элементы выборки

3 43 46 34 35 42 32 41 34 42 42

4 38 40 46 47 34 42 38 40 38 36

5 30 43 41 40 40 35 35 41 38 45

6 37 42 38 36 44 39 32 48 43 39

7 43 30 32 36 42 34 49 48 49 50

8 37 30 44 48 44 35 45 34 33 41

9 43 45 50 34 33 39 41 39 46 31

10 40 52 44 39 35 45 33 42 42 36

11 44 51 45 39 34 44 40 37 43 32

12 33 42 40 35 37 43 48 48 50 32

13 40 48 45 43 36 36 42 40 37 30

14 44 50 46 39 41 48 44 42 36 51

15 44 50 47 37 33 34 42 43 43 47

16 33 48 38 42 45 32 34 44 39 45

17 48 26 31 34 38 36 46 49 40 48

Построить статистический ряд

Первым этапом статистического изучения вариации является построение ряда распределения (или вариационного ряда) - упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Вариационный ряд: 26, 30, 30, 30, 30, 31, 31, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33, 33, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 35, 35, 35, 35, 35, 35, 36, 36, 36, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 38, 38, 38, 38, 38, 39, 39, 39, 39, 39, 39, 39, 39, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 41, 41, 41, 41, 41, 41, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 42, 43, 43, 43, 43, 43, 43, 43, 43, 43, 43, 44, 44, 44, 44, 44, 44, 44, 44, 44, 44, 45, 45, 45, 45, 45, 45, 45, 45, 46, 46, 46, 46, 46, 47, 47, 47, 48, 48, 48, 48, 48, 48, 48, 48, 48, 48, 49, 49, 49, 50, 50, 50, 50, 50, 51, 51, 52.

Он достаточно громоздкий, поэтому из полученных данных составим ранжированный дискретный ряд.

Записать сгруппированную выборку в виде таблицы

Таблица 2

X 26 30 31 32 33 34 35 36 37 38 39 40 варианта (значение) f 1 4 2 6 6 10 6 8 6 7 8 10 частота

X 41 42 43 44 45 46 47 48 49 50 51 52 варианта (значение) f 6 13 10 10 8 5 3 10 3 5 2 1 частота

Построить гистограмму и кумуляту

Гистограмма - интервальный ряд, изображаемый столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс (x), являются интервалами значений варьирующего признака; а высоты столбиков - это частоты, соответствующие масштабу по оси ординат (y).

Соответственно, дискретный ряд надо преобразовать в интервальный. Для этого воспользуемся формулой Стерджесса, чтобы определить число групп: k = 1 3,322 ? LGN где k - число групп, округляемое до ближайшего целого числа, а N - численность совокупности. k = 1 3,322 ? lg150 = 1 3,322 ? 2,176 = 8,229 ? 8

Можно было воспользоваться готовой таблицей оптимальных соотношений числа единиц статистической совокупности и числа групп. Значения вычислены по той же формуле Стерджесса: Таблица 3

N 15-24 25-44 44-89 90-179 180-359 360-719 k 5 6 7 8 9 10

Зная число групп, рассчитаем длину (размах) интервала по формуле:

где Xmax и Xmin - максимальное и минимальное значения в совокупности.

По правилу записи числа шага интервала: «если величина интервала, рассчитанная по формуле, представляет собой величину, которая имеет один знак до запятой (например, 0,88; 1,585; 4,71), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала».

Теперь построим интервальный ряд, состоящий из 8 групп с интервалом 3,3.

Таблица 4

№ интервала (i) Размах интервала (Xi ) Частоты (fi )

А 1 2

1 26 - 29,3 1

2 29,3 - 32,6 12

3 32,6 - 35,9 22

4 35,9 - 39,2 29

5 39,2 - 42,5 29

6 42,5 - 45,8 28

7 45,8 - 49,1 21

8 49,1 - 52,4 8

Итого 150

На основании данных Таблица 4 построим гистограмму: Рисунок 1

Для построения кумуляты значения варьирующего признака откладываются по оси абсцисс (x), а на оси ординат (y) помещаются накопленные итоги частот или частостей (от f1 до ?f).

Составим кумулятивный вариационный ряд, по которому и построим кумуляту.

Таблица 5

X 26 30 31 32 33 34 35 36 37 38 39 40 41 f 1 4 2 6 6 10 6 8 6 7 8 10 6

?f 1 5 7 13 19 29 35 43 49 56 64 74 80

X 42 43 44 45 46 47 48 49 50 51 52 f 13 10 10 8 5 3 10 3 5 2 1

?f 93 103 113 121 126 129 139 142 147 149 150

Рисунок 2

Проверить гипотезу о нормальном законе распределения случайной величины X по критерию Пирсона и записать вычисления в таблицу

Критерий согласия Пирсона:

где k - число интервалов; fi - эмпирическая частота i-го интервала; ft - теоретическая частота.

Таблица 6

№ интервала (i) Размах интервала (Xi ) Частоты (fi ) Середина интервала (X?i) (t) ?(t) Теоретические частоты (f?t)

А 1 2 3 4 5 6 7 8

1 26 - 29,3 1 27,65 -2,31 0,0277 2,475 -1,475 0,879

2 29,3 - 32,6 12 30,95 -1,71 0,0925 8,266 3,734 1,687

3 32,6 - 35,9 22 34,25 -1,12 0,2131 19,044 2,956 0,459

4 35,9 - 39,2 29 37,55 -0,52 0,3485 31,144 -2,144 0,148

5 39,2 - 42,5 29 40,85 0,08 0,3977 35,541 -6,541 1,204

6 42,5 - 45,8 28 44,15 0,67 0,3187 28,481 -0,481 0,008

7 45,8 - 49,1 21 47,45 1,27 0,1781 15,916 5,084 1,624

8 49,1 - 52,4 8 50,75 1,86 0,0707 6,318 1,682 0,448

Итого 150 - - - 147,185 - 6,457

Найдем среднюю величину. При использовании интервального ряда, допускаем, что распределение в границах i-го интервала является равномерным и как вариант Xi, используем середину интервала (X?).

Определим среднее квадратическое отклонение.

Определим нормированное отклонение t для каждого варианта (Таблица 6 графа 4).

По таблице распределения функции ?(t) определим ее значения (Таблица 6 графа 5).

Определим теоретические частоты f? по формуле:

где k - длина интервала.

В нашем случае, при одинаковых интервалах:

3,3 ? 150 / 5,539 ? 89,366. Полученное значение (const) умножим на величину ?(t) при данном t и получим искомую теоретическую частоту (Таблица 6 графа 6).

В графах 7 и 8 произведем вспомогательные расчеты.

В задании было поставлено условие: «при проверке гипотезы о нормальном распределении принять уровень значимости ? = 0,05».

Уровень значимости ? - это вероятность ошибочного отклонения выдвинутой гипотезы. Тогда, по условию, статистическая достоверность принятия правильной гипотезы P = 0,95.

Число степеней свободы ? определяется по формуле: ? = k - z - 1, где k - число интервалов;

z - число параметров, задающих теоретический закон распределения.

Для нормального распределения z = 2, так как нормальное распределение зависит от двух параметров - средней арифметической ( ) и среднего квадратического отклонения (?).

В рассматриваемом примере ряд имеет 8 групп вариантов, следовательно, и 8 групп частот. Поэтому число степеней свободы (при выравнивании по кривой нормального распределения) будет равно ? = 8 - 2 - 1=5.

По таблице значение ?2-критерия Пирсона для степеней свободы ? = 5 и уровня значимости a = 0,05 определяем, что ?2табл =11,07. Так как полученное в ходе расчетов фактическое значение ?2рас = 6,457, меньше табличного, можно считать с вероятностью 0,95 случайными расхождения между эмпирическими и теоретическими частотами. Выдвинутая гипотеза о близости эмпирического распределения к нормальному не опровергается.

Исследовать вариацию признака X, найдя для этого числовые характеристики (выборочное среднее, среднее квадратическое отклонение, коэффициент линейной вариации, асимметрию и эксцесс)

Расчеты будут производится по данным Таблица 2 на 5стр.

Выборочной средней величиной называют среднее взвешенное арифметическое значение признака совокупности. Эта величина характеризует типичный уровень признака для данного ряда:

где m - число групп.

Среднее квадратическое отклонение показывает на сколько в среднем отклоняются конкретные варианты признака от его среднего значения:

Коэффициент линейной вариации определяет однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному) при отсутствии других нормативов:

для этого вычислим среднее линейное отклонение:

Отсюда также видно, что среднее квадратическое отклонение по величине больше среднего модуля отклонений. Разница между ними тем больше, чем больше в изучаемой совокупности резких, выделяющихся отклонений. Для закона нормального распределения отношение . В нашем примере: .

Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются центральные моменты распределения определенного порядка. Порядок соответствует степени, в которую возводятся отклонения.

Симметричным называется распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой.

Асимметрия:

Для этого вычислим величину центрального момента третьего порядка:

Асимметрия имеет отрицательное значение, соответственно в ряду распределения преобладают варианты, которые меньше, чем средняя, то есть ряд отрицательно асимметричен. Графически же, более длинная ветвь графика расположена слева от вершины (левосторонняя скошенность). Асимметрия незначительна, так как 0,014<0,25.

Эксцесс. При оценке крутизны (заостренности) в качестве эталонного выбирается нормальное распределение, которое сравнивается с фактическим и вычисляется показатель эксцесса распределения:

Для этого вычислим величину центрального момента четвертого порядка:

Ex < 0, значит, полученный график будет ниже графика нормального распределения (низковершинное распределение).

По значениям показателей асимметрии и эксцесса распределения можно судить о близости распределения к нормальному. Показатели асимметрии и эксцесса не должны превышать своих двукратных средних квадратических отклонений, то есть и . Эти средние квадратические отклонения вычисляются по формулам:

Получается:

Показатель асимметрии не превышает своего двукратного среднего квадратического отклонения (As = |- 0,07| < 0,198?2). То же и с показателем эксцесса Ex = |- 0,778| < 0,788 (0,394?2). Поэтому можно говорить, что анализируемое распределение схоже с нормальным.

Список использованных источников

1. Практикум по теории статистики: Учеб. пособие/Р.А. Шмойлова, В.Г. Минашкин, Н.А. Садовникова; Под ред. Р.А. Шмойловой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2006.-416 с: ил.

2. Материалы с сайта http://chaliev.ru/

3. Табличные данные: http://helpstat.ru/statisticheskie-tablitsyi/tablitsa-znacheniy-lokalnoy-funktsii-laplasa/ http://helpstat.ru/statisticheskie-tablitsyi/kriticheskie-tochki-2-raspredeleniya/

Размещено на .ru
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?