Знакомство с этапами построения графика эмпирической функции распределения и полигона относительных частот. Способы выявления наличия корреляционной связи между объемами продукции и уровнем механизации труда. Характеристика графиков первичного ряда.
Для выборки, извлеченной из генеральной совокупности и представленной интервальным рядом (в первой строке указаны интервалы значений исследуемого количественного признака генеральной совокупности; во второй - частоты , т.е. количество элементов выборки, значения признака которых принадлежат указанному интервалу). По каждой группе и в целом по всем предприятиям определить: число предприятий, объем продукции, среднесписочное число работников, среднегодовую стоимость основных средств, а также среднюю выработку продукции на одного работника. По каждой группе и в целом по всем предприятиям определить число предприятий, объем продукции, среднегодовую стоимость основных средств, среднесписочное число работников, а также размер среднегодовой стоимости основных средств в расчете на одного работника. Для выборки, извлеченной из генеральной совокупности и представленной интервальным рядом (в первой строке указаны интервалы значений исследуемого количественного признака X генеральной совокупности; во второй - частоты , т.е. количество элементов выборки, значения признака которых принадлежат указанному интервалу), требуется: 1) Построить полигон относительных накопленных частот (кумулятивную кривую); Для отыскания моды в случае интервальной группировки используем формулу , где - левая граница интервала, имеющего наибольшую интервальную частоту, h - шаг (длина интервала группировки), , R - размах выборки, k - количество интервалов, - наибольшая интервальная частота, - интервальная частота интервала, расположенного слева от интервала с наибольшей интервальной частотой, - интервальная частота интервала, расположенного справа от интервала с наибольшей интервальной частотой.Таблица значений функции ЛапласаТаблица значений функцииКритические точки распределенияТаблица значенийТаблица значенийчисло степеней свободы большей дисперсии, - число степеней свободы меньшей дисперсии.
Введение
Цель контрольной работы - закрепление и проверка знаний, полученных студентами заочной формы обучения в процессе самостоятельного изучения учебного материала, а так же выявление их умения применять на практике методы решения задач статистики.
Каждый студент заочной формы обучения должен решить все задачи своего варианта.
При выполнении контрольной работы необходимо руководствоваться следующими требованиями: 1. Вариант контрольной работы выбирать по последней цифре номера зачетной книжки (или по последней цифре порядкового номера Ф.И.О. студента в списке журнала группы, если он взят за основу при определении варианта); цифра "0" означает вариант 10.
2. В начале работы должен быть указан номер варианта задания;
3. Перед решением задачи должно быть приведено ее условие;
4. Решение задач следует сопровождать необходимыми формулами, развернутыми расчетами и краткими пояснениями;
5. В конце работы должна стоять подпись студента с указанием даты ее выполнения;
6. На лицевой стороне контрольной работы необходимо указать следующую информацию: ФИО студента, номер группы с указанием формы обучения, дисциплина и номер зачетной книжки (или, соответственно, порядковый номер Ф.И.О. студента в списке журнала группы).
Задача 1
Из генеральной совокупности , распределенной по нормальному закону, извлечена выборка. Требуется: 1. Составить вариационный, статистический и выборочный ряды распределения; найти размах выборки;
По полученному распределению выборки: 2. Построить полигон относительных частот;
3. Построить график эмпирической функции распределения;
5. С надежностью найти доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения изучаемого признака генеральной совокупности.
Таблица 1
Задача 2
Для выборки, извлеченной из генеральной совокупности и представленной интервальным рядом (в первой строке указаны интервалы значений исследуемого количественного признака генеральной совокупности; во второй - частоты , т.е. количество элементов выборки, значения признака которых принадлежат указанному интервалу). Требуется: 1) Построить полигон относительных накопленных частот (кумулятивную кривую);
2) Построить гистограмму частот и гистограмму относительных частот;
3) Найти выборочную среднюю, выборочную дисперсию, моду и медиану;
4) Проверить на уровне значимости гипотезу о нормальном распределении признака генеральной совокупности по критерию согласия Пирсона;
5) В случае согласованности с нормальным распределением найти с надежностью доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака генеральной совокупности.
Таблица 2
Замечание: При отыскании выборочной средней и выборочной дисперсии в задачах 2.5. и 2.6. для упрощения счета рекомендуется переходить к условным вариантам.
Задача 3
Проведите сравнительный анализ результатов педагогического эксперимента в контрольных и экспериментальных группах, используя критерий однородности Пирсона.
Уровень значимости положите
Таблица 3
Задача 4
Исследуется зависимость коэффициента усвоения знаний, выраженного в процентах ( %) от уровня посещаемости занятий ( %) в группе из четырнадцати учащихся ( - порядковый номер учащегося). Статистические данные приведены в таблице.
Требуется: 1) Найти оценки параметров линейной регрессии на . Построить диаграмму рассеяния и нанести прямую регрессии на диаграмму рассеяния.
2) На уровне значимости проверить гипотезу о согласии линейной регрессии с результатами наблюдений.
3) С надежностью найти доверительные интервалы для параметров линейной регрессии.
Таблица 4
Задача 5
Предположим, что в педагогическом эксперименте участвовали три группы студентов по 10 человек в каждой. В группах применили различные методы обучения: в первой - традиционный , во второй - основанный на компьютерных технологиях , в третьей - метод, широко использующий задания для самостоятельной работы . Знания оценивались по десятибалльной системе.
Требуется обработать полученные данные об экзаменах и сделать заключение о том, значимо ли влияние метода преподавания, приняв за уровень значимости .
Результаты экзаменов заданы таблицей, - уровень фактора - оценка -го учащегося обучающегося по методике .
Таблица 5
Задача 6
По промышленным предприятиям города имеются следующие данные за отчетный год:
Таблица 6
№ Предп. Объем продукции, млн.руб. Среднегодовая стоимость Основных средств, млн.руб. Среднесписочное число работников, чел. Прибыль, млн.руб.
1 197,7 10,0 900 13,5
2 592,0 22,8 1500 136,2
3 465,5 18,4 1412 97,6
4 296,2 12,6 1200 44,4
5 584,1 22,0 1485 146,0
6 480,0 19,0 1420 110,4
7 578,5 21,6 1390 138,7
8 204,7 9,4 817 30,6
9 466,8 19,4 1375 111,8
10 292,2 13,6 1200 49,6
11 423,1 17,6 1365 105,8
12 192,6 8,8 850 30,7
13 360,5 14,0 1290 64,8
14 208,3 10,2 900 33,3
Требуется выполнить группировку предприятий по объему выпущенной продукции, приняв следующие интервалы: 1) до 200 млн.руб. 2) от 200 до 400 млн.руб.; 3) от 400 до 600 млн.руб.
По каждой группе и в целом по всем предприятиям определить: число предприятий, число продукции, среднесписочное число работников, среднюю выработку продукции на одного работника. Результаты группировки представить в виде статистической таблицы.
Решить задачу 6.1., приняв следующие интервалы группировки: 1) до 250 млн.руб. 2) от 250 до 500 млн.руб.; 3) от 500 млн.руб. и более
Решить задачу 6.1., приняв следующие интервалы группировки: 1) до 300 млн.руб. 2) от 300 до 500 млн.руб.; 3) более 500 млн.руб.
Требуется произвести группировку предприятий по стоимости основных средств, приняв следующие интервалы: 1) до 12 млн.руб. 2) от 12 до 18 млн.руб.; 3) от 18 млн.руб. и выше
По каждой группе и в целом по всем предприятиям определить: число предприятий, среднегодовую стоимость основных средств. Результаты представить в виде статистической таблицы.
Решить задачу 6.4., приняв следующие интервалы группировки: 1) менее 10 млн.руб. 2) от 10 до 20 млн.руб.; 3) более 20 млн.руб.
Решить задачу 6.4., приняв следующие интервалы группировки: 1) менее 14 млн.руб. 2) от 14 до 19 млн.руб.; 3) от 19 млн.руб. и более
Требуется выполнить группировку предприятий по численности работников, приняв следующие интервалы: 1) до 1000 чел. 2) от 1000 до 1300 чел.; 3) от 1300 чел. и более
По каждой группе и в целом по всем предприятиям определить: число предприятий, объем продукции, среднесписочное число работников, среднегодовую стоимость основных средств, а также среднюю выработку продукции на одного работника. Результаты группировки представить в виде статистической таблицы.
Решить задачу 6.7., приняв следующие интервалы группировки: 1) не более 900 чел. 2) от 900 до 1400 чел.; 3) более 1400 чел.
Требуется произвести группировку предприятий по величине прибыли, приняв следующие интервалы: 1) до 50 млн.руб. 2) от 50 до 100 млн.руб.; 3) от 100 до 150 млн.руб.
По каждой группе и в целом по всем предприятиям определить число предприятий, объем продукции, среднегодовую стоимость основных средств, среднесписочное число работников, а также размер среднегодовой стоимости основных средств в расчете на одного работника. Результаты группировки представить в виде статистической таблицы.
Решить задачу 6.9., приняв следующие интервалы группировки: 1) до 70 млн.руб. 2) от 70 до 110 млн.руб.; 3) свыше 110 млн.руб.
Задача 7
По каждому из трех предприятий фирмы ( -порядковый номер предприятия) имеются соответствующие данные о фактическом объеме реализованной в 2000 г. продукции ( , млн.руб.), о плановом задании по росту реализованной продукции на 2001г. ( ,%), а также о фактическом объеме реализованной в 2001г. продукции ( , млн.руб.). статистические данные приведены в таблице.
Требуется определить в целом по фирме: 1) размер планового задания по росту объема реализованной продукции в 2001г.;
2) процент выполнения плана по объему реализованной продукции в 2001г.;
3)показатель динамики реализованной продукции.
Таблица 7
Задача 8
По каждой из трех основных рабочих профессий цеха ( -порядковый номер профессии: 1-токари; 2-фрезеровщики; 3-слесари) имеются соответствующие данные о числе рабочих профессии ( , чел.), о средней заработной плате ( , руб.), а также о внутригрупповой дисперсии заработной платы ( , руб.2). Статистические данные за месяц приведены в таблице.
Требуется: 1) определить общую дисперсию заработной платы рабочих цеха;
2) оценить однородность совокупности рабочих цеха по уровню месячной заработной платы;
3) определить, на сколько процентов дисперсия в размере заработной платы обусловлена различиями в профессии рабочих и влиянием других причин.
Таблица 8
Задача 9
По 14-ти предприятиям городского хозяйства ( -порядковый номер предприятия) имеются соответствующие данные об объеме продукции (услуг) за месяц ( млн.руб.) и уровне механизации труда ( ,%). Статистические данные приведены в таблице.
Для выявления наличия корреляционный связи между объемам продукции и уровнем механизации труда требуется: 1) построить аналитическую таблицу и дать графическое изображение линии связи.
2) Измерить тесноту связи между признаками с помощью коэффициента корреляции рангов; проверить его достоверность.
Таблица 9
Задача 10
Динамика удельного расхода условного топлива на производство теплоэнергии ( , кг/Гкал) на ТЭЦ по городам представлена в таблице.
Требуется: 1) произвести сглаживание ряда методом трехлетней скользящей средней;
2) выровнять ряд по прямой;
3) методом экстраполяции определить прогноз экономического показателя на 2002 и 2003 г.г.;
4) начертить графики первичного и выроненного рядов.
Таблица 10
Методические указания к выполнению контрольной работы.
Решение типовых задач.
Задача 11
Из генеральной совокупности , распределенной по нормальному закону, извлечена выборка. Требуется: 1. Составить вариационный, статистический и выборочный ряды распределения; найти размах выборки;
По полученному распределению выборки: 2. Построить полигон относительных частот;
3. Построить график эмпирической функции распределения;
5. С надежностью найти доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения изучаемого признака генеральной совокупности.
Таблица 11
Составим вариационный ряд. Напомним, что вариационным рядом называется последовательность наблюдаемых значений признака , расположенных в неубывающем порядке , ,…, , где … . Следовательно, в нашей задаче вариационный ряд запишется так:
Таблица 12
Составим статистический ряд распределения данной нам выборки
Таблица 13
- варианты, - частоты.
Найдем объем выборки
.
Относительная частота вычисляется по формуле .
Запишем выборочный ряд распределения
Таблица 14
.
Размах выборки , т.е. в нашем случае .
Рис.1
Построим полигон относительных частот
Вычислим выборочную среднюю
= = ( )= =5,56.
Построим график эмпирической функции распределения где ( число вариант, меньших, чем значение аргумента ).
Рис.2
Вычислим выборочную дисперсию , где в нашем случае
Вычислим "исправленную" дисперсию , которая выражается формулой
(в нашем случае ) и "исправленное" среднее квадратическое отклонение
.
Модой называется варианта с наибольшей частотой, т.е. в нашей задаче . Медиана - варианта, которая делит вариационный ряд на две части, равные по числу вариант, т.е. в нашей задаче .
Найдем с надежностью g=0,95 доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения изучаемого признака генеральной совокупности.
Так как по условию задачи генеральная совокупность x распределена по нормальному закону и объем выборки равен n=40, то искомый доверительный интервал для оценки математического ожидания имеет вид
, где - среднее квадратическое отклонение, а величина t определяется по таблице значений функции Лапласа из равенства .
Следовательно, в нашем случае последнее равенство принимает вид . Из этого равенства по таблице значений интегральной функции Лапласа находим значение t=1,96. Величина была найдена ранее: и .
Вычислим . .
Учитывая, что , доверительный интервал для оценки математического ожидания запишется или, окончательно, .
Доверительный интервал для среднего квадратического отклонения нормально распределенной случайной величины находится по формуле , где s - "исправленное" среднее квадратическое отклонение, а d находится по формуле , где величина q определяется по специальной таблице значений функции .
q=q(0,95;40)=0,24; d=sq=0,321?0,24=0,077. Следовательно, или окончательно .
На этом решение задачи 1 закончено.
Задача 12
Для выборки, извлеченной из генеральной совокупности и представленной интервальным рядом (в первой строке указаны интервалы значений исследуемого количественного признака X генеральной совокупности; во второй - частоты , т.е. количество элементов выборки, значения признака которых принадлежат указанному интервалу), требуется: 1) Построить полигон относительных накопленных частот (кумулятивную кривую);
2) Построить гистограмму частот и гистограмму относительных частот;
3) Найти выборочную среднюю, выборочную дисперсию, моду и медиану;
4) Проверить на уровне значимости гипотезу о нормальном распределении признака генеральной совокупности по критерию согласия Пирсона;
5) В случае согласованности с нормальным распределением найти с надежностью доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака генеральной совокупности.
Таблица 15
2.0.
.
В нашем случае n=2750.Тогда на основе данной таблицы построим интервальный статистический и интервальный выборочный ряды распределения, сведенные в одну таблицу.
В нашем случае исследуемый признак X может принимать значения на отрезке [3;17]. Интервальная группировка выполнена таким образом, что длина каждого интервала равна h=2. Площадь прямоугольника, построенного на i-ом интервале, должна равняться . Это значит, что высота i-го прямоугольника будет .
Рис.4
На остальных интервалах прямоугольники строятся аналогично.
Если высоту i-го прямоугольника определим как , то получим гистограмму относительных частот, которую можно рассматривать как аналог дифференциальной функции распределения в теории вероятностей.
Для того, чтобы найти выборочную среднюю, воспользуемся формулой
, где k - количество интервалов, n - объем выборки.
.
Для вычисления выборочной дисперсии воспользуемся формулой . В случае интервальной группировки находится по формуле
= .
Теперь можно окончательно вычислить выборочную дисперсию
Найденное значение выборочного коэффициента вариации дает наглядное представление о степени относительного рассеяния исследуемого признака.
Отыщем значения "исправленной" дисперсии и "исправленного" среднего квадратического отклонения , .
Для отыскания моды в случае интервальной группировки используем формулу , где - левая граница интервала, имеющего наибольшую интервальную частоту, h - шаг (длина интервала группировки), , R - размах выборки, k - количество интервалов, - наибольшая интервальная частота, - интервальная частота интервала, расположенного слева от интервала с наибольшей интервальной частотой, - интервальная частота интервала, расположенного справа от интервала с наибольшей интервальной частотой.
В нашем случае .
Значение медианы для случая интервальной группировки отыщем по формуле , где - левая граница интервала, содержащего медиану, n - объем выборки, h - шаг, - интервальная частота интервала, содержащего медиану, - интервальные частоты всех интервалов, расположенных слева от интервала, содержащего медиану.
Найдем значение медианы для нашей конкретной задачи .
Далее начнем суммировать интервальные частоты слева направо до тех пор пока сумма интервальных частот не превзойдет .Номер последней прибавленной частоты будет совпадать с номером интервала, содержащего медиану распределения: 10 70 450 970=1500>1375. Следовательно, =9, .
Проверим на уровне значимости a=0,05 гипотезу о нормальном распределении признака x генеральной совокупности по критерию согласия Пирсона.
Для нашей задачи все условия применимости метода Пирсона выполняются: , для любого интервала .
Проверка гипотезы нормальности по критерию Пирсона основана на сравнении эмпирического и гипотетического распределений, точнее, на сравнении эмпирических и гипотетических интервальных частот. Мера близости между ними оценивается статистикой Пирсона: , где - интервальные (эмпирические) частоты, - интервальные теоретические частоты, - теоретические вероятности попадания переменной x в i-ый интервал группировки, , - левая граница i-го интервала, - правая граница i-го интервала.
При этом теоретические вероятности рассчитываются в предположении нормальности распределения случайной величины x по формуле: , где и функция есть плотность стандартного нормального распределения, таблица значений которой приведена в приложении 2.
Вычисление наблюдаемого значения статистики Пирсона организуем в форме расчетной таблицы. Для заполнения таблицы нам понадобятся величины , , .
Таблица 17
Следовательно, . Заданный уровень значимости , количество интервалов группировки , и потому p=1-a=0,95 и число степеней свободы k=m-3=4.
Теперь по таблице критических точек распределения отыщем значение .
Сравним значения и . Имеем 6,735<9,5 , следовательно, < . Поэтому гипотезу о нормальном распределении признака x принимаем. В этом случае необходимо найти с надежностью g=0,95 доверительные интервалы для оценки математического ожидания и среднего квадратического отклонения признака x генеральной совокупности. Пример нахождения доверительных интервалов разобран при решении задачи 1 (пятый вопрос).
Таким образом, решение задачи 2 полностью разобрано.
Задача 13
Проведите сравнительный анализ результатов педагогического эксперимента в контрольных и экспериментальных группах, используя критерий однородности Пирсона.
, где и .
Уровень значимости положите
Таблица 18
Проведем сравнительный анализ результатов педагогического эксперимента в контрольных и экспериментальных группах, используя критерий однородности Пирсона: , где 2, 3, 4, 5 - вариационный ряд (оценки, выставляемые по результатам проведения контрольных работ), - частота появления i-ой варианты в экспериментальной группе, - частота появления i-ой варианты в контрольной группе, - объем выборки в экспериментальной группе, - объем выборки в контрольной группе, m=4 - количество различных значений варианты (количество интервалов группировки), k=m-1=3 - количество степеней свободы.
Найдем и . =27 25 28 9=89, =9 5 18 10=42.
Теперь вычислим .
= =8,6.
По таблице критических точек распределения , приведенной в приложении 3, для числа степеней свободы k=3 и уровня значимости a=0,05 находим значение =7,81.
Так как > (8,6>7,81), то согласно правилу принятия решения, делаем вывод, что существуют достоверные различия между результатами проведения контрольных работ в экспериментальной и контрольной группах на уровне надежности g=1-a=1-0,05=0,95.
На этом решение задачи 3 закончено. Приведенный пример с небольшими изменениями взят из работы [7].
Задача 14
Исследуется зависимость коэффициента усвоения знаний, выраженного в процентах ( %) от уровня посещаемости занятий ( %) в группе из четырнадцати учащихся ( - порядковый номер учащегося). Статистические данные приведены в таблице.
Требуется: 1) Найти оценки параметров линейной регрессии на . Построить диаграмму рассеяния и нанести прямую регрессии на диаграмму рассеяния.
2) На уровне значимости проверить гипотезу о согласии линейной регрессии с результатами наблюдений.
3) С надежностью найти доверительные интервалы для параметров линейной регрессии.
Таблица 19
Найдем точечные статистические оценки и параметров и линейной регрессии Y на X: .
Для уравнения прямой регрессии по статистическим данным таблицы 4.0 найдем оценки и ее параметров методом наименьших квадратов. Применим известные формулы
, где , ;
Вычисления организуем в форме следующей расчетной таблицы: Таблица 20 i
1 53 36 1908 2809 1296
2 40 30 1200 1600 900
3 46 32 1472 2116 1024
4 39 29 1131 1521 841
5 35 27 945 1225 729
6 29 23 667 841 529
7 75 47 3525 5625 2209
8 31 19 589 961 361
9 68 44 2992 4624 1936
10 66 42 2772 4356 1764
11 60 40 2400 3600 1600
12 54 39 2106 2916 1521
13 55 33 1815 3025 1089
14 59 37 2183 3481 1369
710478257053870017168
50,71434,1431836,0712764,2861226,286
Таким образом, , , , , .
Далее вычисляем ковариации
;
;
;
и по указанным выше формулам находим
; .
В результате получаем уравнение прямой регрессии
.
Проверим согласованность выбранной линейной регрессии с результатами наблюдений. Для этого решим следующую задачу проверки статистической гипотезы.
На заданном уровне значимости выдвигается гипотеза об отсутствии линейной статистической связи. Для проверки выдвинутой гипотезы используется коэффициент детерминации и применяется статистика Фишера F.
В случае парной линейной регрессии коэффициент детерминации равен квадрату выборочного коэффициента корреляции Пирсона, т.е.
.
Статистика F выражается формулой и при условии справедливости гипотезы имеет классическое распределение Фишера с и степенями свободы.
В соответствии с приведенными формулами вычисляем коэффициент детерминации и наблюдаемое значение статистики Фишера: , .
Критическое значение статистики Фишера находим по таблице квантилей распределения Фишера, исходя из равенства , где p=1-a (порядок квантили), и . В данном случае .
Сравниваем между собой наблюдаемое и критическое значения статистики Фишера. Так как , то выдвинутая гипотеза решительно отвергается, что свидетельствует о согласии линейной регрессивной связи с результатами наблюдений.
Так как линейная регрессия согласуется со статистическими данными, найдем (с надежностью g=0,95 ) доверительные интервалы для параметров и линейной регрессии. Для нахождения доверительных интервалов применим известные формулы: , где , - квантиль распределения Стьюдента порядка с k=n-2 степенями свободы, ;
, где .
В данном случае = , ;
;
= .
Применив приведенные выше формулы для доверительных интервалов, окончательно получим
, .
Задача 15
Предположим, что в педагогическом эксперименте участвовали три группы студентов по 10 человек в каждой. В группах применили различные методы обучения: в первой - традиционный , во второй - основанный на компьютерных технологиях , в третьей - метод, широко использующий задания для самостоятельной работы . Знания оценивались по десятибалльной системе.
Требуется обработать полученные данные об экзаменах и сделать заключение о том, значимо ли влияние метода преподавания, приняв за уровень значимости .
Результаты экзаменов заданы таблицей, - уровень фактора - оценка -го учащегося обучающегося по методике .
Таблица 21
Поместим в таблице экзаменационные оценки ( ), их отклонения от общей средней ( ) и квадраты этих отклонений . Уровни фактора означают: - традиционный метод, - применение компьютерной технологии, - увеличение доли самостоятельной работы.
Таблица 22
1 Номер испытания (порядковый номер студента группы).
2 Групповая средняя (средний балл группы).
Общая средняя равна
.
; .
.
В нашем примере p=3 (p - количество факторов), q=10 (q - количество студентов), поэтому для степеней свободы получаются следующие значения: pq-1=29, p-1=2, p(q-1)=27.
Находим выборочные дисперсии: ; ; .
Примем в качестве нулевой гипотезу о том, что выявленное различие групповых средних (средних баллов) случайно, т.е. при уровне значимости a=0,05 средние баллы совпадают.
Для проверки этой гипотезы следует воспользоваться F-критерием Фишера-Снедекора. Вычисляется .
По таблицам находится критическая точка . Здесь a - уровень значимости, - число степеней свободы для дисперсии (в числитель формулы вписывается большая из дисперсий), - число степеней свободы для меньшей дисперсии . В случае нулевая гипотеза принимается, в случае она отвергается.
В примере .
Таким образом, нулевая гипотеза отвергается, и следует считать, что средние баллы групп различаются "значимо". В частности, повышение качества знаний под воздействием уровня фактора F нельзя считать случайным.
Задача 16
Группировка статистических данных.
По промышленным предприятиям города имеются следующие данные за отчетный год:
Таблица 23
№ Объем продукции, млн. руб. Среднегодовая стоимость основных средств, млн. руб. Среднесписочное число работников, чел. Прибыль, млн. руб.
1 478,0 19,1 1415 112,2
2 207,3 9,6 813 30,2
3 194,4 8,9 852 30,4
4 462,3 18,3 1409 97,3
5 207,1 10,1 896 33,2 б 196,5 10,0 900 13,4
7 290,2 13,5 1195 49,3
8 356,6 14,0 1284 62,8
9 422,3 17,4 1359 104,6
10 590,0 22,7 1490 134,6
11 581,0 21,8 1392 138,9
12 297,3 12,8 1202 44,5
13 462,4 19,5 1378 111,6
14 582,3 22,1 1482 143,2
Требуется выполнить группировку предприятий по объему продукции, приняв следующие интервалы: 1)до 200 млн. руб.; 2) от 200 до 400 млн.руб.; 3) от 400 млн.руб. и более. По каждой группе и в целом по всем предприятиям определить: число предприятий;
среднесписочное число работников;
среднегодовую стоимость основных средств;
объем продукции всего; средний объем продукции на одного работника; средний объем продукции на 1 млн. руб. стоимости основных средств;
прибыль всего; среднюю прибыль на одного работника; среднюю прибыль на 1 млн. руб. стоимости основных средств.
Сделать вывод.
Для удобства вычислений заполняем сначала вспомогательную таблицу.
Таблица 24
Результаты группировки приведены в следующей аналитической таблице.
Таблица 25
Значения показателей объема продукции, прибыли, среднегодовой стоимости основных средств и среднесписочного числа работников по каждой группе и по всем предприятиям получаются суммированием соответствующих значений по каждому предприятию из вспомогательной таблицы.
Средние показатели объема продукции и прибыли на одного работника рассчитаны делением соответствующих суммарных показателей на число работников по группе (или по всем предприятиям). Аналогично рассчитаны средние показатели объема продукции и прибыли на один млн. руб. основных средств.
По результатам группировки, приведенной в аналитической таблице, можно сделать следующие выводы.
По объему продукции предприятия разделены на мелкие, средние и крупные. Доля мелких предприятий значительно ниже, чем доля средних и крупных.
Значение объема продукции в среднем на одного работника возрастает от мелких предприятий к крупным (I гр. - 223,1 тыс. руб., II гр. - 252,04 тыс. руб., III гр. - 360,53 тыс.руб.).
Еще более значительно растет прибыль на одного работника (I гр. - 25 тыс. руб., II гр. - 40,82 тыс. руб., III гр. - 84,88 тыс. руб.). На крупных предприятиях прибыль на одного работника в 3,4 раза выше, чем на мелких, и в два с лишним раза выше, чем на средних.
Аналогичная картина наблюдается и при сравнении объема продукции и прибыли в среднем на 1 млн. руб. основных средств. Так для крупных предприятий эта прибыль примерно в два с половиной (5,98:2,317ss2,58) раза больше, чем для мелких и в 1,6 раза больше, чем для средних.
Эти данные свидетельствуют о наибольшей эффективности предприятий третьей группы.
Задача 17
Абсолютные, относительные и средние величины
По каждому из трех предприятий фирмы (г- порядковый номер предприятия), имеются соответствующие данные о фактическом объеме реализованной в 2000 г. продукции (у0 млн.руб.), о плановом задании по росту реализованной продукции на 2001 г. (8, %), а также о фактическом объеме реализованной в 2001 г. продукции (ух млн.руб.). Статистические данные приведены в таблице.
Требуется определить в целом по фирме: 1) размер планового задания по росту объема реализованной продукции в2001 г;
2) процент выполнения плана по объему реализованной продукции в2001г.;
3) показатель динамики реализованной продукции.
Таблица 26 i y0i ?i% y1i
1 28,5 103,0 31
2 51,5 105,0 55,5
3 62,5 102,5 63,0
При решении задачи используются следующие понятия: Относительный показатель динамики (ОПД) характеризует изменение явления во времени
ОПД= или в процентах ОПД= 100%, где у0 - базовый уровень исследуемого явления. В нашей задаче это объем реализованной продукции в 2000г; уі (i - 0,1,2,3,...) - уровень явления за одинаковые последовательные периоды времени (например, выпуск продукции по годам). ОПД иначе называются темпами роста. Они могут быть базовыми или цепными .
Относительный показатель плана ОПВП) - отношение величины показателя по плану (упл) к его фактической величине в базисном (или предшествующем) периоде.
ОПП= или ОПП= 100%.
Относительный показатель выполнения плана (ОПВП) - отношение фактической (отчетной) величины показателя у1 к запланированной на тот же период времени его величине
ОПВП=
ОПД, ОПП и ОПВП связаны соотношением или опп·опвп=опд.
Решение задачи 7.
1. Найдем размер планового задания в целом по фирме по росту объема реализованной продукции в 2001 г., т.е. ОППФ - относительный показатель плана фирмы.
Для этого найдем сначала плановое задание на 2001 г. по каждому предприятию и в целом по фирме
28,5·1,03 51,5·1,05 62,5·1,025=
= 29,355 54,075 64,0625 = 147,4925 (млн.руб.).
Достигнутый в базисном периоде (2000г.) уровень в целом по фирме составляет 28,5 51,5 62,5 = 142,5 (млн.руб.)
Теперь можно найти относительный показатель плана в целом по фирме на 2001г.
ОППФ= или в процентах ?103,5%.
2. Найдем процент выполнения плана по объему реализованной продукции в 2001 г. в целом по фирме (ОПВПФ). Для этого найдем фактический уровень, достигнутый в 2001 г.
31 55,5 63,0 = 149,5 млн.руб., тогда ОПВПФ= 1,0136108 или 101,36%, т.е. план перевыполнен на 1,36%.
3. Найдем относительный показатель динамики реализованной продукции в целом по фирме (ОПДФ)
ОПДФ= 1,0491228 или ?104,91%, т.е. фактический рост составил ?4,91%.
По каждой из трех основных рабочих профессий цеха (i -порядковый номер профессии: 1-токари; 2-фрезеровщики; 3-слесари) имеются соответствующие данные о числе рабочих профессии ( чел.), о средней заработной плате ( руб.), а также о внутригрупповой дисперсии заработной платы ( руб2). Статистические данные за месяц приведены в таблице.
Требуется: определить общую дисперсию заработной платы рабочих цеха;
оценить однородность совокупности рабочих цеха по уровню месячной заработной платы;
определить, на сколько процентов дисперсия в размере заработной платы обусловлена различиями в профессии рабочих и влиянием других причин.
Таблица 27 i
1 52 2650 2400
2 26 2780 3100
3 42 2420 730
Предварительные сведения.
Для характеристики величины вариации (колеблемости) признака статистической совокупности используются абсолютные и относительные показатели. В качестве абсолютных показателей чаще всего рассматривают дисперсию и среднеквадратическое отклонение (СКО).
, где - наблюденные значения признака (варианты), п - общее число вариант (объем выборки). Суммирование в этой формуле производится по всем вариантам; - среднее значение признака, - среднее значение квадрата признака
.
Изучая только общую дисперсию интересующего исследователя признака, нельзя оценить влияние отдельных факторов, как качественных, так и количественных, на величину признака. Это можно сделать при помощи метода группировки, когда варианты подразделяются на непересекающиеся группы по признаку-фактору. При этом, кроме общей средней по всей выборке, рассматриваются средние по отдельным группам и следующие показатели дисперсии: общая дисперсия межгрупповая дисперсия , внутригрупповые дисперсии , средняя внутригрупповая дисперсия .Кратко охарактеризуем эти дисперсии. 1. Общая дисперсия учитывает влияние всех факторов, от которых зависит величина изучаемого признака X
, где - общая средняя по всей выборке.
2. Межгрупповая дисперсия (дисперсия групповых средних) отражает систематическую вариацию, т.е. те различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки. Эта дисперсия определяется по формуле:
здесь - внутригрупповые средние, - число вариант в i -ой группе; к число групп, суммирование производится по различным группам.
3. Внутригрупповая дисперсия отражает рассеяние значений признака, относящихся к одному уровню группировочного фактора, поэтому она определяется не этим фактором, а другими причинами.
4. Средняя внутригрупповая дисперсия , так же как и , характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия, положенного в основу группировки. Эта дисперсия определяется по формуле
.
Можно доказать, что имеет место правило сложения дисперсий
Отношение показывает, какую долю общей дисперсии составляет дисперсия, возникающая под влиянием группировочного фактора, т.е. позволяет оценить влияние этого фактора на величину изучаемого признака X.
При сравнении колеблемости различных признаков в одной и той же совокупности или при сравнении колеблемости одного и того же признака в разных совокупностях используются относительные показатели вариации. Наиболее распространенным среди относительных показателей вариации является коэффициент вариации
Его применяют также и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).
Решение задачи 8.
1. Найдем среднюю из внутригрупповых дисперсий
1967,17 (руб2).
Определим среднюю зарплату по цеху для основных рабочих профессий (общую среднюю)
2597,67(руб).
Находим межгрупповую дисперсию
=19438(руб2).
Используя правило сложения дисперсий, найдем общую дисперсию заработной платы: = 19438 1967 = 21405 (руб2)
2. Оценим однородность совокупности рабочих цеха по уровню месячной заработной платы с помощью коэффициента вариации
5,63%.Так как V < 33 %, то совокупность считается однородной.
3. Общая дисперсия заработной платы рабочих цеха обусловлена различиями в профессии на
.
Эта же дисперсия обусловлена влиянием других причин на
Задача 19
Элементы корреляционного анализа.
По 14-ти предприятиям городского хозяйства (i-порядковый номер предприятия) имеются соответствующие данные об объеме продукции (услуг) за месяц (у млн.руб.) и уровне механизации труда (х, %). Статистические данные приведены в таблице.
Для выявления наличия корреляционной связи между объемом продукции и уровнем механизации труда требуется: 1) измерить тесноту связи между признаками с помощью коэффициента корреляции рангов Спирмена;
2) проверить его достоверность на уровне значимости ?= 0,05;
Таблица 28
С помощью выборочного коэффициента ранговой корреляции Спирмена оценивается теснота связи между двумя качественными переменными X и Y. Этот коэффициент применяется и в случае количественных переменных, если заранее не гарантируется нормальность распределения двумерной случайной величины (X,Y).
Выборочный коэффициент служит точечной оценкой генерального коэффициента ранговой корреляции . Коэффициенты и изменяются от минус единицы до плюс единицы. Чем ближе к 1, тем теснее связь между переменными X и Y.
1. Для того чтобы вычислить коэффициент ранговой корреляции , нужно сначала провести ранжировку объектов и получить две согласованные последовательности рангов.
Расположим наблюдаемые пары в порядке невозрастания качества по показателю X: Таблица 29
Затем пронумеруем объекты (числа) в каждой из строк в порядке неубывания. Рангом объекта называется его номер в ранжировке. Получим следующую таблицу:
Таблица 30
В первой ранжировке обведены группы объектов, имеющих одинаковое качество по переменной X; во второй ранжировке единообразно отмечены объекты, имеющие одинаковое качество по переменной Y.
Далее объектам одинакового качества присваиваем средние ранги (средние арифметические порядковых номеров этих объектов). В результате получим две согласованные последовательности рангов: Таблица 31
В последней строке записаны разности рангов .
Найдем сумму квадратов разностей рангов: =670,5 и по известной формуле вычислим выборочный коэффициент ранговой корреляции Спирмена:
2) Для
Список литературы
1. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. М.: ИНФРА-М, 2001. 416 с.
2. Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики: Учеб. пособие. М.: Финансы и статистика, 2001. 280 с.
3. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. М.:ЮНИТИ-ДАНА, 2002. 311 с.
4. Методические рекомендации "Методика выполнения дипломных работ по специализации 030543 Профессионально педагогические технологии". Екатеринбург: Изд-во УГППУ, 1998.
5. Шолохович Ф.А., Васин В.В. Основы высшей математики. Екатеринбург: Уральское изд-во, 2003. 416с.
6. Грабарь М.И., Краснянская К.Л. Применение математической статистики в педагогических исследованиях. Непараметрические методы. М.: Педагогика, 1977. 136 с.
7. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов. М.: Высш. школа, 1972. 368 с.
8. Сборник задач по математике для вузов. Специальные курсы. / Под ред. А.В. Ефимова. М.: Наука, 1984. 608 с.
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы