Сводка и группировка статистических данных. Функции статистических служб. Сводка и группировка статистических данных. Графическое отображение вариационных рядов. Абсолютные и относительные статистические показатели. Выборочное наблюдение в статистике.
Значение критерия Пирсона ?2 df(v) Уровень значимости ? df(v) Уровень значимости ? Значение t-критерия Стьюдента df(v) Уровень значимости ? df(v) Уровень значимости ?.
Введение
Предмет и метод статистической науки
Статистическая наука сложилась в результате теоретических обобщений накопленных человечеством опыта учетно-расчетных работ, обусловленных потребностями управления обществом.
Термин «статистика» произошел от латинских слов stato (государство) status (положение вещей, политическое состояние).
Статистика - это наука, изучающая количественную сторону массовых явлений и процессов в неразрывной связи с их качественной стороной, количественное выражение закономерностей общественного развития в конкретных условиях места и времени.
Статистика - это отрасль практической деятельности по сбору, накоплению, обработке и анализ цифровых данных, характеризующих население, экономику, культуру, образование и другие явления общественной жизни и предназначенную для задач государственного регулирования и управления.
Статистика - это собственно данные (цифровой материал), который обрабатывается определенными методами.
Предмет и метод статистической науки
Объектом исследования статистики как науки являются: · общество;
· массовые социально-экономические явления;
· влияние природных и технических факторов на изменение количественных характеристик социально-экономических явлений;
· влияние жизнедеятельности общества на среду обитания.
Предметом статистики выступают количественные характеристики и соотношения качественно определенных социально-экономических явлений, закономерности их связей и развития в конкретных условиях места и времени.
Основой для разработки и применения статистической методологии (совокупности методов и приемов) является диалектический метод познания, когда общественные явления и процессы рассматриваются в развитии, взаимной связи и причинной обусловленности.
Статистика опирается на диалектические категории: · случайного и необходимого;
· единичного и массового;
· индивидуального и общего;
· причинность и закономерность.
Многообразие статистических методов обусловлено сложностью объекта и сложностью и многоэтапностью трех стадий исследования экономических явлений: 1 стадия - сбор первичной информации - метод массового статистического наблюдения, обеспечивающий репрезентативность информации;
2 стадия - сводка, группировка, обработка первичной информации - метод статистических группировок математической статистики и теории вероятности;
3 стадия - обобщение и интерпретация статистической информации - метод обобщения и анализа на основе показателей абсолютных относительных и средних величин, вариаций динамики, индексов.
На всех стадиях применяются графические, табличные и математические методы.
Задачи статистики в современных условиях: исследование происходящих в обществе преобразований социальных и экономических процессов на основе системы специальных показателей;
обобщение и прогнозирование тенденций развития народного хозяйства и его составляющих;
влияние имеющихся резервов эффективности общественного производства;
создание единого информационного пространства органов государственной власти;
организация статистики отраслей народного хозяйства и общества (прикладной статистики).
Теория статистки - методологическая основа всех отраслевых (прикладных) статистик: экономической; социальной; труда; государственной; финансов.
Организация и функции статистических служб
В России в 1811 г. при департаменте полиции было образовано статистическое отделение, в 1857 г. - Центральный статистический комитет, губернские и земские Комитеты, с 25 июля 1918 г. - Центральное статистическое управление (ЦСУ).
В настоящее время в соответствии со ст. 71 Конституции Российской Федерации - существует Государственный Комитет Российской Федерации по статистике (Госкомстат РФ). Органы Госкомстата составляют единую сеть государственной политики. Данные собираются по единым стандартам, а их представление является обязательным для хозяйствующих субъектов. «Российский статистический ежедневник», «Россия в цифрах».
Функции Госкомстата РФ: 1) организация наблюдений по определенным формам;
2) обеспечение единого государственного реестра предприятий и организаций (ОГРПО);
3) обеспечение сбора, обработки и хранения информации и соблюдение государственной, коммерческой и личностной тайны;
4) сопоставление социально-экономических показателей во всем масштабе;
5) осуществление технических, информационных, научных и организационных задач статистических служб.
Международные статистические службы: · Статистическая комиссия ООН, ЮНЕСКО, ЕВРОСТАТ (страны общего рынка) - координирует деятельность статистических бюро, осуществляет консультации, обеспечивает сопоставимость показателей и распространение информации.
· Статистическое бюро Секретариата ООН, Всемирный банк, МВФ - исполнительный орган, собирают информацию от государств членов ООН, публикует эти данные в периодических изданиях: «Ежемесячный статистический бюллетень», «Демографический ежегодник», «Ежегодник по внешней торговле» и др.
· Международный статистический институт МСИ - ведет обобщение научных исследований в области теории методологии статистики. 2. Этапы статистического исследования
Понятие о статистической информации
Информация - (лат.) «осведомление, доведение сведений о чем-либо».
Статистическая информация (статистические данные) - первичный материал о социально-экономических явлениях, формирующийся в процессе статистических наблюдений, который затем подвергается систематизации, сводке, анализу и обобщению.
В природе, технике, обществе, экономике нет явлений, в которых не присутствовали бы элементы случайности. Случайность (неопределенность) - когда исход не ясен в принципе - порождается одновременным влиянием множества изменяющихся факторов на изучаемый процесс.
Статистическое наблюдение
Статистическое наблюдение - это такое наблюдение, которое обеспечивает получение объективной, сопоставимой, достоверной и полной информации о событии и обладает, как и вероятность, следующими свойствами: рассматривают события (данные) только тех испытаний (явлений), которые могут быть воспроизведены в сопоставимых условиях достаточно много раз;
вероятность появления войн или гениальных произведений не определяется как статистическая закономерность;
события (данные) должны обладать статистической устойчивостью, т.е. изменяться в пределах закономерностей больших чисел;
число данных должно быть достаточно большим (массовым), чтобы вероятность Р(А) приближенно равнялась частоте (А).
Не всякий сбор данных является статистическим наблюдением. Статистическим можно назвать такое наблюдение, которое обеспечивает регистрацию устанавливаемых фактов.
Объект статистического наблюдения - явление или процесс, обладающий свойствами однородности, воспроизводимости и устойчивости.
Сводка и группировка статистических данных
Получаемая в ходе статистического наблюдения информация характеризует единицы статистической совокупности с различных сторон и не позволяет сделать обобщающие выводы об объекте в целом (т.е. о всей статистической совокупности).
Статистическая совокупность - это множество единиц явления, объединенных в соответствии с задачей исследования единой качественной основой (однородностью), но отличающиеся друг от друга признаками.
Единицей статистической совокупности является элементы данного множества, которые характеризуются общими свойствами, т.е. признаками.
Признаки бывают: · атрибутивными, т.е. качественными;
· количественными (дискретными и непрерывными).
Вариация признаков обуславливается случайным характером реальных явлений и процессов и зависит от изменения факторов, влияющих на объект статистического исследования.
Статистическое наблюдение - это первый этап анализа.
Статистическая сводка - это специальным образом организованная первичная обработка данных статистического наблюдения, включающая систематизацию, группировку данных, подсчет групповых, итоговых и относительных (средних показателей ). (Это второй этап обработки данных).
Программа статистической сводки устанавливает следующие этапы: · выбор группировочных признаков;
· определение порядка формирования групп;
· разработка системы статистических показателей для характеристик групп и объекта в целом;
· разработка макетов статистических таблиц или графиков.
В сводке отдельные единицы статистической совокупности объединяются в группы при помощи метода группировок.
С помощью метода группировок решаются задачи: · выделение социально-экономических типов явлений;
· изучение структуры явления и структурных сдвигов, происходящих в нем;
· выявление связи и зависимости между явлениями.
Группировка - это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединения изучаемых единиц в частные совокупности по существенным признакам.
Различают следующие виды группировок: · типологическая группировка, т.е. разделение качественно разнородной совокупности на классы или однородные группы;
· структурная группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьируемому признаку;
· аналитическая группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками (факторными и результативными);
· комбинированная группировка, образованная по двум или более признакам.
В таблицах 2.1-2.3 приведены примеры различных группировок.
Таблица 2.1 - Типологическая группировка
№ п/п Группы предприятий по форме собственности Число предприятий единиц в % к итогу
1 Федеральная собственность 26326 93,6
2 Муниципальная 420 1,5
3 Частная 1366 4,9
Всего 28112 100,0
Таблица 2.2.- Структурная группировка
№ п/п Группы населения по размеру среднедушевого дохода, руб. Численность населения всего, млн. чел. в % к итогу
1 до 1000 руб. 2,4 2,0
2 1000-1800 24,8 18,0
3 1800-2600 34,2 25,0
4 2600-3400 29,4 21,5
5 3400-10000 45,7 33,5
Всего 136,5 100,0
Таблица 2.3 - Аналитическая группировка
№ п/п Группы банков по сумме активов, млн.руб. Количество банков В среднем на 1 банк
Численность занятых, чел. Балансовая прибыль, млрд. руб.
1 до 20 29 184 22,5
2 20 - 30 8 313 31,6
3 30 - 40 7 374 36,0
4 40 - 50 9 468 69,2
5 50 и более 7 516 205,6
Всего 50 1855 360,0
Принципы построения статистических группировок
1. Выбор группировочного признака - признака, по которому производится разбиение совокупности на отдельные группы. В качестве признака необходимо использовать существенные обоснованные признаки. Группировочный признак - это основание (свойство объекта) для разделения объектов на группы.
Признаки различаются: · по форме выражения (атрибутивные и количественные);
· по характеру колебания (альтернативные «да», «нет»; множественные);
· по роли во взаимосвязи явлений (результативные - могут меняться в зависимости от ситуации и целей анализа; факторные - воздействующие на другие признаки).
2. Определение количества групп. Если в основание группировки положен атрибутивный признак, то количество групп будет столько, сколько существует градаций (уровней) данного признака. Если основание группировки - количественный признак, то при определении количества групп в каждом конкретном случае следует исходить не только из степени колеблемости признака, но и из особенностей объекта и цели исследования.
Если совокупность состоит из большого числа единиц и распределение единиц по группировочному признаку близко к нормальному, для определения количества групп (m) используют формулу Стерджесса: m = 1 3,322·lg N, (2.1)
где N - численность единиц совокупности.
Таблица 2.4 - Номограмма по формуле Стерджесса
N 15?24 25?44 45?89 90?179 180?359 360?719 720?1489 m 5 6 7 8 9 10 11
3. Определение интервала группировки. Интервал - это значение варьирующего признака, лежащее в определенных границах.
Если вариация признака происходит в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами: , (2.2) где h - величина интервала;
xmax, xmin - максимальное и минимальное значения группировочного признака в совокупности;
m - число групп.
Величина интервала округляется до ближайшего целого числа, или же кратного 10, 50, 100.
Возможны и другие варианты определения интервала группировки.
Интервалы могут быть двух видов: · закрытыми, когда у интервала указаны обе границы;
· открытыми, когда у первого интервала указана верхняя граница, а у последнего - нижняя (например, в таблице 2.3, 1-я группа населения по размеру среднедушевого дохода - до 1000 руб.; последняя - 10000 и более).
Возможно построение вторичных группировок. Основные задачи, вторичной группировки: · приведение данных к сопоставимым результатам;
· укрупнение интервалов;
· долевая перегруппировка (образование новых групп с меньшими интервалами).
Пример 2.1.
Имеются первичные данные о количестве работников определенного возраста.
При изучении совокупности интересующий нас признак у различных единиц совокупности принимает различные значения, т.е. он имеет некоторую вариацию.
Вариацией признака называется наличие различий в численных значениях признаков у отдельных единиц совокупности.
Чтобы выявить характер распределения единиц совокупности по варьирующим признакам, определить закономерности в этом распределении, строят ряды распределения единиц совокупностей по какому-либо варьирующему признаку.
Ряды распределения, построенные по количественному признаку называются вариационными.
При анализе вариационных рядов решают следующие задачи: 1) Определение меры вариации, т.е. количественное измерение степени колеблемости признака. Это позволяет сравнивать различные совокупности между собой по степени рассеяния и отслеживать уровень вариации признака одной и той же совокупности в различные периоды.
2) Исследование закономерностей вариации в статистических совокупностях для изучения причин, вызывающих вариацию.
Для описания статистических распределений обычно используются следующие виды характеристик (показателей): 1) средние величины;
2) характеристики вариации (рассеяния);
3) характеристики дифференциации и концентрации;
4) характеристики формы распределения.
Графическое отображение вариационных рядов
Вариационный ряд по своей конструкции имеет 2 характеристики: · значения варьирующего признака - варианты xi, i = 1,2,…,m;
· число случаев вариантов: абсолютные - частоты ni (fi), относительные - частости wi (относительные доли частот в общей сумме частот).
Тогда можно сказать, что вариационный ряд - это ранжированный (упорядоченный) в порядке возрастания или убывания ряд статистических частот (частостей).
Вариационные ряды по способу построения бывают дискретные и интервальные.
Дискретный вариационный ряд можно рассматривать как такое преобразование ранжированного ряда, при котором перечисляются отдельные значения признака и указывается их частота.
Если число вариантов велико или признак имеет непрерывную вариацию, то строится интервальный вариационный ряд, в котором отдельные варианты объединяются в интервалы (группы). Принципы построения групп рассмотрены в разделе 2.4.Существуют следующие виды графического отображения вариационных рядов (рис. 3.1, 3.2): · полигон для отображения дискретных рядов, когда фиксируются значения ( xi; ni, i = 1,2,…,m);
· гистограмма для отображения интервальных рядов (ki = х(i 1)- xi, ni(wi));
Рис. 3.2. Графическое отображение кумулятивного ряда
Обобщающие статистические показатели
Экономико-статистические показатели содержат количественную характеристику тех или иных свойств экономических явлений и представляют собой модель. С помощью показателей определяются результаты экономической деятельности и состояние общества. Система статистических показателей основана на содержательном единстве характеристик объекта исследования. Развитие систем статистических показателей происходит в соответствии с развитием отражаемой объективной реальности и в результате углубления процессов познания реальных систем.
Под статистическим показателем понимается количественная характеристика изучаемого объекта или его свойства. На этапе статистической сводки от индивидуальных значений признаков совокупности путем суммирования переходят к показателям совокупности, которые называются обобщающими.
Например, система статистических показателей продукции промышленного предприятия включает следующие показатели: · товарная продукция;
· отгруженная продукция;
· реализованная продукция;
· чистая продукция;
· добавленная стоимость и др.
Раньше учитывали товарную продукцию, а в новых условиях - чистую и добавленную стоимость.
Система экономико-статистических показателей в управлении предприятиями призвана выполнять четыре функции: · директивную (плановые показатели, нормативы, разряды, ставка);
· учетную (фактические результаты деятельности);
· стимулирующую (зарплата, средняя численность, развитие производства);
· познавательную (сведения о налогах, трудоустройстройстве, среднем возрасте и т.д.).
В зависимости от методов расчета обобщающие статистические показатели могут быть: · абсолютными;
· относительными;
· средними величинами.
Абсолютные и относительные статистические показатели
Абсолютными в статистике называются суммарные обобщающие показатели, характеризующие размеры, объемы, уровни, мощности, темпы и др. изменения величин. Абсолютные показатели являются именованными числами, т.е. измеримы. Существуют: натуральные, стоимостные и условно-натуральные (условное топливо, эталонные лошадиные силы) измерители. Они служат для описания фактического состояния объекта, установления плановых и прогнозных значений. Абсолютные показатели могут быть сравнимы в разные периоды времени (прошлый, настоящий, будущий).
Абсолютные показатели позволяют точно характеризовать объект в данный момент времени, но должны уточняться в динамике (сопоставимые цены, инвестиции с учетом инфляции и т.д.).
Относительные статистические величины - это показатели в виде коэффициентов, характеризующих долю отдельных частей, изучаемой совокупности во всем ее объеме.
Относительные показатели при исследовании экономических явлений и процессов изучаются совместно с абсолютными показателями и обеспечивают сопоставимость сравниваемой и базовой величин.
Относительный показатель динамики (ОПД) представляет собой отношение уровня исследуемого процесса или явления за данный период времени (по состоянию на данный момент времени) к уровню этого же процесса или явления в прошлом: ОПД или ОПД . (4.1)
Пример 4.1.
Менеджер получал 400$, ему снизили заработную плату на 10%. Через год опять повысили на 10%. Сколько будет получать менеджер?
1-й год: было 400$; стало 400·0,9 = 360$;
2-й год: было 360$; стало 360·1,1 = 396$, т.е. на 4$ меньше, чем в самом начале.
Относительный показатель структуры (ОПС) представляет собой отношение структурных частей изучаемого объекта и их целого:
ОПС . (4.2)
Выражается относительный показатель структуры в долях единицы или в процентах. Рассчитанные величины, соответственно называемые долями или удельными весами, показывают, какай долей обладает или какой удельный вес имеет та или иная часть в общем итоге.
Относительный показатель координации (ОПК) представляет собой отношение одной части совокупности к другой части этой же совокупности: ОПК . (4.3)
При этом в качестве базы сравнения выбирается та часть, которая имеет наибольший удельный вес или является приоритетной с экономической, социальной или какой-либо другой точки зрения. В результате получают величину, отражающую во сколько раз данная часть больше базисной или сколько процентов от нее составляет, или сколько единиц данной структурной части приходится на 1 единицу (иногда - на 100, 1000 и т.д. единиц) базисной структурной части.
Относительный показатель сравнения (ОПСР) представляет собой отношение одноименных абсолютных показателей, характеризующих разные объекты (предприятия, фирмы, районы, области, страны и т.п.): ОПСР . (4.4)
Относительный показатель интенсивности (ОПИ) характеризует степень распространения изучаемого процесса или явления и представляет собой отношение исследуемого показателя к размеру присущей ему среды: ОПИ , (4.5) где XA - показатель, характеризующий явление А;
YA - показатель, характеризующий среду распространения явления А.
Данный показатель получают сопоставлением уровней двух взаимосвязанных в своем развитии явлений. Поэтому, наиболее часто он представляет собой именованную величину, но может быть выражен и в процентах и т.п.
Обычно ОПИ рассчитывается в тех случаях, когда абсолютная величина оказывается недостаточной для формулировки обоснованных выводов о масштабах явления, его размерах, насыщенности, плотности распространения. Так, например, для определения уровня обеспеченности населения легковыми автомобилями рассчитывается число автомашин, приходящихся на 100 семей, для определения плотности населения рассчитывается число людей, приходящихся на 1 км2.
Например, если число граждан, состоящих на учете в службе занятости, составляет 3064 тыс. человек, а число заявленных предприятиями вакансий - 309 тыс., то на каждых 100 незанятых приходилось 10 свободных мест ( ).
Разновидностью относительных показателей интенсивности являются относительные показатели уровня экономического развития, характеризующие производство продукции в расчете на душу населения и играющие важную роль в оценке развития экономики государства. Так как объемные показатели производства продукции по своей природе являются интервальными, а показатель численности населения - моментным, в расчетах используют среднюю за период численность населения.
Относительные показатели плана и реализации плана используются для целей планирования и сравнения реально достигнутых результатов с ранее намеченными.
ОПП , (4.6) где ОПП - относительный показатель плана;
- уровень, планируемый на i 1 период;
xi - уровень, достигнутый в i-м периоде.
ОПРП , (4.7) где ОПРП - относительный показатель реализации плана;
xi - уровень, достигнутый в (i 1)-м периоде.
ОПП характеризует напряженность плана, т.е. во сколько раз намечаемый объем производства превысит достигнутый уровень или сколько процентов от этого уровня составит. ОПРП отражает фактический объем производства в процентах или коэффициентах по сравнению с плановым уровнем.
Относительные величины выполнения плана и динамики связаны между собой следующими соотношениями: ОПД = ОПП · ОПРП . (4.8)
Пример 4.2.
Оборот торговой фирмы в базисном году составил 2 млрд.руб. Руководство фирмы считает реальным в следующем году довести оборот до 2,8 млрд. руб. Найти ОПП, ОПРП, ОПД, если фактический оборот фирмы за отчетный год составил 2,6 млрд. руб.
ОПП = ? 100% = 140,0%;
ОПРП = ? 100% = 92,9%.
ОПД = 1,4·0,929 = =1,3 или 130%.
1. Средние величины
Средняя величина является обобщающей характеристикой совокупности однотипных явлений по изучаемому признаку. Средняя величина должна вычисляться с учетом экономического содержания определяемого показателя.
Все виды средних делятся на: · степенные (аналитические, порядковые) средние (арифметическая, гармоническая, геометрическая, квадратическая);
· структурные (позиционные) средние (мода и медиана) - применяются для изучения структуры рядов распределения.
1.1 Средние степенные величины
Средняя степенная (при различной величине k) определяется: (1.1).
Таблица 1.1 - Виды средних степенных величин k Наименование средней Формула средней Когда используется
1 Средняя арифметическая простая (невзвешенная) (1.2) где xi - i-й вариант осредняемого признака ( ); n - число ВАРИАНТИСПОЛЬЗУЕТСЯ, когда расчет осуществляется по несгруппированным данным
1 Средняя арифметическая взвешенная (1.3), где fi - частота повторяемости i-го ВАРИАНТАИСПОЛЬЗУЕТСЯ, когда данные представлены в виде рядов распределения или группировок
-1 Средняя гармоническая взвешенная (1.4), где .Используется, когда известны индивидуальные значения признака и веса W за ряд временных интервалов
-1 Средняя гармоническая невзвешенная (1.5)Используется в случае, когда веса равны
0 Средняя геометрическая невзвешенная (1.6)Используется в анализе динамики для определения среднего темпа роста
0 Средняя геометрическая взвешенная (1.7)
2 Средняя квадратическая невзвешенная (1.8)Используется при расчете показателей вариации
2 Средняя квадратическая взвешенная (1.9)
В статистическом анализе также применяются степенные средние 3-го и более высоких порядков.
Правило мажорантности средних: с ростом показателя степени значения средних возрастают.
(1.10)
Средняя прогрессивная - средняя для “лучших” значений признака.
Свойства средней арифметической
Средняя арифметическая постоянной величины равна самой величине.
Если все варианты xi увеличить (уменьшить) на одно и тоже число c, увеличится (уменьшится) на то же число.
. (1.11)
Если все варианты xi увеличить (уменьшить) в одно и то же число раз k, увеличится (уменьшится) в то же число раз.
. (1.12)
Средняя арифметическая отклонений вариантов от средней арифметической равна 0.
. (1.13)
По свойству 2 при : .
Средняя арифметическая алгебраической суммы признаков равна такой же сумме средней арифметической этих признаков.
. (1.14)
Если ряд состоит из нескольких групп, общая средняя равна средней арифметической групповых средних, причем весами являются объемы группы.
, (1.15) где - средняя арифметическая группы i;
N - общий объем ряда ( );
ni - объем группы i ( ).
. (1.16)
1.2 Средние структурные величины
В условиях недостаточности средних используют структурные средние величины - моду и медиану.
Медиана (Ме) - это вариант, который находится а середине вариационного ряда. Медиана делит ряд на две равные (по числу наблюдений) части. В ранжированных рядах не сгруппированных данных нахождение медианы сводится к отысканию порядкового номера и значения варианта у этого номера.
Медиана в интервальных вариационных рядах рассчитывается по формуле: , (1.17)
где х0 - нижняя граница медианного интервала (накопленная частота которого превышает половину общей суммы частот);
Также в интервальных вариационных рядах медиана может быть найдена с помощью кумуляты как значение признака, для которого или . (1.18)
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины: .
Модой (Мо) вариационного ряда называется вариант, которому соответствует наибольшая частота.
Для вычисления моды в интервальном ряду сначала находится модальный интервал, имеющий наибольшую частоту (или наибольшую плотность распределения - отношение частоты интервала к его величине ni/hi - в интервальном ряду с неравными интервалами), а значение моды определяется линейной интерполяцией: , (1.19) где хо - нижняя граница модального интервала;
- величина модального интервала;
, , - частота ni (в интервальном ряду с равными интервалами) или плотность распределения ni/hi (в интервальном ряду с неравными интервалами) модального, до и послемодального интервала.
Мода так же, как и медиана обладает определенной устойчивостью к вариации признака. Если в совокупности первичных признаков нет повторяющихся значений, то для определения моды проводят группировку.
Графически отобразить моду по гистограмме можно следующим образом: нужно взять столбец, имеющий наибольшую высоту, и из его левого верхнего угла провести отрезок в угол последующего столбца, а из правого угла - в верхний правый угол предыдущего столбца, абсцисса точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности. Медиану приближенно можно определить графически - по кумуляте. Для этого высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения и есть медиана (рисунок 1.1)
Рис. 1.1 Графическое отображение интервального вариационного ряда
В симметричных рядах имеет место следующее соотношение моды, медианы и средней арифметической (1.20).
В случае, если (1.21), имеет место левосторонняя асимметрия ряда.
В случае, если (1.22), имеет место правосторонняя асимметрия ряда.
Мода и медиана, в отличие от степенных средних, являются конкретными характеристиками ряда. Медиана - характеризует центр, вычисляется проще и не чувствительна к концам интервала. Мода - наиболее вероятное значение в изучаемой совокупности (например, наиболее возможные результаты).
1 2 3
1 - распределение с левосторонней асимметрией
2 - распределение с правосторонней асимметрией
3 - нормальное (симметричное) распределение
2. Анализ вариационных рядов
2.1 Показатели вариации
Вариацией называется изменяемость, колеблемость величины признака. Вариация проявляется в отклонениях от средних и зависит от множества факторов, влияющих на социально-экономическое явление. Вариация бывает случайной и систематической, существует в пространстве и во времени. Показатели вариации делятся на абсолютные и относительные (таблица 2.1).
Таблица 2.1 - Показатели вариации
Показатель Формула расчета показателя простой взвешенный
Относительные показатели (коэффициент вариации, линейный коэффициент вариации, коэффициент осцилляции) строятся с учетом базы (в виде средней), выражаются в процентах и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации
. (2.11)
Для расчета дисперсии можно использовать модифицированную формулу: . (2.12)
Выведем эту формулу из формулы (2.5)
Для расчета дисперсии можно использовать способ отсчета от условного нуля, который позволяет упростить вычисления при больших значениях признака. Тогда дисперсия вычисляется по формуле: , (2.13) где h - величина интервала;
А - условный нуль, в качестве которого можно использовать как середину серединного интервала, так и середину интервала с наибольшей частотой.
2.1.1 Свойства дисперсии
Дисперсия постоянной величины равна нулю.
Если у всех значений вариантов отнять какое-то постоянное число А, то средний квадрат отклонений (дисперсия) от этого не изменится
. (2.14)
Это значит, что дисперсию можно вычислить не по заданным значениям признака, а по их отклонениям от какого-то постоянного числа, например условного нуля (см. формулу 2.13).
Если все значения вариантов разделить на какое-то постоянное число А, то дисперсия уменьшится в А2 раз: . (2.15)
Если распределение признака близко к нормальному или симметричному, то по правилу мажорантности (т.к. среднее квадратическое отклонение - средняя геометрическая величина, а среднее линейное отклонение - средняя арифметическая) среднее квадратическое отклонение больше среднего линейного отклонения ( ), причем , . (2.16)
Размах вариации, среднее линейное и среднее квадратичное отклонение - это именованные величины. Единицей измерения у них и у исходных значений признака совпадают. Дисперсия может быть задана в ед.2 признака или в % отклонений.
2.1.2 Вариация альтернативного признака
Альтернативные признаки - два противоположных, взаимоисключающих друг друга качественных признака, которыми одни единицы совокупности обладают (значение варианта 1), а другие не обладают (значение варианта 0) (например, пол - мужской и женский, население - городское и сельское, продукция - годная и бракованная).
Частостью (p) является доля единиц, обладающих данным признаком, в общей численности совокупности и (q = 1 - p) - доля единиц, не обладающих данным признаком, в общей численности совокупности. xi fi
1 p
0 q = 1 - p
Средняя арифметическая альтернативного признака
. (2.18)
Дисперсия альтернативного признака
, (2.19) т.е. дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, и доли единиц, не обладающих этим признаком.
Исходя из того, что p q = 1: ; . (2.20)
2.2 Виды дисперсий в совокупности, разделенной на части. Правило сложения дисперсий
Если исходная совокупность является такой, что по значениям признака она делится на l групп, то общая дисперсия складывается из частных дисперсий. В таблице 2.2 представлен анализ такой совокупности.
Таблица 2.2 - Определение исходной совокупности по группам
Значение признака х Число единиц в j-й группе Итого
1 … j … l х1 f11 … f1j … f1l
… … … … … … … xi fi1 … fij … fil
… … … … … … … xk fk1 … fkj … fkl
Итого … …
Здесь j - номер группы ( );
хі - i-е значение признака ( );
fij - частота i-го значения признака, число единиц в j-й группе;
mi - сумма частот i-го значения признака в каждой группе;
nj - сумма частот всех значений признака в j-й группе;
N - сумма частот всех значений признака во всех группах (объем совокупности).
Сначала вычисляем l частных средних ( ), т.е. среднее значение признака в каждой группе: . (2.22)
На основе частных средних определяем общую среднюю ( ) по формулам или . (2.23)
Общая дисперсия совокупности
. (2.24)
Общая дисперсия отражает вариацию признака за счет всех факторов, действующих в данной совокупности.
Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия, которая исчисляется как средний квадрат отклонений групповой средней от общей средней: . (2.25)
Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, т.е. вариацию между группами за счет признака-фактора, положенного в основу группировки.
Вариацию внутри каждой группы изучаемой совокупности отражает внутригрупповая дисперсия, которая исчисляется как средний квадрат отклонений значений признака х от частной средней : или . (2.26)
Для всей совокупности внутригрупповую вариацию будет выражать средняя из внутригрупповых дисперсий, которая рассчитывается как средняя арифметическая из внутригрупповых дисперсий: . (2.27)
Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основу группировки.
Между представленными видами дисперсий существует определенное соотношение, которое известно как правило сложения дисперсий: . (2.28)
Таким образом, общая дисперсия складывается из двух слагаемых: первое - средняя из внутри
Список литературы
1) объем пассажирских авиаперевозок характеризуется ярко выраженной сезонностью;
2) объем пассажирских авиаперевозок по отдельным месяцам года значительно отклоняется от среднемесячного;
3) наибольший объем характерен для мая, наименьший - для декабря.
Для наглядного изображения сезонной волны индексы сезонности изображают в виде графика.
Индекс сезонности авиаперевозок пассажиров
6.4 Статистические методы прогнозирования экономических показателей
Прогнозирование - процесс определения возможных в будущем значений экономических показателей на основании уже известных.
Различают прогнозы по периоду упреждения: оперативные (до 1 мес.); краткосрочные (до 1 года); среднесрочные (1 - 5 лет); долгосрочные (более 5 лет).
Различают методы прогнозирования: Экстраполяция тенденций: - упрощенные приемы, основанные на средних показателях динамики (средние темпы роста, прироста);
- аналитические методы (метод наименьших квадратов, тренды, т.е. математические функции);
- адаптивные методы, учитывающие степень устаревания данных (методы скользящих и экспоненциальных средних, методы авторегрессии).
Методы статистического моделирования: - статические (методы парной и множественной регрессии);
- динамические (анализ динамических рядов): - методы агрегатного моделирования (разложение ряда на тенденции, сезонность, случайные составляющие);
- методы регрессии по взаимосвязанным рядам динамики (включаются в модель не только факторы, но и лаговые переменные);
- методы регрессии по пространственно-временной информации (для каждого ряда строится регрессионная модель по совокупности объектов).
6.4.1 Прогнозирование на основе экстраполяции тренда
Тренд - основная тенденция развития. Методы выявления тренда называются методами выравнивания временного ряда (метод наименьших квадратов, скользящей средней, конечных разностей).
При наличии тенденции в ряду динамики модель уровня динамического ряда: , (6.25) где - средний уровень динамического ряда;
Чем меньше остаточные колебания , тем выше адекватность (практическая значимость) модели. Следовательно, результаты прогноза зависят от типа кривой тренда y(t).
1. Линейный тренд yt = a0 a1·t означает, что уровни динамики ряда изменяются с одинаковой скоростью. a0 - начальный уровень тренда (t = 0);
a1·- средний абсолютный прирост в единицу времени.
В линейном тренде уровни динамики ряда изменяются в арифметической прогрессии, а темпы роста уровня - падающие.
2. Параболический тренд yt = a0 a1·t a2·t2 применяется, если ряд характеризуется относительным абсолютным ускорением, т.е. постоянными являются вторые разности (производные) - приросты абсолютных приростов. a0 - начальный уровень тренда (t = 0);
a1·- средний абсолютный прирост за период;
a2·- половина абсолютного ускорения динамического ряда.
Парабола означает смену тенденций (рост сменяется падением или наоборот). Это, как правило, связано с новым этапом в развитии явления по времени. Применяется для краткосрочного прогноза.
3. Парабола кубическая характеризует три этапа развития: рост, падение и опять рост. Число наблюдений должно быть около 6-7 временных единиц на один шаг прогноза. Следовательно, чтобы применить полином третьей степени надо иметь ряд за 20 лет, и корректно это только в стабильной экономике.
4. Показательная кривая , применяется при стабильном темпе роста динамического ряда. Рост по экспоненте означает геометрическую прогрессию уровней ряда. Это возможно в экономике в сравнительно небольшой период времени, когда ограничены ресурсы, меняются условия рынка. a0 - начальный уровень тренда (t = 0);
a1·- средний абсолютный прирост за период;
4. Логистическая кривая (кривая Перла-Рида) (кривые Гомперца), имеющая асимптоту, применяется, когда существует ограничение на рост показателя (уровней динамического ряда).
Если изучается динамика детской смертность, то нижняя асимптота - уровень жизни, верхняя - демографический состав населения.
8.4.2 Выбор наилучшего тренда при прогнозировании
При выборе уравнения тренда можно руководствоваться средней ошибкой аппроксимации
, %. (6.26)
5?7% - хорошая аппроксимация.
Доверительные интервалы прогноза определяются по дисперсии уточненного тренда
, %. (6.27)
Где yt - фактические уровни ряда;
- расчетные (трендовые) значения;
n - длина ряда;
m - число параметров в уравнении тренда (без свободного члена).
Доверительный интервал с учетом табличного значения критерия Стьюдента , равен
. (6.28)
Если распространить этот интервал на следующий отрезок времени, то надо ввести поправочный коэффициент q, зависящий от длины ряда и периода l упреждения
, (6.29) где n - длина ряда;
tl - порядковый номер прогнозируемого периода (tl = n l);
- порядковый номер середины ряда.
Тогда ошибка прогноза
. (6.30)
. (6.31)
7. Экономические индексы
Индексом в статистике называется относительный показатель, характеризующий изменение величины какого-либо явления по сравнению с эталоном.
Таблица - Классификация индексов
Классификационный признак Вид индексов
1. Содержание изучаемых объектов Количественные (объемные) индексы (физического объема, товарооборота национального дохода) Качественные индексы (интенсивности) (курса валют, цен, себестоимости, производительности труда)
2. Степень охвата элементов совокупности Индивидуальные (изменение одного показателя однотоварного) общие (групповые или субидексы (по отраслям))
3. Метод расчета Агрегатные Средние
4. База сравнения Динамические Территориальные (например, индекс цен на товары в РФ и ФРГ)
5. Вид весов С постоянными весами С переменными весами
6. Состав явления Постоянного состава Переменного состава Структурных сдвигов
7. Период исчисления Годовые Квартальные Помесячные и т.д.
Таблица - Обозначения индексируемых величин
Обозначение Индексируемая величина Обозначение Индексируемая величина q количество (объем) какого-либо товара в натуральном выражении t затраты времени на производство единицы продукции, трудоемкость p цена единицы товара W выработка продукции в единицу времени или на одного работника (производительность труда) pq товарооборот (стоимость продукции) z (c) себестоимость единицы продукции T=tq общие затраты времени на производство продукции или численность работников y урожайность отдельных сельскохозяйственных культур
П посевная площадь под отдельными культурами
7.1 Общие индексы количественных показателей
Индекс физического объема продукции показывает относительное изменение стоимости продукции изза изменения объема производства.
Индивидуальный индекс: , (7.1)
Агрегатный индекс: , (7.2) где q1 и q0 - объем выпуска продаж в базисном и отчетном периодах соответственно;
p0 - цена в базисном периоде.
Индекс товарооборота (или стоимости продукции), показывает во сколько раз изменилась стоимость продукции.
Агрегатный индекс товарооборота
. (7.4)
На сколько изменилась стоимость продукции показывает разница между числителем и знаменателем индекса: . (7.3)
При построении индекса физического объема продукции в качестве соизмерителей (весов) принимаются сопоставимые, неизменные, фиксированные цены, отличающиеся от текущих (действующих) цен (это в условиях инфляции могут быть цены предшествующего периода) или себестоимость продукции z0. В этом случае индекс характеризует изменение издержек производства.
. (7.5)
Аналогично строятся индексы товарооборота и потребления.
Значение общего индекса Ipq зависит от изменения двух индексируемых величин объема продукции (q0, q1) и цен (p1,p0).
В зависимости от вида исходных данных можно исчислить средние взвешенные (арифметические) индексы физического объема.
Если неизвестно q1, но дано значение q0 и , а также стоимость продукции базисного периода p0, то средний арифметический индекс физического объема равен: . (7.6)
Средний гармонический индекс физического объема используется для аналитических оценок в случае, когда неизвестно q0, но дано значение q1 и , а также стоимость продукции базисного периода p0:
. (7.7)
Индекс физического объема в прошлом вычисляется в сопоставимых, фиксированных ценах и отражает динамику выпуска продукции. В торговле чаще вычисляется в фактических ценах, отражая одновременное изменение цен и объема.
Пример Предприятие выпускает 3 вида неоднородной продукции. Данные об их производстве и ценах на них за два периода приведены в таблице (графы 1-5). Определить индивидуальные и агрегатные индексы физического объема.
Товар Выработано тыс. единиц Цена за единицу товара, руб. Стоимость продукции в базисных ценах, тыс.руб. Индивидуальный индекс физического объема базисный период отчетный период базисный период отчетный период базисный период отчетный период q0 q1 p0 p1 q0p0 q1p0
А 80 60 13 16 1040 780 0,750
Б 50 30 18 20 900 540 0,600
В 40 35 6 8 240 210 0,875
? - - - - 2180 1530 -
Агрегатный индекс физического объема: = 0,702 (70,2%).
Вычитая из числителя знаменатель = 1530 - 2180 = -650, определяем, что в абсолютном выражении за счет уменьшения выпуска стоимость продукции в отчетном периоде уменьшилась на 650 тыс.руб.
8.2 Общие индексы качественных показателей
Индексы цен показывают, как изменилась стоимость продукции за счет изменения цен.
Агрегатный индекс цен Пааше: , (7.8) где p1q1 - фактическая стоимость продаж (товарооборот) в отчетном периоде;
p0q1 - условная стоимость товаров, реализованных в отчетном периоде по базисным ценам.
Агрегатный индекс цен Ласпейреса: , (7.9) где p0q0 - фактическая стоимость продаж (товарооборот) в базисном периоде;
p1q0 - условная стоимость товаров, реализованных в базисном периоде по отчетным ценам.
Индекс цен Пааше показывает изменение цен отчетного периода по сравнению с базисным (на сколько товары стали дороже (дешевле)). Если бы товары были реализованы в отчетном периоде по базисным ценам, то фактическая экономия составила
. (7.10)
Индекс цен Ласпейреса показывает условную экономию, т.е. на сколько изменились цены в отчетном периоде по сравнению с базисным, но по той продукции, которая была реализована в базисном периоде. Этот индекс применяется при прогнозировании объема товарооборота в связи с предлагаемым изменением цен.
В условиях стабильности применяют индекс Пааше, при инфляции - индекс Ласпейреса.
Основываясь на рассмотренных двух вариантах построения индексов, Фишер предложил рассчитывать среднюю геометрическую индексов цен Пааше и Ласпейреса: . (7.11)
Этот индекс носит название “идеальный” индекс цен Фишера. Индекс цен Фишера “обратим” во времени (т.е. если рассчитывать индекс базисного периода к отчетному, он будет равен обратной величине первоначального индекса), но лишен экономического содержания.
При синтезировании общего индекса цен вместо фактического количества товаров (в отчетный и базисный периоды) в качестве соизмерителей индексируемых величин р1 и р0 могут применяться средние величины реализации товаров. При таком способе расчета формула сводного индекса цен (называемого индексом цен Лоу) выглядит следующим образом: . (7.12)
Индекс цен Лоу применяется в расчетах при закупках или реализации товаров в течение продолжительных периодов времени (пятилетках, десятилетиях и т.п.), поскольку он дает возможность анализа цен с учетом происходящих внутри отдельных субпериодов изменений в ассортиментном составе товаров.
Пример По имеющимся данным о ценах и реализации неоднородных товаров за два периода необходимо определить индексы цен: 1) индивидуальные; 2) агрегатные, в т.ч. а) индекс Пааше; б) индекс Ласпейреса; в) “идеальный” индекс Фишера; г) индекс Лоу.
Товар Единица измерения Базисный период Отчетный период
Цена за единицу продукции, руб. Продано единиц Цена за единицу продукции, руб. Продано единиц p0 q0 p1 q1
А т 20 7500 25 9500
Б м 30 2000 30 2500
В шт. 15 1000 10 1500
Сведем расчет индивидуальных индексов цен и промежуточные расчеты для определения агрегатных индексов цен в таблицу: Товар Индивидуальный индекс цен Стоимость товаров базисного периода, руб.Стоимость товаров отчетного периода, руб.Стоимость товаров для среднего за период выпуска, руб. в базисных ценах p0q0 в отчетных ценах p1q0 в базисных ценах p0q1 в отчетных ценах p1q1 базисного периода p0 отчетного периода p1
Абсолютный прирост товарооборота за счет фактора изменения цен в текущем периоде по сравнению с базисным периодом составил
= 327500 - 287500 = 40000 руб., т.е. если бы уровень цен остался на уровне базисного периода, экономия потребителя составила бы 40000 руб. б) Индекс цен Ласпейреса
= 1,1444 (114,44%).
Абсолютный прирост товарооборота за счет фактора изменения цен в текущем периоде по сравнению с базисным периодом составил
= 257500 - 225000 = 32500 руб. в) “Идеальный” индекс цен Фишера
=1,1418 (114,18%). г) Индекс цен Лоу
= 1,1415 (114,15%).
Товарооборот
Сводный индекс товарооборота: . (7.13)
Построение моделей взаимосвязанных индексов возможно лишь для сопоставимого круга элементов, т.е. при неизменном ассортименте отдельных товаров в отчетном и базисном периодах.
Абсолютное изменение товарооборота в отчетном периоде по сравнению с базисным одновременно за счет изменения физического объема продаж и изменения цен характеризует разница между числителем и знаменателем индекса, рассчитываемое по формуле (7.3): .
Измерить изолированное влияние каждого из этих факторов можно через разность числителя и знаменателя соответствующих аналитических индексов.
Разность числителя и знаменателя индекса физического объема (по формуле Ласпейреса)
(7.14) показывает изменение товарооборота за счет роста (сокращения) физического объема продаж.
Разность числителя и знаменателя индекса физического объема (по формуле Пааше)
(7.15) показывает изменение товарооборота в результате роста (снижения) цен.
Абсолютное изменение за счет отдельных факторов в сумме дают общее абсолютное изменение результативного признака: . (7.16)
Участие каждого фактора в формировании общего изменения товарооборота в относительном изменении определяется по следующим формулам: · прирост (уменьшение) товарооборота за счет изменения физического объема продаж
; (7.17)
· прирост (уменьшение) товарооборота за счет изменения цен
. (7.18)
Совокупное влияние факторов в относительном выражении отражается моделью
. (7.19)
При проведении статистического анализа можно определить долю каждого фактора в формировании общего изменения результата: · доля прироста (уменьшения) товарооборота за счет изменения физического объема продаж
; (7.20)
· доля прироста (уменьшения) товарооборота за счет изменения цен
. (7.21)
При этом (или 100%). (7.22)
Оценка доли отдельных факторов в формировании результата проводится лишь в случае однонаправленного изменения признаков-факторов.
7.3 Индексы переменного и фиксированного состава. Индекс структурных сдвигов
При изучении качественных показателей часто приходится рассматривать изменение во времени (или пространстве) средней величины индексируемого показателя для определенной совокупности.
Будучи сводной характеристикой качественного показателя, средняя величина складывается как под влиянием значений показателя у индивидуальных элементов (единиц), из которых состоит объект, так и под влиянием соотношения их весов (“структуры” объекта).
Если любой качественный индексируемый показатель обозначить через x, а его веса - через f, то динамику среднего показателя можно отразить как за счет изменения обоих факторов (x и f), так и за счет каждого фактора отдельно. В результате получим три различных индекса: индекс переменного состава, индекс фиксированного состава, индекс структурных сдвигов.
Индекс переменного состава отражает динамику среднего показателя (для однородной совокупности) за счет изменения индексируемой величины x у отдельных элементов (частей целого) и за счет изменения весов f, по которым взвешиваются отдельные значения x. Любой индекс переменного состава - это отношение двух средних величин для однородной совокупности (за два периода или по двум территориям): . (7.23)
Индекс фиксированного состава отражает динамику среднего показателя лишь за счет изменения индексируемой величины x, при фиксировании весов на уровне, как правило отчетного периода f1: . (7.24)
Другими словами индекс фиксированного состава исключает влияние изменения структуры (состава) совокупности на динамику средних величин, т.е. он характеризует динамику средних величин, рассчитанных для двух периодов при одной и той же фиксированной структуре.
Аналогично можно показать динамику среднего показателя лишь за счет изменения весов f при фиксировании индексируемой величины на уровне базисного периода x0. Такой индекс условно назван индексом структурных сдвигов: . (7.25)
Если от абсолютных весов перейти к относительным ( и ?d =1), формулы индексов средних величин примут вид: Индекс переменного состава: . (7.26)
Индекс фиксированного состава: . (7.27)
Индекс структурных сдвигов: . (7.28)
Индекс переменного состава есть произведение индекса фиксированного состава на индекс структурных сдвигов: . (7.29)
Пример По имеющимся данным о выпуске и себестоимости одноименного товара на двух предприятиях требуется определить изменение себестоимости единицы продукции на каждом предприятии, а также в целом по всем предприятиям с помощью индексов: а) переменного состава; б) фиксированного состава; в) структурных сдвигов.
Предприятие Базисный период Отчетный период
Произведено продукции Себестоимость единицы продукции, руб. Произведено продукции Себестоимость ед. продукции, руб. в тыс. шт. в долях к итогу в тыс. шт. в долях к итогу q0 d0 z0 q1 d1 z1
1 120 0,5 480 160 0,4 400
2 120 0,5 400 240 0,6 440
Итого 240 1,0 - 400 1,0 -
Индивидуальные индексы для 1-го и 2-го предприятия соответственно: = 0,8333 (83,33%); = 1,1000 (110,00%).
Для дальнейших расчетов понадобятся дополнительные расчеты: Предприятие Базисный период Отчетный период Расчетные графы q0 d0 z0 q1 d1 z1 z0 d0 z1 d1 z0 d1
1 120 0,5 480 160 0,4 400 240 160 192
2 120 0,5 400 240 0,6 440 200 264 240
Итого 240 1 - 400 1 - 440 424 432
Средние себестоимости: в базисном периоде руб.;
в отчетном периоде руб.
Индекс переменного состава: (96,36%).
Индекс фиксированного состава: (98,15%).
Индекс структурных сдвигов: (98,18%).
Проверка
%.
Себестоимость по двум предприятиям в среднем снизилась на 3,64%
Іпс - 100% = 96,36 - 100 = -3,64%.
В том числе: - за счет изменения структуры выпуска продукции: Icc - 100% = 98,18 - 100 = -1,82%;
- за счет снижения себестоимости на каждом предприятии
Іпс - Icc = 96,36 - 98,18 = -1,82%.
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы