Необхідно: перевірити експериментальні дані на відповідність нормальному закону розподілу за допомогою трьох критеріїв згоди: ? спрощеного критерію - методом моментів (через вибіркові значення асиметрії та ексцесу) на основі розрахунку статистичних характеристик; Для початку дамо означення відносної частоти події - це відношення тих спроб, у яких відбулася подія, до всіх спроб у серії випробувань. x1 , x2 … хп , хі, - елементи вибірки обєму n зустрічається пі разів, а число пі - частота елементу хі , а відношення - відносна частота елементу хі Для оцінки р(х) за вибіркою (xl , x2 … хп), розібємо область значень Х на l інтервалів (груп) довжини hi і= . Позначимо через і середини інтервалів, а через ni - число елементів вибірки, що потрапили у вказаний інтервал - і-у групу. Результати проміжних розрахунків зведемо до таблиці 1.2 і побудуємо гістограму вибірки за вихідними експериментальними даними, що наведені в таблиці.Критерій дозволяє знайти точку, у якій сума накопичених розходжень між двома розподілами є найбільшою, і оцінити достовірність цього розходження. Визначається критичне значення критерію для заданого рівня значущості ? , яке порівнюється з ?емп> , то Н0 відхиляється на заданому рівні значущості ?. В статистиці користуються трьома рівнями а: § ?= 0,1 (в 10 випадках зі 100 може бути відхилена правильна гіпотеза); Перевагою критерію Колмогорова є те, що для вибірок обємом n> 35критичні значення можна визначити не по таблицях, а розрахувати по асимптотичній формулі [5]: (1.15) де ? - рівень значущості. Порівнюючи значення ?емп з (1.14) зі значеннями з (1.15b) бачимо, що задовольняється нерівність ?емп> (1.16) для кожного з заданих рівнів значущості а .Для рівнів значущості?1 =0,01 і ?2=0,05?3=0,1перший член варіаційного ряду - =2,48 , що є найменшим членом емпіричної сукупності даних, не є викидом оскільки , тоді як) для =8,22критерій Граббсане виконується, тобто , що свідчить про те, що дана вибірка не належить до генеральної сукупності і найбільший член вибірки на вказаному рівні значущості можна вважати викидом. Провести ідентифікацію параметрів поліноміальної математичної регресії, яка задана рівнянням параболи другого ступеня вигляду Y=a0 a1X a2X2що є аналітичним наближенням вибірки експериментальних даних, які наведені в табл.4.1, і оцінити значущість кожного зі знайдених коефіцієнтів, а, також, робото здатність заданої регресійної моделі за критерієм Фішера. Перші два підходи можна застосувати тільки в тих випадках, коли матриця А є не виродженою, тобто коли її визначник - головний визначник ? системи - відмінний від нуля. Для перевірки значущості отриманого рівняння регресії визначимо статистику Фішера - F-статистику, - тобто характеристику точності рівняння регресії, що є відношенням частини дисперсії залежної змінної, яка пояснена (обрахована)рівнянням регресії, до непоясненої (залишкової) частини дисперсії цієї ж змінної, яка обумовлена відсутністю інформації про всі точки генеральної сукупності: , (4.9) де - обєм вибірки, - число незалежних параметрів при факторних змінних в рівнянні регресії (в нашому випадку це коефіцієнти при х і х2 ) . Для вибраного рівня значущості ? по розподілу Фішера визначається табличне значення , ймовірність перевищення якого у вибірці обєму п , отриманої з генеральної сукупності без звязку між змінними, не перевищує рівня значущості ? , і далі порівнюється з фактичним ЗНАЧЕННЯМF - статистики (4.9) для регресійного рівняння (в нашому випадку це (4.8)).Для регресійної моделі , що описується квадратичною функціональною залежністю типу yn= a0 a1x a2x2, методом найменших квадратів розраховані коефіцієнти профакторних змінних і за допомогою t-критерію Стьюдента доказана їхня значущість.
Вывод
Оскільки умови значущості статистичних характеристик критерію для заданої вибіркової сукупності не виконується, то даний критерій не відповідає нормальному розподілу.
ІІ. Перевірка статистичної гіпотези на відповідність експериментальних даних нормальному закону розподілу за критерієм Колмогорова.
Критерій ? Колмогорова - Смирнова призначений для співставлення двох розподілів: емпіричного розподілу ознаки з теоретичним (рівномірним чи нормальним) або двох емпіричних розподілів. Критерій дозволяє знайти точку, у якій сума накопичених розходжень між двома розподілами є найбільшою, і оцінити достовірність цього розходження. Під час розрахункової процедури співставляються спочатку частоти за першим розрядом (рівнем), потім за сумою першого і другого розрядів, далі за сумою першого, другого та третього розрядів і т. д. Таким чином, кожен раз проводиться співставлення накопичених до даного розряду частот. Якщо розбіжності між двома розподілами суттєві, то в деякий момент різниця накопичених частот досягне критичного значення, і тоді можна визнати розбіжності достовірними. У формулу критерію ? включається ця різниця. Чим більше емпіричне значення ?, тим більш істотні розбіжності. Статистичні гіпотези при цьому будуються таким чином. Основна (Н0 ). Розбіжності між двома розподілами недостовірні (судячи з точки максимального накопиченого розходження між ними). Конкуруюча (Н1 ). Розбіжності між двома розподілами достовірні (судячи з точки максимального накопиченого розходження між ними). Попри досить просту розрахункову процедуру та універсальність зазначений критерій має декілька обмежень: 1. Критерій вимагає, щоб вибірка була достатньо великою. При спів- ставленні двох емпіричних розподілів необхідно, щоб n1,2 ? 50. Порівняння емпіричного розподілу з теоретичним іноді допускається при n ? 5
2. Розряди (рівні) повинні бути впорядковані за наростанням або спаданням якої-небудь ознаки. Вони обовязково повинні відображати будь-яку односпрямовану його зміну. Таким чином, не можна накопичувати частоти (частості) за розрядами, які відрізняються лише якісно і не являють собою шкали порядку.
3. Кількість розрядів ознаки повинна перевищувати 3 розряди.
Алгоритм застосування критерію Колмогорова виглядає таким чином: 1. Записуються варіаційні ряди емпіричної і контрольної (теоретичної) вибірок.
2. Обчислюються відносні частоти і для двох наявних вибірок.
3. Записуються модулі різниць d1=| | і шукається найбільший dmax.
4. Визначається емпіричне значення критерію ?емп за допомогою формули ?емп=dmax? . (1.12)
5. Визначається критичне значення критерію для заданого рівня значущості ? , яке порівнюється з ?емп> , то Н0 відхиляється на заданому рівні значущості ?.
Рівень значущості а - це ймовірність того, що помилково буде відхилена висунута гіпотеза Н0. В статистиці користуються трьома рівнями а: § ?= 0,1 (в 10 випадках зі 100 може бути відхилена правильна гіпотеза);
§ ?= 0,05 (в 5 випадках зі 100 може бути відхилена правильна гіпотеза);
§ ? = 0,01 (в 1 випадку зі 100 може бути відхилена правильна гіпотеза).
Для перевірки розподілу на предмет відповідності нормальному закону розподілу обчислюють середнє значення і середньоквадратичне відхилення ?, а потім обчислюють відності теоретичні частоти за наступною формулою:
(1.13)
- абсолютна теоретична частота, ; -крок (ширина інтервалу даних ознаки, згрупованих в і-у групу з серединою в точці ), , ?(u)= .
Обчислимо значення контрольних величин = на підставі (1.13) і внесемо результати обчислень в розрахункову табл.1.3. Значення для і ? беремо з (1.7a) - (1.7b): ; ?=1,624; hi= h= 2; = 0,8058 .
Табл. 1.3 і хі ui ?і fi теор fi емп | fi теор - fi емп |
1 5032 -5,42 0,00074 0,0006 0,01 0,0094
2 5034 -4,19 0,00935 0,00754 0,03 0,0225
3 5036 -2,96 0,06149 0,04955 0,02 0,0296
4 5038 -1,73 0,21114 0,17014 0,09 0,0801
5 5040 -0,5 0,37875 0,3052 0,41 0,1048
6 5042 0,73 0,35493 0,28601 0,3 0,0140
7 5044 1,96 0,17376 0,14002 0,07 0,0700
8 5046 3,2 0,04444 0,03581 0,03 0,0058
9 5048 4,43 0,00594 0,00478 0,02 0,0152
10 5050 5,66 0,00041 0,00033 0,01 0,0097
З табл. 1.3 видно, що dmax= 0,1048 при і = 5. Оскільки п = 210, то згідно (1.12) ?емп=0,1048? = 1,5187. (1.14)
Перевагою критерію Колмогорова є те, що для вибірок обємом n> 35критичні значення можна визначити не по таблицях, а розрахувати по асимптотичній формулі [5]:
(1.15) де ? - рівень значущості.
Для ? = 0,1; 0,05; 0,01 з (1.15) маємо відповідно: ; ; ; (1.15a) а , отже, порівнюючи (1.15) з (1.15а), знаходимо
; ; ; (1.15b)
Порівнюючи значення ?емп з (1.14) зі значеннями з (1.15b) бачимо, що задовольняється нерівність ?емп> (1.16) для кожного з заданих рівнів значущості а . Це означає , що гіпотеза Н0 відхиляється.
Оскільки задовольняється нерівність (1.16) для заданої вибіркової сукупності, то гіпотезу слід відкинути.
ІІІ. Перевірка статистичної гіпотези за критерієм згоди Пірсона (критерій ).
Значення критерію розраховують [1] за формулою:
де - спостережувана абсолютна частота і-тої групи; - теоретична частота попадання даних в і-й інтервал для вибраного розподілу; n - обєм вибірки, k - число груп, на які розбито розподіл.
Для розподілу складені таблиці, де вказано критичне значення критерію згоди для вибраного рівня значущості ? і ступенів свободи v . Число ступенів свободи v визначається як число груп в емпіричному ряді розподілу мінус число звязків. Число ступенів свободи v=k - r - 1, де r- число параметрів моделі розподілу, що використовуються для розрахунку теоретичних частот. Зокрема, при розрахунку параметрів моделі за інтервальним варіаційним рядом число ступенів свободи v беруть рівним k - 2 для біноміального і k - 3 - для нормального розподілу, оскільки в останньому випадку використовуються r = 2 параметри : і ?.
Алгоритм застосування критерію виглядає наступним чином.
1. Записують частоти по кінтервалам.
2. Перевіряють рівність вибірка дискретний критерій розподіл
3. Обчислюють значення
4. Знаходять
5.
6. Знаходять по таблиці критичних точок розподілу
7. Якщо , то приймається гіпотеза Н0 .
Розраховуємо значення , , і підставляємо їх в табл.1.4. Значення розраховуємо за допомогою (1.13) і значень з табл. 1.3.
За таблицею критичних точок розподілу [1] по рівнях значущості ? = 0,01; 0,05; 0,1 і числу ступенів свободи v = k - 3 = 10 - 3 = 7знаходимо відповідні критичні точки (див. Додаток 1): .
Порівнюючи ці значення зі значенням з табл. 1.4 бачимо, що задовольняється нерівність , а це означає, що приймається альтернатива до Н0 гіпотеза про несхожість заданого емпіричного розподілу з нормальним.
Табл. 1.4 і хі ui ?і ni (ni- )2
1 5032 -5,42 0,00074 0,1198 2 3,535 29,509
2 5034 -4,19 0,00935 1,5074 6 20,183 13,390
3 5036 -2,96 0,06149 9,9092 5 24,100 2,432
4 5038 -1,73 0,21114 34,027 19 225,811 6,636
5 5040 -0,50 0,37875 61,0396 87 673,942 11,041
6 5042 0,73 0,35493 57,2012 63 33,626 0,588
7 5044 1,96 0,17376 28,003 15 169,078 6,038
8 5046 3,20 0,04444 7,1616 7 0,026 0,004
9 5048 4,43 0,00594 0,9568 4 9,261 9,679
10 5050 5,66 0,00041 0,0828 2 3,676 44,392
Оскільки не задовольняється нерівність для заданої вибіркової сукупності, то гіпотезу слід відкинути.
Завдання №2
Визначити коефіцієнти звязку k1, xp вхідного X та вихідного Усигналів фазово-часового дискримінатора, що є складовою системи автоматичного супроводу цілі по дальності, якщо відомо, що дискримінаційна характеристика пристрою апроксимується фінітною функцією y(x)кусково-лінійнійного типу:
де - значення розугодження керуючого сигналу, при якому вихідна напруга дискримінатора Y=0. Ідентифікацію параметрів лінійної математичної моделі статистичного обєкта провести: 1) регресійним методом найменших квадратів;
2) з використанням центрованих даних.
Обраховану функціональну залежність зобразити на координатній площині (х,у).
Розвязок : X TAY - є кінцеві множини експериментальних значень вхідних (факторних) величин
1. Математична модель функціонального звязку між вхідними і вихідними змінними задається у вигляді рівняння регресії
, При регресійних методах ідентифікації в якості найбільш часто застосовуються степеневі поліноми: . (2.4)
Задача ідентифікації полягає у знаходження таких оцінок невідомих параметрів аі, при яких задана рівнянням (2.4) аналітична залежність буде найкращим чином апроксимувати експериментальні дані.
В якості критерію близькості використовується мінімум квадратичної невязки J значень фактичних змінних уі і модельних УМІ , що розраховані за рівнянням регресії (2.4): (2.5) де - експериментальне значення вихідної змінної, - відповідне модельне значення.
Для обрахунку коефіцієнтів регресії складають рівняння на знаходження екстремума по кожному параметру : (2.6)
Сукупність співвідношень (2.5) утворює систему з т 1 рівняння відносно оцінок коефіцієнтів рівняння регресії (2.4). В нашому випадку, коли рівняння регресії має вигляд (2.2), критерій мінімуму середньоквадратичної похибки визначається функціоналом: (2.7)
З (2.7) відповідно до (2.6) отримуємо систему нормальних рівнянь:
(2.8)
Для визначення коефіцієнтів системи (2.8) складаємо таблицю 2.1: Табл. 2.1
1 1,25 1 1,25
2 2,5 4 5
3 2,75 9 8,25
4 3,5 16 14
5 4,25 25 21,25
звідки: (2.9)
Розвязуючи систему (2.9), знаходимо параметри моделі. З першого рівняння системи знаходимо
(2.10)
Підставляючи вираз (2.10) для в друге рівняння системи (2.9), маємо рівняння для знаходження : 15 (2,85 - 3 ) 55 = 49,75 (2.11)
З (2.11) знаходимо : 10 = 7, або = 0,7. (2.12)
Отже, наша лінійна регресійна модель має вигляд: . (2.13)
2)Центрованою називається випадкова величина х , математичне очікування якої M[x] дорівнює нулю. Випадкові величини центрують, віднімаючи від них математичне очікування або його незміщену оцінку.
Якщо в заданих статистичних спостереженнях нема систематичної похибки (змішення, тренду), то в цьому випадку задовольняється рівність , де і - вибіркові середні, а - коефіцієнт регресії.
Оцінка коефіцієнта регресії рівняння лінійної регресії знаходиться за формулами: (2.14) де ,( - коефіцієнт кореляції).
. (2.15)
Розрахуємо модель з використанням центрованих даних. Для цього обчислимо коефіцієнт кореляції між ХІУ через коваріацію цих двох вибірок, що є мірою їхньої лінійної залежності: , (2.16) де - вибіркові дисперсії вибірок ХІУ відповідно - див. (1.1d).
Обраховуємо середні вибіркові
Підставляючи знайдені значення статистичних характеристик в (2.14) знаходимо : (2.17) а з (2.15) з врахуванням (2.17) знаходимо, що , що співпадає з (2.13).
Обрахована лінійна регресійна модель і початкові емпіричні дані зображені на рис. 2.1.
Рис. 2.1. Регресійна модель і емпірична залежність
Завдання №3
Використовуючи критерії типу Граббса, перевірити наступну експериментальну вибірку даних (Х) на наявність аномальних членів: =3,68; =5,08; =2,81; =4,43; =3,11; =2,95; =4,65; =3,43; =4,76; =8.22; =3,27; =3,26; =2,75; =3,78; =4,08; =2,48; =4,15; =4,51; =4,84.
Розвязок : Для статистичного аналізу даних на наявність викидів і ідентифікації викидів застосовують критерії Кохрена і Граббса.
Для перевірки спостережень на викид застосовують прості критерії Граббса. Критерії використовуються для перевірки на аномальність спостережень, що належать вибіркам з нормальної генеральної сукупності. Статистики критерію Граббса передбачають можливість перевірки на наявність у вибірці або одного аномального спостереження (найменшого або найбільшого), або двох (двох найменших у вибірці або двох найбільших).
Критерій Граббса перевірки на один викид.
Нехай , , … , - спостережувана вибірка, - побудований по ній варіаційний ряд. Гіпотеза Н0 , що перевіряється, полягає в тому, що усі , , … , належать одній генеральній сукупності. При перевірці на викид найбільшого вибіркового значення конкуруюча гіпотеза Н1 полягає в тому, що належать одному закону, а деякому іншому, істотно зрушеному вправо. При перевірці на викид статистика критерію Граббса має вигляд
, (3.1)
Де
, (3.2)
. (3.3)
При перевірці на викид найменшого вибіркового значення конкуруюча гіпотеза Н1 припускає, що належить деякому іншому закону, істотно зрушеному вліво. В даному випадку обчислювана статистика набирає вигляду
, (3.4)
Максимальне або мінімальне спостереження вважається викидом, якщо значення відповідної статистики перевищить критичне : , (3.5) де п - обєм вибірки, ? - рівень значущості, що задається.
Критичні значення можна взяти з таблиць, що наведені в стандарті ISO5725-2: «Точність (правильність і прецизійність) методів і результатів вимірювань. Частина 2.». але в таблиці процентних точок , що наведена в стандарті ISO5725-2 (табл.5), невірно вказані рівні значущості а. Тому слід користуватися скорегованою таблицею, наведеною в Додатку 2.
Побудуємо за спостережуваною вибіркою варіаційний ряд, тобто проведемо ранжирування експериментальної вибірки з порядку збільшення її членів: =2,48; 2,75; =2,81; =2,95; 3,11; =3,26; 3,27; =3,43; 3,68; =3,78; 4,08; =4,15; 4,43; =4,49; 4,51; =4,65; 4,76; =4,84; 5,08; =8,22.
Перевіримо найменший =2,48 і найбільший =8,22 члени варіаційного ряду на викид, тобто на задоволення критерію Граббса (3.5). Для цього обрахуємо середнє вибіркове і середнє квадратичне відхилення s:
Підставив знайдені значення , s, а також і в (3.1), (3.4), знаходимо:
. (3.6)
Для рівнів значущості виберемо найбільш вживані значення: ?1 =0,01; ?2=0,05; ?3=0,1.
По таблиці з Додатку 2 знаходимо критичні значення для ?1 =0,01; ?2=0,05; ?3=0,1: (0,01;20)=2,884; (0,05;20)=2,557; (0,1;20)=2,385 . (3.7)
Порівнюючи (3.6) з (3.7) робимо висновок, що для рівнів значущості ?1 =0,01 і ?2=0,05 обидва члени варіаційного ряду - і не є викидами, в той час як для ?3=0,1 нульова гіпотеза про належність до генеральної сукупності не справджується, тобто на цьому рівні значущості є викидом.Для рівнів значущості?1 =0,01 і ?2=0,05?3=0,1перший член варіаційного ряду - =2,48 , що є найменшим членом емпіричної сукупності даних, не є викидом оскільки , тоді як) для =8,22критерій Граббсане виконується, тобто , що свідчить про те, що дана вибірка не належить до генеральної сукупності і найбільший член вибірки на вказаному рівні значущості можна вважати викидом.
Завдання №4
Провести ідентифікацію параметрів поліноміальної математичної регресії, яка задана рівнянням параболи другого ступеня вигляду Y=a0 a1X a2X2що є аналітичним наближенням вибірки експериментальних даних, які наведені в табл.4.1, і оцінити значущість кожного зі знайдених коефіцієнтів, а, також, робото здатність заданої регресійної моделі за критерієм Фішера.
На координатній площині (Х,Y) нанести дані з табл.4.1 і побудувати графік знайденої параболи в діапазоні експериментальних значень Х.
X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y 10 16 20 23 25 26 30 36 48 62 78 94 107 118 127
Розвязок: Регресія - форма звязку між випадковими величинами. В задачі апроксимація дослідних даних відбувається квадратичним поліномом.
. (4.1)
Ідентифікацію статистичного обєкта проведемо регресійним методом найменших квадрантів. Критерій мінімума середньоквадратичної похибки в цьому випадку визначається функціоналом
, (4.2) що повинен задовольняти рівнянням (2.6), які визначають умови знаходження екстремума для (4.2).
(4.3)
Після нескладних перетворень в (4.3), отримуємо систему нормальних рівнянь: (4.4)
Подамо систему (4.4) в матричному вигляді: , де
- квадратна матриця 3х3;
-вектор-стовбець шуканих коефіцієнтів аі ( і = ) рівняння регресії (4.1);
-вектор-стовбецьвільних коефіцієнтів системи рівнянь (4.4).
Система лінійних рівнянь (4.4) відносно шуканих компонентів вектора може бути розвязана будь-яким з трьох методів: 1. за допомогою правила Крамера;
2. методом оберненої матриці;
3. методом Гауса (метод виключення невідомих).
Перші два підходи можна застосувати тільки в тих випадках, коли матриця А є не виродженою, тобто коли її визначник - головний визначник ? системи - відмінний від нуля.
Табл. 4.2
1 1 1 1 10 10 10
2 4 8 16 16 32 64
3 9 27 81 20 60 180
4 16 64 256 26 92 368
5 25 125 625 25 125 625
6 36 216 1296 26 156 936
7 49 343 2401 30 210 1470
8 64 512 4096 36 288 2304
9 81 729 6561 48 432 3888
10 100 1000 10000 62 620 6200
11 121 1331 14641 78 858 9438
12 144 1728 20736 94 1128 13536
13 169 2197 28561 107 1391 18083
14 196 2744 38416 118 1652 23128
15 225 3375 50625 127 1905 28575
1240 14400 178312 820 8959 108805
Матриця А є не виродженою,розвяжемо рівняння методом оберненої матриці. Застосуємо для вирішення цієї задачі апарат Mathcad.
Отриманий вектор стовбець коефіцієнтів регресії
Підставляючи знайдені значення в (4.1) знаходимо, що регресійна модель експериментальних даних, заданих таблицею 4.1 , має вигляд: ум=15,07-1,65х 0,64х2. (4.8)
Для перевірки значущості отриманого рівняння регресії визначимо статистику Фішера - F-статистику, - тобто характеристику точності рівняння регресії, що є відношенням частини дисперсії залежної змінної, яка пояснена (обрахована)рівнянням регресії, до непоясненої (залишкової) частини дисперсії цієї ж змінної, яка обумовлена відсутністю інформації про всі точки генеральної сукупності: , (4.9) де - обєм вибірки, - число незалежних параметрів при факторних змінних в рівнянні регресії (в нашому випадку це коефіцієнти при х і х2 ) . Залишкова дисперсія - це частина дисперсії залежної змінної у , яка не пояснена рівнянням регресії, її наявність є наслідком дії випадкової складової. У нашому випадку (4.8) т = 2, оскільки х2 можна вважати другою незалежною змінною.
Для вибраного рівня значущості ? по розподілу Фішера визначається табличне значення , ймовірність перевищення якого у вибірці обєму п , отриманої з генеральної сукупності без звязку між змінними, не перевищує рівня значущості ? , і далі порівнюється з фактичним ЗНАЧЕННЯМF - статистики (4.9) для регресійного рівняння (в нашому випадку це (4.8)).
Якщо виконується умова , то встановлений по вибірці функціональний звязок між змінними у і х є і в генеральній сукупності , тобто регресійна модель вважається працездатною.
Якщо ж виявляється, що рівняння , то існує реальна ймовірність того, що по вибірці встановлений не існуючий в реальності звязок між змінними.
Знайдемо значення F-статистики з (4.9) для нашого випадку, коли n = 15, т = 2; ; при для (4.8). Для цього складемо табл. 4.3.
Табл. 4.3
1 10 14,06 -40,61 -4,06 1649,17 16,48
2 16 14,33 -40,34 1,67 1627,32 2,79
3 20 15,88 -38,79 4,12 1504,66 16,97
4 23 18,71 -35,96 4,29 1293,12 18,40
5 25 22,82 -31,85 2,18 1014,42 4,75
6 26 28,21 -26,46 -2,21 700,13 4,88
7 30 34,88 -19,79 -4,88 391,64 23,81
8 36 42,83 -11,84 -6,83 140,19 46,65
9 48 52,06 -2,61 -4,06 6,81 16,48
10 62 62,57 7,9 -0,57 62,41 0,32
11 78 74,36 19,69 3,64 387,70 13,25
12 94 87,43 32,76 6,57 1073,22 43,16
13 107 101,78 47,11 5,22 2219,35 27,25
14 118 117,41 62,74 0,59 3936,31 0,35
15 127 134,32 79,65 -7,32 6344,12 53,58
820 22350,57 289,12
За таблицями значень критерію Фішера (Додаток 3) для п = 15, т = 2, ? = 0,05 знаходимо, що (4.10)
Підставляючи значення з табл.4.3 в (4.9), розраховуємо статистику Фішера F:
- модель є працездатною.
Взагалі вважається, що для отримання статистично значущих рівнянь регресії необхідно, щоб задовольнялась умова: .В нашому випадку це виконується, оскільки 15 6?2=12.
Після того, як виконана перевірка статистичної значущості регресійного рівняння в цілому корисно здійснити перевірку на статистичну значущість отриманих коефіцієнтів регресії. Ідеологія перевірки така ж, як і при перевірці рівняння в цілому, але як критерій використовується t-критерій Стьюдента. Перевіряється нульова гіпотеза Н0 : коефіцієнт аі є незначущим, тобто аі=0.
Будемо вважати, що модель (4.1) є двомірною, ввівши для цього нову лінійну факторну змінну х2 = х2. Для цього обраховуємо значення критерію Стюдента для коефіцієнтів ; розраховуємо за формулами: ; ,… (4.11) де - статистична дисперсія і-ї факторної ознаки (незалежної змінної); Ri - коефіцієнт множинної кореляції, що виражається через інформаційну матрицю Фішера М: - залишкова дисперсія. Для нашого випадку можна вважати, що . Знайдемо і : ; . (4.12)
Підставляючи (4.12) в (4.11) , знаходимо: ;
; (4.13)
.
Отримані фактичні значення критерію Стьюдента порівнюються з табличними значеннями критичних точок t?, n-m-1, отриманими з розподілу Стьюдента. Якщо виявляється , що , то відповідний коефіцієнт статистично значущий і приймається альтернатива до Н0 гіпотеза, в протилежному випадку - ні. Для ? = 0,05 і п-т-1=12 знаходимо табличне значення критерію Стьюдента: . (4.14)
Порівнюючи (4.14) з (4.13), приходимо до висновку, що ( і = ), а отже всі коефіцієнти регресійної моделі статистично значущі і приймається альтернатива до Н0 гіпотеза.
Як експрес-метод оцінки значущості коефіцієнтів рівняння регресії можна застосовувати наступне правило: якщо фактичне значення критерію Стьюдента більше 3, то такий коефіцієнт, як правило, виявляється статистично значущим.
На рис. 4.1 відображено обраховану квадратичну регресійну модель і початкові емпіричні дані на координатній площині ХОУ.Для регресійної моделі , що описується квадратичною функціональною залежністю типу yn= a0 a1x a2x2, методом найменших квадратів розраховані коефіцієнти профакторних змінних і за допомогою t-критерію Стьюдента доказана їхня значущість. Для перевірки значущості отриманого рівняння регресії розраховано статистику Фішера - F - статистику для рівняння значущості а = 0,05 і доказана працездатність запропонованої регресійної моделі.
Рис. 4.1. Регресійна модель і емпірична залежність
Список литературы
1. Секей Г. Парадоксы в теории вероятности и математической статистике / Г. Секей. - М. : Мир, 1990. - 235 с.
2. Сидоренко Е. В. Методы математической обработки в психологии / Е. В. Сидоренко. - СПБ : Речь, 2000. - 350 с.
3. В.Н. Киричков. Идентификация объектов систем управления 4. технологическими процессами //К. «Вища школа», 1990, 263 с.
4. Д. Гроп. Методы идентификации систем // М. ""Мир"", 1979, 302с.
5. А. Уорсинг, Дж. Геффнер. Методы обработки экспериментальных данных
6. Н.Дрейпер, Г.Смит. Прикладной регрессионный анализ // М. Статистика, 1973.- 392с.
7. Крамер Г. Математические методы статистики/ Пер.с англ. под. ред. акад. Н.Колмогорова.- 2-е изд., стереотипное.- М.: Мир, 1975.- 648с.
8. Бахрушин В.Є. Методи аналізу даних. - Запоріжжя: КПУ, 2011. -268с.
9. Орлов А.И. Прикладная статистика. - М.: Экзамен, 2006. - 672 с.
10. Боровков А.А. Математическая статистика. Оценка параметров. Проверка гипотез. - М.: Наука, 1984. - 472 с.