Структурно-параметрична ідентифікація математичних моделей. Застосування елементів регресійного аналізу в ідентифікації моделей. Прогноз трендового компонента часового ряду. Ключові особливості згладжування часових рядів в присутності аномальних даних.
Міністерство освіти і науки, молоді та спорту України Національний технічний університет України Київський політехнічний інститут Методичні вказівки до комп’ютерного практикуму АНАЛІЗ ДАНИХ ТА СТАТИСТИЧНА ОБРОБКА СИГНАЛІВ для студентів Фізико-технічного інституту НТУУ “КПІ” спеціальності: 8.080201 - прикладна математика Архипов О.Є., Архіпова С.А. Київ 2012 Вступ математичний регресійний тренд прогноз Аналіз даних - сукупність дій, що здійснюються дослідником у ході вивчення та обробки даних з метою формування уявлень про основні закономірності та характеристики явищ чи процесів, які описуються цими даними. Традиційно аналіз даних сприймався як напрям математико-статистичних досліджень, представлений комплексом методів обробки результатів спостережень за об’єктом досліджень, функціонування якого описується множиною ознак, чиї значення припускають вимірювання та фіксацію. Метою обробки було встановлення прихованих причинно-наслідкових зв’язків на множині цих ознак з подальшою реконструкцією всього механізму функціонування об’єкту. Як правило, ці дослідження базувалися на моделях та методах регресійного аналізу, в повній мірі використовуючи розвинену методологічну базу регресійного підходу, зокрема численні критерії та процедури перевірки адекватності та точності моделей. Пріоритетним стало створення автоматизованих засобів обробки даних, які у своїх діях орієнтовані на процедури аналізу, застосування та виконання яких раніше було притаманним лише людині або певним біологічним спільнотам. Друга - теоретичні засади застосування математичних моделей для прогнозу часових рядів, зокрема опис ряду методів прогнозування та відповідних лабораторних робіт. 1. Наприклад розрізняють [6] предметні, фізичні, знакові та інші моделі. Однак серед множини моделей пріоритетне місце міцно займають математичні моделі (ММ), що пояснюється рядом їх визначальних особливостей: компактною формою представлення інформації, практичною відсутністю витрат на реалізацію, можливістю застосування математико-аналітичних методів аналізу та оптимізації, практично необмеженим ресурсом використання засобів обчислювальної техніки для потреб моделювання. 1, функціонування якого може бути описане двома групами змінних: першу з них становлять так звані вхідні, незалежні змінні або фактори, упорядкована сукупність яких утворює вектор , другу - вихідні, залежні змінні, вектор . Слід зазначити, що не обовязково всі вхідні змінні будуть використані у виразі (1), деякі з них можуть зовсім не впливати на залежну змінну і ході побудови ММ мають бути вилучені з подальшого розгляду. У загальному випадку маємо наступні етапи ідентифікації: 1) визначення сукупності суттєвих факторів, з яких формується вектор ; 2) встановлення характеру зв’язків (відношень) між елементами ММ; 3) оцінювання значень вектору параметрів (коефіцієнтів) ММ; 4) верифікація ММ, тобто перевірка її придатності до прикладного застосування. (2) Зважаючи на це, перший і другий етапи, результатом виконання яких є визначення структури ММ, часто поєднують під назвою структурна ідентифікація. Отримані на цьому етапі негативні результати унеможливлюють позитивне рішення всієї задачі. Зміст задачі параметричної ідентифікації - якнайточніше обчислити кількісні значення параметрів ММ за експериментальними даними, які поряд з корисною інформацією містять випадкову шумову складову, що й обумовлює появу помилок в розрахованих значеннях (оцінках) параметрів. В достатній мірі цим вимогам відповідають так звані лінійні регресійні моделі, для структурно-параметричної ідентифікації яких застосовують регресійний аналіз. Якщо відносно змінних, що входять до рівняння (9), виконуються вимоги: 1) експериментально отримані значення факторних змінних не містять помилок; 2) змінна y відома лише із випадковою похибкою е , математичне очікування якої , причому вплив цієї похибки від експерименту до експерименту змінюється абсолютно випадково, однак дисперсія лишається незмінною: то вираз (9) відповідає моделі класичної лінійної регресії. Працюючи з лінійними регресійними моделями, отримуємо суттєве спрощення розв’язку задачі ідентифікації ММ, пов’язане з тим, що задачі другого та третього етапів ідентифікації співпадають із задачами та змістом регресійного аналізу, який в своєму практичному застосуванні спирається на добре розвинений методичний та алгоритмічний апарат [9,10,11,12]. В загальному випадку парна вибіркова регресійна модель має вигляд: , (10) де Z - вектор значень залежної змінної, ; Х - вектор значень незалежної змінної, ; а0, а1 - невідомі параметри регресійної моделі; Е - вектор значень випадкових величин (помилок спостережень) , . Розрахувати -статистику Фішера для двох послідовно отриманих моделей для перевірки ефективності ускладнення моделі за формулою: , (15) - сума квадратів невязок для регресійної моделі попереднього -го кроку, - сума квадратів невязок для моделі поточного ( )-го кроку, k - ступінь вільності для моделі ( )-го кроку. (16) В загальному випадку F-статистику розраховують за такою ф
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы