Основні поняття логлінійного аналізу - статистичного аналізу зв’язку таблиць спряженості за допомогою логлінійних моделей. Аналіз зв’язку категоризованих змінних. Канонічна кореляція при аналізі таблиць спряженості ознак. Побудова логарифмічної моделі.
Останніми роками активно розробляються методи аналізу таблиць спряженості ознак. Тоді при спостереженні n обєктів, кожні з k ознак, що описують ці обєкти, подаються у вихідній матриці кодами їх категорій (рівнів). За даною вихідною матрицею спостережень одержують таблицю спряженості, яка включає частоти спостережень при всіх комбінаціях рівнів ознак. Основна ідея логлінійного аналізу полягає в тому, що в кожній комірці таблиці спряженості записується розклад натурального логарифма частоти на суму ефектів всіх взаємозвязків досліджуваних ознак. Модель к-го порядку називається насиченою, якщо вона крім головних ефектів містить будь-які взаємозвязки величин від другого до к-го порядків включно.Дуже часто вивчення взаємозвязків між якісними змінними зводитися до аналізу двох змінних х і у, які набувають низку значень - х1, …, хм і y1,…, yp. Кожен обєкт характеризується значеннями двох змінних хі і yj. Існуючі взаємозвязки між змінними вимагають їх спільного розгляду, переходу від парних звязків до аналізу множинних і частинних звязків, від двовимірних таблиць спряженості до складних комбінаційних таблиць. При цьому не виявляється дуже важлива інформація про зміну інтенсивності звязку змінних із зміною їх значень: при одних значеннях звязок ознак може бути щільним, при інших - слабким і навіть взагалі не спостерігатися. Число таких таблиць повинне дорівнювати числу ступенів вільності критерію ?2, при його обчисленні за вихідною таблицею.Логарифмічно лінійна модель системи з трьох змінних запишеться у вигляді: ?IJKABC (4.1) де ln(nijk) - очікувана частота чарунка (і, j, k) тривимірної таблиці спряженості, обчислена за умови незалежності змінних A, B, C; параметри ? визначають внесок у логарифм очікуваної частоти змінних як окремо , так і внаслідок їхньої взаємодії. Якщо поділити, знайдену в результаті розрахунків оцінку на оцінку його середнє квадратичного відхилення , то одержимо стандартизоване значення оцінки параметра. Відзначається, що, крім з насиченої моделі стандартизовані параметри , рівні нулю, можна перейти до моделі, більш адекватної вихідних даних або апріорним припущенням про відносини між змінними. A, B, C, а це означає припущення існування звязків у будь-якій підгрупі зі складових "старших" взаємозвязок (ABC) змінних, і тому в модель включені такі параметри, як ?AB, ?BC, ?AC, ?A, ?B, ?C.Логлінійна модель для трьох змінних має вигляд: де fijk,? - невідомі параметри, які називаються: ?IA - ефект i-ого рівня ознаки А, i=1,..,I; ?IJAB - ефект взаємодії i-ого рівня ознаки А та j-ого рівня ознаки B; ?IKAC - ефект взаємодії i-ого рівня ознаки А та k-ого рівня ознаки C; ?IJKABC - ефект взаємодії i-ого рівня ознаки А, j-ого рівня ознаки B та k-ого рівня ознаки C; Якщо гіпотезу Н0 відхиляти при: і не відхиляти в супротивному разі, то з імовірністю ? гіпотеза відхиляється, коли вона справедлива. n - кількість всіх комірок, p - число оцінюваних очікуваних частот при умові незалежності змінних, Критерій частинного звязку ознак.
План
Зміст
1. Основні поняття логлінійного аналізу
2. Аналіз звязку категоризованих змінних
3. Канонічна кореляція при аналізі таблиць спряженості ознак
4. Побудова логарифмічної моделі
Висновки
Список використаних джерел
1.
Вывод
Логлінійний аналіз - це статистичний аналіз звязку таблиць спряженості за допомогою логлінійних моделей. Логлінійна модель для трьох змінних має вигляд:
де fijk,? - невідомі параметри, які називаються: ?IA - ефект i-ого рівня ознаки А, i=1,..,I;
?JB - ефект j -ого рівня ознаки B, j=1,..,J;
?KC - ефект k-ого рівня ознаки C, k=1,..,K;
?IJAB - ефект взаємодії i-ого рівня ознаки А та j -ого рівня ознаки B;
?IKAC - ефект взаємодії i-ого рівня ознаки А та k-ого рівня ознаки C;
?JKBC - ефект взаємодії j -ого рівня ознаки B та k-ого рівня ознаки C;
?IJKABC - ефект взаємодії i-ого рівня ознаки А, j -ого рівня ознаки B та k-ого рівня ознаки C;
fijk - гіпотетична частота в (i,j,k)-ій комірці
Оцінки параметрів знаходяться за методом максимальної правдоподібності й набувають вигляду:
де
Для перевірки гіпотез
H0: ?IJAB=0, i=1,..,I, j=1,..,J - про незалежність ознак А і В;
H0: ?IKAC=0, i=1,..,I, k=1,..,K - гіпотеза про незалежність ознак А і C;
H0: ?JKBC=0, j=1,..,J, k=1,..,K - гіпотеза про незалежність ознак B і C;
H0: ?IJKABC=0, i=1,..,I, j=1,..,J, k=1,..,K - гіпотеза про незалежність ознак A, B і C використовують критерій та критерій частинного звязку ознак.
Критерій . Якщо гіпотезу Н0 відхиляти при:
і не відхиляти в супротивному разі, то з імовірністю ? гіпотеза відхиляється, коли вона справедлива. n - кількість всіх комірок, p - число оцінюваних очікуваних частот при умові незалежності змінних, Критерій частинного звязку ознак. Якщо гіпотезу Н0 про взаємозвязок ознак А і В відхиляти при і не відхиляти в супротивному разі, то з імовірністю ?, гіпотеза відхиляється, коли вона справедлива.
Якщо гіпотезу Н0 про взаємозвязок ознак А і C відхиляти при і не відхиляти в супротивному разі, то з імовірністю ?, гіпотеза відхиляється, коли вона справедлива.
Якщо гіпотезу Н0 про взаємозвязок ознак В і C відхиляти при і не відхиляти в супротивному разі, то з імовірністю ?, гіпотеза відхиляється, коли вона справедлива.
Список литературы
1. Толстова Ю.Н. Анализ социологических данных: методология дескриптивная статистика, изучение связей между номинальными признаками, М.: Научный мир 2000.