Суть статистической обработки экспериментальных данных. Проверка выборочной информации на стохастичность и отсутствие грубых ошибок. Оценка точности измерения отклика. Порядок дисперсионного анализа трехфакторной модели. Выбор стратегии поиска оптимума.
При низкой оригинальности работы "Построение регрессионной математической модели с учетом взаимодействия факторов", Вы можете повысить уникальность этой работы до 80-100%
Министерство образование и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тихоокеанский государственный университет" Кафедра «Технологической информатики и информационных систем»Перед проведением регрессионного анализа проверить выборки: на однородность дисперсий, на стохастичность, на отсутствие грубых ошибок и определить точность оценки отклика в указанных опытах. Факторы варьируются на пяти уровнях в пределах: X1=0,1 … 0,4; X2=10 … 40; X3=150 … 750. эксперимента и результаты эксперимента латинского квадрата для r=5 приведены в таблице 2 Именно второй критерий и должен использоваться для проверки однородности дисперсий, в соответствии с которым наблюдаемое значение критерия Кохрена Gн определяется по формуле: .
Введение
Задание на проектирование. Вариант №17 (77-60)
1. По результатам экспериментальных исследований (табл.1) построить регрессионную математическую модель с учетом взаимодействия факторов (достроить план, учитывающий взаимодействие факторов).
Таблица 1 - Результаты эксперимента
№ опыта Факторы Отклик Yi х1 х2 x3 Y1 Y2 Y3 Y4 Y5
1 - - - 4,29 4,47 4,44 4,37 4,38
2 - - -5,62 -5,46 -5,41 -5,44 -5,34
3 - - 0,2 0,28 0,2 0,47 0,34
4 - -1,9 -1,56 -1,83 -1,99 -1,53
5 - - -11,67 -11,32 -11,55 -11,47 -11,72
6 - -6 -5,54 -5,77 -5,55 -5,61
7 - 4,32 4,13 4,24 4,39 4,36
8 18,69 18,22 18,57 18,52 18,57
Перед проведением регрессионного анализа проверить выборки: на однородность дисперсий, на стохастичность, на отсутствие грубых ошибок и определить точность оценки отклика в указанных опытах.
Факторы варьируются на пяти уровнях в пределах: X1=0,1 … 0,4; X2=10 … 40; X3=150 … 750. эксперимента и результаты эксперимента латинского квадрата для r=5 приведены в таблице 2
Таблица 2 - Результаты эксперимента
X11 X12 X13 X14 X15
X21 645,04 956,35 1330,1 1766,3 2265,1
X22 1425 2080,1 2860,1 3765 2270,1
X23 2455,1 3516,3 4765 2895,1 4050,1
X24 3735,1 5265,1 3270 4675 6330
X25 5265 3395,1 4987,6 6892,6 9110,1
Выбрать стратегию поиска оптимума в однофакторном пространстве: статическую - проведение опытов в каждой точке факторного пространства или последовательного поиска - по дискретным точкам при условии: - количество дискретных точек - 30;
- необходимое число опытов для оценки отклика с заданной точностью при последовательном поиске m=4.
Указать одну из общих для обоих методов точек факторного пространства, в которой обязательно проводится эксперимент независимо от выбранной стратегии поиска оптимума.
1. Проверка статистических гипотез
До статистической обработки экспериментальных данных (результатов измерений отклика) необходимо: - выяснить вопрос однородности выборочных дисперсий, т.е. их равенства дисперсии генеральной совокупности;
- проверить выборочные данные на стохастичность;
- проверить выборочные данные на отсутствие грубых ошибок;
- оценить точность измерения отклика.
1.1 Проверка однородности дисперсий
Однородность дисперсий проверяется по одному из критериев [1]: - критерию Фишера Fk(p,m1,m2), когда выборки разного объема и их количество две или более;
- критерию Кохрена Gk(p,m,n), когда количество выборок n более 2-х и их объемы m одинаковы.
Именно второй критерий и должен использоваться для проверки однородности дисперсий, в соответствии с которым наблюдаемое значение критерия Кохрена Gн определяется по формуле: .
Здесь - дисперсия воспроизводимости u-ой выборки
- среднее значение u-ой выборки
.
Соответственно параметры первой выборки (среднее и дисперсия)
Значения параметров остальных выборок представлены в таблице 1, из которой следует, что максимальное значение дисперсии воспроизводимости соответствует второй выборке S2max= 0,04257, а сумма дисперсий всех выборок
Для оценки однородности дисперсии по автоматизированному справочнику [2] находим критическое значение критерия Кохрена для p=0,95, m=5 и n=8 Gk(p,m,n)=0,392. Так как Gн< Gk, то дисперсии однородны.
1.2 Проверка выборочных данных на стохастичность
Проверка выборочных данных на стохастичность производится по критерию последовательных разностей [3]. Наблюдаемое значение этого критерия tнu для u-ой выборки tнu=Cu2/Su2, где
Значения дисперсий воспроизводимости всех рассматриваемых выборок приведены в таблице 1.
Наблюдаемое значение критерия последовательных разностей для первой выборки тн1=С12/S12=0,00485/4,39=0,456
Для остальных выборок расчетные значения наблюдаемого критерия последовательных разностей приведены в таблице 2, из которой следует, что минимальное значение критерия больше критического tнmin>t к
(0,456>0,369), следовательно, все выборки стохастичны.
Таблица 2
№ опыта Yi 1-Yi Cu2 tнu
1 0,0324 0,0009 0,0049 1E-04 0,004787 0,987
2 0,0256 0,0025 0,0009 0,01 0,004875 0,456
3 0,0064 0,0064 0,0729 0,0169 0,012825 1,008
4 0,1156 0,0729 0,0256 0,2116 0,053213 1,250
5 0,1225 0,0529 0,0064 0,0625 0,030538 1,191
6 0,2116 0,0529 0,0484 0,0036 0,039563 1,049
7 0,0361 0,0121 0,0225 0,0009 0,00895 0,816
8 0,2209 0,1225 0,0025 0,0025 0,04355 1,408 минимальное значение 0,456
1.3 Проверка выборочных данных на отсутствие грубых ошибок
Проверка выборочных данных на отсутствие грубых ошибок производится по критерию nk(p,m) [4]. Наблюдаемое значение nнui i-го измерения u-ой выборки рассчитывается по формуле
.
Так, например, для первого элемента первой выборки, в соответствии с данными, приведенными в таблице 1, наблюдаемое значение критерия nн11 nн11=|4,39-4,29| /O0,00485 = 1,436
Для остальных элементов выборок расчетные значения наблюдаемых критериев приведены в таблице 3.
Таблица 3
№ опыта nн= /S max nн
1 1,436 1,436 1,436 1,436 1,436 1,436 1,436
2 1,606 1,606 1,606 1,606 1,606 1,606 1,606
3 0,869 0,869 0,869 0,869 0,869 0,869 0,869
4 0,669 0,669 0,669 0,669 0,669 0,669 0,669
5 0,775 0,775 0,775 0,775 0,775 0,775 0,775
6 1,575 1,575 1,575 1,575 1,575 1,575 1,575
7 0,306 0,306 0,306 0,306 0,306 0,306 0,306
8 1,001 1,001 1,001 1,001 1,001 1,001 1,001
max nн 1,606
Критическое значение критерия для p=0,95 и m=5 определяется по автоматизированному справочнику [2] и равно nk(p,m)=2,345. В соответствии с данными таблицы 3 максимальное значение наблюдаемого критерия max ?н=1,606 меньше критического, следовательно, ни в одной из рассматриваемых выборок по результатам измерений грубых ошибок не обнаружено.
1.4 Оценка точности измерения отклика
Оценка точности измерения отклика при серии m экспериментов в одной u-ой точке факторного пространства определяется по формуле
.
В соответствии с данными таблицы 1 и значением тк(р,m)=2,803 оценка точности измерения отклика в первой точке факторного пространства
Оценка точности измерения отклика в других точках факторного пространства приведена в таблице 4.
Таблица 4
№ Опыта дисперсия воспроизводимости Точность оценки отклика Du
1 0,00485 0,09
2 0,01068 0,04
3 0,01272 0,25
4 0,04257 0,74
5 0,02563 0,15
6 0,03773 0
7 0,01097 0
8 0,03093 0,1
2. Регрессионный анализ
Регрессионный анализ предназначен для определения вида и параметров модели. В данном случае предполагаем следующий вид регрессионной модели
Для получения данного вида математической модели достраиваем план эксперимента с учетом указанного взаимодействия факторов.
Параметры регрессионной модели определяются по следующим зависимостям: статистический выборочный стохастичность дисперсионный
; ; ;
Аналогично рассчитаны остальные параметры модели b2=4,96; b3=1; b12=2,02; b13=3,9978; b23=5,0553; b123=0,07375.
Значимость параметров модели определяется их сравнением с доверительным интервалом Dbi . Параметр значим, если | bi | ? Dbi.
= 0,04872
Сравнивая рассчитанные значения параметров регрессионной модели с доверительным интервалом Dbi, делаем вывод - все параметры значимы. Для дальнейшей статистической обработки принимаем b0 b1 b2 b3 b12 b13 b23 b123 принятые параметры модели
0,4 1 5 1 2 4 5 0,07 тогда получаем нормализованную модель, по которой рассчитываются теоретические значения: f=0,4 Х1 5Х2 X3 2X1X2 4Х1Х3 Х2Х3 0,07Х1Х2Х3
Адекватность полученной модели проверяется с помощью статистического критерия Фишера, наблюдаемое значение которого Fн определяется по одной из зависимостей если ( ) или если ( ), где =0,02201 , а дисперсия адекватности определяется по уравнению
= 0,02678
Ниже приведен расчет значения теоретической зависимости для первого опыта f1=0,4-1-5-1 2 4 5-0,07=4,39 значения остальных fu приведены в таблице 6
Таблица 6
№ опыта Значения отклика fu Yuj - fu у1 у2 у3 у4 у5
В этой же таблице приведены значения Yuj - fu, необходимые для расчета .
Так как , то наблюдаемое значение критерия фишера
=0,02678 / 0,02201=1,21674
Соответствующее критическое значение критерия Фишера при p=0,95; m1=20 и m2=5 Fk(p,m1,m2)=6,615 (определено по автоматизированному справочнику [2]).
Так как Fн< Fk, то модель адекватна.
3. Планирование эксперимента при дисперсионном анализе. Латинский Квадрат
Цель многофакторного дисперсионного анализа - выявление существенности влияния факторов на отклик. Для трехфакторной модели результаты наблюдения можно представить в виде суммы где m общая средняя; biv отклонение, вызванное влиянием первого фактора на i-м уровне при v-м дублировании; ?jv отклонение, вызванное влиянием второго фактора на j-м уровне при v-м дублировании; dkv отклонение, вызванное влиянием третьего фактора на k-м уровне при v-м дублировании; Zijkv отклонение, вызванное влиянием неконтролируемых факторов.
Для дисперсионного анализа трехфакторной модели используется план в виде латинского квадрата (таблица 7).
Таблица 7
X11 X12 X13 X14 X15
X21 X31 X32 X33 X34 X35
X22 X32 X33 X34 X35 X31
X23 X33 X34 X35 X31 X32
X24 X34 X35 X31 X32 X33
X25 X35 X31 X32 X33 X34
С учетом изменений уровней факторов: первого - в диапазоне от 0,1 до 0,4; второго - в диапазоне от 10 до 40 и третьего - в диапазоне от 150 до 750 план эксперимента принимает вид (таблица 8).
Таблица 8
100 125 150 175 200
5 20 25 30 35 40
10 25 30 35 40 20
15 30 35 40 20 25
20 35 40 20 25 30
25 40 20 25 30 35
Таблица 9
X11 X12 X13 X14 X15
X21 -56,9 -111,5 -169,8 -222,9 -272,3
X22 6,8 -48,7 -95,6 -141,8 -526,2
X23 69,8 25,1 -17,6 -407,1 -447,4
X24 137,3 100 -284,9 -329,2 -364,8
X25 208,3 -168 -210,8 -244,9 -266,8
Отклики, указанные в таблице 9 соответствуют сочетаниям уровней факторов, указанных в таблице 10. Например, отклик Y234 соответствует эксперименту, проведенному при сочетании уровней факторов: первого на втором, второго на третьем, третьего на четвертом.
Таблица 10
X11 X12 X13 X14 X15
X21 Y111 Y212 Y313 Y414 Y515
X22 Y122 Y223 Y324 Y425 Y521
X23 Y133 Y234 Y335 Y431 Y532
X24 Y144 Y245 Y341 Y442 Y543
X25 Y155 Y251 Y352 Y453 Y554
Для удобства обработки результатов эксперимента предварительно проводим кодировку значений отклика, вычитая из всех его значений одно и то же число - значения кода (таблица 11).
Таблица 11 наименование обозначение значение
Принятое значение кода D 154
Сумма значений откликов после кодировки Ya 10,100
Квадрат суммы откликов 102,01
Значения отклика после кодировки представлены в таблице 12
Таблица 12
X11 X12 X13 X14 X15
X21 97,1 42,5 -15,8 -68,9 -118,3
X22 160,8 105,3 58,4 12,2 -372,2
X23 223,8 179,1 136,4 -253,1 -293,4
X24 291,3 254 -130,9 -175,2 -210,8
X25 362,3 -14 -56,8 -90,9 -112,8
Сумма квадратов значений откликов, указанных в этой таблице
Далее из факторов приведены нижетании уровней факторов: первого на втором, второго на третьем, третьего на четпроизводится суммирование значений откликов по уровням каждого фактора. Результаты суммирования удобно сводить в таблицу 13.
Таблица 13
Фактор Уровень фактора
1 2 3 4 5
X1 Y11 Y12 Y13 Y14 Y15
X2 Y21 Y22 Y23 Y24 Y25
X3 Y31 Y32 Y33 Y34 Y35
Примеры расчета по первому уровню каждого из факторов приведены ниже Y11= Y111 Y212 Y313 Y144 Y155 = 97,1 160 223,3 362,3=1135,3
Дисперсию отклика, вызванную влиянием j-го фактора, вычисляют по формуле
Для первого фактора
Соответственно для второго и третьего факторов S2(X2) = 691,332; S2(X3) = 54774,8
Проверку значимости влияния фактора Х, производят при помощи критерия Фишера, наблюдаемое значение которого где
Тогда наблюдаемые значения критерия Фишера для первого фактора
Соответственно Fн(X2)=4,35791; Fн(X3)=345,281.
Наблюдаемое значение критерия Фишера сравнивается с критическим Fk(p,m1,m2). Его значение находим по автоматизированному справочнику [2]. При доверительной вероятности p=0,95, m1=4 и m2=12 Fk=3,536.
Так как для всех факторов Fн< Fk, то все факторы значимы.
4. Выбор стратегии поиска оптимума
При выборе стратегии поиска оптимума исходим из минимального количества опытов для достижения цели эксперимента - определения оптимума за определенное количество опытов.
При статической стратегии поиска оптимума количество опытов определяется количеством k дискретных точек фактора, при которых проводится измерение отклика. Учитывая, что в одной из точек общих для двух стратегий поиска проводится серия из m экспериментов, необходимая для оценки отклика с заданной точностью при заданной доверительной вероятности, то при статической стратегии поиска количество экспериментов Nct определяется по зависимости
Nct=k (m-1)=30 (4-1)=33, где k - количество дискретных точек.
При последовательной стратегии поиска, если k дискретных точек равно k=Fn 1-1, то первые два опыта проводятся в точках Fn и Fn-1, откуда следует, что ориентировочное значение F*n 1 определяется из уравнения
F*n 1=k 1
Для данного случая
F*n 1=k 1=30 1.
Ближайшее большее число Фибоначчи Fn 1 = 34 соответствует n 1=8 (таблица 14).
Таблица 14 n 1 2 3 4 5 6 7 8 9 10 11 12
Fn 1 2 3 5 8 13 21 34 55 89 134 243
Следовательно, первые две серии опытов должны быть проведены в точках Fn =21 (n=7) и Fn-1=13 (n=6), а всего возможных серий опытов n=7.
Исходя из того, что в каждой точке из 7 возможных проводится серия из 4-х опытов, то общее количество опытов при последовательной стратегии поиска определяется по формуле
Nпслд=n*m=7*4=28
Сравнивая две стратегии поиска, делаем вывод: Наиболее предпочтительной является последовательная стратегия поиска, так как Nпслд< Nct (28<33)
Общими точками, в которых проводятся опыты независимо от стратегии поиска это дискреты под номером 13 и 21.
Список литературы
1. Проверка гипотезы о равенстве дисперсий. Методические указания к выполнению лабораторной работы по дисциплине "Планирование и организация эксперимента" для студентов направлений 221400.62 "Управление качеством", 221700.62 "Стандартизация и метрология" и специальности 151701.65 "Проектирование технологических машин и комплексов" всех форм обучения / Сост. Ю.Г. Иванищев, - Хабаровск : Изд-во Тихоокеан. гос. ун-та, 2016, - 16 с.
2. Автоматизированный справочник по определению статистических критериев. Методические указания к выполнению лабораторной работы по дисциплине "Планирование и организация эксперимента" для студентов направлений 221400.62 "Управление качеством", 221700.62 "Стандартизация и метрология" и специальности 151701.65 "Проектирование технологических машин и комплексов" всех форм обучения / Сост. Ю.Г. Иванищев, Д.В. Картелев, А.Ю. Коношко, - Хабаровск : Изд-во Тихоокеан. гос. ун-та, 2016, - 15 с.
3. Проверка на стохастичность. Методические указания к выполнению лабораторной работы по дисциплине "Планирование и организация эксперимента" для студентов направлений 221400.62 "Управление качеством", 221700.62 "Стандартизация и метрология" и специальности 151701.65 "Проектирование технологических машин и комплексов" всех форм обучения / Сост. Ю.Г. Иванищев, Д.В Картелев. - Хабаровск : Изд-во Тихоокеан. гос. ун-та, 2016, - 16 с.
Размещено на .ru
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы