Использование нейросетей для управления динамическими объектами в недетерминированной среде. Реализация мягкого управления на базе топологии "Внутренний учитель", используя нечеткую логику, повышающую адаптационные свойства СУ для некритических задач.
В настоящее время стали популярны реализации систем управления объектами на базе топологий с подкреплением [2], в частности все большее развитие получают адаптивные критики [8,9], а также системы с различными реализациями Q - обучения [11]. При этом существует большое количество топологий на все случаи жизни, как адаптивных критиков, так и систем на базе Q - обучения, в частности приведем следующий список: DHP, GDHP, ADHPD, ADGDHP, GIFACL, FACL, Q - Хемминг, Dyna - Q, Q - Kohonen network, CMLP, HQ и т.д.[6, 8,9,10,11,12]. Для топологии "Внутренний учитель" используются две основные компоненты - Решатель и Учитель. Компонента обучения оценивает состояние среды на предмет изменения характера воздействия на объект, и если это имеет место быть, то Учитель вмешивается в управление, перенастраивая правила управления или же вообще изменяя их. В качестве компоненты обратной связи используется коэффициент эффективности l (далее КЭ): , где i - номер кванта времени (итерации, одного законченного цикла управления), для которого вычисляется коэффициент; - безразмерный показатель полезной деятельности, произведенной объектом; - безразмерный показатель затраченных ресурсов.Таким образом, используя нечеткую логику можно реализовать мягкое (нечеткое) управление на базе топологии "Внутренний учитель".
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы